dimanche 4 décembre 2011

logo data.gouv.fr

Mise-à-jour du 5/12/11 à 8h40 : Les 500 jeux de données évoqués dans cet article ont apparemment été éclatés en plus de 350 000 notamment en divisant les données de l’INSEE commune par commune, mais notre analyse reste la bonne, série de données par série de données.

Alors que Regards Citoyens semble tenu à distance de la sortie du portail data.gouv.fr, nous avons réussi à consulter des documents de travail de la mission ÉtaLab nous permettant d’évaluer le contenu de la plateforme OpenData française qui sera présentée ce lundi matin en conférence de presse.

Tout d’abord, Regards Citoyens ne peut que se réjouir de la sortie d’un portail référençant les données publiques librement réutilisables. C’est un effort à notre sens indispensable de l’État pour un renouveau démocratique et citoyen. Moins d’un an après son installation, l’objectif que s’est fixé ÉtaLab est donc globalement atteint. Conformément aux principes reconnus au niveau international, la gratuité et l’absence de barrière juridique sont bien au rendez-vous. Concernant les formats, le bilan semble en revanche nettement plus mitigé.

Formats propriétaires : le point noir d’ÉtaLab

Rappelons-le : sur l’échelle à 5 étoiles de Sir Tim Berners Lee mesurant le degré d’ouverture d’un jeu de données, la troisième étoile impose des formats non-propriétaires, c’est-à-dire « libres et ouverts », comme le requérait d’ailleurs le gouvernement à l’annonce du projet. Pourtant, en examinant le catalogue, nous n’avons pu recenser que quelques dizaines de données en CSV et XML contre plusieurs centaines sous des formats propriétaires de Microsoft, loin de respecter les objectifs fixés par le gouvernement. Un sérieux effort reste donc encore à faire par ÉtaLab sur ce point. Suivant la norme édictée par l’inventeur du web, ce n’est qu’une petite moyenne que l’on peut simplement accorder à data.gouv.fr pour sa sortie.

Data.gouv.fr devrait référencer à sa sortie environ 500 jeux de données accessibles et librement réutilisables par tous, si le contenu n’a pas trop évolué d’ici lundi. À titre d’exemple, on peut noter que l’Angleterre, qui a beaucoup inspiré l’équipe d’Étalab et avait travaillé dans les même délais, proposait 2 500 jeux de données lors de l’ouverture de son portail data.gov.uk. L’éclatement des données réalisé par certains ministères illustre cependant la difficulté à raisonner simplement en termes quantitatifs sur les jeux de données.

Une majorité de données déjà accessibles, mais d’intéressants efforts

De manière assez logique, beaucoup des données référencées étaient déjà accessibles sur les sites respectifs des ministères (et donc déjà référencées notamment par Data-Publica). Une bonne centaine de jeux de données ont cependant fait l’objet d’un véritable effort de reformatage, permettant à des données auparavant seulement consultables de devenir réutilisables. Parmi celles-ci, nous nous réjouissons de trouver notamment de nombreux tableaux disponibles auparavant exclusivement en PDF, comme par exemple différents « jaunes budgétaires », mais aussi les questions écrites parlementaires ou encore les recettes et dépenses de l’État. Rappellons que le manque criant de plusieurs de ces données avait déjà été comblé par différentes initiatives citoyennes et référencées au sein de NosDonnees.fr, notre data-gov.fr citoyen.

Enfin, data.gouv.fr référencera quelques dizaines de jeux de données auparavant totalement inaccessibles. C’est par exemple le cas de données de répartition des effectifs des administrations centrales et à l’étranger (Ministère des Affaires Étrangères), les données d’activités des services fiscaux depuis 2004 (Ministère du Budget) ou celles relatives à l’aide au développement accordée par la France (Ministère de l’Économie).

Les ministères de l’Éducation et de l’Agriculture les plus pro-actifs

ministeres
Répartition des données par ministère
Les jeux de données du Ministère de l’enseignement suppérieur ont été agrégés à ceux de l’Education nationale

Les documents auxquels nous avons pu avoir accès permettent également d’évaluer les administrations les plus motivées pour proposer leurs données ou les enrichir. En novembre, le Ministère de l’Éducation nationale était le ministère qui référençait le plus de données sur la version Alpha de data.gouv.fr, mais la très grande majorité de ces données étaient déjà présentes sur le site du ministère. Venaient ensuite le Ministère de l’Agriculture, celui du Travail, de l’Écologie, du Budget et de la Culture, lesquels semblent avoir fait plus d’efforts pour améliorer la qualité des données ou rendre disponibles pour la première fois certains jeux de données. Les services du Premier Ministre, qui comprennent de nombreuses administrations détentrices de données, semblaient en revanche plutôt restés en retrait et ce malgré leur proximité statutaire avec ÉtaLab. Il est ainsi décevant que la DILA n’ait pas fait la preuve d’une volonté forte en proposant par exemple les bases de données du Journal Officiel ou des Marchés Publics. On regrettera enfin, sans trop de surprise, la pauvreté en termes de données issues de l’INSEE ou de l’IGN (données altimétriques de qualité moindre à celles déjà fournies pour la France par la NASA…).

La sortie de data.gouv.fr devrait également être l’occasion de disposer de jeux de données soumis jusqu’à présent à des redevances de plusieurs milliers d’euros : l’historique de la cotation des produits agricoles ou les subventions PAC versées au niveau national (Ministère de l’Agriculture), la base des établissements scolaires (vendue 120 000 € par an par le Ministère de l’Éducation nationale), la dotation budgétaire globale et les éléments d’imposition locale de chaque collectivité territoriale (vendus 123 000 € par la DGFIP), ou encore la base des questions écrites (vendue 6 480 € par la DILA jusque récemment). Nous espérons que la mise en ligne de data.gouv.fr sera l’occasion pour ÉtaLab de publier, comme annoncé par le décret de mai, la liste publique des données reconnues officiellement et de manière justifiée comme payantes.

L’avenir de l’OpenData Français entre les mains des réutilisateurs et de l’Europe

Alors que la Commission Européenne doit dévoiler dans les prochains jours sa proposition de révision de la directive PSI relative à l’OpenData, en élargissant notamment le cadre d’ouverture aux données culturelles, un effort intéressant est à noter du côté du Ministère de la Culture avec la libération de diverses données relatives aux pratiques culturelles des français (entrées en salles de cinéma, achats moyens, …). Notons d’ailleurs que celles-ci ont d’ores et déjà été exploitées par deux des applications gagnantes du concours étudiants d’Etalab.

L’ouverture du portail data.gouv.fr, prenant la suite de collectivités territoriales pionnières, officialise l’entrée de la France dans le monde de l’Open Data. Mais cette ouverture n’est qu’une première étape : si de nombreuses données pourraient encore être intégrées, cela ne sera possible que si un maximum de citoyens, d’associations, de journalistes, d’entreprises et d’universitaires s’emparent des données déjà existantes.

Les documents préparatoires à partir desquels cette analyse est basée datant de quelques semaines, il est possible que les chiffres avancés soient légèrement différents à la sortie, nous proposerons alors bien évidemment un rectificatif.
Télécharger la synthèse en CSV des documents préparatoires


18 réponses à “OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires”

  1. […] indispensable de l’Etat pour un renouveau démocratique et citoyen« . Mais dans son analyse, il pointe du doigt certains faiblesses, notamment le recours à des formats propriétaires (en […]

  2. chauvat dit :

    En recherchant des données en RDF sur le portail Etalab, on trouve… un seul résultat, à savoir le site de la Bibliothèque nationale de France: http://data.bnf.fr/

  3. […] Citoyens, un collectif de promotion de l’open-data se félicite de l’entrée de la France dans l’open-data, dénonçant cependant la trop grosse […]

  4. […] Répartition de la nouveauté des données mises à disposition à l’ouverture de Data.gouv selon Regards citoyens […]

  5. […] en ligne de partage des données publiques. Pour Tangui Morlier, cofondateur du collectif «Regards Citoyens», si ce n’est «pas une révolution», l’open data à la française «peut mener à un certain […]

  6. […] site Regards Citoyens a livré une première analyse du site, qui, rappelons-le, est encore en version Beta. Il critique […]

  7. […] disponible sur les sites des « producteurs ». Selon l’association Regards Citoyens, seuls 5 % auront été spécialement publiées par Etalab pour la sortie du […]

  8. […] territoriales (Longjumeau, Saint-Quentin, Coulommiers, le Loir-et-Cher). Néanmoins, selon le blog regardscitoyens.org, la majorité de ces données était déjà accessible par d’autres moyens à disposition. […]

  9. […] guerre française des licences s’achève ! – regardscitoyens.org – 19 Oct. 2011 /// OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires – regardscitoyens.org – 4 Déc. 2011 /// Étude sur le redécoupage électoral – […]

  10. […] recommandons aussi à ceux qui veulent comprendre cet ensemble de jeux de données la lecture de l’article de Regards Citoyens qui a fait une analyse antérieure à l’annonce du lancement du […]

  11. […] OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires « Regards Citoyens L’ouverture du portail data.gouv.fr, prenant la suite de collectivités territoriales pionnières, officialise l’entrée de la France dans le monde de l’Open Data. Mais cette ouverture n’est qu’une première étape : si de nombreuses données pourraient encore être intégrées, cela ne sera possible que si un maximum de citoyens, d’associations, de journalistes, d’entreprises et d’universitaires s’emparent des données déjà existantes. Les documents préparatoires à partir desquels cette analyse est basée datant de quelques semaines, il est possible que les chiffres avancés soient légèrement différents à la sortie, nous proposerons alors bien évidemment un rectificatif. […]

  12. […] que dans les documents de travail que nous avons pu consulter, et dont Regards Citoyens s’est également fait l’écho, l’ouverture des données concerne à ce jour, avant tout, la quantité des informations. […]

  13. […] publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les […]

  14. […] publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les […]

  15. […] publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les […]

  16. […] que dans les documents de travail que nous avons pu consulter, et dont Regards Citoyens s’est également fait l’écho, l’ouverture des données concerne à ce jour, avant tout, la quantité des informations. […]

  17. […] propriétaires – Très impliqué dans le développement de l’open data, le collectif Regards Citoyens se réjouit de la sortie du portail data.gouv.fr et du  travail réalisé en un an par Etalab […]

  18. […] l’analyse de Regards Citoyens sur l’usage de formats propriétaires, on constate qu’il s’agit du format Excel dans 80% des […]

Laisser un commentaire

*

Regards Citoyens est fièrement propulsé par WordPress

Contenu sous Creative Commons License sauf mention contraire.

Mentions légales - Contact Presse