Archives d’un auteur


jeudi 22 septembre 2011

Deux ans après s’être intéressés à l’activité des députés, nous sommes fiers d’ouvrir ce matin NosSénateurs.fr. Dans la droite ligne de NosDéputes.fr, ce nouveau site référence une grande masse d’informations relatives aux travaux parlementaires du Sénat français : 870 000 interventions, 110 000 présences individuelles, 50 000 amendements, 40 000 questions, 7 000 rapports parlementaires et textes de loi ont été intégrés. La base de données contenant près d’un million de documents permet notamment de dresser le bilan des sénateurs dont le mandat s’achève ce week-end.

Mis à jour toutes les quatre heures, NosSenateurs.fr permettra à tous les citoyens de suivre l’activité des nouveaux élus, de rentrer dans le détail du travail complexe des parlementaires, de le commenter et de suivre par e-mail les travaux d’un sénateur ou les débats portant sur un thème particulier.

Les informations constituant NosSénateurs.fr ayant la même structure que celles de NosDéputés.fr, une comparaison de l’activité des deux chambres devient possible et révèle des informations nouvelles, voire surprenantes.

Les sénateurs plus bavards en hémicycle et plus présents en commission

Si la présence moyenne des parlementaires est quasiment la même dans les deux chambres (21 semaines d’activité à Paris en moyenne chaque année), une étude plus fine des données révèle que les sénateurs sont plus bavards que les députés. Depuis octobre 2007, bien que moins nombreux, ils ont prononcés un total de 33 millions de mots en hémicycle contre 29 millions pour leurs collègues de l’Assemblée durant la même période.

De même, si le nombre de réunions de commissions est quasiment identique dans les deux chambres (3 370 à l’Assemblée contre 3 440 au Sénat), les sénateurs s’y montrent plus assidus : un sénateur a assisté en moyenne à 203 réunions depuis 2007 alors que la moyenne chez les députés est de 137 réunions.

Un Sénat rebelle ?

Malgré la réforme constitutionnelle et le renforcement du poids des commissions, les sénateurs de l’opposition interviennent finalement peu en commission et restent attachés au débat en hémicycle, bousculant quelque peu les règles.

Si le Sénat adopte un peu moins d’amendements que l’Assemblée (7 700 contre 10 300 depuis 2007), la Chambre Haute se montre plus encline à voter des dispositions proposées par l’opposition que le Palais Bourbon : 20 % des amendements adoptés au Palais du Luxembourg proviennent de l’opposition alors qu’à l’Assemblée cette proportion n’est que de 10 %. De même, 20 % des amendements votés par les sénateurs le sont contre l’avis du gouvernement, suggérant une certaine marge de manœuvre des sénateurs lors des débats législatifs.

Un Sénat discret, moins enclin aux questions et propositions de loi

Si les sénateurs semblent légèrement plus actifs que les députés sur une majorité du travail parlementaire, ce n’est pas le cas en ce qui concerne le dépôt de propositions de loi (703 au Sénat contre 1 828 à l’Assemblée) et de questions écrites (17 914 au Sénat contre 112 605 à l’Assemblée). Ce phénomène pourrait trouver son explication dans les modalités d’élection des deux chambres. Beaucoup de députés, élus au suffrage direct à l’inverse des sénateurs, usent de ces outils pour afficher leur travail parlementaire auprès de leurs électeurs.

Les questions écrites sont ainsi souvent utilisées par les députés pour démontrer leur « efficacité » vis-à-vis des électeurs : en posant des questions écrites, ils démontrent leur rôle de représentation et leur engagement en faisant remonter à l’exécutif les problématiques qui leur ont été signalées sur le terrain. Les propositions de loi sont également exploitées politiquement. Leur fort emploi à l’Assemblée provient à 70 % des députés UMP : nombreux sont les élus du parti majoritaire qui les utilisent pour disposer d’une plus grande visibilité médiatique et afficher les gages d’une expertise.

De par leur éloignement relatif du raout politique, les sénateurs ressentent probablement moins ce besoin de justification médiatique vis à vis des citoyens et exploitent en conséquence moins ces outils parlementaires que sont la question et la proposition.

NosSénateurs.fr : une source de données publiques

Les données parlementaires sont des données riches et complexes. Nous ne traçons à l’occasion de cette sortie de NosSenateurs.fr qu’une esquisse de ce que leur exploitation pourrait nous apprendre.

Alors que pour les élections sénatoriales, le Palais du Luxembourg s’avance avec difficultés sur la voie de l’OpenData, nous sommes soucieux d’appliquer à nous-mêmes l’effort de transparence que nous demandons à nos élus. Nous rediffusons donc librement le fruit de ce long travail d’extraction des données publiques du Sénat, rendu nécessaire faute d’accès simple et libre aux données officielles. Nous espérons que ces données inspireront citoyens, développeurs, politologues et élus et qu’elles participeront avec NosSenateurs.fr à valoriser l’activité des parlementaires au Sénat, et établir ainsi une nouvelle relation entre les citoyens français et leurs représentants.

mardi 31 mai 2011
Regards sur l'actualité
Couverture du N° 370
de Regards sur l’Actualité

La revue « Regards sur l’Actualité » a consacré son numéro d’avril aux données publiques. Essayant de synthétiser l’actualité autour de la libération des données publiques à travers des tribunes, des articles et des interviews, la Documentation Française nous a proposé d’y participer en répondant à leurs questions. Nous reproduisons ici l’interview que nous avons donnée à Céline Persini le 15 février 2011. Vous pouvez retrouver un aperçu du N° 370 de « Regards sur l’Actualité » édité par la Documentation Française sur leur site.

Céline Persini : Pouvez-vous nous rappeler le rôle de « Regards Citoyens » dans l’accès aux données publiques ?

Regards Citoyens : Regards Citoyens est une association constituée d’une dizaine de personnes qui vise à utiliser les données publiques pour valoriser et permettre aux citoyens de mieux comprendre les institutions françaises. À l’origine, nous nous sommes rassemblés autour de la création en juillet 2009 de NosDeputes.fr. Lancé le 14 septembre 2009, ce site web cherche à mettre en valeur l’activité parlementaire des députés de l’Assemblée nationale (AN). En synthétisant les différentes activités législatives et de contrôle du Gouvernement, NosDeputes.fr vise à donner aux citoyens de nouveaux outils pour comprendre et analyser le travail de leurs représentants. Conçu comme une plateforme de médiation entre citoyens et élus, le site propose à chacun de participer et de s’exprimer sur les débats parlementaires. Au travers de leurs commentaires, les utilisateurs peuvent donc prendre part aux débats et partager leur expertise avec leurs représentants. Nous utilisons des documents publiés par le site de l’AN et par le Journal Officiel pour essayer de valoriser l’activité des députés, sachant qu’en général leur travail en circonscription est relativement accessible, ne serait-ce que par la presse. D’un côté, cela rend plus lisible le travail parlementaire, et d’un autre, cela encourage le dialogue entre les institutions et les citoyens.

Nous avons par la suite travaillé sur les effets potentiels du redécoupage électoral, il n’existait alors aucune étude à proprement parler d’évaluation politique à destination du citoyen en la matière. En réalisant ce travail, nous nous sommes aperçus que l’accès aux données ayant trait aux résultats électoraux, pourtant centrales dans une démocratie, était très difficile. Notre étude a permis de combler au moins partiellement ce manque, tout en fournissant aux citoyens des éléments factuels permettant d’équilibrer les discours idéologiques. À l’heure actuelle, nous avons d’autres projets similaires en préparation autour de la valorisation de l’activité politique et administrative, mais également sur le lobbying ou les élections.

De manière générale, notre expérience nous a montré qu’en matière de données publiques, nous consacrions plus de temps à aller chercher les données qu’à créer les interfaces pour les diffuser. En ce qui concerne NosDeputes.fr, par exemple, nous avons consacré les trois quarts du temps de travail à la création et l’alimentation de la base de données.

Quelles initiatives existent déjà dans le domaine de l’accès aux données publiques ?

Tout d’abord, les données publiques sont des éléments importants pour la prise de décision politique. Elles sont collectées et employées dans le cadre de nombreux travaux de l’État et des collectivités territoriales. Il semblerait donc naturel qu’elles soient mises à la disposition de chacun afin d’être réutilisées pour de nouveaux emplois.

C’est en tout cas la décision qui a été prise dans certaines démocraties occidentales. Les premiers ont sans doute été les États-Unis avec l’ouverture du site data.gov par le président Barack Obama au début de son mandat. Le Royaume-Uni a rapidement suivi, épaulé par l’inventeur du Web, Tim Berners-Lee. Ce sont ces deux initiatives qui ont popularisé le terme anglo-saxon Open Data : la mise à disposition, libre et gratuite, des données publiques.

En France, les premières initiatives sont venues du milieu de l’entreprise d’une part avec Data Publica, et des citoyens d’autre part avec NosDonnees.fr. Ces catalogues cherchent à recenser et à rendre visibles les données déjà accessibles sur Internet ainsi qu’à pointer les données manquantes ou publiées sous des formes ou des conditions fermées empêchant leur réutilisation par le plus grand nombre. Si l’État essaie de combler son retard grâce au projet ÉtaLab, chargé de la création d’un portail gouvernemental des données publiques, certaines collectivités territoriales pionnières, comme Rennes ou Paris plus récemment, n’ont pas attendu et se sont déjà lancées dans l’expérience.

Malgré l’ordonnance du 6 juin 2005, transposant la directive 2003/98/CE du Parlement européen et du Conseil de l’Union européenne qui a reconnu le droit à la réutilisation des données publiques, et les expériences existantes, nous n’observons pas de réutilisation massive des données publiques en France ?

Tout à fait, leur accès n’est pas massif et généralisé. Tout d’abord, cela s’explique par l’absence de culture d’accès aux données publiques au sein des institutions malgré la loi de 1978 qui le prévoit. En matière de réutilisation des données publiques, le réflexe de certaines administrations est plutôt celui du repli que de l’encouragement de la co-production. La base de données des prix de l’essence en est un très bon exemple.

La Direction générale de la concurrence, de la consommation et de la répression des fraudes (DGCCRF) s’apercevant de problèmes de concurrence liés au prix de l’essence, a souhaité que le prix à la pompe soit accessible à tous depuis Internet.

Malheureusement, l’interface était sommaire et peu adaptée aux usages des automobilistes : il n’était, par exemple, pas possible d’utiliser le site sur son téléphone portable alors que c’est en voiture que l’on a le plus besoin de la consulter. Un certain nombre de sites ont donc réutilisé ces données et les ont intégrées à leurs applications, notamment mobiles. Les gestionnaires s’en sont aperçus. Plutôt que de féliciter ces réutilisateurs de produire, sans coût pour l’administration, des applications qui allaient dans le sens visé par la DGCCRF, à savoir diffuser l’information économique sur le prix du pétrole pour éclairer le consommateur, Bercy a fait fermer certains de ces sites en posant des limites juridiques et en restreignant les utilisations techniques possibles du site. Désormais, toute réutilisation des données par un service gratuit ou non donne lieu à une redevance de 38 500 euros, ce qui revient à faire payer tous les usages rendus publics qu’ils soient marchands ou non marchands1. L’objectif premier de cette initiative de meilleur accès à l’information des citoyens est ainsi totalement perdu : seules les grandes entreprises ont désormais accès à la réutilisation de ces données devenues totalement inaccessibles aux citoyens qui souhaiteraient créer un service non lucratif autour de ces données.

Comme l’illustre cet exemple, les principaux réutilisateurs des données publiques après les acteurs publics sont, à l’heure actuelle, essentiellement des entreprises privées. Les coûts d’accès aux données sont très importants : les identifier nécessite du temps et, quand elles sont mises à disposition, elles le sont très rarement gratuitement et il faut parfois négocier cet accès. Les secteurs citoyens et associatifs sont donc défavorisés par rapport aux secteurs privé et public. Cette situation crée des monopoles de fait parmi les réutilisateurs des données et freine donc sérieusement l’émergence de nouveaux usages. À l’heure actuelle, de nombreux acteurs ne réutilisent les données qu’en vue de les revendre, ce n’est pourtant pas leur vocation ! Elles pourraient plutôt permettre d’éclairer des décisions publiques et privées et valoriser l’activité de l’État.

De plus, il ne faut pas que les administrations sous-estiment le pouvoir co-productif de la mise à disposition des données publiques : en général, les données publiques récupérées sont enrichies et permettent d’apporter une sorte de retour d’expertise aux institutions. En publiant ses données, le service public peut donc s’équiper pour en améliorer la qualité.

Le dernier rapport sur la Révision générale des politiques publiques de juin 2010 a fait état du potentiel de croissance économique que représentaient les données publiques. Qu’en pensez-vous ? Un accès gratuit pourrait-il engendrer le même niveau de croissance ?

Plusieurs études internationales se sont penchées sur le sujet2. Elles montrent que la moins bonne solution économique est de poser des barrières financières entravant l’accès aux données publiques. En effet, elles réduisent les usages potentiels des réutilisateurs et renforcent sa concentration aboutissant à la réduction des possibilités d’innovation. Or, l’objectif premier de l’exploitation des données publiques consiste à apporter une information innovante et précise à un acteur, qu’il soit décideur public, entrepreneur ou citoyen. Caractérisés par une culture de séparation entre l’administration et les commerçants – il y a très peu d’établissements publics à caractère industriel et commercial dans les pays anglo-saxons –, la Grande-Bretagne et les États-Unis ont fait le choix de mettre à disposition un maximum de données publiques, librement accessibles, c’est-à-dire sans coût de licence, ni de restriction à l’usage.

Au Danemark, une étude sur un programme de mise à disposition gratuite de données 3 a montré que l’opération avait permis la création de 90 emplois, de multiplier par dix le chiffre d’affaires de la filière des réutilisateurs, tout en divisant par cinq le coût unitaire de création des données, et de réduire de 40 % les frais de fonctionnement des services publics impliqués. Une économie pour les institutions publiques de 50 000 euros par an a même été réalisée ! De même, en Catalogne, la libération de données publiques a engendré un bénéfice annuel de plusieurs millions d’euros ainsi que des économies de 500 heures de travail mensuelles4.

Ces différents exemples montrent que la gratuité de l’accès aux données ne s’oppose pas à l’émergence d’une activité économique florissante du secteur privé, fondée sur la création de services associés aux données publiques sans surcoût pour le secteur public. Ainsi, l’innovation technologique est favorisée par un plus grand accès à ces données. Des données ouvertes donnent lieu à l’apparition d’outils informatiques qui facilitent leur traitement ; les entreprises démontrent leur savoir-faire et leur expertise à partir d’outils de traitement voire d’analyse de données, ou vendent des services plus classiques, par exemple, du conseil d’aide à la décision. À Paris, l’initiative de portail d’accès aux données publiques a déjà suscité plusieurs réutilisations, par des citoyens mais également des entreprises ayant par exemple utilisé les données mises en ligne pour valoriser leur savoir-faire en termes de traitement de l’information.

Quels types de frais les licences visent-elles à couvrir ?

Les articles 4 et 15 de la loi de 1978 stipulent précisément les motifs possibles de la mise en place de frais de licences : outre les coûts de reproduction ou éventuellement d’anonymisation, ces frais n’ont légalement pas de visée commerciale car ils ne peuvent excéder les coûts de production de la donnée cumulés à ceux engendrés par l’administration de ces licences. Mais, dans la réalité, on remarque que lorsque des frais de licences sont mis en place, ils arrivent à couvrir tout au plus les processus mis en place pour vendre les données. Une étude a démontré qu’en Angleterre, avant d’être gratuites, les données étaient achetées à 75 % par des acteurs du secteur public5. In fine, c’est le contribuable qui paie indirectement pour des données publiques auxquelles il n’a pas accès.

Regards Citoyens met à disposition gratuitement et, sous des conditions libres de réutilisation, toutes les données publiques que nous utilisons pour nos projets. Ce coût de mise à disposition est très faible, il est compris dans le coût d’hébergement de nos outils et de nos données, soit 150 euros par mois. Les processus sont sûrement plus lourds dans les institutions publiques mais la différence montre tout de même qu’il y a des abus et que des pratiques plus efficaces pourraient être mises en place. Ainsi dans les pays anglo-saxons, les plateformes de publication de données ont été éclatées et décentralisées, pour être au plus proche des services producteurs, et cela a permis de réduire les coûts. Pour autant, il existe dans ces pays une plateforme centralisée référençant les jeux de données publiés localement. Ce sont les sites data.gov ou data.gov.uk.

Concernant les licences, il est important qu’elles n’entravent pas la réutilisation, en excluant par exemple les usages commerciaux. En effet, la restriction à des usages non commerciaux n’est juridiquement pas définie et a donc tendance à décourager les réutilisateurs, y compris bénévoles. Un citoyen éditant un site qui utilise des données publiques et insère de la publicité pour couvrir ses frais d’hébergement ou un journaliste s’appuyant sur des données publiques dans son article font-ils un usage commercial des données publiques ? Une entreprise de cartographie qui met gratuitement en ligne des informations publiques fait-elle un usage non commercial de ces données ? En réalité, faire un distinguo entre une réutilisation commerciale ou un usage non commercial n’est pas pertinent. En effet, le monde de la donnée est dynamisé par la coproduction : un citoyen peut enrichir une donnée publique qui sera potentiellement réutilisée par une entreprise et inversement. La différenciation de ces usages, en plus d’être très floue juridiquement, induit une discrimination et le non-partage de ces données avec des tiers.

Non seulement de telles restrictions empêchent donc les institutions publiques, les citoyens et les entreprises de travailler ensemble, mais elles rendent les données incompatibles avec des projets non lucratifs comme Wikipedia ou OpenStreetMap qui ont pourtant démontré leur efficacité en termes de diffusion de l’information publique sur Internet.

En nous inspirant de ces projets, nous pensons que la seule restriction juridiquement viable est d’imposer une obligation de coproduction : lorsque le réutilisateur mélange les données publiques avec d’autres données, il doit mettre à disposition de tous les données résultantes. Cette solution ouvre la possibilité de demander une contribution financière aux réutilisateurs qui ne souhaitent pas contribuer à l’amélioration des données et permet de s’assurer que ces dernières ne sont pas dénaturées comme le demande la loi. La ville de Paris a fait ce choix d’une licence co-productive pour son projet « Open Data Paris ».

Ces frais ne peuvent-ils pas rémunérer les auteurs des données publiques ?

La majorité des données publiques ne sont pas soumises au droit d’auteur. Le droit d’auteur protège des œuvres originales de l’esprit dont on peut déterminer l’auteur6. Les données étant des « descriptions élémentaires, souvent codées, d’une réalité », c’est-à-dire des éléments chiffrés représentant une réalité, elles ne jouissent pas du statut juridique d’œuvre originale. En revanche, leurs producteurs se voient protégés par une autre notion juridique : le droit sui generis des bases de données qui reconnaît l’investissement lié à la création et à la structuration de l’information.

Une confusion entre droit d’auteur et données publiques peut tout de même s’opérer à la lecture de la loi de 1978. En effet, si elle garantit l’accès et la réutilisation des données publiques, elle prévoit tout de même quelques exceptions, notamment lorsque ces données sont contenues dans un document soumis au droit d’auteur (typiquement, les rapports produits par des acteurs privés) ou lorsqu’il s’agit de données patrimoniales (base de données bibliographiques par exemple). Ces points vont sans doute évoluer dans les prochains mois avec la révision de la directive Public sector information de 2003, transposée en droit français en 2005.

Pour les données publiques n’étant pas soumises au droit d’auteur, on ne saurait donc évoquer la rémunération des auteurs pour justifier la mise en place de barrières financières. Ce qu’il ne faut pas oublier, c’est que ces données sont nécessaires au bon fonctionnement de l’État : qu’elles soient mises à disposition ou non, elles sont produites et diffusées au sein des institutions publiques. Le prix des données est donc souvent survalorisé pour justifier le paiement de frais de mise à disposition. Par exemple, le coût de la licence pour la mise à disposition technique par la Direction de l’information légale et administrative (DILA) de la base de données des « questions écrites » des parlementaires, pour une réutilisation marchande ou non, s’élève à 6 480 euros par an7. Pour NosDeputes.fr, deux mois de travail nous ont permis de créer des outils qui rendent disponibles gratuitement et à tous des données comparables mises à jour toutes les quatre heures et enrichies des rapports parlementaires, des amendements, des discussions, etc.

Certaines expériences à l’étranger ont témoigné des échecs rencontrés par des portails gouvernementaux. Selon vous, quels seraient les facteurs de succès en la matière ?

Il faut que les citoyens se réapproprient les données publiques. En Angleterre, un travail a été mené par les Gouvernements successifs avec la société civile pour ouvrir l’accès aux données publiques. Ainsi, cela fonctionne d’autant mieux que des mouvements citoyens accompagnent les décideurs publics. En Grande-Bretagne, par exemple, le fondateur du web, Tim Berners-Lee, a aidé et poussé le Gouvernement vers l’ouverture d’un portail de données publiques. La communauté citoyenne y est encore peu développée mais l’Australie continue ses efforts et a ouvert en mars 2010 sa plateforme data.gov.au qui va certainement voir naître de nombreuses réutilisations innovantes et enrichissantes.

En ce qui concerne le projet de portail en France, la mission EtaLab, chargée de la création d’un portail interministériel des données publiques, a récemment été mise en place et commence ses consultations8. L’ingrédient important dans ces projets est l’implication des citoyens dans la réutilisation des données : nous nous sommes opposés à l’idée de création de barrières financières pour l’accès aux données publiques poussée par l’Agence du patrimoine immatériel de l’État (APIE).

L’animation de cette communauté peut être favorisée par des acteurs extérieurs. Ainsi, en France, deux répertoires en ligne de données publiques ont été créés : DataPublica, créé par trois start-up françaises (Araok, Nexedi et Talend), et notre initiative, NosDonnees.fr, qui vise à référencer toutes les données librement accessibles sans restrictions financières, ou d’usage. Ainsi, chacun peut librement accéder aux données publiques déjà référencées pour en tirer de nouvelles applications innovantes sans risque légal ou financier.
Un autre facteur essentiel de succès est l’accompagnement des réutilisateurs en offrant, comme nous le faisons modestement sur NosDonnees.fr, la possibilité de pouvoir contribuer, échanger sur les données et indiquer celles auxquelles les utilisateurs souhaiteraient avoir accès.

Que voulez-vous dire par « restrictions d’usage » ?

Il existe deux types de restrictions d’usage. La première consiste, comme nous l’avons évoqué, à imposer des restrictions juridiques à la réutilisation des données pour des usages dits « commerciaux ». La seconde est liée au format utilisé pour la mise à disposition des données. L’idée de la libération des données publiques est de les rendre accessibles à tous quels que soient le matériel et les logiciels informatiques des usagers. Pour garantir cet accès à tous de l’information publique, il faut donc utiliser des formats dont la recette est publique et non la propriété exclusive d’un seul acteur. Les formats dont la recette est disponible à tous sont appelés « formats ouverts ». Il faut savoir que les .doc ou les .xls ne sont pas des « formats ouverts » mais des « formats propriétaires » : l’entreprise américaine détentrice de cette recette peut potentiellement interdire l’usage de ces fichiers aux acteurs n’utilisant pas ses logiciels. Ainsi, un format de fichier propriétaire peut rendre difficile la lecture et la réutilisation des données qu’il contient et créer une discrimination entre les utilisateurs.

Enfin, il faut noter qu’il existe par ailleurs des restrictions à la concurrence : un rapport de la Commission européenne en avait recensé cinq cas en France9. Ainsi, certaines entreprises privées ayant obtenu des données publiques sont parvenues à s’assurer l’exclusivité de l’accès à ces données. La rareté des données augmente leur prix mais affecte également leur qualité : la possibilité de correction d’erreurs potentielles s’accroît avec la quantité d’utilisateurs. Au vu du grand nombre d’informations qu’elles contiennent, les bases de données comportent la plupart du temps des inexactitudes dues par exemple à des inversions lors de la saisie ou à des erreurs de calculs. Toutes ces restrictions peuvent ainsi poser de sérieux freins, tant à l’usage innovant des données, qu’à la qualité de celles-ci.

Références

1 : Arrêté du 22 janvier 2009 fixant le montant des rémunérations dues en contrepartie de la cession des licences de réutilisation de données de la base de données informatique du ministère de l’Économie, de l’Industrie et de l’Emploi relative aux prix des carburants. Le montant annuel de la rémunération à acquitter en contrepartie de la cession des licences est de 5 000 euros pour une licence de réutilisation à usage interne (pour les propres besoins du détenteur de la licence ou de l’entité juridique qu’il représente) commercial ou non.

2 : Rufus Pollock, The Economics of Public Sector Information, Cambridge Working Papers from Faculty of Economics, novembre 2008, University of Cambridge. Quelques études et enquêtes sur la question sont répertoriées sur le site wiki.linkedgov.org.

3 : The value of Danish address data : Social benefits from the 2002 agreement on procuring address data

4 : Étude de l’impact socio-économique de l’infrastructure de données géographiques dans la région de Catalogne

5 : Francis Maude, Minister for the Cabinet Office, 19 novembre 2010, Université de London Union, Open governement data conference 2010.

6 : Le principe de la protection du droit d’auteur est posé par l’article L. 111-1 du Code de la propriété intellectuelle qui dispose que « l’auteur d’une œuvre de l’esprit jouit sur cette œuvre, du seul fait de sa création, d’un droit de propriété incorporelle exclusif et opposable à tous. Ce droit comporte des attributs d’ordre intellectuel et moral ainsi que des attributs d’ordre patrimonial ».

7 : Les tarifs des bases de données du Journal Officiel. Cette base de données est librement consultable et sa réutilisation donne lieu à une licence si la masse de données concernée est substantielle et sa réutilisation récurrente. Ainsi l’insertion de citations ponctuelles dont la source serait citée dans le cadre d’un article, par exemple, n’entre pas dans ce cas de figure. En revanche, une utilisation massive et systématique de rapports ou productions de l’Assemblée nationale pourrait être concernée.

8 : Décret n° 2011-194 du 21 février 2011 portant création d’une mission « Étalab » chargée de la création d’un portail unique interministériel des données publiques (NDLR).

9 : Virginie Boillet et Louise Guerre, PSI Re-Use: Identification of potential exclusive agreements – France Report, 02/04/2010

jeudi 17 mars 2011

Les députés peuvent-il légiférer et contrôler le gouvernement seuls sans interroger les acteurs concernés par leurs réformes ? 577 individus, même élus du peuple, ne peuvent pas tout connaître des sujets sur lesquels l’Assemblée nationale se penche. Il est donc logique qu’ils interrogent et questionnent des acteurs publics et privés, syndicats ou associations. Mais qui auditionnent-ils donc ? Avec quels « experts », lobbyistes, représentants d’intérêt sont-ils en contact ? C’est pour répondre à ces questions que nous mettons à disposition, avec Transparence International France, une analyse et une application sur le lobbying.

3 000 internautes pour numériser 15 000 personnes auditionnées

Comme à notre habitude, nous sommes partis de documents publics : les 1 250 rapports parlementaires publiés entre juillet 2007 et juillet 2010. Ces rapports incluent régulièrement, en annexe, une liste des personnes auditionnées. Avec l’aide de plus de 3 000 internautes, nous avons référencé 15 000 individus intervenus lors de 9 000 auditions. Ces personnes représentaient au total près de 5 000 organisations.

Des chiffres bien différents des 130 organisations référencées dans le registre des lobbyistes tenu par l’Assemblée nationale. Cela pose un sérieux problème quant à la transparence de l’activité d’influence, si souvent critiquée. Autant les députés ont besoin d’interroger les acteurs impactés par leurs projets de loi, autant les citoyens ont le droit de savoir quels sont ces acteurs.

Le secteur public globalement plus écouté, le secteur privé se focalise sur certains thèmes

Toutes les données collectées sur ces auditions, part importante du processus parlementaire pour les lobbyistes, ont donc été cartographiées afin d’obtenir une vision plus factuelle du travail d’influence qui s’y opère.

Il ressort ainsi que les parlementaires auditionnent pour leurs rapports majoritairement les organisations publiques (48,3 %). Viennent ensuite les organisations représentatives (20,9 %), puis le secteur économique privé (16,4 %). La société civile n’est entendue qu’à hauteur de 7,5 %.

Nous avons également exploité les thèmes attribués par l’Assemblée à ses rapports. On peut noter que sur les thèmes « économie », « culture », « énergie », « internet », « médias » et « transports », le secteur privé (entreprises et leurs associations) est proportionnellement plus écouté. Les organisations représentatives (syndicats représentatifs, associations professionnelles, …) sont proportionnellement plus écoutées sur les thèmes traitant de l’agriculture, de la justice, des collectivités territoriales, des pouvoirs publics, de l’emploi et du sport. Enfin, les associations, fondations et ONG de la société civile sont plus écoutées que la moyenne sur les thèmes « femmes », « société », « anciens combattants » et « aide au développement ».

Le Parlement doit rendre le lobbying plus transparent

Le premier enseignement tiré de cette étude est la nécessité d’une plus grande transparence en matière de lobbying parlementaire : il n’est pas normal que seule une minorité de rapports des députés contienne la liste des personnes auditionnées (nous n’en avons trouvé que dans 38 % des rapports publiés depuis 2007). De même le registre des représentants d’intérêts devrait être révisé : il n’est pas normal qu’il ne recense que 130 organisations quand nous avons pu en dénombrer 5 000 durant ce travail.

Avoir un registre à l’image du travail effectif des parlementaires est dans l’intérêt de tous : sans transparence, le dialogue pourtant nécessaire entre les députés et la société pourra être suspecté de partialité. De plus, ce registre pourrait être un outil au service des députés : ils sont souvent désemparés face aux sollicitations des différents acteurs. Avoir un vrai registre qui encadre réellement les pratiques du lobbying, maintenue par l’institution, qui référence les groupes d’intérêt et leurs « expertises » devrait être le prochain défi à relever pour le parlement.

Comme pour toutes nos réalisations, en nous appliquant à nous même les principes de transparence que nous demandons aux institutions démocratiques, les outils et les données utilisés et créés dans le cadre de ce projet sont mis librement à disposition de tous sous licences libres.

mercredi 19 janvier 2011

Les usages des internautes évoluent vite. Suivre le rythme pour les institutions comme l’Assemblée nationale n’est pas toujours facile car les activités législatives et de contrôle s’inscrivent dans un temps beaucoup plus long que celui du numérique. Alors que NosDeputes.fr s’enrichissait notamment d’alertes e-mail à la rentrée passée, le site officiel du Palais Bourbon se parait d’une nouvelle présentation et d’un site de vidéo à la demande. Ces évolutions semblent n’être que le début d’une réflexion plus large menée par la chambre. En effet, le Bureau de l’Assemblée a chargé un comité baptisé CERESIAN (pour « Comité pour l’Étude et la Réflexion sur l’Évolution du Site Internet de l’Assemblée Nationale » ?) de trouver des pistes afin de répondre au mieux aux nouvelles attentes des internautes.

Ce comité, apparemment constitué d’administrateurs de l’Assemblée et de consultants externes (Tipik et Useo), travaille actuellement sur deux fronts : une approche visant à interroger un maximum d’utilisateurs du site d’un côté, et des auditions pour approfondir les thèmes avec des « personnalités qualifiées » d’autre part. Depuis décembre, l’Assemblée propose ainsi aux utilisateurs de ses services de répondre à une enquête publique en ligne. En parallèle, des contacts ont été pris pour organiser des « tables rondes » : du 11 au 17 janvier, le CERESIAN a auditionné successivement des journalistes, des députés ou des blogueurs, ainsi que divers acteurs de l’Internet.

Le site de l’Assemblée nationale entre 2000 et 2011 :

En 2000 En 2003 En 2008 Depuis 2010

Regards Citoyens est un gros utilisateur du site de l’Assemblée : nos robots consultent toutes les 4 heures plusieurs milliers de ses pages afin d’alimenter NosDeputes.fr. Nous avons également développé des fonctionnalités encore inexistantes sur le site officiel : identification de son député en un clic, moteur de recherche global, liens entre documents parlementaires, … Enfin, le site de l’Assemblée est synonyme d’une véritable fiabilité de l’information pour nous comme pour nos visiteurs, lesquels peuvent toujours se référer à la source de nos données. C’est sans doute pour ces raisons que le CERESIAN nous a convié à participer aux tables rondes. Nous nous sommes donc retrouvés jeudi dernier dans une salle de réunion face à 3 auditionneurs, sous le regard attentif de 3 administrateurs de l’Assemblée. Ce rendez-vous fut l’occasion d’exprimer à la fois notre retour d’expérience sur l’utilisation intensive de leur site, et nos souhaits pour l’amélioration pratique et démocratique de celui-ci.

Notre premier cheval de bataille, largement partagé par les internautes qui ont répondu à notre appel à suggestions : le respect des standards ouverts afin de garantir des contenus lisibles et accessibles par tous sur les équipements de leurs choix. Au programme de nos requêtes :

  • la disponibilité des amendements de commission sous un format web plutôt que les pdfs habituels ;
  • la disponibilité des différents calendriers de l’Assemblée (feuillles jaunes et vertes, agenda international, réunions des commissions, …) voire de l’agenda des députés eux-mêmes sous des formats iCal/vCal (suggéré également par mmu_man) ;
  • l’usage de formats libres pour les vidéos (suggestion de mmu_man et sxpert1) ;
  • l’abandon du flash (proposé par m3lampous) ;
  • l’accès par des urls uniques à l’ensemble des éléments du site (interventions d’un député, résultats d’une recherche, …).

L’OpenData était bien évidemment au programme de nos revendications : afin d’encourager les réutilisations et de faciliter les interactions avec d’autres services de l’État comme par exemple Légifrance (comme l’a proposé graoum), l’accès intégral et exhaustif aux données relatives aux travaux de l’Assemblée sous la forme de données lisibles par les machines serait un progrès fantastique. Qu’il s’agisse des interventions, amendements, textes parlementaires, votes, questions, calendriers ou encore métadonnées de la VOD, l’accès simplifié à ces données brutes permettrait à des initiatives comme NosDeputes.fr de voir le jour beaucoup plus facilement, et ceci de façon bien plus perenne. Le développement d’une API permettrait en plus d’encourager les usages pratiques comme la création de liens entre les éléments, par exemple entre les amendements et les débats ou les textes de lois en vigueur. Permettre à la société civile de créer des innovations citoyennes à partir de ses données, n’est-ce pas une garantie forte pour ancrer durablement l’Assemblée nationale dans le monde de l’Internet ?

OpenData ou pas, il nous a semblé important de souligner qu’une éventuelle refonte du site de l’Assemblée devrait s’accompagner d’une interaction, d’une ouverture et d’une transparence renouvelées de la part de l’institution. Compléter la quasi-exhaustivité du site en y ajoutant l’ensemble des informations disponibles électroniquement, notamment sur les votes publics (l’ensemble des votants et l’usage des délégations), serait un pas fondamental vers plus de transparence démocratique. De la même façon, permettre aux visiteurs de signaler des erreurs puis les informer de la prise en compte de leurs demandes offrirait plus de visibilité aux investissements humains réalisés par l’Assemblée. Cela permettrait de faire remonter les anomalies régulières identifiées par les milliers de visiteurs du site ou par les traitements automatiques réalisés par nos robots. En ce qui concerne les études d’impact, la publication des contributions des internautes devrait être de rigueur afin d’éviter toute suspicion d’instrumentalisation de cet outil de coproduction avec les citoyens.

Après cette présentation formelle, nous avons pu nous exprimer librement sur l’ergonomie du site actuel de l’Assemblée, sur la complémentarité avec NosDeputes.fr, ainsi que sur d’autres publications institutionnelles comme LégiFrance, le Journal Officiel ou le site du Sénat. D’autres personnes auditionnées au même moment ont rappelé l’importance de permettre aux utilisateurs d’exporter le contenu, afin d’aller chercher l’audience là où elle se trouve : sur les réseaux sociaux, sur les blogs, sur leurs sites personnels ou les forums. À ce titre, nous avons souligné l’ouverture dont fait preuve l’Assemblée en autorisant de nombreux acteurs à reprendre les documents produits. Cela fut l’occasion d’exprimer notre souhait de voir levée la clause non commerciale apposée à ces données publiques, source d’une grande précarité juridique. Sa suppression garantirait une plus grande diffusion des contenus, notamment sur des sites à but non-lucratif comme Wikipedia.

Que ressortira-t-il de tout ceci ? Dans un premier temps, un rapport devrait être publié en mars 2011. Pour la suite, seul le comité CERESIAN et le bureau de l’Assemblée le savent, mais nous attendons cela avec une grande curiosité !

lundi 22 novembre 2010

Illustration sous CC-by-sa par Regards Citoyens
inspirée du logo FOI du DCA de Grande-Bretagne.

L’OpenData est-elle un produit dangereux selon le gouvernement ? C’est ce que l’on peut craindre en lisant l’article 30 ter de la LOPPSI, ce projet de loi sur la sécurité intérieure qui revient en discussion cette semaine à l’Assemblée nationale, 9 mois après notre suivi en direct des premiers débats.

Par un simple amendement, le gouvernement a introduit, lors des débats au Sénat, une disposition pouvant soumettre à un contrôle de moralité les réutilisateurs de données publiques sous licence. Ces contrôles de moralité, définis en 1995 par la LOPS d’alors, sont aujourd’hui réalisés par des agents de police, notamment pour l’acquisition de la nationalité française pour des recrutements à des postes touchant à la sécurité nationale, ou encore pour la manipulation de produits dangereux.

Cette disposition ressemble donc à un bug législatif introduit par le gouvernement. Non seulement elle vient s’opposer au droit communautaire, mais elle réalise une grave confusion entre les données publiques accessibles via la CADA et les données personnelles régies par la CNIL.

En effet, l’accès aux données publiques est doublement protégé en France. Il est permis par la loi de juillet 1978 à travers le mécanisme des demandes d’accès aux documents administratifs. Il a été réaffirmé par la directive européenne PSI, transposée en 2005, qui stipule que la réutilisation de documents administratifs ne peut pas être discriminatoire. Imparfaite car sans réel pouvoir d’injonction, la CADA reste un outil indispensable, notamment pour les journalistes et les citoyens curieux d’en savoir plus sur le fonctionnement de nos institutions. En rendant discrétionnaire l’usage des documents et données administratives, le gouvernement introduit une véritable atteinte au droit de tout citoyen d’accéder à l’information publique.

Le gouvernement invoque la sécurité publique sous le prétexte d’assurer la sécurité de données personnelles, liées par exemple à l’immatriculation des véhicules (afin de les mettre à disposition notamment des industriels du secteur). Ces fichiers contenant des données personnelles, les lois existantes permettent déjà un même niveau de contrôle. L’imposer pour de simples demandes d’accès à des informations publiques apparait non seulement inutile, mais surtout totalement disproportionné.

La LOPPSI faisait déjà frissonner Internet par les atteintes qu’elle pourrait représenter en matière de neutralité des réseaux. Cette nouvelle mesure nous apparaît très grave : elle va à l’encontre totale des principes de l’OpenData dont nous faisons la promotion, et s’oppose plus largement à la liberté d’information. Regards Citoyens appelle donc tous les députés à rejeter cet article afin de corriger le bug introduit, nous espérons par erreur, par le gouvernement.

La table ronde sur les données publiques organisée vendredi soir à Paris, alors que les débats de l’Assemblée seront clos, sera notamment l’occasion de faire le point sur le rejet ou l’adoption par la représentation nationale de cette disposition.
Venez donc nombreux à la Cantine vendredi 26 novembre à partir de 19h !

La soirée sera retransmise en direct en vidéo par la Cantine avec UbiCast.

Edition du 23/11/10 : Pour des raisons de calendrier parlementaire, la conférence des présidents de l’Assemblée nationale a décidé ce midi de repousser au 14 décembre 2010 l’examen de la loi LOPPSI.

mardi 5 octobre 2010

Le début de la session ordinaire 2010 — 2011 offre une visibilité nouvelle sur Internet à l’activité des députés. Hier, au moment même où nous mettions en ligne une nouvelle version de NosDeputes.fr, l’Assemblée nationale dévoilait les dernières évolutions de son site.

Ces changements viennent renforcer la complémentarité des deux sites. La mise-à-jour de Assemblee-nationale.fr s’axe sur des améliorations visuelles avec une refonte de la charte graphique et — sans doute le plus intéressant — un accès aux vidéos des débats en hémicycle sur les 3 derniers mois.

De notre côté, nous nous sommes attelés à enrichir NosDeputes.fr afin d’offrir un accès plus simple et plus complet au travail parlementaire des députés. Nous nous sommes concentrés pour cela sur cinq axes.

L’une des plus fortes demandes, venant notamment des députés, était de compléter nos informations en intégrant les rapports parlementaires et les propositions de lois sur le site. Nous n’avions pas eu le temps de le faire en septembre 2009 pour notre première version, c’est désormais chose faite. Tous ces documents parlementaires sont accessibles et commentables depuis le site. Ils ont également rejoints les différents indicateurs d’activités.

Second axe important : permettre au citoyen d’identifier et retrouver rapidement son député. C’est maintenant possible dès la page d’accueil. En plus d’une carte de France permettant de chercher par département, le site permet de trouver son député en saisissant simplement un code postal ou le nom d’une ville.

L’amélioration de la recherche a également été au cœur de notre travail. Plus intuitive, celle-ci permet aujourd’hui de rechercher parmi l’intégralité des travaux parlementaires de la 13ème législature : 520 000 interventions, 90 000 questions écrites, 38 000 amendements, 3 000 rapports et propositions de loi. Un graphe présentant la répartition temporelle des résultats permet ensuite de réduire le cadre de sa recherche. Cette dernière peut également être affinée en filtrant les résultats suivant leur type, le député associé ou un mot-clé complémentaire.

En plus du suivi par flux RSS, chacun peut désormais être tenu informé par des alertes email de la publication de nouveaux éléments parlementaires relatifs à un député ou un mot-clé, ainsi que suivre facilement les commentaires.

Enfin, nous avons cherché à rendre plus visuelle l’activité des différents groupes politiques. Il est désormais possible de repérer l’appartenance de chaque député à un groupe depuis notre synthèse, page qui permet au visiteur de réaliser son propre classement. Cette dernière a également été enrichie d’un graphique montrant comment les groupes se répartissent chacune des activités de l’Assemblée nationale.

La coïncidence des mises-à-jour du site de l’Assemblée et de NosDéputés.fr montre qu’une coproduction indirecte entre les sphères institutionnelle et citoyenne est effective sur Internet. Alors que la première s’occupe de la publication officielle des documents parlementaires, la seconde réalise un travail de synthèse et de mise en forme de ces documents afin de les rendre plus accessibles aux citoyens.

lundi 16 août 2010

Nous nous apprêtions à vivre un véritable marathon. Numériser 16 860 noms à partir de 1 100 rapports était un défi qui allait prendre du temps : les moins optimistes d’entre nous tablaient sur 3 mois. Nous avions donc décidé pour rythmer cette campagne de procéder en deux temps. L’équipe de Transparence International France étant en congés, Regards Citoyens lançait l’initiative le 4 août, puis l’équipe de TI devait, à son retour en fin d’été, la relancer auprès de ses réseaux. Votre enthousiasme pour cette opération en a décidé autrement ! Hier soir, alors que nos partenaires sont encore en vacances, la barre des 100 % a été atteinte : tous les noms sont numérisés.

À peine 24h après le lancement de l’application, 10% des personnes auditionnées avaient été numérisées et l’engouement s’est confirmé les jours suivants avec un relai de plus en plus intense sur twitter et identi.ca ainsi que sur de nombreux blogs. Nous tenons donc à remercier très chaleureusement pour leur aide les 3 214 internautes (et notamment les plus motivés d’entre eux) qui sont venus numériser avec nous au moins un nom !

numerisation heure par heure
Participation des internautes à l’opération de numérisation heure par heure
CC-by-sa – Regards Citoyens

Qui sont donc ces citoyens volontaires qui ont offert quelques minutes de leur temps à ce projet ? Difficile de le dire, mais nous avons tout de même quelques pistes. Au vu de la baisse de participation durant le week-end, il s’agirait plutôt d’une majorité d’actifs que de vacanciers. La #PauseCafé, comme l’a baptisée ls01, a probablement joué un rôle crucial ! En observant la participation moyenne sur une journée, on peut remarquer trois pics de participations : à 10h, 15h et 22h.


Participation moyenne au cours d’une journée type
CC-by-sa – Regards Citoyens

Le fonctionnement de l’application a d’ailleurs soulevé de nombreuses questions parmi ses utilisateurs. Notamment comment s’assurer que les milliers de participants contribuaient réellement et ne remplissaient pas aléatoirement nos formulaires ? Pour le garantir, chaque nom a été traité par 3 à 7 internautes différents. Si deux d’entre eux indiquaient les mêmes informations pour chacun des champs saisis, nous considérions l’information valable. Sur les près de 17 000 noms à traiter en tout, nous n’avons été obligés de faire intervenir au moins un 4ème internaute que pour 2 500 d’entre eux. Cela n’était pas le fait de « vandalisme » : il s’agissait simplement de cas complexes pour lesquels une vérification accrue s’est montrée nécessaire et fructueuse.

Autre question fréquente : comment avions-nous pu repérer ces milliers de noms au sein des rapports ? Ce travail s’est déroulé en deux étapes. Il a fallu dans un premier temps identifier au travers de plusieurs dizaines de milliers de pages de rapports, les seules sections dédiées aux listes de personnes auditionnées. Ceci fait, nous nous sommes attelés à en retirer la seule information que nous pouvions identifier de manière automatique sans trop d’erreur : les noms des auditionnés. Nous avons procédé pour cela en deux temps : un premier programme identifiait les noms et prénoms en se basant sur une pratique commune à l’Assemblée de préfixer les noms par un « M. » ou « Mme » et quelques variantes. À partir de ces premiers résultats, un second logiciel est venu compléter la liste en utilisant les prénoms déjà identifiés pour s’assurer qu’aucune personne n’avait été oubliée. C’est ainsi que France étant également un prénom, certains d’entre vous se sont retrouvés confrontés à devoir signaler des lobbyistes qui n’en étaient pas, comme France Télévisions ou France Télécom.


Représentation graphique du repérage des personnes auditionnées dans deux rapports
CC-by-sa – Regards Citoyens

C’est à partir de cette première base de résultats que nous avons pu proposer une interface web d’utilisation la plus simple possible pour qualifier chacun des noms. Comme à notre habitude, tous les logiciels que nous avons réalisés pour ce projet sont diffusés librement (téléchargeable sous licence Affero-GPL). Développés en quelques jours, ces programmes sont perfectibles. Nous envisageons de les rendre plus génériques afin qu’ils puissent mieux profiter à la communauté.

Maintenant que cette première partie a été réalisée grâce à votre aide, il reste encore du travail : il faut désormais analyser les données et réfléchir avec TI à ce qu’il nous sera possible d’en tirer. Comme toujours, nous rediffuserons l’ensemble des données résultantes librement, mais d’ici quelques semaines seulement, le temps de voir avec la CNIL dans quelle mesure ces informations pourrons être partagées : contenant des données personnelles, même issues de documents publics, leur diffusion est moins évidente au regard de la législation que pour des données non nominatives.

Pour être tenu informé de l’évolution de ce travail, n’hésitez pas à vous inscrire à notre lettre d’information.

jeudi 5 août 2010
Vous aussi, numérisez un lobbyiste

Exercer sa vigilance citoyenne est désormais à portée de clic de tout internaute. Depuis hier, le collectif Regards citoyens a mis en place une vaste opération de « crowdsourcing », afin d’identifier et surtout de cartographier les lobbyistes qui œuvrent à l’Assemblée nationale. En clair ici, utiliser les capacités (et la tendance à procrastiner ?) d’un grand nombre d’internautes pour abattre une tâche à première vue fastidieuse.

[…]

Lire en ligne…

Un article de Sophie Gindensperger publié le 5 août 2010 sur Ecrans.fr

mercredi 4 août 2010

Un article d’Isabelle Barré paru dans Le Canard Enchaîné N° 4684 du 4 août 2010.

vendredi 23 juillet 2010
Le Figaro
Le Figaro

[…]

Regards citoyens maintient s’en être strictement tenu à «l’ensemble des critères définis par le règlement et le bureau de l’Assemblée». D’ailleurs, ce n’est pas tant cette «évaluation» que contestent les élus épinglés que les motifs de sanction. «Je suis étonnée que le seul critère retenu soit celui de la présence en commission.J’ai été présente à près de cinquante séances de nuit, et cela me paraît tout aussi important», explique ainsi Marie-José Roig, députée maire UMP d’Avignon. Favorable à une loi instaurant le non-cumul entre un mandat de parlementaire et une fonction exécutive locale, elle ajoute que, dans la situation actuelle, elle «privilégie la présence sur le terrain». À l’inverse, le député de Lyon Michel Havard, également sanctionné, juge le nouveau règlement «très juste». L’élu UMP reconnaît avoir «raté sept séances de commission du développement durable », mais justifie ses absences. Motif: une formation payée par l’Assemblée, suivie d’un stage «International Visitor» de quinze jours aux États-Unis.

[…]

Lire en ligne…

Un article et une interview par Sophie Huet publié dans Le Figaro N° 20 520 du 23 juillet 2010

Regards Citoyens est fièrement propulsé par WordPress

Contenu sous Creative Commons License sauf mention contraire.

Mentions légales - Contact Presse