• contenu
  • menu
  • pied de page

OpenData


Les données (Data)⚓

Mais qu'appelle-t-on les données (data) ?⚓

Dans son Rapport au Premier ministre sur la gouvernance de la donnée, l'Administrateur général des données de l'État propose la définition de la donnée numérique :

Une donnée numérique est la description élémentaire de nature numérique, représentée sous forme codée, d'une réalité (chose, événement, mesure, transaction, etc.) en vue d'être :

  • collectée, enregistrée ;

  • traitée, manipulée, transformée ;

  • conservée, archivée ;

  • échangée, diffusée, communiquée.

Rappel : Ne pas confondre données et informations

On peut penser que données et informations veulent dire la même chose.

exemple :

"Les dernières données de l'économie rendent la France optimiste" est une phrase interchangeable avec "Les dernières informations de l'économie rendent la France optimiste".

En fait ce n'est pas le cas.

Les données doivent être traitées, manipulées, transformées ou encore croisées pour aboutir à une information qui a du sens. Elles nécessitent une interprétation pour devenir une information.

Complément : Les métadonnées

Un jeu de données sans les métadonnées n'a pas beaucoup de sens.

Les métadonnées sont les données qui décrivent un jeu de données à proprement parler. Il s'agit d'un ensemble de champs décrivant les données, tels qu'un titre, une description, une liste de mots-clés, une date de modification. Il est important d'ajouter des métadonnées à un jeu de données afin de s'assurer qu'il puisse être détecté, compris et réutilisé par les utilisateurs. Dans certains cas, elles peuvent également être essentielles en termes d'interopérabilité, afin de garantir que les autres systèmes sont en mesure d'interpréter le contenu du jeu de données.

OpenData⚓

Les données ouvertes ou Open Data sont des informations accessibles librement et gratuitement, sous la forme de fichiers respectant des formats interopérables. Open data se traduisant par "données numériques ouvertes".

Ces données ouvertes peuvent être d'origine publique : émanant des services publics, de collectivités, de communes ...etc. Ces données peuvent également être d'origine privée : provenant d'entreprises et d'institutions dont les données concourent à des projets d'utilité publique, comme par exemple la SNCF, la RATP .. etc.

Il existe quelques exceptions :

  • Les données à caractères personnels ;

  • Les données en rapport à la sécurité nationale ;

  • Les données des entreprises lorsque cela concerne le droit des affaires.

Attention : BigData

Le bigdata comme son nom l'indique correspond à des données volumineuses, donc complexes à traiter surtout dans le cadre de l'éducation.

On pense plus à des données personnelles : sécurité sociale, les GAFA, ...

Mais on a aussi les données du CNES, de Inserm, Météo ... etc.

Complément :

Les données publiques sont considérées comme ouvertes si elles répondent à ces 8 principes (2007, Open Government Data, USA)

  • Complètes : toutes les données doivent être rendues disponibles sauf les données pouvant porter atteinte à la vie privée des citoyens ou à la sécurité ;

  • Primaires : les données doivent être brutes, telles qu'elles ont été collectées à la source, non agrégées, non modifiées ;

  • Récentes et actualisées : elles doivent être rendues disponibles aussi vite que possible afin de préserver leur valeur ;

  • Accessibles : les données sont disponibles au plus large spectre d'utilisateurs ;

  • Exploitables : elles doivent être structurées et documentées afin de permettre un traitement informatisé ;

  • Accès non discriminatoire : elles sont disponibles à tout le monde de façon anonyme ne nécessitant pas d'enregistrement ;

  • Format non propriétaire : elles doivent être rendues disponibles au moins dans un format sur lequel aucune entité ne détient le monopole (ex : non PDF, non Excel) ;

  • Libre de droits : les données ne doivent pas être l'objet de droits d'auteurs, marques déposées, brevets, etc.

Rappel :