On trouve énormément de données sur internet. Une partie de ces données est publique, par exemple le site data.gouv.fr recense un grand nombre de données publiques. Ces données sont librement réutilisables.


Qu'est-ce qu'une donnée?

Une donnée est une valeur attribuée à une entité pour la décrire. Il peut s’agir d’un objet, d’une personne, d’un événement ou par exemple d’un numéro de téléphone. L’information est l’interprétation que l’on fait d’une donnée.
Les données peuvent être renseignées par un humain, comme lorsque nous nous inscrivons sur un site qui nous incite à renseigner nos données personnelles pour créer un compte. Les données peuvent aussi être capturées et enregistrées par un dispositif matériel, comme les caméras de surveillance à reconnaissance faciale.


Les bases de données

Pour retrouver et traiter des données facilement, on les organise sous forme d’un tableau appelé table de données. Une collection regroupe des objets partageant les mêmes descripteurs. Un objet est donné par la liste des valeurs de tous ses descripteurs. Les données sont alors dites « structurées »


Métadonnée

Une métadonnée est une donnée particulière qui donne des informations sur la donnée principale, comme le titre d’une vidéo. Les données personnelles sont souvent associées à de nombreuses métadonnées qui donnent davantage d’informations sur le fichier principal et sur leur propriétaire. Ces métadonnées varient selon le type de fichier qu’elles décrivent.


Formats de fichiers

Pour assurer leur persistance et leurs échanges, les données sont stockées sous différents format sous forme de fichier. Un format de données est un mode d’organisation des données qui les rendent lisibles, faciles à mettre à jour, échangeable et pérennes.

- Les principaux formats de fichiers:

- Quelques formats ouverts de données :

Un format de données est dit ouvert (ou libre) si son mode d’organisation a été rendu public par son auteur et qu’aucune entrave légale ne s’oppose à sa libre utilisation (droit d’auteur, brevet, copyright).