Big Data II (2)
L’émergence du Big Data n’est pas seulement une affaire de quantité. Elle se traduit par des transformations multiples.
- La possibilité d’analyser des quantités de données croissantes : non seulement nous pouvons stocker sans cesse davantage, mais nous pouvons les traiter massivement,
- L’acceptation de l’approximation et du désordre, car l’abondance des données rend moins nécessaire l’exactitude : « Quand la donnée était rare, chaque donnée élémentaire était critique, aussi il fallait faire attention pour ne pas créer de biais dans l’analyse. Aujourd’hui nous ne vivons plus dans une situation de manque d’informations. Ayant affaire à des ensembles de données de plus en plus complets, qui captent non plus seulement une petite tranche d’un phénomène à portée de main, mais beaucoup plus, voire tout, nous n’avons plus à nous soucier autant que des données élémentaires biaisent l’analyse globale. »
- La recherche des corrélations plutôt des causalités : « Dans le monde du Small Data, montrer que des intuitions de causalité sont fausses prend du temps. C’est en train de changer. Dans le futur, des corrélations issues du Big Data seront utilisées pour réfuter des intuitions de causalité, en montrant que souvent il n’y a rien qu’une relation statistique entre l’effet et la cause supposée. » (1)
Autre différence majeure avec le monde des choses matérielles, le fait de se servir des données ne les épuise pas : « La valeur des données ne diminue pas quand on s’en sert. Elles peuvent être traitées encore et encore. L’information est ce que les économistes appellent un bien « sans rivalité » : l’utilisation par une personne n’empêche un autre de s’en servir. »
Au contraire, plus on s’en sert, plus de nouvelles idées naissent et de nouvelles valorisations aussi. Mais ceci n’est pas sans poser des problèmes…
(à suivre)
(1) Attention, le monde du Big Data n’est pas non plus un monde sans hypothèses préalables : « Le Big Data est lui-même une théorie. Par exemple, il emploie des théories statistiques et mathématiques, et parfois aussi de la théorie informatique. (…) De plus, parce que le Big Data repose sur des théories, nous ne pouvons nous en extraire. Elles conditionnent à la fois les méthodes et les résultats. Cela commence avec la façon de choisir les données. »