L’enjeu Big Data : le comprendre et l’apprivoiser


Big Data is like teenage sex : Everybody talks about it, Nobody really knows how to do it, Everyone thinks everyone else si doing it, So everyone claims they are doing it…

Alors, qu’est ce que c’est que le Big Data ?

Le Big Data est défini comme étant « l’ensemble des informations produites par l’ensemble de nos actions« , le tout constitue une base de données sur-géante à exploiter ! Noms, e-mails, achats, transactions bancaires, affinités, trajets en voitures, abonnements, lectures… Tout ce que nous faisons génère une donnée. Le Big Data c’est toutes ces données réparties chez tout le monde !

En 2003 , nous générions 5 exabytes de données dans l’année, aujourd’hui nous atteignons les 5 exabytes en moins de 2 jours ! Internet, objets connectés, smartphones, stratégies Data et tracking y sont pour quelque chose…

Aujourd’hui, le Big data est le nerf de la guerre pour la croissance des sociétés, certaines sociétés françaises commencent à peine depuis quelques années à vraiment conscience. Il s’agit de prendre part au jeu, quelque soit la position sur la chaine de valeur, pour être au cœur du système.

Une sensibilisation aux outils et l’utilisation des data permettra de monter rapidement en compétences et en intelligence par rapport aux non data analysts. Une expertise permet de se positionner dans des entreprises de haut niveau et de se développer positivement.

Les Marchés de la Big Data qui vont exploser !

On l’aura compris, la Data est partout! Il y a cependant des secteurs qui seront plus à même d’exploiter, analyser, travailler ces informations :

  • La santé : Google investit aujourd’hui beaucoup plus que Sanofi dans le traitement des Datas. Bien sûr, arrive toujours très rapidement la notion éthique, de confidentialité de la donnée.
  • L’agroalimentaire : météos, différents types de cultures, localités, toutes les données sont analysées et croisées afin de proposer de nouvelles méthodes d’exploitation des terres. Une meilleure utilisation de nos ressources ?
  • L’automobile : analyses comportementales des automobilistes, de la météo, des accidents… la question du traitement de la donnée se pose notamment avec les projets de voitures autonomes
  • Le Prédictif : le Big Data en tant que boule de cristal ? Cette analyse est répandu notamment dans le Baseball avec de l’analyse sur les joueurs, les paris en ligne, les campagnes présidentielles,…
  • La Maison / Domotique : nos données du quotidien valent de l’or ! La façon dont on mange, dont on dort, dont on interagit avec notre univers,… sont autant d’informations utiles dans la réalisation de nouveaux produits.

Espionnage à des fins mercantiles ou traitement intelligent pour la réalisation de nouveaux produits ?

Utiliser le Big Data : La méthode des 7’C

Vous vous en doutez, on n’utilise pas le Big Data n’importe comment ! Il s’agit de mettre en place une méthode claire, d’avancer « agile », pas à pas.

Pour se faire, il existe la Méthode dite des 7’C :

  • Choose your questions : « Augmenter les ventes de 5% ? » Il s’agit de définir clairement ses objectifs. Le big data n’est pas une solution en soi mais un moyen de résoudre un problème existant. Ou est-ce qu’on dépense de l’argent inutilement ?
  • Collect your data : Choisir les bonnes données, faire le tri dans toutes celles qui sont disponibles.
  • Check out your data : Consulter vos données
  • Clean up your data : une base de données peut contenir des infos inutiles.
  • Chart your analysis : Proposer une charte spécialement dédiée aux analyses.
  • Customize your analysis : Mise en forme et customisation de l’analyse de données fera notre différence.
  • Communicate your results : Les analyses peuvent être bien, mais si on ne peut pas les communiquer, on y perd de l’intérêt et pertinence. Il s’agit ainsi de préparer l’auditoire (responsables de services, directions, conseils d’administration…) aux principes et enjeux du Big data, à l’analyse de données ou de certains résultats. La mise en forme et l’annonce des résultats compte autant que le traitement lui même.

Véracité des données et interprétation des résultats

Parlant de traitement de la data et interprétation, un site américain nous présente des corrélations de données … incohérentes !
Source : https://tylervigen.com/
Nombre de personnes noyées dans une piscine VS les sorties de films de Nicolas Cage
Consommation par habitant de fromage mozzarella (US) VS Nombre de diplômes en Ingénierie civile délivrés (US)

En somme, le big data se développe à grand pas, les agences spécialisées restent encore couteuse, cette nouvelle forme d’analyse est complexe et seules les grandes entreprises osent s’y frotter. Cependant, à plus petite échelle il existe des solutions et de soutils pour penser autrement et considérer ce nouvel enjeu.

Continuer la lecture ....