Qu'est-ce que le Big Data ? - Consept - Assembleur de talents

Le Big Data, c’est quoi ?

Le Big Data, c’est quoi ?

 

Big Data

Cela fait déjà quelques années que les collaborateurs de la sphère « systèmes d’informations » collaborent de près ou de loin à des projets liés au Big Data. Avec le développement des possibilités, entre les objets connectés et l’Internet des objets (IoT), la sphère « systèmes industriels » passe aussi au Big Data. Mais, qu’est-ce que le Big Data ?

 

Le Big Data désigne un ensemble très volumineux de données qu’aucun outil classique de gestion de bases de données ou de gestion de l’information ne peut vraiment travailler. Ce sont des informations qui proviennent de partout. 

 

Ce phénomène se caractérise surtout par son objectif dont l’ambition est de tirer un avantage économique de l’analyse quantitative des données disponibles pour une entité. Inventé par les géants du web tels que Facebook et Google, le Big Data se présente comme une solution dessinée pour permettre à tout le monde d’accéder en temps réel à des bases de données géantes. Il vise à proposer un choix aux solutions classiques de bases de données et d’analyse.

 

Ce concept regroupe une famille d’outils qui répondent à une problématique générale. Il s’agit notamment des 7 V pour Volume, Vitesse, Variété, Véracité, Variabilité, Visualisation et Valeur. Pour donner un ordre de grandeur, un giga n’est rien face au Big Data.

 

Pour une entreprise, les données peuvent venir, en interne, de la CRM, de l’ERP ou du PLM et, en externe, de l’open data. Un certain nombre de données sont disponibles grâce à l’IGN (Institut national de l’information géographique et forestière) ou encore grâce à l’INSEE. Ces données sont accessibles sur data.gouv.fr ou sur data-publica.com.

 

Un des intérêts majeurs du Big Data est l’impact qu’il a eu sur l’organisation de la production et sur la culture projet.

 

Auparavant, les cultures étaient souvent architecturées selon un mode où chaque système était en silo par rapport à son niveau de service opérationnel mais aussi par rapport aux métiers : le commerce avait une gestion de la relation client, la comptabilité avait son espace, ses études. Chaque espace était cloisonné. D’autre part, chaque application avait ses propres ressources en termes de serveurs. Lorsqu’un système nécessitait d’évoluer afin de passer à la taille supérieure, un certain nombre d’études de montée en charge étaient réalisées au préalable.

 

Le Big Data n’est pas organisé comme tel. Il se base sur des groupements de serveurs où toute la data et tous les moyens de calculs sont disponibles au plus grand nombre : le fait de casser les silos et d’être en architecture distribuée sont des fondamentaux de la Big Data.

 

En parallèle, l’impact sur les organisations est aussi une révolution car les structures les plus traditionnelles peuvent évoluer. Le DSI (Directeur des Systèmes d’Information) devient force de proposition en devenant un CTO (Directeur de la technologie) intégrant la R&D et les statistiques, les métiers ne gardant que leur BI (Informatique décisionnelle).

 

Pour mener à bien un projet de Big Data, une équipe doit être composée des talents suivants : un data scientist (spécialisé en mathématiques et surtout en statistiques), un data engineer (spécialisé en database et en développements), un data analyste (expert dans son domaine métier) et un data manager (pouvant comprendre et organiser le projet tout en gérant les interactions avec le hors projet).

 

NoSql, NewSql ou encore Hadoop seront des suites à cette introduction sur le Big Data.

 

Article publié le 06/08/2018.

Suivez Consept sur Linkedin