Romain Rissoan

logo

Consultant formateur Big Data Lyon

Consultant Formateur Indépendant en Big Data, j’interviens principalement sur Lyon, Paris et Marseille comme Expert en Big Data. J’interviens pour des PME et des grands groupes. Mon discours et mes formations sont dédiées à des décideurs ou des managers en vue de réflexions sur les positions stratégiques en lien avec le Big Data. J’interviens alors comme conférencier expert en Big Data.

Mes contenus de Formateur Big Data

Big Data en deux mots

La définition du Big Data est : des données plus diversifiées, un volume accru et une vitesse plus élevée. C’est ce qu’on appelle les trois « V ».
En d’autres termes, le Big Data est constitué d’ensembles de données complexes, provenant pour la plupart de nouvelles sources. Ces ensembles de données sont si volumineux que les logiciels de traitement de données traditionnels ne peuvent pas les traiter. Mais cette énorme quantité de données peut être utilisée pour résoudre des problèmes que vous ne pouviez pas résoudre auparavant.
Deux autres « V » ont vu le jour ces dernières années : valeur et véracité. Les données possèdent une valeur intrinsèque. Mais cela ne sert à rien tant que cette valeur n’est pas découverte. Tout aussi important : dans quelle mesure vos données sont-elles véridiques – et dans quelle mesure pouvez-vous vous y fier ?
À l’heure actuelle, le Big Data revêt une importance capitale. Pensez à certaines des plus grandes entreprises de technologie du monde. Une grande partie de la valeur qu’ils offrent provient de leurs données qu’ils analysent en permanence pour accroître leur efficacité et développer de nouveaux produits.
Les avancées technologiques récentes ont réduit de manière exponentielle le coût de stockage et de calcul des données, ce qui facilite plus que jamais leur stockage. Un plus grand volume de Big Data étant maintenant plus économique et accessible, vous êtes en mesure de prendre des décisions commerciales plus précises.
Trouver de la valeur dans le Big Data ne consiste pas seulement à l’analyser (ce qui est un avantage supplémentaire). C’est un processus de découverte complet qui nécessite des analystes perspicaces, des utilisateurs professionnels et des dirigeants qui posent les bonnes questions, reconnaissent les tendances, fassent des suppositions éclairées et prédisent les comportements.
Bien que le concept de Big Data soit relativement nouveau, les grands ensembles de données remontent aux années 60 et 70, lorsque le monde des données commençait à peine à démarrer avec les premiers datacenters et le développement de la base de données relationnelle.
En 2005, on assista à une prise de conscience de la quantité de données que les utilisateurs généraient sur Facebook, YouTube et autres services en ligne. Hadoop (une infrastructure open source créée spécifiquement pour stocker et analyser les jeux de Big Data) fut développé cette même année. NoSQL commença également à être de plus en plus utilisé à cette époque.
Le développement d’infrastructures open source telle que Hadoop (et, plus récemment, Spark) a été primordial pour la croissance du Big Data, car celles-ci facilitent l’utilisation du Big Data et réduisent les coûts de stockage. Depuis, le volume du Big Data a explosé. Les utilisateurs génèrent toujours d’énormes quantités de données, mais ce ne sont pas seulement les humains qui les utilisent.
Avec l’avènement de l’Internet of Things (IoT), de plus en plus d’objets et de terminaux sont connectés à Internet, collectant des données sur les habitudes d’utilisation des clients et les performances des produits. L’émergence du machine learning a produit encore plus de données.
Si le Big Data ouvre des perspectives intéressantes, il n’en présente pas moins certains écueils.
Premièrement, le Big Data est… volumineux. Même si de nouvelles technologies ont été mises au point pour le stockage des données, les volumes de données doublent environ tous les deux ans. Les entreprises éprouvent toujours des difficultés à maîtriser leur croissance et à trouver des moyens de les stocker efficacement.
Mais il ne suffit pas de stocker les données. Pour être utiles, celles-ci doivent être exploitées et, en amont, organisées. Des données propres, ou des données pertinentes pour le client et organisées de manière à permettre une analyse significative, nécessitent beaucoup de travail. Les spécialistes des données passent 50 à 80 % de leur temps à organiser et à préparer les données avant leur utilisation.
Enfin, la technologie du Big Data évolue rapidement. Il y a quelques années, Apache Hadoop était la technologie la plus utilisée pour traiter le Big Data. Puis, Apache Spark fit son apparition en 2014. Actuellement, l’association des deux infrastructures semble constituer la meilleure approche. Maîtriser la technologie du Big Data est un enjeu continu

Contenu de formation big data

Aux origines du big data : le monde des données numériques, la e-santé, la chronologie. Définition des quatre V : La source des données. Rupture : Modifications de la quantité, de la qualité, des habitudes. La valeur des données : Changement significatif. Les données comme matière première. Le quatrième paradigme de la découverte scientifique
Collecte de données​​: Crawling, scraping.
Gestion des flux d’événements (traitement d’événements complexes, CEP).
Indexez le flux entrant.
Intégration avec les données héritées.
Qualité des données : le Cinquième V ?
Différents types de traitement : recherche, apprentissage (machine learning, traitement transactionnel, data mining).
Autres modèles de lien : Amazon, eHealth.
Un ou plusieurs référentiels de données ? De Hadoop à la mémoire. De l’analyse tonale à la découverte des connaissances
Modèles architecturaux pour les clouds publics et privés.
Services XaaS.
Objectifs et avantages de l’architecture cloud.
Infrastructure.
Différences entre le cloud computing et le big data.
Stockage en ligne.
Classification, sécurité et confidentialité des données.
Structure en tant que taxonomie : non structurée, structurée, semi-structurée.
Classées par cycle de vie : données temporaires ou permanentes, archives actives.
Difficultés de sécurité : augmentation du nombre, répartition.
Philosophie et objectifs des données ouvertes.
Publication de données publiques.
Difficile à mettre en œuvre.
Les caractéristiques essentielles des données ouvertes.
Champs d’application.
Bénéfices attendus.
L’utilisation de serveurs, de disques, de disques réseau et SSD, l’importance de l’infrastructure réseau.
Architecture cloud et architectures plus traditionnelles.
Avantages et difficultés.
Consommation électrique : serveur (IPNM), disque (MAID).
Stockage d’objets : principes et avantages.
Stockage d’objets par rapport au stockage traditionnel NAS et SAN.
Architecture logicielle.
Niveau de mise en œuvre de la gestion du stockage.
Stockage défini par logiciel.
Architecture centralisée (système de fichiers Hadoop).
Architectures peer-to-peer et hybrides.
Interfaces et connecteurs : S3, CDMI, FUSE, etc.
L’avenir des autres stockages (NAS, SAN) par rapport au stockage objet.
Face à l’augmentation du volume, économisez sur la durée.
Sauvegarde, en ligne ou locale ?
Archives traditionnelles et archives actives.
Liens vers Storage Hierarchy
Management : The Future of Tape.
Réplication multisite.
Dégradation des supports de stockage
Les méthodes analytiques sont classées en fonction du volume de données et de la puissance de traitement.
Hadoop : modèle de traitement Map Reduce. Écosystème Hadoop : Hive, Pig.
Difficultés avec Hadoop.
Gestionnaire de données OpenStack et Ceph.
Gestion d’événements complexes : un exemple ?
De l’intelligence d’affaires au big data.
Prise de décision et transactionnalité des mises à jour : bases de données NoSQL.
Typologie et exemples.
Ingestion et indexation des données.
Deux exemples : Splunk et Logstash.
Robot d’exploration open source.
Recherche et analyse : Elasticsearch.
Étude : Mahout. en mémoire.
Visualisation : Live or Not, Cloud (Bime), Comparaison QlikView, Tibco Spotfire, Tableau.
Architecture générale pour l’exploration de données via le Big Data.
Attente : besoins des utilisateurs de l’entreprise, maintenance des équipements.
Sécurité des personnes, détection de fraude (postale, fiscale), réseau.
Suggérer. Analyse marketing et analyse d’impact.
Diffusez du contenu vidéo.
Le big data dans l’industrie automobile ? Pour l’industrie pétrolière ?
Doit-on se lancer dans un projet Big Data ?
Quel avenir pour les données ?
Gouvernance des Data Stores : Rôles et recommandations, Data Scientists, Compétences pour les projets Big Data.

Ma FAQ de Formateur Big Data

Il existe de nombreuses raisons d’utiliser le big data. Avec autant de données disponibles, les entreprises peuvent mieux comprendre leurs clients et prendre des décisions plus éclairées. Le big data peut également aider les entreprises à améliorer leurs opérations et à faire de meilleures prévisions pour l’avenir. Le big data peut être particulièrement utile dans les secteurs qui traitent de grandes quantités de données, comme les soins de santé.
Les mégadonnées sont précieuses car elles permettent aux systèmes informatiques de faire des prédictions et des décisions meilleures et plus précises. Par exemple, l’analyse prédictive peut aider les entreprises à prendre de meilleures décisions financières en identifiant les tendances et les opportunités que les humains ne peuvent pas voir. Cela peut également permettre aux systèmes d’identifier les criminels ou les terroristes plus tôt que les êtres humains en analysant de grandes quantités de données. La capacité de collecter rapidement et facilement de grandes quantités de données permet aux ordinateurs de les analyser et de faire des prédictions à leur sujet beaucoup plus rapidement que les êtres humains. Cela a un impact profond sur la façon dont les entreprises, les gouvernements et les gens ordinaires fonctionnent. Cela leur permet de mieux répondre à leurs besoins et de répondre aux exigences de la société.

Il est facile d’utiliser les mégadonnées pour répondre aux questions sur le passé et le présent. Par exemple, les données historiques peuvent être utilisées pour prédire avec précision des événements futurs tels que des attaques terroristes ou des catastrophes naturelles. Les gouvernements, les entreprises ou les particuliers peuvent également utiliser les mégadonnées pour collecter des informations sur un sujet spécifique afin de pouvoir répondre à des questions spécifiques ou résoudre des problèmes de société. Cela a un effet profond sur la société car cela affecte la façon dont les gens pensent à des questions comme la criminalité, la santé ou le commerce. Les données recueillies à partir de sources physiques telles que des villes ou des parcelles de terrain peuvent être utilisées pour prédire les tendances de la criminalité ou d’autres problèmes sociaux afin que des solutions puissent être mises en œuvre avant que les problèmes ne deviennent incontrôlables. La collecte de ce type de données devient plus facile à mesure que les ordinateurs deviennent plus puissants, ce qui permet de trouver des réponses plus précises.
Les entreprises peuvent investir dans le big data de plusieurs façons. L’une d’elles consiste à acheter ou à louer de la capacité de stockage et de la puissance de calcul auprès d’un fournisseur de big data. Cette solution peut s’avérer coûteuse, mais elle est intéressante pour les entreprises qui ne disposent pas des ressources nécessaires pour mettre en place leur propre infrastructure de big data. Une autre façon d’investir dans le big data est acheter un logiciel qui aidera les responsables à donner un sens à toutes ces données. Ces logiciels peuvent être coûteux, mais c’est un investissement nécessaire pour les entreprises qui veulent tirer le meilleur parti de leurs big data. Enfin, les entreprises peuvent également investir dans la formation de leurs employés à l’utilisation efficace du big data. Il s’agit souvent d’un bon investissement pour les entreprises qui veulent s’assurer que leurs employés sont en mesure d’utiliser efficacement le big data

Le Big Data est un grand nombre de données collectées à partir de différentes sources. Elles sont généralement collectées et analysées rapidement, ce qui les rend utiles à certaines fins commerciales. Par exemple, les mégadonnées peuvent être utilisées pour prédire le comportement des clients afin que les entreprises puissent fournir un meilleur service client. Il peut également être utilisé pour créer de nouveaux produits que les clients adoreront, tels que des appareils intelligents pour la maison ou des véhicules autonomes. Investir dans le Big Data est un moyen essentiel pour les entreprises de rester compétitives dans l’économie actuelle axée sur les données. Une autre raison pour laquelle investir dans le Big Data est une bonne idée est qu’il a de nombreuses utilisations différentes autres que la simple collecte de données. Il peut être utilisé pour créer de nouveaux produits que les clients adoreront, tels que des appareils intelligents pour la maison ou des véhicules autonomes. Il peut également être utilisé pour tout comprendre sur un client afin que les entreprises puissent lui proposer de meilleures offres et de meilleures expériences. Cela fait du big data un outil essentiel pour toute entreprise, car il leur donne accès à des informations précieuses auxquelles elles n’auraient pas accès autrement. D’un autre côté, il y a certains inconvénients à investir dans le big data, comme le fait que tout le monde n’est pas d’accord sur la façon dont il doit être utilisé. Une autre façon d’utiliser les mégadonnées consiste à fournir des informations que les responsables gouvernementaux utilisent pour prendre des décisions. Cela peut être utile dans certaines situations, mais toutes les applications de Big Data ne sont pas morales ou éthiques.
Il n’existe pas de réponse unique à cette question, car les big data peuvent avoir des significations différentes selon les personnes. En général, le big data fait référence aux quantités massives de données que les entreprises ont maintenant à leur disposition. Ces données peuvent provenir de diverses sources, notamment des médias sociaux, des capteurs et des transactions. Les big data peuvent être difficiles à les big data ne sont pas toujours faciles à gérer et à comprendre, mais elles peuvent être extrêmement précieuses pour les entreprises qui savent comment les utiliser. Grâce au big data, les entreprises peuvent mieux comprendre leurs clients, améliorer leurs opérations et faire de meilleures prévisions pour l’avenir.

L’un des principaux avantages du Big Data est qu’il peut être utilisé pour analyser les tendances et le comportement de la société humaine. Ceci est utile pour les institutions privées et publiques qui collectent des informations sur la population. Par exemple : les entreprises peuvent utiliser le Big Data pour mieux comprendre leur clientèle, prévoir les besoins des clients et prendre des décisions marketing. En outre, les institutions publiques peuvent utiliser les mégadonnées pour évaluer les problèmes sociaux et prendre des décisions politiques. Par exemple, la police pourrait utiliser les mégadonnées pour identifier les zones où le crime est le plus susceptible de se produire. Ce type d’analyse fournit une compréhension beaucoup plus approfondie du comportement humain que les systèmes de bases de données traditionnels ne sont capables de fournir. Elle conduit à une meilleure prise de décision lorsqu’elle est appliquée aux problèmes de société. Le Big Data peut également être utilisé pour prédire les tendances futures et faire des prédictions sur la façon dont les gens agiront à l’avenir. Les gouvernements, les entreprises et d’autres institutions peuvent utiliser ces informations pour planifier des événements futurs et prendre des décisions éclairées. Par exemple : les entreprises pourraient utiliser le Big Data pour comprendre comment les gens achètent et ce qu’ils achètent en fonction de leurs achats précédents. De cette façon, ils pourraient cibler plus précisément les campagnes marketing et planifier les tendances saisonnières de la demande. Les prédictions fournies par ce type d’analyse sont beaucoup plus précises que celles fournies par les méthodes traditionnelles. Puisqu’il est basé sur des informations détaillées sur la société humaine, il est extrêmement utile lorsqu’il est appliqué à la prise de décision.
Il existe plusieurs façons de rapprocher le big data et les RH. L’une d’elles consiste à utiliser le big data pour faciliter le recrutement. Les entreprises peuvent utiliser le big data pour identifier les candidats potentiels et les faire correspondre aux postes ouverts. De plus, le big data peut être utilisé pour filtrer les candidats et prédire lesquels sont les plus susceptibles de réussir dans un rôle particulier.

L’une des raisons de combiner le big data et les RH est qu’il permet aux RH de recueillir plus d’informations sur chaque employé. En utilisant le Big Data, les RH peuvent facilement comparer un nouvel employé aux employés actuels. Cette comparaison peut révéler des écarts de performances ou des tendances qui n’étaient pas visibles auparavant. Par exemple, les RH peuvent constater que certains groupes d’employés ne sont pas promus aussi rapidement que d’autres. Ces informations peuvent aider les RH à identifier pourquoi cela se produit afin qu’ils puissent résoudre le problème. Une autre raison de combiner le big data et les RH est qu’il améliore la rétention du personnel. De nombreuses entreprises utilisent l’analyse des employés pour identifier les employés les plus performants. Ils peuvent ensuite récompenser ces employés avec de meilleurs avantages ou ensembles d’avantages sociaux. Donner aux employés ce qu’ils veulent contribue à stimuler le moral du personnel et à augmenter la productivité des employés. Cela aide également les organisations à attirer et à retenir les meilleurs talents. Les RH et le Big Data peuvent également conduire à de meilleures recommandations d’employés pour des promotions ou des transferts. De nombreuses organisations utilisent des algorithmes pour identifier les meilleurs candidats pour un certain poste. Ces algorithmes sont souvent basés sur des évaluations de performances, des postes occupés précédemment ou des données démographiques telles que l’âge, le sexe ou l’état matrimonial. La combinaison de ces entrées avec des sources externes, comme les médias sociaux, crée une image complète de chaque candidat. Cela permet aux RH d’identifier rapidement les meilleurs candidats pour une promotion ou un transfert afin qu’ils puissent progresser plus rapidement que les autres candidats.
Le big data peut vous être utile de nombreuses façons. Avec autant de données disponibles, les entreprises peuvent mieux comprendre leurs clients et prendre des décisions plus éclairées. Les big data peuvent également aider les entreprises à améliorer leurs opérations et à faire de meilleures prévisions pour l’avenir. En outre, le big data peut être utilisé pour trouver de nouvelles opportunités et identifier les risques potentiels.

Une façon dont les mégadonnées peuvent profiter à la société est d’aider les entreprises à prendre de meilleures décisions. Comprendre la clientèle d’une entreprise aide les entreprises à prendre de meilleures décisions concernant leurs produits et services. Cela les aide également à améliorer leurs stratégies de marketing, ce qui peut entraîner de meilleures ventes. Par exemple, à l’aide de mégadonnées, le gouvernement des États-Unis a pu prédire la propagation du virus Zika à l’été 2017. Cela a aidé le gouvernement à allouer des ressources afin qu’il soit préparé à l’épidémie. Les entreprises peuvent également utiliser ces données pour analyser les tendances actuelles et comparer différentes options pour voir lesquelles sont les plus efficaces. Lors de l’utilisation de mégadonnées, les entreprises doivent être conscientes des problèmes de confidentialité qu’elles peuvent causer et de la manière de les atténuer.

Une autre façon dont les mégadonnées peuvent profiter à la société consiste à permettre aux entreprises d’organiser et d’analyser leurs données. La richesse des informations disponibles aujourd’hui permet de trier et de catégoriser facilement toutes les données collectées. Par exemple, un algorithme d’apprentissage automatique a trié 3 millions de photos en fonction des émotions humaines et identifié celle qui était la plus appréciée par les humains. Même avec toutes ces données disponibles, leur collecte reste un processus fastidieux et chronophage. L’organisation et l’analyse de toutes ces informations permettent aux entreprises de repérer facilement les tendances et les modèles de leur secteur. Cela leur permet de prendre plus facilement des décisions éclairées et de créer de nouveaux produits et services adaptés aux besoins de leurs clients.
Il n’existe pas de réponse unique à cette question, car les exigences de stockage pour le big data peuvent varier en fonction de la taille et du type de données concernées. Cependant, les options de stockage les plus courantes pour le big data sont Hadoop, les bases de données NoSQL et le stockage en nuage
Les disques durs sont le choix traditionnel pour stocker de grandes quantités de données car ils sont fiables et durent longtemps. Ils sont également abordables, ce qui en fait une bonne option pour la plupart des entreprises et des organisations. Les disques durs offrent une capacité de stockage plus élevée par dollar que les SSD ou la mémoire flash en raison de leurs plateaux rotatifs traditionnels et de leurs têtes de lecture/écriture. Ils sont également plus rapides que les autres supports de stockage car ils n’ont pas à rechercher les données lorsqu’ils se déplacent dans le boîtier du disque. Ces facteurs les rendent bien adaptés aux applications à faible latence telles que les sauvegardes de bases de données et l’archivage. En revanche, les disques durs ne conviennent pas aux applications hautes performances car ils sont plus lents que les autres supports de stockage. Bien qu’ils soient fiables, ils occupent également beaucoup d’espace, ce qui peut ne pas être réalisable dans certaines applications. De nombreuses personnes ont également du mal à mettre à niveau leurs disques durs à l’avenir car il n’y a pas de chemin de mise à niveau standard – vous devez en acheter de nouveaux lorsqu’ils sont pleins. De plus, les disques durs sont vulnérables aux dommages physiques, ce qui peut les rendre inutilisables s’ils sont endommagés lors de l’installation ou du transport.