Le terme Big Data est de plus en plus utilisé presque partout sur la planète – en ligne et hors ligne. Et ce n’est pas uniquement lié aux ordinateurs. Il relève d’un terme général appelé technologie de l’information, qui fait maintenant partie de presque toutes les autres technologies et domaines d’études et entreprises. Le Big Data n’est pas un gros problème. Le battage médiatique qui l’entoure est certainement assez important pour vous confondre. Cet article se penche sur ce qu’est le Big Data. Il contient également un exemple de la façon dont NetFlix a utilisé ses données, ou plutôt, Big Data, pour mieux répondre aux besoins de ses clients.
Qu’est-ce que le Big Data
Jusqu’à hier, les données stockées sur les serveurs de votre entreprise n’étaient que des données triées et archivées. Soudain, l’argot Big Data est devenu populaire, et maintenant les données de votre entreprise sont des Big Data. Le terme couvre chaque élément de données que votre organisation a stocké jusqu’à présent. Cela inclut les données stockées dans les nuages et même les URL que vous avez mises en signet. Votre entreprise n’a peut-être pas numérisé toutes les données. Vous n’avez peut-être pas déjà structuré toutes les données. Mais alors, toutes les données numériques, papiers, structurées et non structurées avec votre entreprise sont désormais du Big Data.
Bref, toutes les données – catégorisées ou non – présentes dans vos serveurs sont collectivement appelées BIG DATA. Toutes ces données peuvent être utilisées pour obtenir différents résultats en utilisant différents types d’analyse. Il n’est pas nécessaire que toutes les analyses utilisent toutes les données. Les différentes analyses utilisent différentes parties du BIG DATA pour produire les résultats et les prédictions nécessaires.
Le Big Data est essentiellement les données que vous analysez pour obtenir des résultats que vous pouvez utiliser pour des prédictions et d’autres utilisations. Lorsque vous utilisez le terme Big Data, votre entreprise ou votre organisation travaille soudainement avec une technologie de l’information de haut niveau pour déduire différents types de résultats en utilisant les mêmes données que vous avez stockées intentionnellement ou non au fil des ans.
Quelle est la taille du Big Data
Essentiellement, toutes les données combinées sont du Big Data, mais de nombreux chercheurs s’accordent à dire que le Big Data – en tant que tel – ne peut pas être manipulé à l’aide de feuilles de calcul normales et d’outils réguliers de gestion de base de données. Ils ont besoin d’outils d’analyse spéciaux comme Hadoop (nous étudierons cela dans un article séparé) afin que toutes les données puissent être analysées en une seule fois (peut inclure des itérations d’analyse).
Contrairement à ce qui précède, bien que je ne sois pas un expert en la matière, je dirais que les données de toute organisation – grande ou petite, organisée ou non – sont du Big Data pour cette organisation et que l’organisation peut choisir ses propres outils pour analyser le Les données.
Normalement, pour analyser les données, les gens avaient l’habitude de créer différents ensembles de données basés sur un ou plusieurs champs communs afin que l’analyse devienne facile. Dans le cas du Big Data, il n’est pas nécessaire de créer des sous-ensembles pour l’analyser. Nous disposons désormais d’outils capables d’analyser les données, quelle que soit leur taille. Probablement, ces outils eux-mêmes catégorisent les données alors même qu’ils les analysent.
Je trouve important de citer deux phrases du livre « Big Data » de Jimmy Guterman :
« Big Data: lorsque les exigences de taille et de performance pour la gestion des données deviennent des facteurs de conception et de décision importants pour la mise en œuvre d’un système de gestion et d’analyse des données.
-Et-
« Pour certaines organisations, faire face à des centaines de gigaoctets de données pour la première fois peut déclencher un besoin de reconsidérer les options de gestion des données. Pour d’autres, cela peut prendre des dizaines ou des centaines de téraoctets avant que la taille des données ne devienne une considération importante.
Vous voyez donc que le volume et l’analyse sont une partie importante du Big Data.
Lis: Qu’est-ce que le Data Mining ?
Concepts de données volumineuses
C’est un autre point sur lequel la plupart des gens ne sont pas d’accord. Certains experts disent que les Big Data Concepts sont trois V :
- Le volume
- Rapidité
- Variété
D’autres ajoutent quelques V supplémentaires au concept :
- Visualisation
- Véracité (Fiabilité)
- Variabilité et
- Évaluer
Je couvrirai les concepts de Big Data dans un article séparé car cet article devient déjà important. À mon avis, les trois premiers V suffisent à expliquer le concept de Big Data.
Exemple de Big Data – Comment NetFlix l’a utilisé pour résoudre ses problèmes
Vers 2008, il y a eu une panne chez NetFlix à cause de laquelle de nombreux clients ont été laissés dans le noir. Alors que certains pouvaient encore accéder aux services de streaming, la plupart d’entre eux ne le pouvaient pas. Certains clients ont réussi à obtenir leurs DVD loués tandis que d’autres ont échoué. Un article de blog sur le Wall Street Journal indique que Netflix venait de commencer le streaming à la demande.
le lien sur le blog du Wall Street Journal, si vous souhaitez consulter les exemples de Big Data.
La panne a fait réfléchir la direction aux éventuels problèmes futurs et donc; il s’est tourné vers le Big Data. Il a analysé les zones à fort trafic, les points sensibles et le débit du réseau, etc. à l’aide de ces données et y a travaillé pour réduire les temps d’arrêt si un problème futur survenait alors qu’il devenait mondial. VoiciCe qui précède résume ce qu’est le Big Data dans le langage d’un profane. Vous pouvez appeler cela une introduction très basique. Je prévois d’écrire quelques articles supplémentaires sur des facteurs associés tels que – Concepts, Analyse, Outils et utilisations du Big Data, Big Data 3 V, etc. En attendant, si vous souhaitez ajouter quelque chose à ce qui précède, veuillez commenter et partager avec nous.
Lire la suite: Qu’est-ce que le Web Scraping ?