Introduction aux types de visualisation de données

Dans l'arène moderne des mégadonnées, ayant plus de 2, 5 quintillions d'octets (1 quintillion d'octets = 10 18 octets!) De données créées chaque jour (selon socialmediatoday.com), il y a un besoin pressant de stocker les données. Il va sans dire que ces données sont denses et donc moins lisibles par l'utilisateur et sont constamment non ciblées. Pour changer de paradigme afin de comprendre facilement la portée des données et d'en tirer des avantages utiles dans l'entreprise, les données doivent être présentées de manière plus intuitive et nécessiteraient donc des graphiques appropriés pour les visualiser. Il existe des outils et des méthodologies conçus pour représenter efficacement les données, mais l'efficacité dépend principalement du type de données et de l'exigence à extraire des données.

Qu'est-ce que la visualisation des données?

La visualisation des données est une méthodologie par laquelle les données au format brut sont représentées pour en faire ressortir le sens. Avec l'avènement du Big Data, il est devenu impératif de construire une manière significative de présenter les données afin que la quantité de données ne devienne pas écrasante. La partie de la représentation des données peut être utilisée à diverses fins, par exemple pour trouver des tendances / similitudes / modèles dans les données, construire des modèles pour l'apprentissage automatique ou peut être utilisée pour une opération simple comme l'agrégation.

Différents types de visualisation des données

La visualisation des données est largement classée en 6 types différents. Bien que le domaine de la visualisation des données ne cesse de croître, il ne sera pas surprenant que le nombre de catégories augmente.

Temporelle: les données pour ces types de visualisation doivent satisfaire aux deux conditions: les données représentées doivent être linéaires et doivent être unidimensionnelles. Ces types de visualisation sont représentés par des lignes qui peuvent se chevaucher et ont également un point de données de début et de fin commun.
Diagrammes de dispersionUtilise des points pour représenter un point de données. Le plus courant dans le monde d'aujourd'hui dans l'apprentissage automatique lors de l'analyse exploratoire des données.
Diagramme circulaireCe type de visualisation comprend des graphiques circulaires où la longueur de l'arc signifie la magnitude.
Diagramme de zone polaireComme le diagramme circulaire, le diagramme de la zone polaire est un tracé circulaire, sauf que les angles de secteur sont de longueur égale et que la distance de prolongement du centre signifie la magnitude.
Graphiques linéairesComme le nuage de points, les données sont représentées par des points, sauf jointes par des lignes pour maintenir la continuité.
DélaisDe cette façon, nous affichons une liste de points de données par ordre chronologique de temps.
Séquences de séries chronologiquesDans les séries chronologiques, nous représentons la magnitude des données dans un graphique 2D dans l'ordre chronologique de l'horodatage des données.
Hiérarchique: ces types de visualisations représentent des groupes ordonnés au sein d'un groupe plus large. En langage simple, l'intuition principale derrière ces visualisations est que les clusters peuvent être affichés si le flux des clusters commence à partir d'un seul point.
Diagramme d'arbreDans un diagramme arborescent, le flux hiérarchique est représenté sous la forme d'un arbre comme son nom l'indique. Peu de terminologies pour cette représentation sont:

- Noeud racine: point d'origine.

- Nœud enfant: a un parent au-dessus

- Nœud feuille: plus de nœud enfant.

Graphiques en anneau / Diagramme SunburstLa représentation d'arbre dans le diagramme d'arbre est convertie en base radiale. Ce type aide à présenter l'arbre dans une taille concise. Le cercle le plus à l'intérieur est le nœud racine. Et la zone du nœud enfant signifie le% de données.
TreeMapL'arbre est représenté sous la forme de rectangles étroitement emballés. La zone signifie la quantité contenue.
Emballage circulaireSemblable à un treemap, il utilise un remplissage circulaire au lieu de rectangles.
Réseau: la visualisation de ce type connecte des ensembles de données à des ensembles de données. Ces visualisations décrivent comment ces ensembles de données sont liés les uns aux autres au sein d'un réseau.
Tableaux matricielsCe type de visualisation est largement utilisé pour trouver la connexion entre différentes variables en elles-mêmes. Par exemple, tracé de corrélation
Diagrammes alluviauxIl s'agit d'un type d'organigramme dans lequel les changements dans le flux du réseau sont représentés sur des intervalles souhaités par l'utilisateur.

Mot nuageCeci est généralement utilisé pour représenter des données de texte. Les mots sont étroitement emballés et la taille du texte signifie la fréquence du mot.

Diagrammes de liaison de nœudsIci, les nœuds sont représentés sous forme de points et la connexion entre les nœuds est présentée.
Multidimensionnel: contrairement au type temporel de visualisation, ces types peuvent avoir plusieurs dimensions. En cela, nous pouvons utiliser 2 ou plusieurs fonctionnalités pour créer une visualisation 3D à travers des couches simultanées. Ceux-ci permettront à l'utilisateur de présenter les principaux points à retenir en cassant un grand nombre de données non utiles.
Diagrammes de dispersionDans les données multidimensionnelles, nous sélectionnons 2 entités quelconques, puis les tracons dans un nuage de points 2D. Ce faisant, nous aurions n graphes C 2 = n (n-1) / 2.
Graphiques à barres empiléesLes barres de segment de représentation les unes sur les autres. Il peut s'agir soit d'un graphique à barres empilées à 100% où la ségrégation est représentée en%, soit d'un graphique à barres empilées simple qui indique l'ampleur réelle
Tracé de coordonnées parallèlesDans cette représentation, une toile de fond est dessinée et n lignes parallèles sont dessinées (pour les données à n dimensions).
Géospatial: Ces visualisations se rapportent à l'emplacement physique réel actuel en le croisant avec des cartes (il peut s'agir d'une carte géospatiale ou spatiale). L'intuition derrière ces visualisations est de créer une vue holistique de la performance.
Carte de fluxLe mouvement d'informations ou d'objets d'un endroit à un autre est présenté où la taille de la flèche signifie la quantité.
Choropleth: carteLa carte géospatiale est colorée sur la base d'une variable de données particulière.
CartogrammeCe type de représentation utilise la variable thématique pour la cartographie. Ces cartes déforment la réalité pour présenter des informations. Cela signifie que sur une variable particulière, les cartes sont exagérées. Par exemple, l'image de gauche est une carte spatiale déformée en une structure de ruche.

Carte de chaleurCeux-ci sont très similaires à Choropleth dans le genre géospatial mais peuvent également être utilisés dans des zones autres que géospatiales.
Divers: ces visualisations ne peuvent pas être généralisées dans un groupe particulièrement important. Ainsi, au lieu de former des groupes plus petits pour le type individuel, nous les regroupons en divers. Voici quelques exemples:
Graphique Open-High-Low-CloseCe type de graphiques est généralement utilisé pour la représentation du cours des actions. La tendance à la hausse est appelée haussière et décroissante comme baissière.
Kagi-ChartEn règle générale, l'offre et la demande d'un actif sont représentées à l'aide de ce graphique.

Conclusion

À partir des types de visualisation ci-dessus, nous voyons qu'il existe en gros 6 types de groupes. La liste ci-dessus n'est pas une liste exhaustive, mais peu qui sont largement utilisées. Dans les temps à venir, au fur et à mesure que de nouveaux types seront ajoutés à la liste, les groupes pourraient augmenter. C'est tout pour les types de visualisation. Nous continuerions sur les paramètres à regarder lors de la fixation du type de visualisation.

Articles recommandés

Ceci est un guide sur le type de visualisation des données. Nous discutons ici de l'introduction et des différents types de visualisation des données. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus–

  1. Types de techniques d'analyse de données
  2. Intégration des données Talend
  3. Outils d'analyse de données
  4. Outils de science des données
  5. Outils Talend
  6. Qu'est-ce que l'intégration de données?
  7. Nuages ​​de points dans Matlab
  8. Comment le graphique à barres est utilisé dans Matlab (exemples)

Catégorie: