Introduction aux questions et réponses d'entrevue Data Analytics
Vous avez donc finalement trouvé votre emploi de rêve dans Data Analytics, mais vous vous demandez comment résoudre l'interview Data Analytics 2019 et quelles pourraient être les questions probables de l'interview Data Analytics. Chaque entretien Data Analytics est différent et la portée d'un travail est également différente. En gardant cela à l'esprit, nous avons conçu les questions et les réponses les plus courantes aux entretiens Data Analytics pour vous aider à réussir votre entretien Data Analytics.
Vous trouverez ci-dessous les principales questions d'entrevue Data Analytics 2019 qui sont principalement posées dans une interview
1. Quelle est la différence entre l'exploration de données et l'analyse de données?
Répondre:
|
2. Mentionnez quelles sont les différentes étapes d'un projet d'analyse?
Répondre:
L'analyse de données traite de la collecte, du nettoyage, de la transformation et de la modélisation des données pour obtenir des informations précieuses et soutenir une meilleure prise de décision dans une organisation. Les étapes impliquées dans le processus d'analyse des données sont les suivantes -
Exploration des données - Après avoir exploré le problème commercial, un analyste de données doit analyser la cause première du problème.
Préparation des données - Dans cette étape du processus d'analyse des données, nous trouvons des anomalies de données comme des valeurs manquantes dans les données.
Modélisation des données - L'étape de modélisation commence après la préparation des données. La modélisation est un processus itératif dans lequel le modèle est exécuté à plusieurs reprises pour des améliorations. La modélisation des données garantit le meilleur résultat possible pour un problème commercial.
Validation - Dans cette étape, le modèle fourni par le client et le modèle développé par l'analyste de données sont validés l'un par rapport à l'autre pour savoir si le modèle développé répondra aux exigences de l'entreprise.
Mise en œuvre du modèle et suivi - Dans cette dernière étape de la mise en œuvre du modèle d'analyse des données est en cours et après que le suivi est effectué pour s'assurer que le modèle est correctement mis en œuvre ou non?
3.Quelle est la responsabilité d'un analyste de données?
Répondre:
• Résoudre les problèmes commerciaux liés aux clients et effectuer des opérations d'audit des données.
• Interpréter les données à l'aide de techniques statistiques.
• Identifier les domaines pour les opportunités d'amélioration.
• Analyser, identifier et interpréter les tendances ou les modèles dans des ensembles de données complexes.
• Acquérir des données à partir de sources de données primaires ou secondaires.
• Maintenir des bases de données / systèmes de données.
• Localisez et corrigez les problèmes de code à l'aide d'indicateurs de performances.
• Sécurisation de la base de données en développant un système d'accès.
4.Quelles sont les collisions avec les tables de hachage? Comment est-il évité?
Répondre:
Une collision de table de hachage se produit lorsque deux clés différentes hachent à la même valeur. Il existe de nombreuses techniques pour éviter les collisions de tables de hachage, nous en énumérons deux:
Chaînage séparé: il utilise la structure de données qui est hachée sur le même emplacement pour stocker plusieurs éléments.
Adressage ouvert: il recherche d'autres emplacements à l'aide d'une deuxième fonction et stocke l'élément dans le premier emplacement vide.
5. Liste des meilleurs outils qui peuvent être utiles pour l'analyse des données?
Répondre:
•Tableau
• RapidMiner
• OpenRefine
• KNIME
• Opérateurs de recherche Google
• Solveur
• NodeXL
• io
• Wolfram Alpha
• Google Fusion Tables
6. Quelle est la différence entre l'exploration de données et le profilage de données?
Répondre:
La différence entre l'exploration de données et le profilage de données est la suivante -
• Profilage des données: il cible l'analyse instantanée d'attributs individuels tels que le prix varie, le prix distinct et leur fréquence, une incidence de valeurs nulles, le type de données, la longueur, etc.
• Exploration de données: il se concentre sur les dépendances, la découverte de séquences, la relation entre plusieurs attributs, l'analyse de cluster, la détection d'enregistrements inhabituels, etc.
7. Expliquer l'algorithme K-mean et l'algorithme de clustering hiérarchique?
Répondre:
Algorithme K-Mean - K mean est une célèbre méthode de partitionnement. Dans l'algorithme K-mean, les clusters sont sphériques, c'est-à-dire que les points de données d'un cluster sont centrés sur ce cluster. De plus, la variance des grappes est similaire, c'est-à-dire que chaque point de données appartient à la grappe la plus proche
Algorithme de clustering hiérarchique - L'algorithme de clustering hiérarchique combine et divise les groupes existants et crée une structure hiérarchique pour eux pour montrer l'ordre dans lequel les groupes sont divisés.
8.Qu'est-ce que le nettoyage des données? Mentionnez quelques bonnes pratiques que vous devez suivre lors du nettoyage des données?
Répondre:
À partir d'un ensemble de données donné, il est extrêmement important de trier les informations nécessaires à l'analyse des données. Le nettoyage des données est une étape cruciale dans laquelle les données sont inspectées pour trouver des anomalies, supprimer les informations répétitives et incorrectes, etc. .
Certaines des meilleures pratiques pour le nettoyage des données comprennent -
• Développer un plan de qualité des données pour identifier où se produisent les erreurs maximales de qualité des données afin que vous puissiez évaluer la cause première et planifier en fonction de cela.
• Suivez une méthode habituelle de justification des informations nécessaires avant leur entrée dans les informations.
• Identifiez les données en double et validez l'exactitude des données car cela vous fera gagner beaucoup de temps lors de l'analyse.
• Le suivi de toutes les opérations d'amélioration effectuées sur les informations est incroyablement nécessaire pour que vous répétiez ou supprimiez les opérations si nécessaire.
9.Quelles sont les méthodes statistiques utiles à l'analyste de données?
Répondre:
Les méthodes statistiques utiles au data scientist sont
• Méthode bayésienne
• Processus de Markov
• Processus spatiaux et cluster
• Statistiques de classement, centile, détection des valeurs aberrantes
• Techniques d'imputation, etc.
• Algorithme simplex
• Optimisation mathématique
10. Expliquez ce qu'est l'imputation? Énumérer différents types de techniques d'imputation? Quelle méthode d'imputation est la plus favorable?
Répondre:
Lors de l'imputation, nous avons tendance à remplacer les informations manquantes par des valeurs substituées. Les types de techniques d'imputation impliquées sont -
• Imputation unique: l'imputation unique indique que la valeur manquante est remplacée par une valeur. Dans cette méthode, la taille de l'échantillon est récupérée.
• Imputation hot-deck: une valeur manquante est imputée à partir d'un enregistrement similaire sélectionné au hasard à l'aide d'une carte perforée
• Imputation à froid: elle fonctionne de la même manière que l'imputation à chaud, mais un peu plus avancée et choisit les donateurs à partir d'autres ensembles de données
• Imputation moyenne: elle consiste à remplacer la valeur manquante par les valeurs prévues d'autres variables.
• Imputation par régression: elle consiste à remplacer la valeur manquante par les valeurs prédites d'une certaine valeur en fonction d'autres variables.
• Régression stochastique: elle est identique à l'imputation de régression, cependant, elle ajoute la variance de régression commune à l'imputation de régression
• Imputation multiple: contrairement à l'imputation unique, les imputations multiples estiment les valeurs plusieurs fois
Bien que l'imputation unique soit largement utilisée, elle ne reflète pas l'incertitude créée par les données manquantes au hasard. Ainsi, les imputations multiples sont plus favorables que l'imputation unique en cas de données manquantes au hasard.
Articles recommandés
Ceci a été un guide complet des questions et réponses d'entrevue Data Analytics afin que le candidat puisse réprimer facilement ces questions d'entrevue Data Analytics. Vous pouvez également consulter les articles suivants pour en savoir plus -
- 10 questions et réponses d'entrevue Agile utiles
- Questions d'entretiens chez Awesome Algorithm
- 25 questions d'entrevue les plus importantes en informatique
- 10 questions et réponses d'entrevue étonnantes de Data Engineer