Description de la formation
Data Science - Certification en programmation R eLearning
Apprenez à extraire des connaissances et des idées à partir de données structurées et non structurées.
APERÇU DU COURS
R est un langage de programmation et un environnement logiciel libre pour le calcul statistique. Ce cours de Data Science vous enseigne diverses techniques d'analyse de données à l'aide du langage de programmation R. Vous maîtriserez également les techniques d'exploration de données, de visualisation, d'analyse prédictive et descriptive.
Pendant le cours, vous recevrez une formation pratique en mettant en œuvre divers projets industriels réels dans les secteurs de la santé, de la vente au détail, de l'assurance et bien d'autres.
Ce cours de Data Science est une formule idéale pour les futurs analystes de données qui aspirent à une carrière réussie dans l'analyse/la science des données. Vous obtiendrez une vue d'ensemble à 360 degrés de l'analyse commerciale et de R, en utilisant des projets et des études de cas réels.
QU'EST-CE QUI EST INCLUS ?
- Le cours et le matériel sont en anglais
- Niveau débutant à intermédiaire
- Accès d'un an à la plateforme d'apprentissage en ligne 24h/24 et 7j/7
- 6 heures de contenu vidéo
- 40 heures de temps d'étude et de pratique recommandées
- Laboratoires virtuels, quiz, simulation de tests, projets finaux
- Aucun examen pour le cours, mais l'étudiant recevra une certification de fin de formation
OBJECTIFS DU COURS Vous apprendrez :
- À la fin du cours, vous serez capable d'utiliser :
- Les différents graphiques R pour la visualisation des données
- La méthode de test d'hypothèse pour orienter les décisions commerciales
- Les modèles de régression linéaire et non linéaire et les techniques de classification pour l'analyse des données
- Les différentes règles d'association et l'algorithme Apriori
- Les méthodes de clustering, y compris K-means, DBSCAN et le clustering hiérarchique.
- Acquérir une compréhension de base de l'analyse commerciale et des différents concepts statistiques
- Installer R, R-studio et configurer l'espace de travail
- Maîtriser la programmation R et comprendre comment les différentes instructions sont exécutées dans R
- Comprendre la structure des données utilisée dans R et importer/exporter des données
- Définir, comprendre et utiliser les différentes fonctions d'application et les fonctions DPYR
- Comprendre les différents concepts statistiques et tests d'hypothèses
Qui devrait s'inscrire à ce programme ?
La demande de data scientists qualifiés est en augmentation dans tous les secteurs, ce qui rend ce cours de certification en Data Science adapté aux participants de tous niveaux d'expérience.
- Professionnels de l'informatique
- Professionnels de l'analyse
- Développeurs de logiciels
- Data scientist
- Business Intelligence
Il n'y a pas d'exigence formelle pour ce cours. Cependant, il est recommandé d'avoir :
Des statistiques de base : Une compréhension fondamentale des statistiques (moyenne, médiane, écart type, etc.) aidera à saisir le contenu du cours, en particulier lors de l'apprentissage des techniques d'analyse des données.
Des bases en mathématiques : Des compétences de base en mathématiques, en particulier dans des domaines tels que l'algèbre et la probabilité, aideront à comprendre certains des sujets plus avancés d'analyse et de modélisation des données.
Connaissance des données : une compréhension de base des ensembles de données, des types de données (numériques, catégoriques) et des structures telles que les tableaux sera utile.
Contenu du cours
Introduction à l'analyse commerciale
- Décisions commerciales et analyse
- Types d'analyse commerciale
- Applications de l'analyse commerciale
- Présentation de la Data Science
Introduction à la programmation R
- Importance de R
- Types de données et variables dans R
- Opérations dans R
- Instructions conditionnelles dans R
- Boucles dans R
Structures de données
- Identifier les structures de données
- Démo : identifier les structures de données
- Attribuer des valeurs aux structures de données
- Manipulation des données
- Démo : Affectation de valeurs et application de fonctions
Visualisation des données
- Introduction à la visualisation des données
- Visualisation des données Utilisation de graphiques dans R
- Ggplot2
- Formats de fichiers des sorties graphiques R
Statistiques pour Data Science - I
- Introduction à l'hypothèse
- Types d'hypothèse
- Échantillonnage des données
- Niveaux de confiance et de signification
Statistiques pour Data Science - II
- Test d'hypothèse
- Test paramétrique
- Test non paramétrique
- Tests d'hypothèse sur les moyennes de population
- Tests d'hypothèse sur la variance de population
- Tests d'hypothèse sur les proportions de population
Analyse de régression
- Introduction à l'analyse de régression
- Types de modèles d'analyse de régression
- Régression linéaire
- Démo : Régression linéaire simple
- Régression non linéaire
- Démo : Analyse de régression avec plusieurs variables
- Validation croisée
- Modèles non linéaires à linéaires
- Analyse en composantes principales
- Analyse factorielle
Classification
- Classification et ses types
- Régression logistique
- Machines à vecteurs de support
- Démo : Classificateur Naïve Bayes
- Démo : Classificateur Naïve Bayes
- Décision : Classification arborescente
- Démo : Classification arborescente décisionnelle
- Classification aléatoire en forêt
- Évaluation des modèles de classification
- Démo : Validation croisée K-Fold
Regroupement
- Introduction au regroupement
- Méthodes de regroupement
- Démo : Regroupement K-means
- Démo : Regroupement hiérarchique
Association
- Règle d'association
- Algorithme Apriori
- Démo : Algorithme Apriori
Prochaines sessions
Faire une demande
Apprenez à faire la différence Adding Value Consulting (AVC) est un ATO (organisme de formation accrédité) leader. Nous avons introduit un grand nombre de méthodes de « meilleures pratiques » en Scandinavie. Nous sommes experts en formation et certification. Au fil des...
Apprenez-en plus sur l'organisme et découvrez toutes leurs formations