Description de la formation
Data Science with Python eLearning
Apprenez le langage de programmation de plus en plus populaire pour le développement
APERÇU DU COURS
Python est un langage de programmation polyvalent dont la popularité ne cesse de croître. Des entreprises du monde entier utilisent Python pour tirer des enseignements des données et prendre l'avantage sur leurs concurrents. Contrairement à tout autre cours de Python, ce programme se concentre sur Python spécifiquement pour la science des données. Vous apprendrez à stocker et à manipuler des données ainsi qu'à utiliser des outils utiles pour commencer vos propres analyses.
Le cours Python for Data Science couvre les concepts fondamentaux de la programmation Python et explique l'analyse des données, l'apprentissage automatique, la visualisation des données, le web scraping et le traitement du langage naturel. Vous acquerrez une compréhension complète des différents packages et bibliothèques nécessaires pour effectuer certains aspects de l'analyse des données.
QU'EST-CE QUI EST INCLUS ?
- Le cours et le matériel sont en anglais
- Niveau débutant à intermédiaire
- Accès d'un an à la plateforme d'apprentissage en ligne à rythme libre 24 heures sur 24, 7 jours sur 7
- 6 heures de contenu vidéo
- 40 heures de temps d'étude et de pratique recommandées
- Laboratoires virtuels, simulation de tests, projets finaux
- Aucun examen pour le cours, mais l'étudiant recevra une certification de fin de formation
OBJECTIFS DU COURS Vous apprendrez :
À la fin du cours, vous serez capable de :
- Acquérir une compréhension approfondie des processus de Data Science, d'exploration de données, de visualisation de données, de développement et de test d'hypothèses.
- Installer l'environnement Python nécessaire ainsi que d'autres outils et bibliothèques auxiliaires
- Comprendre les concepts de base de la programmation Python tels que les types de données, les taps, les listes, les dict, les opérateurs et fonctions de base.
- Effectuer des calculs mathématiques de haut niveau avec le package NumPy et sa grande bibliothèque de fonctions mathématiques
- Effectuer des calculs scientifiques et techniques avec le package SciPy et ses sous-packages tels que Integrate, Optimize, Statistics, IO et Weave
- Effectuer des analyses et des manipulations de données à l'aide des structures de données et des outils fournis dans le package Pandas
- Acquérir une expertise en apprentissage automatique avec le package Scikit-Learn
- Comprendre les modèles d'apprentissage supervisé et non supervisé tels que la régression linéaire, la régression logistique, le clustering, la réduction de la dimensionnalité, K-NN et le pipelining.
- Utiliser le package Scikit-Learn pour le traitement du langage naturel
- Utiliser la bibliothèque matplotlib en Python pour la visualisation des données
- Extraire des informations utiles des sites web par web scraping avec Python
- Intégrer Python avec Hadoop, Spark et MapReduce
Prérequis
Il n'y a pas de prérequis pour ce cours de Data Science. Le cours Python Fundamentals inclus dans ce programme vous fournira des conseils de codage supplémentaires.
Contenu du cours
Introduction à la Data Science
- Configuration de Jupyter Notebook
- Fonctions Python
- Types et séquences Python
- Chaînes Python Approfondissement
- Démo Python : lecture et écriture de fichiers csv
- Date et heure en Python
- Objets en Python Carte
- Compréhension de Lambda et des listes
- Pourquoi Python pour l'analyse de données ?
- Packages Python pour la Data Science
- Package StatsModels
- Package Scipy
Les bases de la programmation Python
- Configuration de Jupyter Notebook
- Fonctions Python
- Types et séquences Python
- Chaînes Python Approfondissement
- Démo Python : lecture et écriture de fichiers csv
- Date et heure en Python
- Objets en Python Carte
- Compréhension de Lambda et des listes
- Pourquoi Python pour l'analyse de données ?
- Packages Python pour la Data Science
- Package StatsModels
- Paquet Scipy
NumPy
- Fondamentaux de NumPy
- Formes et axes des tableaux dans NumPy : Partie A
- Formes et axes des tableaux NumPy : Partie B
- Opérations arithmétiques
- Logique conditionnelle
- Fonctions mathématiques et statistiques courantes dans Numpy
- Indexation et découpage
- Gestion des fichiers
Algèbre linéaire
- Introduction à l'algèbre linéaire
- Scalaires et vecteurs
- Produit scalaire de deux vecteurs
- Indépendance linéaire des vecteurs
- Norme d'un vecteur
- Opérations sur les matrices
- Rang d'une matrice
- Déterminant d'une matrice et matrice ou opérateur identité
- Inverse d'une matrice et valeurs et vecteurs propres
- Calcul en algèbre linéaire
Fondamentaux des statistiques
- Importance des statistiques par rapport à la Data Science
- Termes statistiques courants
- Types de statistiques
- Catégorisation et types de données
- Niveaux de mesure
- Mesures de tendance centrale
- Mesures de dispersion
- Variables aléatoires
- Ensembles
- Mesures de forme (asymétrie et aplatissement)
- Covariance et corrélation
Distribution de probabilité
- Probabilité, son importance et distribution de probabilité
- Distribution de probabilité : distribution binomiale
- Distribution de probabilité : distribution de Poisson
- Distribution de probabilité : distribution normale
- Distribution de probabilité : distribution de Bernoulli
- Fonction de densité de probabilité et fonction de masse
- Fonction de distribution cumulative
- Théorème de la limite centrale
- Théorie de l'estimation
Statistiques avancées
- Distribution
- Kurtosis Asymétrie et distribution T de Student
- Test d'hypothèse et mécanisme
- Test d'hypothèse Résultats : Erreurs de type I et II
- Hypothèse nulle et hypothèse alternative
- Intervalles de confiance
- Marges d'erreur
- Comparaison et contraste Test T et test Z
- Théorème de Bayes
- Distribution du khi carré
- Test du khi carré et qualité de l'ajustement
- Analyse de la variance ou ANOVA
- Terminologies de l'ANOVA
- Partition de la variance à l'aide de Python
- Distribution F à l'aide de Python
- Test F
Pandas
- Série Pandas
- Interroger une série
- Pandas Dataframes
- Pandas Panel
- Fonctions courantes dans Pandas
- Fonctions Pandas Fonction statistique des données, fonction Windows
- Fonction Pandas Données et Timedelta
- Données catégoriques
- Travailler avec des données textuelles
- Itération
- Tri
- Tracé avec Pandas
Analyse des données
- Comprendre les données
- Types de données Structurées Non structurées En désordre, etc.
- Travailler avec les données Choisir les outils appropriés, Collecte de données, Manipulation des données
- Importation et exportation de données en Python
- Expressions régulières en Python
- Manipulation de texte avec des expressions régulières
- Accès aux bases de données en Python
Traitement des données
- Pandorable ou code idiomatique Pandas
- Chargement Indexation et réindexation
- Fusion
- Optimisation de la mémoire en Python
- Pré-traitement des données : chargement et suppression des valeurs nulles
- Pré-traitement des données Remplissage des valeurs nulles
- Classement des données Formatage et normalisation
- Classement des données Normalisation
- Description des données
Visualisation des données
- Principes de la visualisation de l'information
- Visualisation des données à l'aide de tableaux croisés dynamiques
- Bibliothèques de visualisation des données en Python Matplotlib
- Types de graphiques
- Bibliothèques de visualisation de données en Python Seaborn, Ploty, Bokeh
- Utilisation de Matplotlib pour tracer des graphiques
- Tracé de graphiques 3D pour plusieurs colonnes à l'aide de Matplotlib
- Utilisation de Matplotlib avec d'autres packages Python
- Utilisation de Seaborn pour tracer des graphiques
- Tracé de graphiques 3D pour plusieurs colonnes à l'aide de Seaborn
- Introduction à Plotly et Bokeh
Prochaines sessions
Faire une demande
Apprenez à faire la différence Adding Value Consulting (AVC) est un ATO (organisme de formation accrédité) leader. Nous avons introduit un grand nombre de méthodes de « meilleures pratiques » en Scandinavie. Nous sommes experts en formation et certification. Au fil des...
Apprenez-en plus sur l'organisme et découvrez toutes leurs formations