Avantages de l'organisme

10 années d'expérience

Programmes sur mesure

Formations courtes
Prochaines sessions
Objectifs visés
Cette formation vous fera découvrir l’environnement Databricks, vous apprendra à générer développer des applications impliquant beaucoup de données.
A l'issue de cette formation, vous aurez acquis les compétences nécessaires pour :
- Présenter Databricks et Apache Spark.
- Créer un Workspace et un cluster.
- Se connecter à de différentes sources pour lire et écrire des données.
- Comprendre les différents types de cluster et de ressources.
- Mettre en œuvre un traitement en streaming.
- Connecter Databricks à des outils gestion de versions comme Git.
- Comprendre la partie DevOps & Sécurité de Databricks.
Contenu
Module 1 : Découvrir Découvrir Databricks.
- Problématique
- Qu’est-ce que Databricks ?
- Architecture du produit Databricks
- Apprendre à installer/configurer Databricks
- Cas Pratique : Configurer Databricks
Module 2 : Présentation des fondamentaux de Spark.
- Premier pas avec spark
- Vue d’ensemble des composants
- Découverte du référentiel d’artefact
Module 3 : Conception de clusters Spark : Workspace, Runtimes, Clusters, Notebooks, Workflows & Libraires.
Module 4 : Importer des données dans Databricks
Module 5 : Connexion vers et depuis Databricks.
Module 6 : Traitement en batch et en temps réel dans Databricks.
Module 7 : Montage d'Azure Data Lake dans Databricks.
Module 8 : ML dans Databricks.
Module 9 : Graphe dans Databricks.
Module 10 : Système de fichiers Databricks (DBFS).
Module 11 : Lecture et écriture depuis et vers divers services Azure et formats de fichier.
Module 12 : Intégration de Git avec Databricks Repos.
Module 13 : Les pools Databricks.
Module 14 : Les instances spot de Databricks.
Module 15 : Les managed resource groups de Databricks.
Module 16 : Présentation de Databricks Delta Lake.
Module 17 : Databricks avec Azure Key Vault, App Configuration et Log Analytics.
Module 18 : DevOps CI/CD pour Azure Databricks.
Module 19 : Sécurité et Monitoring dans Azure Databricks.
Module 20 : Sécurité et Monitoring dans Azure Databricks.
Public Cible
Data Engineer , Data Architects , Data Scientist , Data Analyst
Prérequis
Connaissance d’apache Spark, cloud, python.
Cette formation vous intéresse ?
Acquérir les compétences nécessaires à l’analyse de données avec L'École de la Data
L’École de la Data est un organisme de formation basé à Paris. Comme son nom l’indique, l’organisme est spécialisé dans les formations dans le domaine du traitement des données. De nos jours, les entreprises stockent de plus en plus de...
Apprenez-en plus sur l'organisme et découvrez toutes leurs formations