Module 2 : Architecture et composants

Vue d'ensemble de l'architecture

Azure Synapse est compose de plusieurs couches et composants qui travaillent ensemble :


+----------------------------------------------------------+
|                    SYNAPSE WORKSPACE                      |
|  +--------------------------------------------------+    |
|  |              SYNAPSE STUDIO (Interface Web)       |    |
|  +--------------------------------------------------+    |
|                           |                              |
|  +------------+  +------------+  +------------+          |
|  | SQL Pool   |  | SQL Pool   |  | Spark Pool |          |
|  | Serverless |  |   Dedie    |  |            |          |
|  +------------+  +------------+  +------------+          |
|                           |                              |
|  +--------------------------------------------------+    |
|  |           PIPELINES (Integration de donnees)      |    |
|  +--------------------------------------------------+    |
|                           |                              |
|  +--------------------------------------------------+    |
|  |              LINKED SERVICES (Connexions)         |    |
|  +--------------------------------------------------+    |
+----------------------------------------------------------+
                            |
            +---------------+---------------+
            |               |               |
     Azure Data Lake   Azure SQL DB    Power BI
            

Composants principaux

1. Synapse Workspace

Le workspace est le conteneur principal qui regroupe toutes vos ressources Synapse. Il inclut :

2. Synapse Studio

L'interface web unifiee pour :

3. SQL Pools

SQL Serverless (Built-in)
- Pas de provisionnement necessaire
- Paiement a la requete (donnees scannees)
- Ideal pour l'exploration ad-hoc
SQL Dedie (Dedicated Pool)
- Ressources reservees (DWU)
- Haute performance pour workloads intensifs
- Data warehouse permanent

4. Spark Pools

Clusters Apache Spark manages pour :

5. Pipelines

Herite d'Azure Data Factory, permet de :

Flux de donnees typique

  1. Ingestion : Les donnees arrivent via des pipelines dans le Data Lake
  2. Stockage : Donnees brutes stockees en format Parquet/Delta dans ADLS Gen2
  3. Transformation : Traitement avec Spark ou SQL serverless
  4. Serving : Chargement dans un SQL Pool dedie pour les analyses
  5. Visualisation : Connexion a Power BI pour les rapports

Securite et gouvernance