Module 2 : Architecture et composants

Vue d'ensemble de l'architecture

Azure Synapse est composé de plusieurs couches et composants qui travaillent ensemble :


+----------------------------------------------------------+
|                    SYNAPSE WORKSPACE                      |
|  +--------------------------------------------------+    |
|  |              SYNAPSE STUDIO (Interface Web)       |    |
|  +--------------------------------------------------+    |
|                           |                              |
|  +------------+  +------------+  +------------+          |
|  | SQL Pool   |  | SQL Pool   |  | Spark Pool |          |
|  | Serverless |  |   Dédié    |  |            |          |
|  +------------+  +------------+  +------------+          |
|                           |                              |
|  +--------------------------------------------------+    |
|  |           PIPELINES (Intégration de données)      |    |
|  +--------------------------------------------------+    |
|                           |                              |
|  +--------------------------------------------------+    |
|  |              LINKED SERVICES (Connexions)         |    |
|  +--------------------------------------------------+    |
+----------------------------------------------------------+
                            |
            +---------------+---------------+
            |               |               |
     Azure Data Lake   Azure SQL DB    Power BI
            

Composants principaux

1. Synapse Workspace

Le workspace est le conteneur principal qui regroupe toutes vos ressources Synapse. Il inclut :

2. Synapse Studio

L'interface web unifiée pour :

3. SQL Pools

SQL Serverless (Built-in)
- Pas de provisionnement nécessaire
- Paiement à la requête (données scannées)
- Idéal pour l'exploration ad-hoc
SQL Dédié (Dedicated Pool)
- Ressources réservées (DWU)
- Haute performance pour workloads intensifs
- Data warehouse permanent

4. Spark Pools

Clusters Apache Spark managés pour :

5. Pipelines

Hérité d'Azure Data Factory, permet de :

Flux de données typique

  1. Ingestion : Les données arrivent via des pipelines dans le Data Lake
  2. Stockage : Données brutes stockées en format Parquet/Delta dans ADLS Gen2
  3. Transformation : Traitement avec Spark ou SQL serverless
  4. Serving : Chargement dans un SQL Pool dédié pour les analyses
  5. Visualisation : Connexion à Power BI pour les rapports

Sécurité et gouvernance