Exercise 001_09 [PYTHON-th-P19]

Exercise 001_09

Cahier des charges⚓

# 001_09 — Export et manipulation avancée avec pandas
## Objectifs
- Lire un fichier Excel existant (001_05.xlsx)
- Effectuer des transformations complexes avec pandas
- Démontrer les opérations avancées : pivot, merge, groupby
- Générer un rapport consolidé multi-sources
- Ajouter des formules Excel dans les cellules
## Structure des feuilles
### Feuille "do_source"
Données lues depuis 001_05.xlsx (feuille "do")
### Feuille "do_pivot"
Table pivot avec pandas.pivot_table() :
- Index : Classe de ttf(i)
- Colonnes : Type de métrique
- Values : Statistiques agrégées (count, mean, sum)
### Feuille "do_merged"
Fusion de plusieurs DataFrames :
- Jointure entre données et classes
- Ajout d'informations calculées
- Utilisation de pd.merge()
### Feuille "do_grouped"
Agrégations avec groupby() :
- Groupement par classe
- Calculs : somme, moyenne, min, max
- Plusieurs niveaux de groupement
### Feuille "do_formulas"
Cellules avec formules Excel natives :
- Formules de somme : =SUM(B2:B11)
- Formules conditionnelles : =IF(C2>500, "Long", "Court")
- Références entre feuilles : =do_source!A2
- Formules statistiques : =AVERAGE(), =STDEV()
### Feuille "do_report"
Rapport consolidé formaté :
- En-têtes mis en forme
- Cellules fusionnées
- Formats conditionnels (via xlsxwriter)
- Résumé multi-sources
## Opérations pandas démontrées
### Lecture Excel
```python
df = pd.read_excel('001_do/001_05.xlsx', sheet_name='do')
```
### Pivot table
```python
pivot = df.pivot_table(
    values='N(i)',
    index='classe',
    columns='type',
    aggfunc=['sum', 'mean', 'count']
)
```
### Merge (jointure)
```python
df_merged = pd.merge(
    df_left, 
    df_right, 
    on='i', 
    how='inner'
)
```
### GroupBy (agrégation)
```python
grouped = df.groupby('classe').agg({
    'N(i)': ['sum', 'mean', 'min', 'max'],
    'ttf(i)': ['mean', 'std']
})
```
### Apply (fonction personnalisée)
```python
df['categorie'] = df['ttf(i)'].apply(
    lambda x: 'Court' if x < 500 else 'Long'
)
```
## Formules Excel avec xlsxwriter
### Écriture de formules
```python
worksheet.write_formula('D2', '=B2+C2')
worksheet.write_formula('E2', '=SUM(B2:D2)')
worksheet.write_formula('F2', '=IF(E2>1000, "OK", "KO")')
```
### Références entre feuilles
```python
worksheet.write_formula('A1', '=do_source!B5')
```
### Formules statistiques
```python
worksheet.write_formula('B12', '=AVERAGE(B2:B11)')
worksheet.write_formula('B13', '=STDEV.S(B2:B11)')
```
## Formatage xlsxwriter
### Formats de cellules
```python
bold = workbook.add_format({'bold': True})
money = workbook.add_format({'num_format': '#,##0.00'})
percent = workbook.add_format({'num_format': '0.0%'})
```
### Fusion de cellules
```python
worksheet.merge_range('A1:D1', 'Titre du rapport', title_format)
```
### Largeur de colonnes
```python
worksheet.set_column('A:A', 15)  # Colonne A = 15 caractères
```
## Utilisation
Lit 001_05.xlsx et génère 001_09.xlsx avec analyses avancées

# 001_09 — Export et manipulation avancée avec pandas

## Objectifs
- Lire un fichier Excel existant (001_05.xlsx)
- Effectuer des transformations complexes avec pandas
- Démontrer les opérations avancées : pivot, merge, groupby
- Générer un rapport consolidé multi-sources
- Ajouter des formules Excel dans les cellules

## Structure des feuilles

### Feuille "do_source"
Données lues depuis 001_05.xlsx (feuille "do")

### Feuille "do_pivot"
Table pivot avec pandas.pivot_table() :
- Index : Classe de ttf(i)
- Colonnes : Type de métrique
- Values : Statistiques agrégées (count, mean, sum)

### Feuille "do_merged"
Fusion de plusieurs DataFrames :
- Jointure entre données et classes
- Ajout d'informations calculées
- Utilisation de pd.merge()

### Feuille "do_grouped"
Agrégations avec groupby() :
- Groupement par classe
- Calculs : somme, moyenne, min, max
- Plusieurs niveaux de groupement

### Feuille "do_formulas"
Cellules avec formules Excel natives :
- Formules de somme : =SUM(B2:B11)
- Formules conditionnelles : =IF(C2>500, "Long", "Court")
- Références entre feuilles : =do_source!A2
- Formules statistiques : =AVERAGE(), =STDEV()

### Feuille "do_report"
Rapport consolidé formaté :
- En-têtes mis en forme
- Cellules fusionnées
- Formats conditionnels (via xlsxwriter)
- Résumé multi-sources

## Opérations pandas démontrées

### Lecture Excel
```python
df = pd.read_excel('001_do/001_05.xlsx', sheet_name='do')
```

### Pivot table
```python
pivot = df.pivot_table(
    values='N(i)',
    index='classe',
    columns='type',
    aggfunc=['sum', 'mean', 'count']
)
```

### Merge (jointure)
```python
df_merged = pd.merge(
    df_left, 
    df_right, 
    on='i', 
    how='inner'
)
```

### GroupBy (agrégation)
```python
grouped = df.groupby('classe').agg({
    'N(i)': ['sum', 'mean', 'min', 'max'],
    'ttf(i)': ['mean', 'std']
})
```

### Apply (fonction personnalisée)
```python
df['categorie'] = df['ttf(i)'].apply(
    lambda x: 'Court' if x < 500 else 'Long'
)
```

## Formules Excel avec xlsxwriter

### Écriture de formules
```python
worksheet.write_formula('D2', '=B2+C2')
worksheet.write_formula('E2', '=SUM(B2:D2)')
worksheet.write_formula('F2', '=IF(E2>1000, "OK", "KO")')
```

### Références entre feuilles
```python
worksheet.write_formula('A1', '=do_source!B5')
```

### Formules statistiques
```python
worksheet.write_formula('B12', '=AVERAGE(B2:B11)')
worksheet.write_formula('B13', '=STDEV.S(B2:B11)')
```

## Formatage xlsxwriter

### Formats de cellules
```python
bold = workbook.add_format({'bold': True})
money = workbook.add_format({'num_format': '#,##0.00'})
percent = workbook.add_format({'num_format': '0.0%'})
```

### Fusion de cellules
```python
worksheet.merge_range('A1:D1', 'Titre du rapport', title_format)
```

### Largeur de colonnes
```python
worksheet.set_column('A:A', 15)  # Colonne A = 15 caractères
```

## Utilisation
Lit 001_05.xlsx et génère 001_09.xlsx avec analyses avancées

Code Python⚓

# TD_EDC_01_001_09.py
# Résumé : Manipulation avancée pandas - pivot, merge, groupby, formules Excel
# Lit 001_05.xlsx et génère des analyses avancées
from pathlib import Path
import subprocess
import pandas as pd
import xlsxwriter
def build_paths() -> tuple:
    """Calcule les chemins des fichiers source et destination."""
    script = Path(__file__).resolve()
    root = script.parent.parent
    stem = script.stem
    base_dir_name = script.parent.name
    xlsx_dir = root / f"{base_dir_name}_do"
    
    source_path = xlsx_dir / "001_05.xlsx"
    dest_path = (xlsx_dir / f"{stem}.xlsx").resolve()
    
    return source_path, dest_path
def delete_if_exists(file_path: Path) -> None:
    """Supprime le fichier s'il existe déjà."""
    if file_path.exists():
        file_path.unlink()
def read_source_data(source_path: Path) -> pd.DataFrame:
    """Lit les données depuis 001_05.xlsx."""
    if not source_path.exists():
        raise FileNotFoundError(f"Le fichier source {source_path} n'existe pas. Exécutez d'abord 001_05.py")
    
    df = pd.read_excel(source_path, sheet_name='do')
    # Supprimer la colonne 'classe' si elle existe (type Interval non supporté)
    if 'classe' in df.columns:
        df = df.drop('classe', axis=1)
    
    return df
def create_pivot_table(df: pd.DataFrame) -> pd.DataFrame:
    """Crée une table pivot avec agrégations."""
    # Créer une catégorie ttf pour le pivot
    df['categorie_ttf'] = pd.cut(df['ttf(i)'], bins=3, labels=['Court', 'Moyen', 'Long'])
    
    pivot = df.pivot_table(
        values=['N(i)', 'dN(i)'],
        index='categorie_ttf',
        aggfunc={'N(i)': ['sum', 'mean', 'min', 'max'], 'dN(i)': 'sum'}
    )
    
    # Aplatir les colonnes multi-niveaux
    pivot.columns = ['_'.join(col).strip() for col in pivot.columns.values]
    pivot = pivot.reset_index()
    
    return pivot
def create_grouped_data(df: pd.DataFrame) -> pd.DataFrame:
    """Crée des agrégations avec groupby."""
    df['categorie_ttf'] = pd.cut(df['ttf(i)'], bins=3, labels=['Court', 'Moyen', 'Long'])
    
    grouped = df.groupby('categorie_ttf').agg({
        'ttf(i)': ['mean', 'std', 'min', 'max'],
        'N(i)': ['sum', 'mean'],
        'dN(i)': 'sum'
    })
    
    # Aplatir les colonnes
    grouped.columns = ['_'.join(col).strip() for col in grouped.columns.values]
    grouped = grouped.reset_index()
    
    return grouped
def create_merged_data(df: pd.DataFrame) -> pd.DataFrame:
    """Crée un merge avec des données calculées."""
    # Créer un DataFrame auxiliaire avec des statistiques
    df_stats = pd.DataFrame({
        'i': df['i'],
        'cumul_dN': df['dN(i)'].cumsum(),
        'taux_defaillance': (df['dN(i)'] / df['N(i)'].shift(1)).fillna(0)
    })
    
    # Merge
    df_merged = pd.merge(df, df_stats, on='i', how='inner')
    
    return df_merged
def write_to_excel_with_formulas(dest_path: Path, df_source: pd.DataFrame,
                                   df_pivot: pd.DataFrame, df_merged: pd.DataFrame,
                                   df_grouped: pd.DataFrame) -> None:
    """Écrit dans Excel avec formules et formatage."""
    workbook = xlsxwriter.Workbook(str(dest_path))
    
    # Format bold pour en-têtes
    bold = workbook.add_format({'bold': True, 'bg_color': '#D3D3D3'})
    number_format = workbook.add_format({'num_format': '0.00'})
    
    # Feuille 1 : Données source
    ws_source = workbook.add_worksheet("do_source")
    for col_num, col_name in enumerate(df_source.columns):
        ws_source.write(0, col_num, col_name, bold)
    for row_num, row_data in enumerate(df_source.values, start=1):
        for col_num, value in enumerate(row_data):
            ws_source.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_source' créée")
    
    # Feuille 2 : Table pivot
    ws_pivot = workbook.add_worksheet("do_pivot")
    for col_num, col_name in enumerate(df_pivot.columns):
        ws_pivot.write(0, col_num, col_name, bold)
    for row_num, row_data in enumerate(df_pivot.values, start=1):
        for col_num, value in enumerate(row_data):
            if isinstance(value, (int, float)):
                ws_pivot.write(row_num, col_num, value, number_format)
            else:
                ws_pivot.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_pivot' créée")
    
    # Feuille 3 : Données fusionnées
    ws_merged = workbook.add_worksheet("do_merged")
    for col_num, col_name in enumerate(df_merged.columns):
        ws_merged.write(0, col_num, col_name, bold)
    for row_num, row_data in enumerate(df_merged.values, start=1):
        for col_num, value in enumerate(row_data):
            if isinstance(value, (int, float)):
                ws_merged.write(row_num, col_num, value, number_format)
            else:
                ws_merged.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_merged' créée")
    
    # Feuille 4 : Données groupées
    ws_grouped = workbook.add_worksheet("do_grouped")
    for col_num, col_name in enumerate(df_grouped.columns):
        ws_grouped.write(0, col_num, col_name, bold)
    for row_num, row_data in enumerate(df_grouped.values, start=1):
        for col_num, value in enumerate(row_data):
            if isinstance(value, (int, float)):
                ws_grouped.write(row_num, col_num, value, number_format)
            else:
                ws_grouped.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_grouped' créée")
    
    # Feuille 5 : Formules Excel
    ws_formulas = workbook.add_worksheet("do_formulas")
    
    # En-têtes
    ws_formulas.write('A1', 'Description', bold)
    ws_formulas.write('B1', 'Formule', bold)
    ws_formulas.write('C1', 'Résultat', bold)
    
    # Formules diverses
    ws_formulas.write('A2', 'Somme N(i)')
    ws_formulas.write_formula('B2', '=SUM(do_source!D2:D11)')
    
    ws_formulas.write('A3', 'Moyenne ttf(i)')
    ws_formulas.write_formula('B3', '=AVERAGE(do_source!B2:B11)')
    
    ws_formulas.write('A4', 'Écart-type ttf(i)')
    ws_formulas.write_formula('B4', '=STDEV.S(do_source!B2:B11)')
    
    ws_formulas.write('A5', 'Max N(i)')
    ws_formulas.write_formula('B5', '=MAX(do_source!D2:D11)')
    
    ws_formulas.write('A6', 'Min N(i)')
    ws_formulas.write_formula('B6', '=MIN(do_source!D2:D11)')
    
    ws_formulas.write('A7', 'Référence croisée')
    ws_formulas.write_formula('B7', '=do_source!B5')
    
    ws_formulas.write('A8', 'Condition')
    ws_formulas.write_formula('B8', '=IF(do_source!B5>500, "Long", "Court")')
    
    ws_formulas.set_column('A:A', 25)
    ws_formulas.set_column('B:B', 35)
    ws_formulas.set_column('C:C', 15)
    
    print(f"✓ Feuille 'do_formulas' créée avec formules Excel")
    
    # Feuille 6 : Rapport consolidé
    ws_report = workbook.add_worksheet("do_report")
    
    title_format = workbook.add_format({
        'bold': True,
        'font_size': 14,
        'align': 'center',
        'valign': 'vcenter',
        'bg_color': '#4472C4',
        'font_color': 'white'
    })
    
    ws_report.merge_range('A1:D1', 'Rapport d\'Analyse - Fiabilité', title_format)
    
    ws_report.write('A3', 'Source des données:', bold)
    ws_report.write('B3', '001_05.xlsx')
    
    ws_report.write('A4', 'Nombre d\'observations:', bold)
    ws_report.write_formula('B4', '=COUNTA(do_source!A2:A11)')
    
    ws_report.write('A5', 'MTBF (heures):', bold)
    ws_report.write_formula('B5', '=AVERAGE(do_source!B2:B11)')
    
    ws_report.write('A6', 'Taux de défaillance:', bold)
    ws_report.write_formula('B6', '=SUM(do_source!C2:C11)/SUM(do_source!B2:B11)')
    
    ws_report.set_column('A:A', 25)
    ws_report.set_column('B:B', 20)
    
    print(f"✓ Feuille 'do_report' créée avec rapport consolidé")
    
    workbook.close()
def open_in_excel(xlsx_path: Path) -> None:
    """Ouvre le classeur généré dans Excel."""
    subprocess.Popen(["start", "excel", str(xlsx_path)], shell=True)
def main() -> None:
    """Pipeline : lecture, transformations avancées, formules."""
    source_path, dest_path = build_paths()
    
    print(f"Lecture du fichier source : {source_path}")
    df_source = read_source_data(source_path)
    print(f"✓ {len(df_source)} lignes lues")
    
    print("\nCréation de la table pivot...")
    df_pivot = create_pivot_table(df_source.copy())
    print(df_pivot)
    
    print("\nCréation des données groupées...")
    df_grouped = create_grouped_data(df_source.copy())
    print(df_grouped)
    
    print("\nCréation des données fusionnées...")
    df_merged = create_merged_data(df_source.copy())
    print(df_merged.head())
    
    print("\nÉcriture dans Excel avec formules...")
    delete_if_exists(dest_path)
    write_to_excel_with_formulas(dest_path, df_source, df_pivot, df_merged, df_grouped)
    
    print(f"\nFichier créé : {dest_path}")
    print("6 feuilles générées avec pivot, merge, groupby, formules et rapport")
    open_in_excel(dest_path)
if __name__ == "__main__":
    main()

# TD_EDC_01_001_09.py
# Résumé : Manipulation avancée pandas - pivot, merge, groupby, formules Excel
# Lit 001_05.xlsx et génère des analyses avancées
from pathlib import Path
import subprocess
import pandas as pd
import xlsxwriter


def build_paths() -> tuple:
    """Calcule les chemins des fichiers source et destination."""
    script = Path(__file__).resolve()
    root = script.parent.parent
    stem = script.stem
    base_dir_name = script.parent.name
    xlsx_dir = root / f"{base_dir_name}_do"
    
    source_path = xlsx_dir / "001_05.xlsx"
    dest_path = (xlsx_dir / f"{stem}.xlsx").resolve()
    
    return source_path, dest_path


def delete_if_exists(file_path: Path) -> None:
    """Supprime le fichier s'il existe déjà."""
    if file_path.exists():
        file_path.unlink()


def read_source_data(source_path: Path) -> pd.DataFrame:
    """Lit les données depuis 001_05.xlsx."""
    if not source_path.exists():
        raise FileNotFoundError(f"Le fichier source {source_path} n'existe pas. Exécutez d'abord 001_05.py")
    
    df = pd.read_excel(source_path, sheet_name='do')
    # Supprimer la colonne 'classe' si elle existe (type Interval non supporté)
    if 'classe' in df.columns:
        df = df.drop('classe', axis=1)
    
    return df


def create_pivot_table(df: pd.DataFrame) -> pd.DataFrame:
    """Crée une table pivot avec agrégations."""
    # Créer une catégorie ttf pour le pivot
    df['categorie_ttf'] = pd.cut(df['ttf(i)'], bins=3, labels=['Court', 'Moyen', 'Long'])
    
    pivot = df.pivot_table(
        values=['N(i)', 'dN(i)'],
        index='categorie_ttf',
        aggfunc={'N(i)': ['sum', 'mean', 'min', 'max'], 'dN(i)': 'sum'}
    )
    
    # Aplatir les colonnes multi-niveaux
    pivot.columns = ['_'.join(col).strip() for col in pivot.columns.values]
    pivot = pivot.reset_index()
    
    return pivot


def create_grouped_data(df: pd.DataFrame) -> pd.DataFrame:
    """Crée des agrégations avec groupby."""
    df['categorie_ttf'] = pd.cut(df['ttf(i)'], bins=3, labels=['Court', 'Moyen', 'Long'])
    
    grouped = df.groupby('categorie_ttf').agg({
        'ttf(i)': ['mean', 'std', 'min', 'max'],
        'N(i)': ['sum', 'mean'],
        'dN(i)': 'sum'
    })
    
    # Aplatir les colonnes
    grouped.columns = ['_'.join(col).strip() for col in grouped.columns.values]
    grouped = grouped.reset_index()
    
    return grouped


def create_merged_data(df: pd.DataFrame) -> pd.DataFrame:
    """Crée un merge avec des données calculées."""
    # Créer un DataFrame auxiliaire avec des statistiques
    df_stats = pd.DataFrame({
        'i': df['i'],
        'cumul_dN': df['dN(i)'].cumsum(),
        'taux_defaillance': (df['dN(i)'] / df['N(i)'].shift(1)).fillna(0)
    })
    
    # Merge
    df_merged = pd.merge(df, df_stats, on='i', how='inner')
    
    return df_merged


def write_to_excel_with_formulas(dest_path: Path, df_source: pd.DataFrame,
                                   df_pivot: pd.DataFrame, df_merged: pd.DataFrame,
                                   df_grouped: pd.DataFrame) -> None:
    """Écrit dans Excel avec formules et formatage."""
    workbook = xlsxwriter.Workbook(str(dest_path))
    
    # Format bold pour en-têtes
    bold = workbook.add_format({'bold': True, 'bg_color': '#D3D3D3'})
    number_format = workbook.add_format({'num_format': '0.00'})
    
    # Feuille 1 : Données source
    ws_source = workbook.add_worksheet("do_source")
    for col_num, col_name in enumerate(df_source.columns):
        ws_source.write(0, col_num, col_name, bold)
    for row_num, row_data in enumerate(df_source.values, start=1):
        for col_num, value in enumerate(row_data):
            ws_source.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_source' créée")
    
    # Feuille 2 : Table pivot
    ws_pivot = workbook.add_worksheet("do_pivot")
    for col_num, col_name in enumerate(df_pivot.columns):
        ws_pivot.write(0, col_num, col_name, bold)
    for row_num, row_data in enumerate(df_pivot.values, start=1):
        for col_num, value in enumerate(row_data):
            if isinstance(value, (int, float)):
                ws_pivot.write(row_num, col_num, value, number_format)
            else:
                ws_pivot.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_pivot' créée")
    
    # Feuille 3 : Données fusionnées
    ws_merged = workbook.add_worksheet("do_merged")
    for col_num, col_name in enumerate(df_merged.columns):
        ws_merged.write(0, col_num, col_name, bold)
    for row_num, row_data in enumerate(df_merged.values, start=1):
        for col_num, value in enumerate(row_data):
            if isinstance(value, (int, float)):
                ws_merged.write(row_num, col_num, value, number_format)
            else:
                ws_merged.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_merged' créée")
    
    # Feuille 4 : Données groupées
    ws_grouped = workbook.add_worksheet("do_grouped")
    for col_num, col_name in enumerate(df_grouped.columns):
        ws_grouped.write(0, col_num, col_name, bold)
    for row_num, row_data in enumerate(df_grouped.values, start=1):
        for col_num, value in enumerate(row_data):
            if isinstance(value, (int, float)):
                ws_grouped.write(row_num, col_num, value, number_format)
            else:
                ws_grouped.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_grouped' créée")
    
    # Feuille 5 : Formules Excel
    ws_formulas = workbook.add_worksheet("do_formulas")
    
    # En-têtes
    ws_formulas.write('A1', 'Description', bold)
    ws_formulas.write('B1', 'Formule', bold)
    ws_formulas.write('C1', 'Résultat', bold)
    
    # Formules diverses
    ws_formulas.write('A2', 'Somme N(i)')
    ws_formulas.write_formula('B2', '=SUM(do_source!D2:D11)')
    
    ws_formulas.write('A3', 'Moyenne ttf(i)')
    ws_formulas.write_formula('B3', '=AVERAGE(do_source!B2:B11)')
    
    ws_formulas.write('A4', 'Écart-type ttf(i)')
    ws_formulas.write_formula('B4', '=STDEV.S(do_source!B2:B11)')
    
    ws_formulas.write('A5', 'Max N(i)')
    ws_formulas.write_formula('B5', '=MAX(do_source!D2:D11)')
    
    ws_formulas.write('A6', 'Min N(i)')
    ws_formulas.write_formula('B6', '=MIN(do_source!D2:D11)')
    
    ws_formulas.write('A7', 'Référence croisée')
    ws_formulas.write_formula('B7', '=do_source!B5')
    
    ws_formulas.write('A8', 'Condition')
    ws_formulas.write_formula('B8', '=IF(do_source!B5>500, "Long", "Court")')
    
    ws_formulas.set_column('A:A', 25)
    ws_formulas.set_column('B:B', 35)
    ws_formulas.set_column('C:C', 15)
    
    print(f"✓ Feuille 'do_formulas' créée avec formules Excel")
    
    # Feuille 6 : Rapport consolidé
    ws_report = workbook.add_worksheet("do_report")
    
    title_format = workbook.add_format({
        'bold': True,
        'font_size': 14,
        'align': 'center',
        'valign': 'vcenter',
        'bg_color': '#4472C4',
        'font_color': 'white'
    })
    
    ws_report.merge_range('A1:D1', 'Rapport d\'Analyse - Fiabilité', title_format)
    
    ws_report.write('A3', 'Source des données:', bold)
    ws_report.write('B3', '001_05.xlsx')
    
    ws_report.write('A4', 'Nombre d\'observations:', bold)
    ws_report.write_formula('B4', '=COUNTA(do_source!A2:A11)')
    
    ws_report.write('A5', 'MTBF (heures):', bold)
    ws_report.write_formula('B5', '=AVERAGE(do_source!B2:B11)')
    
    ws_report.write('A6', 'Taux de défaillance:', bold)
    ws_report.write_formula('B6', '=SUM(do_source!C2:C11)/SUM(do_source!B2:B11)')
    
    ws_report.set_column('A:A', 25)
    ws_report.set_column('B:B', 20)
    
    print(f"✓ Feuille 'do_report' créée avec rapport consolidé")
    
    workbook.close()


def open_in_excel(xlsx_path: Path) -> None:
    """Ouvre le classeur généré dans Excel."""
    subprocess.Popen(["start", "excel", str(xlsx_path)], shell=True)


def main() -> None:
    """Pipeline : lecture, transformations avancées, formules."""
    source_path, dest_path = build_paths()
    
    print(f"Lecture du fichier source : {source_path}")
    df_source = read_source_data(source_path)
    print(f"✓ {len(df_source)} lignes lues")
    
    print("\nCréation de la table pivot...")
    df_pivot = create_pivot_table(df_source.copy())
    print(df_pivot)
    
    print("\nCréation des données groupées...")
    df_grouped = create_grouped_data(df_source.copy())
    print(df_grouped)
    
    print("\nCréation des données fusionnées...")
    df_merged = create_merged_data(df_source.copy())
    print(df_merged.head())
    
    print("\nÉcriture dans Excel avec formules...")
    delete_if_exists(dest_path)
    write_to_excel_with_formulas(dest_path, df_source, df_pivot, df_merged, df_grouped)
    
    print(f"\nFichier créé : {dest_path}")
    print("6 feuilles générées avec pivot, merge, groupby, formules et rapport")
    open_in_excel(dest_path)


if __name__ == "__main__":
    main()

Documentation⚓

# 001_09.py — Manipulation avancée pandas
Ce script Python illustre des manipulations avancées de données avec pandas : pivot, merge, groupby et intégration de formules Excel.
## Objectifs pédagogiques
- Maîtriser les opérations pandas avancées (pivot, merge, groupby)
- Lire et transformer des fichiers Excel existants
- Intégrer des formules Excel dans les exports
- Créer des tableaux croisés dynamiques
## Fonctionnement
1. **Lecture de données sources**
   - Chargement du fichier 001_05.xlsx
   - Vérification et nettoyage des données
2. **Transformations pandas**
   - `pivot_table()` : tableaux croisés
   - `merge()` : fusion de DataFrames
   - `groupby()` : agrégations groupées
   - Calculs de statistiques par catégorie
3. **Formules Excel**
   - Insertion de formules dans les cellules
   - Références entre cellules et feuilles
   - Formules de calcul automatique (SUM, AVERAGE, etc.)
4. **Export structuré**
   - Plusieurs feuilles avec analyses différentes
   - Mise en forme conditionnelle
   - Tableaux de synthèse avec formules
## Points techniques
- Lecture Excel multi-feuilles avec pandas
- Opérations de transformation de données
- Export avec formules Excel actives
- Intégration xlsxwriter + pandas
## Utilisation
Ce script sert de référence pour effectuer des analyses de données complexes en combinant pandas et Excel, avec conservation des formules de calcul.
---
*Fichier généré automatiquement par GitHub Copilot (GPT-4.1) — 11/12/2025*

# 001_09.py — Manipulation avancée pandas

Ce script Python illustre des manipulations avancées de données avec pandas : pivot, merge, groupby et intégration de formules Excel.

## Objectifs pédagogiques
- Maîtriser les opérations pandas avancées (pivot, merge, groupby)
- Lire et transformer des fichiers Excel existants
- Intégrer des formules Excel dans les exports
- Créer des tableaux croisés dynamiques

## Fonctionnement
1. **Lecture de données sources**
   - Chargement du fichier 001_05.xlsx
   - Vérification et nettoyage des données

2. **Transformations pandas**
   - `pivot_table()` : tableaux croisés
   - `merge()` : fusion de DataFrames
   - `groupby()` : agrégations groupées
   - Calculs de statistiques par catégorie

3. **Formules Excel**
   - Insertion de formules dans les cellules
   - Références entre cellules et feuilles
   - Formules de calcul automatique (SUM, AVERAGE, etc.)

4. **Export structuré**
   - Plusieurs feuilles avec analyses différentes
   - Mise en forme conditionnelle
   - Tableaux de synthèse avec formules

## Points techniques
- Lecture Excel multi-feuilles avec pandas
- Opérations de transformation de données
- Export avec formules Excel actives
- Intégration xlsxwriter + pandas

## Utilisation
Ce script sert de référence pour effectuer des analyses de données complexes en combinant pandas et Excel, avec conservation des formules de calcul.

---
*Fichier généré automatiquement par GitHub Copilot (GPT-4.1) — 11/12/2025*