Exercise 001_06 [PYTHON-th-P19]

Exercise 001_06

Cahier des charges⚓

# 001_06 — Analyse statistique avancée sur les données de fiabilité
## Objectifs
- Calculer des statistiques descriptives complètes sur ttf(i)
- Calculer le MTBF (Mean Time Between Failures)
- Ajouter des colonnes calculées : taux de défaillance λ(i), fiabilité R(i)
- Générer plusieurs feuilles Excel avec différentes vues statistiques
## Structure des feuilles
### Feuille "do_stats"
Statistiques descriptives sur ttf(i) :
- Moyenne, médiane, mode
- Écart-type, variance
- Min, max, étendue
- Quartiles (Q1, Q2, Q3)
- MTBF (Mean Time Between Failures)
### Feuille "do_fiabilite"
Calculs de fiabilité :
- Colonnes : i, ttf(i), N(i), R(i), λ(i), F(i)
- R(i) = N(i) / N(0) : Fiabilité
- λ(i) = dN(i) / (N(i) × Δt) : Taux de défaillance
- F(i) = 1 - R(i) : Fonction de répartition (défaillance cumulée)
### Feuille "do_summary"
Résumé consolidé :
- Nombre total d'observations
- Durée totale d'observation
- Nombre de défaillances
- MTBF
- Taux de défaillance moyen
## Formules utilisées
### MTBF
```
MTBF = Σ(ttf(i)) / nombre_defaillances
```
### Fiabilité R(i)
```
R(i) = N(i) / N(0)
```
Proportion de composants encore fonctionnels
### Taux de défaillance λ(i)
```
λ(i) = dN(i) / (N(i-1) × Δt)
```
où Δt = ttf(i) - ttf(i-1)
### Fonction de répartition F(i)
```
F(i) = 1 - R(i)
```
Probabilité de défaillance avant le temps i

# 001_06 — Analyse statistique avancée sur les données de fiabilité

## Objectifs
- Calculer des statistiques descriptives complètes sur ttf(i)
- Calculer le MTBF (Mean Time Between Failures)
- Ajouter des colonnes calculées : taux de défaillance λ(i), fiabilité R(i)
- Générer plusieurs feuilles Excel avec différentes vues statistiques

## Structure des feuilles

### Feuille "do_stats"
Statistiques descriptives sur ttf(i) :
- Moyenne, médiane, mode
- Écart-type, variance
- Min, max, étendue
- Quartiles (Q1, Q2, Q3)
- MTBF (Mean Time Between Failures)

### Feuille "do_fiabilite"
Calculs de fiabilité :
- Colonnes : i, ttf(i), N(i), R(i), λ(i), F(i)
- R(i) = N(i) / N(0) : Fiabilité
- λ(i) = dN(i) / (N(i) × Δt) : Taux de défaillance
- F(i) = 1 - R(i) : Fonction de répartition (défaillance cumulée)

### Feuille "do_summary"
Résumé consolidé :
- Nombre total d'observations
- Durée totale d'observation
- Nombre de défaillances
- MTBF
- Taux de défaillance moyen

## Formules utilisées

### MTBF
```
MTBF = Σ(ttf(i)) / nombre_defaillances
```

### Fiabilité R(i)
```
R(i) = N(i) / N(0)
```
Proportion de composants encore fonctionnels

### Taux de défaillance λ(i)
```
λ(i) = dN(i) / (N(i-1) × Δt)
```
où Δt = ttf(i) - ttf(i-1)

### Fonction de répartition F(i)
```
F(i) = 1 - R(i)
```
Probabilité de défaillance avant le temps i

Code Python⚓

# TD_EDC_01_001_06.py
# Résumé : Analyse statistique avancée - MTBF, taux de défaillance, fiabilité
# Génère trois feuilles : do_stats, do_fiabilite, do_summary
from pathlib import Path
import subprocess
import pandas as pd
import numpy as np
import xlsxwriter
def build_paths() -> Path:
    """Calcule le chemin du fichier Excel de sortie."""
    script = Path(__file__).resolve()
    root = script.parent.parent
    stem = script.stem
    base_dir_name = script.parent.name
    xlsx_dir = root / f"{base_dir_name}_do"
    xlsx_dir.mkdir(parents=True, exist_ok=True)
    
    xlsx_path = (xlsx_dir / f"{stem}.xlsx").resolve()
    return xlsx_path
def delete_if_exists(file_path: Path) -> None:
    """Supprime le fichier s'il existe déjà."""
    if file_path.exists():
        file_path.unlink()
def prepare_data(n: int = 9, ttf_values: list = None) -> pd.DataFrame:
    """Prépare les données de base."""
    i_values = list(range(n + 1))
    dN_values = [0] + [1] * n
    N_values = [n - i for i in range(n + 1)]
    
    df = pd.DataFrame({
        'i': i_values,
        'ttf(i)': ttf_values if ttf_values else [0] * (n + 1),
        'dN(i)': dN_values,
        'N(i)': N_values
    })
    
    return df
def calculate_statistics(df: pd.DataFrame) -> pd.DataFrame:
    """Calcule les statistiques descriptives sur ttf(i)."""
    ttf = df['ttf(i)']
    
    stats = {
        'Statistique': ['Moyenne', 'Médiane', 'Écart-type', 'Variance', 
                        'Min', 'Max', 'Étendue', 'Q1', 'Q2', 'Q3', 'MTBF'],
        'Valeur': [
            ttf.mean(),
            ttf.median(),
            ttf.std(),
            ttf.var(),
            ttf.min(),
            ttf.max(),
            ttf.max() - ttf.min(),
            ttf.quantile(0.25),
            ttf.quantile(0.50),
            ttf.quantile(0.75),
            ttf.sum() / df['dN(i)'].sum()  # MTBF
        ]
    }
    
    return pd.DataFrame(stats)
def calculate_reliability(df: pd.DataFrame) -> pd.DataFrame:
    """Calcule les indicateurs de fiabilité."""
    N_0 = df['N(i)'].iloc[0]
    
    # Fiabilité R(i) = N(i) / N(0)
    R_i = df['N(i)'] / N_0
    
    # Fonction de répartition F(i) = 1 - R(i)
    F_i = 1 - R_i
    
    # Taux de défaillance λ(i) = dN(i) / (N(i-1) × Δt)
    lambda_i = []
    for i in range(len(df)):
        if i == 0:
            lambda_i.append(0)
        else:
            delta_t = df['ttf(i)'].iloc[i] - df['ttf(i)'].iloc[i-1]
            N_prev = df['N(i)'].iloc[i-1]
            dN = df['dN(i)'].iloc[i]
            if delta_t > 0 and N_prev > 0:
                lambda_i.append(dN / (N_prev * delta_t))
            else:
                lambda_i.append(0)
    
    df_reliability = pd.DataFrame({
        'i': df['i'],
        'ttf(i)': df['ttf(i)'],
        'N(i)': df['N(i)'],
        'R(i)': R_i,
        'F(i)': F_i,
        'λ(i)': lambda_i
    })
    
    return df_reliability
def create_summary(df: pd.DataFrame) -> pd.DataFrame:
    """Crée un résumé consolidé."""
    total_obs = len(df) - 1  # Exclure la première ligne
    duree_totale = df['ttf(i)'].max()
    nb_defaillances = df['dN(i)'].sum()
    mtbf = df['ttf(i)'].sum() / nb_defaillances if nb_defaillances > 0 else 0
    lambda_moyen = nb_defaillances / duree_totale if duree_totale > 0 else 0
    
    summary = {
        'Indicateur': [
            'Nombre d\'observations',
            'Durée totale (heures)',
            'Nombre de défaillances',
            'MTBF (heures)',
            'Taux de défaillance moyen (1/h)'
        ],
        'Valeur': [
            total_obs,
            duree_totale,
            nb_defaillances,
            mtbf,
            lambda_moyen
        ]
    }
    
    return pd.DataFrame(summary)
def write_to_excel(xlsx_path: Path, df_stats: pd.DataFrame, 
                   df_reliability: pd.DataFrame, df_summary: pd.DataFrame) -> None:
    """Écrit les trois DataFrames dans le fichier Excel."""
    workbook = xlsxwriter.Workbook(str(xlsx_path))
    
    # Feuille 1 : Statistiques descriptives
    ws_stats = workbook.add_worksheet("do_stats")
    for col_num, col_name in enumerate(df_stats.columns):
        ws_stats.write(0, col_num, col_name)
    for row_num, row_data in enumerate(df_stats.values, start=1):
        for col_num, value in enumerate(row_data):
            ws_stats.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_stats' créée avec {len(df_stats)} statistiques")
    
    # Feuille 2 : Fiabilité
    ws_reliability = workbook.add_worksheet("do_fiabilite")
    for col_num, col_name in enumerate(df_reliability.columns):
        ws_reliability.write(0, col_num, col_name)
    for row_num, row_data in enumerate(df_reliability.values, start=1):
        for col_num, value in enumerate(row_data):
            ws_reliability.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_fiabilite' créée avec {len(df_reliability)} lignes")
    
    # Feuille 3 : Résumé
    ws_summary = workbook.add_worksheet("do_summary")
    for col_num, col_name in enumerate(df_summary.columns):
        ws_summary.write(0, col_num, col_name)
    for row_num, row_data in enumerate(df_summary.values, start=1):
        for col_num, value in enumerate(row_data):
            ws_summary.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_summary' créée avec {len(df_summary)} indicateurs")
    
    workbook.close()
def open_in_excel(xlsx_path: Path) -> None:
    """Ouvre le classeur généré dans Excel."""
    subprocess.Popen(["start", "excel", str(xlsx_path)], shell=True)
def main() -> None:
    """Pipeline : calculs statistiques et de fiabilité."""
    xlsx_path = build_paths()
    
    ttf_i = [0, 250, 400, 550, 700, 850, 1000, 1150, 1300, 1450]
    
    # Préparer les données
    df = prepare_data(n=9, ttf_values=ttf_i)
    print("Données préparées")
    
    # Calculer les statistiques
    df_stats = calculate_statistics(df)
    print("\nStatistiques descriptives :")
    print(df_stats)
    print()
    
    # Calculer la fiabilité
    df_reliability = calculate_reliability(df)
    print("Indicateurs de fiabilité :")
    print(df_reliability)
    print()
    
    # Créer le résumé
    df_summary = create_summary(df)
    print("Résumé consolidé :")
    print(df_summary)
    print()
    
    # Écrire dans Excel
    delete_if_exists(xlsx_path)
    write_to_excel(xlsx_path, df_stats, df_reliability, df_summary)
    
    print(f"Fichier créé : {xlsx_path}")
    open_in_excel(xlsx_path)
if __name__ == "__main__":
    main()

# TD_EDC_01_001_06.py
# Résumé : Analyse statistique avancée - MTBF, taux de défaillance, fiabilité
# Génère trois feuilles : do_stats, do_fiabilite, do_summary
from pathlib import Path
import subprocess
import pandas as pd
import numpy as np
import xlsxwriter


def build_paths() -> Path:
    """Calcule le chemin du fichier Excel de sortie."""
    script = Path(__file__).resolve()
    root = script.parent.parent
    stem = script.stem
    base_dir_name = script.parent.name
    xlsx_dir = root / f"{base_dir_name}_do"
    xlsx_dir.mkdir(parents=True, exist_ok=True)
    
    xlsx_path = (xlsx_dir / f"{stem}.xlsx").resolve()
    return xlsx_path


def delete_if_exists(file_path: Path) -> None:
    """Supprime le fichier s'il existe déjà."""
    if file_path.exists():
        file_path.unlink()


def prepare_data(n: int = 9, ttf_values: list = None) -> pd.DataFrame:
    """Prépare les données de base."""
    i_values = list(range(n + 1))
    dN_values = [0] + [1] * n
    N_values = [n - i for i in range(n + 1)]
    
    df = pd.DataFrame({
        'i': i_values,
        'ttf(i)': ttf_values if ttf_values else [0] * (n + 1),
        'dN(i)': dN_values,
        'N(i)': N_values
    })
    
    return df


def calculate_statistics(df: pd.DataFrame) -> pd.DataFrame:
    """Calcule les statistiques descriptives sur ttf(i)."""
    ttf = df['ttf(i)']
    
    stats = {
        'Statistique': ['Moyenne', 'Médiane', 'Écart-type', 'Variance', 
                        'Min', 'Max', 'Étendue', 'Q1', 'Q2', 'Q3', 'MTBF'],
        'Valeur': [
            ttf.mean(),
            ttf.median(),
            ttf.std(),
            ttf.var(),
            ttf.min(),
            ttf.max(),
            ttf.max() - ttf.min(),
            ttf.quantile(0.25),
            ttf.quantile(0.50),
            ttf.quantile(0.75),
            ttf.sum() / df['dN(i)'].sum()  # MTBF
        ]
    }
    
    return pd.DataFrame(stats)


def calculate_reliability(df: pd.DataFrame) -> pd.DataFrame:
    """Calcule les indicateurs de fiabilité."""
    N_0 = df['N(i)'].iloc[0]
    
    # Fiabilité R(i) = N(i) / N(0)
    R_i = df['N(i)'] / N_0
    
    # Fonction de répartition F(i) = 1 - R(i)
    F_i = 1 - R_i
    
    # Taux de défaillance λ(i) = dN(i) / (N(i-1) × Δt)
    lambda_i = []
    for i in range(len(df)):
        if i == 0:
            lambda_i.append(0)
        else:
            delta_t = df['ttf(i)'].iloc[i] - df['ttf(i)'].iloc[i-1]
            N_prev = df['N(i)'].iloc[i-1]
            dN = df['dN(i)'].iloc[i]
            if delta_t > 0 and N_prev > 0:
                lambda_i.append(dN / (N_prev * delta_t))
            else:
                lambda_i.append(0)
    
    df_reliability = pd.DataFrame({
        'i': df['i'],
        'ttf(i)': df['ttf(i)'],
        'N(i)': df['N(i)'],
        'R(i)': R_i,
        'F(i)': F_i,
        'λ(i)': lambda_i
    })
    
    return df_reliability


def create_summary(df: pd.DataFrame) -> pd.DataFrame:
    """Crée un résumé consolidé."""
    total_obs = len(df) - 1  # Exclure la première ligne
    duree_totale = df['ttf(i)'].max()
    nb_defaillances = df['dN(i)'].sum()
    mtbf = df['ttf(i)'].sum() / nb_defaillances if nb_defaillances > 0 else 0
    lambda_moyen = nb_defaillances / duree_totale if duree_totale > 0 else 0
    
    summary = {
        'Indicateur': [
            'Nombre d\'observations',
            'Durée totale (heures)',
            'Nombre de défaillances',
            'MTBF (heures)',
            'Taux de défaillance moyen (1/h)'
        ],
        'Valeur': [
            total_obs,
            duree_totale,
            nb_defaillances,
            mtbf,
            lambda_moyen
        ]
    }
    
    return pd.DataFrame(summary)


def write_to_excel(xlsx_path: Path, df_stats: pd.DataFrame, 
                   df_reliability: pd.DataFrame, df_summary: pd.DataFrame) -> None:
    """Écrit les trois DataFrames dans le fichier Excel."""
    workbook = xlsxwriter.Workbook(str(xlsx_path))
    
    # Feuille 1 : Statistiques descriptives
    ws_stats = workbook.add_worksheet("do_stats")
    for col_num, col_name in enumerate(df_stats.columns):
        ws_stats.write(0, col_num, col_name)
    for row_num, row_data in enumerate(df_stats.values, start=1):
        for col_num, value in enumerate(row_data):
            ws_stats.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_stats' créée avec {len(df_stats)} statistiques")
    
    # Feuille 2 : Fiabilité
    ws_reliability = workbook.add_worksheet("do_fiabilite")
    for col_num, col_name in enumerate(df_reliability.columns):
        ws_reliability.write(0, col_num, col_name)
    for row_num, row_data in enumerate(df_reliability.values, start=1):
        for col_num, value in enumerate(row_data):
            ws_reliability.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_fiabilite' créée avec {len(df_reliability)} lignes")
    
    # Feuille 3 : Résumé
    ws_summary = workbook.add_worksheet("do_summary")
    for col_num, col_name in enumerate(df_summary.columns):
        ws_summary.write(0, col_num, col_name)
    for row_num, row_data in enumerate(df_summary.values, start=1):
        for col_num, value in enumerate(row_data):
            ws_summary.write(row_num, col_num, value)
    print(f"✓ Feuille 'do_summary' créée avec {len(df_summary)} indicateurs")
    
    workbook.close()


def open_in_excel(xlsx_path: Path) -> None:
    """Ouvre le classeur généré dans Excel."""
    subprocess.Popen(["start", "excel", str(xlsx_path)], shell=True)


def main() -> None:
    """Pipeline : calculs statistiques et de fiabilité."""
    xlsx_path = build_paths()
    
    ttf_i = [0, 250, 400, 550, 700, 850, 1000, 1150, 1300, 1450]
    
    # Préparer les données
    df = prepare_data(n=9, ttf_values=ttf_i)
    print("Données préparées")
    
    # Calculer les statistiques
    df_stats = calculate_statistics(df)
    print("\nStatistiques descriptives :")
    print(df_stats)
    print()
    
    # Calculer la fiabilité
    df_reliability = calculate_reliability(df)
    print("Indicateurs de fiabilité :")
    print(df_reliability)
    print()
    
    # Créer le résumé
    df_summary = create_summary(df)
    print("Résumé consolidé :")
    print(df_summary)
    print()
    
    # Écrire dans Excel
    delete_if_exists(xlsx_path)
    write_to_excel(xlsx_path, df_stats, df_reliability, df_summary)
    
    print(f"Fichier créé : {xlsx_path}")
    open_in_excel(xlsx_path)


if __name__ == "__main__":
    main()

Documentation⚓

# 001_06.py — Analyse statistique avancée
Ce script Python effectue une analyse statistique avancée incluant le calcul du MTBF (Mean Time Between Failures), du taux de défaillance et de la fiabilité.
## Objectifs pédagogiques
- Comprendre les concepts de fiabilité et de MTBF
- Calculer le taux de défaillance (λ) et la fiabilité R(t)
- Générer plusieurs feuilles Excel avec des analyses différentes
- Utiliser pandas et numpy pour les calculs statistiques
## Fonctionnement
1. **Génération de données TTF (Time To Failure)**
   - Création d'un jeu de données de temps avant défaillance
   - Calcul du MTBF à partir des données observées
2. **Calculs de fiabilité**
   - Taux de défaillance λ = 1/MTBF
   - Fonction de fiabilité R(t) = e^(-λt)
   - Calculs sur différentes périodes
3. **Export multi-feuilles**
   - Feuille `do_stats` : statistiques descriptives
   - Feuille `do_fiabilite` : calculs de fiabilité
   - Feuille `do_summary` : résumé et indicateurs clés
## Points techniques
- Utilisation de `pandas` pour l'analyse de données
- Utilisation de `numpy` pour les calculs exponentiels
- Export multi-feuilles avec `xlsxwriter`
- Structure de données tabulaire pour analyses statistiques
## Utilisation
Ce script sert de modèle pour effectuer des analyses de fiabilité sur des données de défaillance, avec export automatisé dans Excel.
---
*Fichier généré automatiquement par GitHub Copilot (GPT-4.1) — 11/12/2025*

# 001_06.py — Analyse statistique avancée

Ce script Python effectue une analyse statistique avancée incluant le calcul du MTBF (Mean Time Between Failures), du taux de défaillance et de la fiabilité.

## Objectifs pédagogiques
- Comprendre les concepts de fiabilité et de MTBF
- Calculer le taux de défaillance (λ) et la fiabilité R(t)
- Générer plusieurs feuilles Excel avec des analyses différentes
- Utiliser pandas et numpy pour les calculs statistiques

## Fonctionnement
1. **Génération de données TTF (Time To Failure)**
   - Création d'un jeu de données de temps avant défaillance
   - Calcul du MTBF à partir des données observées

2. **Calculs de fiabilité**
   - Taux de défaillance λ = 1/MTBF
   - Fonction de fiabilité R(t) = e^(-λt)
   - Calculs sur différentes périodes

3. **Export multi-feuilles**
   - Feuille `do_stats` : statistiques descriptives
   - Feuille `do_fiabilite` : calculs de fiabilité
   - Feuille `do_summary` : résumé et indicateurs clés

## Points techniques
- Utilisation de `pandas` pour l'analyse de données
- Utilisation de `numpy` pour les calculs exponentiels
- Export multi-feuilles avec `xlsxwriter`
- Structure de données tabulaire pour analyses statistiques

## Utilisation
Ce script sert de modèle pour effectuer des analyses de fiabilité sur des données de défaillance, avec export automatisé dans Excel.

---
*Fichier généré automatiquement par GitHub Copilot (GPT-4.1) — 11/12/2025*