File size: 3,372 Bytes
d2fdb39
 
 
 
 
 
 
 
 
 
 
 
ced282c
01c4625
ced282c
01c4625
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ced282c
 
 
01c4625
 
 
 
 
 
 
 
 
ced282c
 
 
01c4625
ced282c
 
 
 
01c4625
 
 
 
 
 
 
 
 
 
 
ced282c
01c4625
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ced282c
 
 
01c4625
 
 
 
 
 
 
 
 
 
ced282c
d2fdb39
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
---
title: BOB
emoji: 📈
colorFrom: blue
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: mit
---


# 🎵 BOB Processor - Version Hugging Face

Application de transcription et d'analyse automatique de fichiers audio utilisant Hugging Face Transformers.

## 🚀 Nouveautés (Mise à jour depuis EXE)

### Améliorations intégrées :
-**portable_env.py** : Bootstrap environnement portable avec gestion PyInstaller
- ✅ **Extraction auteur améliorée** : Support des formats "1 DEMARIA Philippe" → "DEMARIA Philippe"
- ✅ **Interface GUI avancée** : Suppression automatique des fenêtres console
- ✅ **Gestion durées audio** : Calcul automatique avec pydub + correction auto P+S/SON
- ✅ **Variables d'environnement** : Lecture dynamique des modèles depuis l'environnement
- ✅ **Gestion d'erreurs améliorée** : Encodage UTF-8 robuste
- ✅ **API factorisée** : Callbacks pour log/progress/cancel dans l'analyse

### Modèles Hugging Face supportés :
- **Qwen/Qwen2-7B-Instruct** (recommandé) - Excellent pour l'analyse
- **microsoft/DialoGPT-medium** (plus léger) - Pour PC avec peu de RAM
- **google/flan-t5-base** (très léger) - Pour tests rapides

## Fonctionnalités

- 🎵 **Transcription audio** avec Whisper (Small/Medium)
- 🤖 **Analyse de contenu** avec Hugging Face Transformers
- 📋 **Classification automatique** des formats :
  - **P** = Papier seul (lecture continue)
  - **P+S** = Papier + Son (avec témoignages/interviews)
  - **QR** = Questions-Réponses (dialogue en direct)
  - **MT** = Micro-Trottoir (opinions publiques)
- 📝 **Extraction d'informations** : Auteur, Qualification, Titre, Durée
- 🔍 **Détection automatique** des patterns de contenu

## Utilisation

### Interface Gradio (Web)
1. Téléchargez un fichier audio (MP3, WAV, etc.)
2. Cliquez sur "Traiter le fichier"
3. Obtenez la transcription et l'analyse automatique

### Interface GUI (Desktop)
```bash
python bob_gui_hf.py
```

### Script en ligne de commande
```bash
python process_bob_hf.py
```

## Installation

```bash
pip install -r requirements.txt
```

## Architecture

```
HUGIN PORTABLE BOB/
├── portable_env.py      # 🆕 Bootstrap environnement portable
├── transcribe_audio.py  # Transcription Whisper
├── analyze_bob_hf.py    # 🆕 Analyse Hugging Face (mis à jour)
├── bob_gui_hf.py        # 🆕 Interface graphique (améliorée)
├── process_bob_hf.py    # Orchestrateur principal
├── app.py               # Interface Gradio pour Hugging Face Spaces
└── requirements.txt     # 🆕 Dépendances nettoyées
```

## Configuration

Variables d'environnement supportées :
- `HF_MODEL` : Modèle Hugging Face à utiliser
- `WHISPER_MODEL` : Modèle Whisper (small/medium/large)
- `BOB_INPUT_DIR` : Dossier d'entrée des fichiers audio
- `BOB_TRANSCRIPTIONS_DIR` : Dossier de sortie des transcriptions
- `BOB_OUTPUT_FILE` : Fichier de résumé final
- `HF_TOKEN` : Token Hugging Face pour modèles privés

## Développement

### Test des améliorations
```bash
python test_ameliorations.py
```

### Compatibilité
- ✅ Hugging Face Spaces
- ✅ Environnement portable (PyInstaller)
- ✅ Windows/Linux/macOS
- ✅ CPU et GPU (détection automatique)

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference