|
|
--- |
|
|
title: BOB |
|
|
emoji: 📈 |
|
|
colorFrom: blue |
|
|
colorTo: pink |
|
|
sdk: gradio |
|
|
sdk_version: 5.49.1 |
|
|
app_file: app.py |
|
|
pinned: false |
|
|
license: mit |
|
|
--- |
|
|
|
|
|
|
|
|
# 🎵 BOB Processor - Version Hugging Face |
|
|
|
|
|
Application de transcription et d'analyse automatique de fichiers audio utilisant Hugging Face Transformers. |
|
|
|
|
|
## 🚀 Nouveautés (Mise à jour depuis EXE) |
|
|
|
|
|
### Améliorations intégrées : |
|
|
- ✅ **portable_env.py** : Bootstrap environnement portable avec gestion PyInstaller |
|
|
- ✅ **Extraction auteur améliorée** : Support des formats "1 DEMARIA Philippe" → "DEMARIA Philippe" |
|
|
- ✅ **Interface GUI avancée** : Suppression automatique des fenêtres console |
|
|
- ✅ **Gestion durées audio** : Calcul automatique avec pydub + correction auto P+S/SON |
|
|
- ✅ **Variables d'environnement** : Lecture dynamique des modèles depuis l'environnement |
|
|
- ✅ **Gestion d'erreurs améliorée** : Encodage UTF-8 robuste |
|
|
- ✅ **API factorisée** : Callbacks pour log/progress/cancel dans l'analyse |
|
|
|
|
|
### Modèles Hugging Face supportés : |
|
|
- **Qwen/Qwen2-7B-Instruct** (recommandé) - Excellent pour l'analyse |
|
|
- **microsoft/DialoGPT-medium** (plus léger) - Pour PC avec peu de RAM |
|
|
- **google/flan-t5-base** (très léger) - Pour tests rapides |
|
|
|
|
|
## Fonctionnalités |
|
|
|
|
|
- 🎵 **Transcription audio** avec Whisper (Small/Medium) |
|
|
- 🤖 **Analyse de contenu** avec Hugging Face Transformers |
|
|
- 📋 **Classification automatique** des formats : |
|
|
- **P** = Papier seul (lecture continue) |
|
|
- **P+S** = Papier + Son (avec témoignages/interviews) |
|
|
- **QR** = Questions-Réponses (dialogue en direct) |
|
|
- **MT** = Micro-Trottoir (opinions publiques) |
|
|
- 📝 **Extraction d'informations** : Auteur, Qualification, Titre, Durée |
|
|
- 🔍 **Détection automatique** des patterns de contenu |
|
|
|
|
|
## Utilisation |
|
|
|
|
|
### Interface Gradio (Web) |
|
|
1. Téléchargez un fichier audio (MP3, WAV, etc.) |
|
|
2. Cliquez sur "Traiter le fichier" |
|
|
3. Obtenez la transcription et l'analyse automatique |
|
|
|
|
|
### Interface GUI (Desktop) |
|
|
```bash |
|
|
python bob_gui_hf.py |
|
|
``` |
|
|
|
|
|
### Script en ligne de commande |
|
|
```bash |
|
|
python process_bob_hf.py |
|
|
``` |
|
|
|
|
|
## Installation |
|
|
|
|
|
```bash |
|
|
pip install -r requirements.txt |
|
|
``` |
|
|
|
|
|
## Architecture |
|
|
|
|
|
``` |
|
|
HUGIN PORTABLE BOB/ |
|
|
├── portable_env.py # 🆕 Bootstrap environnement portable |
|
|
├── transcribe_audio.py # Transcription Whisper |
|
|
├── analyze_bob_hf.py # 🆕 Analyse Hugging Face (mis à jour) |
|
|
├── bob_gui_hf.py # 🆕 Interface graphique (améliorée) |
|
|
├── process_bob_hf.py # Orchestrateur principal |
|
|
├── app.py # Interface Gradio pour Hugging Face Spaces |
|
|
└── requirements.txt # 🆕 Dépendances nettoyées |
|
|
``` |
|
|
|
|
|
## Configuration |
|
|
|
|
|
Variables d'environnement supportées : |
|
|
- `HF_MODEL` : Modèle Hugging Face à utiliser |
|
|
- `WHISPER_MODEL` : Modèle Whisper (small/medium/large) |
|
|
- `BOB_INPUT_DIR` : Dossier d'entrée des fichiers audio |
|
|
- `BOB_TRANSCRIPTIONS_DIR` : Dossier de sortie des transcriptions |
|
|
- `BOB_OUTPUT_FILE` : Fichier de résumé final |
|
|
- `HF_TOKEN` : Token Hugging Face pour modèles privés |
|
|
|
|
|
## Développement |
|
|
|
|
|
### Test des améliorations |
|
|
```bash |
|
|
python test_ameliorations.py |
|
|
``` |
|
|
|
|
|
### Compatibilité |
|
|
- ✅ Hugging Face Spaces |
|
|
- ✅ Environnement portable (PyInstaller) |
|
|
- ✅ Windows/Linux/macOS |
|
|
- ✅ CPU et GPU (détection automatique) |
|
|
|
|
|
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference |
|
|
|