BOB / README.md
vic3610's picture
Upload 8 files
01c4625 verified
---
title: BOB
emoji: 📈
colorFrom: blue
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: mit
---
# 🎵 BOB Processor - Version Hugging Face
Application de transcription et d'analyse automatique de fichiers audio utilisant Hugging Face Transformers.
## 🚀 Nouveautés (Mise à jour depuis EXE)
### Améliorations intégrées :
-**portable_env.py** : Bootstrap environnement portable avec gestion PyInstaller
- ✅ **Extraction auteur améliorée** : Support des formats "1 DEMARIA Philippe" → "DEMARIA Philippe"
- ✅ **Interface GUI avancée** : Suppression automatique des fenêtres console
- ✅ **Gestion durées audio** : Calcul automatique avec pydub + correction auto P+S/SON
- ✅ **Variables d'environnement** : Lecture dynamique des modèles depuis l'environnement
- ✅ **Gestion d'erreurs améliorée** : Encodage UTF-8 robuste
- ✅ **API factorisée** : Callbacks pour log/progress/cancel dans l'analyse
### Modèles Hugging Face supportés :
- **Qwen/Qwen2-7B-Instruct** (recommandé) - Excellent pour l'analyse
- **microsoft/DialoGPT-medium** (plus léger) - Pour PC avec peu de RAM
- **google/flan-t5-base** (très léger) - Pour tests rapides
## Fonctionnalités
- 🎵 **Transcription audio** avec Whisper (Small/Medium)
- 🤖 **Analyse de contenu** avec Hugging Face Transformers
- 📋 **Classification automatique** des formats :
- **P** = Papier seul (lecture continue)
- **P+S** = Papier + Son (avec témoignages/interviews)
- **QR** = Questions-Réponses (dialogue en direct)
- **MT** = Micro-Trottoir (opinions publiques)
- 📝 **Extraction d'informations** : Auteur, Qualification, Titre, Durée
- 🔍 **Détection automatique** des patterns de contenu
## Utilisation
### Interface Gradio (Web)
1. Téléchargez un fichier audio (MP3, WAV, etc.)
2. Cliquez sur "Traiter le fichier"
3. Obtenez la transcription et l'analyse automatique
### Interface GUI (Desktop)
```bash
python bob_gui_hf.py
```
### Script en ligne de commande
```bash
python process_bob_hf.py
```
## Installation
```bash
pip install -r requirements.txt
```
## Architecture
```
HUGIN PORTABLE BOB/
├── portable_env.py # 🆕 Bootstrap environnement portable
├── transcribe_audio.py # Transcription Whisper
├── analyze_bob_hf.py # 🆕 Analyse Hugging Face (mis à jour)
├── bob_gui_hf.py # 🆕 Interface graphique (améliorée)
├── process_bob_hf.py # Orchestrateur principal
├── app.py # Interface Gradio pour Hugging Face Spaces
└── requirements.txt # 🆕 Dépendances nettoyées
```
## Configuration
Variables d'environnement supportées :
- `HF_MODEL` : Modèle Hugging Face à utiliser
- `WHISPER_MODEL` : Modèle Whisper (small/medium/large)
- `BOB_INPUT_DIR` : Dossier d'entrée des fichiers audio
- `BOB_TRANSCRIPTIONS_DIR` : Dossier de sortie des transcriptions
- `BOB_OUTPUT_FILE` : Fichier de résumé final
- `HF_TOKEN` : Token Hugging Face pour modèles privés
## Développement
### Test des améliorations
```bash
python test_ameliorations.py
```
### Compatibilité
- ✅ Hugging Face Spaces
- ✅ Environnement portable (PyInstaller)
- ✅ Windows/Linux/macOS
- ✅ CPU et GPU (détection automatique)
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference