--- title: BOB emoji: 📈 colorFrom: blue colorTo: pink sdk: gradio sdk_version: 5.49.1 app_file: app.py pinned: false license: mit --- # đŸŽ” BOB Processor - Version Hugging Face Application de transcription et d'analyse automatique de fichiers audio utilisant Hugging Face Transformers. ## 🚀 NouveautĂ©s (Mise Ă  jour depuis EXE) ### AmĂ©liorations intĂ©grĂ©es : - ✅ **portable_env.py** : Bootstrap environnement portable avec gestion PyInstaller - ✅ **Extraction auteur amĂ©liorĂ©e** : Support des formats "1 DEMARIA Philippe" → "DEMARIA Philippe" - ✅ **Interface GUI avancĂ©e** : Suppression automatique des fenĂȘtres console - ✅ **Gestion durĂ©es audio** : Calcul automatique avec pydub + correction auto P+S/SON - ✅ **Variables d'environnement** : Lecture dynamique des modĂšles depuis l'environnement - ✅ **Gestion d'erreurs amĂ©liorĂ©e** : Encodage UTF-8 robuste - ✅ **API factorisĂ©e** : Callbacks pour log/progress/cancel dans l'analyse ### ModĂšles Hugging Face supportĂ©s : - **Qwen/Qwen2-7B-Instruct** (recommandĂ©) - Excellent pour l'analyse - **microsoft/DialoGPT-medium** (plus lĂ©ger) - Pour PC avec peu de RAM - **google/flan-t5-base** (trĂšs lĂ©ger) - Pour tests rapides ## FonctionnalitĂ©s - đŸŽ” **Transcription audio** avec Whisper (Small/Medium) - đŸ€– **Analyse de contenu** avec Hugging Face Transformers - 📋 **Classification automatique** des formats : - **P** = Papier seul (lecture continue) - **P+S** = Papier + Son (avec tĂ©moignages/interviews) - **QR** = Questions-RĂ©ponses (dialogue en direct) - **MT** = Micro-Trottoir (opinions publiques) - 📝 **Extraction d'informations** : Auteur, Qualification, Titre, DurĂ©e - 🔍 **DĂ©tection automatique** des patterns de contenu ## Utilisation ### Interface Gradio (Web) 1. TĂ©lĂ©chargez un fichier audio (MP3, WAV, etc.) 2. Cliquez sur "Traiter le fichier" 3. Obtenez la transcription et l'analyse automatique ### Interface GUI (Desktop) ```bash python bob_gui_hf.py ``` ### Script en ligne de commande ```bash python process_bob_hf.py ``` ## Installation ```bash pip install -r requirements.txt ``` ## Architecture ``` HUGIN PORTABLE BOB/ ├── portable_env.py # 🆕 Bootstrap environnement portable ├── transcribe_audio.py # Transcription Whisper ├── analyze_bob_hf.py # 🆕 Analyse Hugging Face (mis Ă  jour) ├── bob_gui_hf.py # 🆕 Interface graphique (amĂ©liorĂ©e) ├── process_bob_hf.py # Orchestrateur principal ├── app.py # Interface Gradio pour Hugging Face Spaces └── requirements.txt # 🆕 DĂ©pendances nettoyĂ©es ``` ## Configuration Variables d'environnement supportĂ©es : - `HF_MODEL` : ModĂšle Hugging Face Ă  utiliser - `WHISPER_MODEL` : ModĂšle Whisper (small/medium/large) - `BOB_INPUT_DIR` : Dossier d'entrĂ©e des fichiers audio - `BOB_TRANSCRIPTIONS_DIR` : Dossier de sortie des transcriptions - `BOB_OUTPUT_FILE` : Fichier de rĂ©sumĂ© final - `HF_TOKEN` : Token Hugging Face pour modĂšles privĂ©s ## DĂ©veloppement ### Test des amĂ©liorations ```bash python test_ameliorations.py ``` ### CompatibilitĂ© - ✅ Hugging Face Spaces - ✅ Environnement portable (PyInstaller) - ✅ Windows/Linux/macOS - ✅ CPU et GPU (dĂ©tection automatique) Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference