Spaces:

vic3610
/

BOB

Sleeping

App Files Files Community

BOB / README.md

vic3610

Upload 8 files

01c4625 verified about 2 months ago

preview code

raw

history blame contribute delete

3.37 kB

A newer version of the Gradio SDK is available: 6.1.0

Upgrade

metadata

title: BOB
emoji: 📈
colorFrom: blue
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: mit

🎵 BOB Processor - Version Hugging Face

Application de transcription et d'analyse automatique de fichiers audio utilisant Hugging Face Transformers.

🚀 Nouveautés (Mise à jour depuis EXE)

Améliorations intégrées :

✅ portable_env.py : Bootstrap environnement portable avec gestion PyInstaller
✅ Extraction auteur améliorée : Support des formats "1 DEMARIA Philippe" → "DEMARIA Philippe"
✅ Interface GUI avancée : Suppression automatique des fenêtres console
✅ Gestion durées audio : Calcul automatique avec pydub + correction auto P+S/SON
✅ Variables d'environnement : Lecture dynamique des modèles depuis l'environnement
✅ Gestion d'erreurs améliorée : Encodage UTF-8 robuste
✅ API factorisée : Callbacks pour log/progress/cancel dans l'analyse

Modèles Hugging Face supportés :

Qwen/Qwen2-7B-Instruct (recommandé) - Excellent pour l'analyse
microsoft/DialoGPT-medium (plus léger) - Pour PC avec peu de RAM
google/flan-t5-base (très léger) - Pour tests rapides

Fonctionnalités

🎵 Transcription audio avec Whisper (Small/Medium)
🤖 Analyse de contenu avec Hugging Face Transformers
📋 Classification automatique des formats :
- P = Papier seul (lecture continue)
- P+S = Papier + Son (avec témoignages/interviews)
- QR = Questions-Réponses (dialogue en direct)
- MT = Micro-Trottoir (opinions publiques)
📝 Extraction d'informations : Auteur, Qualification, Titre, Durée
🔍 Détection automatique des patterns de contenu

Utilisation

Interface Gradio (Web)

Téléchargez un fichier audio (MP3, WAV, etc.)
Cliquez sur "Traiter le fichier"
Obtenez la transcription et l'analyse automatique

Interface GUI (Desktop)

python bob_gui_hf.py

Script en ligne de commande

python process_bob_hf.py

Installation

pip install -r requirements.txt

Architecture

HUGIN PORTABLE BOB/
├── portable_env.py      # 🆕 Bootstrap environnement portable
├── transcribe_audio.py  # Transcription Whisper
├── analyze_bob_hf.py    # 🆕 Analyse Hugging Face (mis à jour)
├── bob_gui_hf.py        # 🆕 Interface graphique (améliorée)
├── process_bob_hf.py    # Orchestrateur principal
├── app.py               # Interface Gradio pour Hugging Face Spaces
└── requirements.txt     # 🆕 Dépendances nettoyées

Configuration

Variables d'environnement supportées :

HF_MODEL : Modèle Hugging Face à utiliser
WHISPER_MODEL : Modèle Whisper (small/medium/large)
BOB_INPUT_DIR : Dossier d'entrée des fichiers audio
BOB_TRANSCRIPTIONS_DIR : Dossier de sortie des transcriptions
BOB_OUTPUT_FILE : Fichier de résumé final
HF_TOKEN : Token Hugging Face pour modèles privés

Développement

Test des améliorations

python test_ameliorations.py

Compatibilité

✅ Hugging Face Spaces
✅ Environnement portable (PyInstaller)
✅ Windows/Linux/macOS
✅ CPU et GPU (détection automatique)

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference