BOB / README.md
vic3610's picture
Upload 8 files
01c4625 verified

A newer version of the Gradio SDK is available: 6.1.0

Upgrade
metadata
title: BOB
emoji: 📈
colorFrom: blue
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: mit

🎵 BOB Processor - Version Hugging Face

Application de transcription et d'analyse automatique de fichiers audio utilisant Hugging Face Transformers.

🚀 Nouveautés (Mise à jour depuis EXE)

Améliorations intégrées :

  • portable_env.py : Bootstrap environnement portable avec gestion PyInstaller
  • Extraction auteur améliorée : Support des formats "1 DEMARIA Philippe" → "DEMARIA Philippe"
  • Interface GUI avancée : Suppression automatique des fenêtres console
  • Gestion durées audio : Calcul automatique avec pydub + correction auto P+S/SON
  • Variables d'environnement : Lecture dynamique des modèles depuis l'environnement
  • Gestion d'erreurs améliorée : Encodage UTF-8 robuste
  • API factorisée : Callbacks pour log/progress/cancel dans l'analyse

Modèles Hugging Face supportés :

  • Qwen/Qwen2-7B-Instruct (recommandé) - Excellent pour l'analyse
  • microsoft/DialoGPT-medium (plus léger) - Pour PC avec peu de RAM
  • google/flan-t5-base (très léger) - Pour tests rapides

Fonctionnalités

  • 🎵 Transcription audio avec Whisper (Small/Medium)
  • 🤖 Analyse de contenu avec Hugging Face Transformers
  • 📋 Classification automatique des formats :
    • P = Papier seul (lecture continue)
    • P+S = Papier + Son (avec témoignages/interviews)
    • QR = Questions-Réponses (dialogue en direct)
    • MT = Micro-Trottoir (opinions publiques)
  • 📝 Extraction d'informations : Auteur, Qualification, Titre, Durée
  • 🔍 Détection automatique des patterns de contenu

Utilisation

Interface Gradio (Web)

  1. Téléchargez un fichier audio (MP3, WAV, etc.)
  2. Cliquez sur "Traiter le fichier"
  3. Obtenez la transcription et l'analyse automatique

Interface GUI (Desktop)

python bob_gui_hf.py

Script en ligne de commande

python process_bob_hf.py

Installation

pip install -r requirements.txt

Architecture

HUGIN PORTABLE BOB/
├── portable_env.py      # 🆕 Bootstrap environnement portable
├── transcribe_audio.py  # Transcription Whisper
├── analyze_bob_hf.py    # 🆕 Analyse Hugging Face (mis à jour)
├── bob_gui_hf.py        # 🆕 Interface graphique (améliorée)
├── process_bob_hf.py    # Orchestrateur principal
├── app.py               # Interface Gradio pour Hugging Face Spaces
└── requirements.txt     # 🆕 Dépendances nettoyées

Configuration

Variables d'environnement supportées :

  • HF_MODEL : Modèle Hugging Face à utiliser
  • WHISPER_MODEL : Modèle Whisper (small/medium/large)
  • BOB_INPUT_DIR : Dossier d'entrée des fichiers audio
  • BOB_TRANSCRIPTIONS_DIR : Dossier de sortie des transcriptions
  • BOB_OUTPUT_FILE : Fichier de résumé final
  • HF_TOKEN : Token Hugging Face pour modèles privés

Développement

Test des améliorations

python test_ameliorations.py

Compatibilité

  • ✅ Hugging Face Spaces
  • ✅ Environnement portable (PyInstaller)
  • ✅ Windows/Linux/macOS
  • ✅ CPU et GPU (détection automatique)

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference