Spaces:

vic3610
/

BOB

Sleeping

App Files Files Community

BOB / README.md

vic3610

Upload 8 files

01c4625 verified about 2 months ago

preview code

raw

history blame contribute delete

3.37 kB

	---
	title: BOB
	emoji: 📈
	colorFrom: blue
	colorTo: pink
	sdk: gradio
	sdk_version: 5.49.1
	app_file: app.py
	pinned: false
	license: mit
	---


	# 🎵 BOB Processor - Version Hugging Face

	Application de transcription et d'analyse automatique de fichiers audio utilisant Hugging Face Transformers.

	## 🚀 Nouveautés (Mise à jour depuis EXE)

	### Améliorations intégrées :
	- ✅ portable_env.py : Bootstrap environnement portable avec gestion PyInstaller
	- ✅ Extraction auteur améliorée : Support des formats "1 DEMARIA Philippe" → "DEMARIA Philippe"
	- ✅ Interface GUI avancée : Suppression automatique des fenêtres console
	- ✅ Gestion durées audio : Calcul automatique avec pydub + correction auto P+S/SON
	- ✅ Variables d'environnement : Lecture dynamique des modèles depuis l'environnement
	- ✅ Gestion d'erreurs améliorée : Encodage UTF-8 robuste
	- ✅ API factorisée : Callbacks pour log/progress/cancel dans l'analyse

	### Modèles Hugging Face supportés :
	- Qwen/Qwen2-7B-Instruct (recommandé) - Excellent pour l'analyse
	- microsoft/DialoGPT-medium (plus léger) - Pour PC avec peu de RAM
	- google/flan-t5-base (très léger) - Pour tests rapides

	## Fonctionnalités

	- 🎵 Transcription audio avec Whisper (Small/Medium)
	- 🤖 Analyse de contenu avec Hugging Face Transformers
	- 📋 Classification automatique des formats :
	- P = Papier seul (lecture continue)
	- P+S = Papier + Son (avec témoignages/interviews)
	- QR = Questions-Réponses (dialogue en direct)
	- MT = Micro-Trottoir (opinions publiques)
	- 📝 Extraction d'informations : Auteur, Qualification, Titre, Durée
	- 🔍 Détection automatique des patterns de contenu

	## Utilisation

	### Interface Gradio (Web)
	1. Téléchargez un fichier audio (MP3, WAV, etc.)
	2. Cliquez sur "Traiter le fichier"
	3. Obtenez la transcription et l'analyse automatique

	### Interface GUI (Desktop)
	```bash
	python bob_gui_hf.py
	```

	### Script en ligne de commande
	```bash
	python process_bob_hf.py
	```

	## Installation

	```bash
	pip install -r requirements.txt
	```

	## Architecture

	```
	HUGIN PORTABLE BOB/
	├── portable_env.py # 🆕 Bootstrap environnement portable
	├── transcribe_audio.py # Transcription Whisper
	├── analyze_bob_hf.py # 🆕 Analyse Hugging Face (mis à jour)
	├── bob_gui_hf.py # 🆕 Interface graphique (améliorée)
	├── process_bob_hf.py # Orchestrateur principal
	├── app.py # Interface Gradio pour Hugging Face Spaces
	└── requirements.txt # 🆕 Dépendances nettoyées
	```

	## Configuration

	Variables d'environnement supportées :
	- `HF_MODEL` : Modèle Hugging Face à utiliser
	- `WHISPER_MODEL` : Modèle Whisper (small/medium/large)
	- `BOB_INPUT_DIR` : Dossier d'entrée des fichiers audio
	- `BOB_TRANSCRIPTIONS_DIR` : Dossier de sortie des transcriptions
	- `BOB_OUTPUT_FILE` : Fichier de résumé final
	- `HF_TOKEN` : Token Hugging Face pour modèles privés

	## Développement

	### Test des améliorations
	```bash
	python test_ameliorations.py
	```

	### Compatibilité
	- ✅ Hugging Face Spaces
	- ✅ Environnement portable (PyInstaller)
	- ✅ Windows/Linux/macOS
	- ✅ CPU et GPU (détection automatique)

	Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference