- Backend: Added global speaker rename endpoint - Backend: Hardened JSON parsing and timestamp offsets - Frontend: Integrated Speaker Management Bar - Frontend: Added Trim Start/End (Scissors) and Single Line Delete - Frontend: Fixed various TypeScript and Syntax issues - Docs: Full documentation of v0.5.0 features
2.3 KiB
2.3 KiB
Meeting Assistant (Transcription Tool)
Version: 0.5.0 Status: Beta (Full Content Management)
Der Meeting Assistant ist eine leistungsstarke Suite zur Transkription und Bearbeitung von Audio-Aufnahmen. Er kombiniert lokale FFmpeg-Verarbeitung mit der Gemini 2.0 Flash AI.
1. Architektur & Stack
- FFmpeg Engine: Automatisches Splitting großer Dateien in 30-Minuten-Segmente.
- Gemini 2.0 Flash: AI-Transkription mit Fokus auf JSON-Struktur (Sprecher, Timestamps).
- Structured Storage: SQLite speichert jedes Segment als editierbares JSON-Array.
- Unified UI: Das Frontend fügt alle Segmente zu einem nahtlosen Dokument zusammen.
2. Key Features (v0.5.0)
🎙️ Intelligente Transkription
- Unterstützt MP3/WAV bis 500MB.
- Native Sprechererkennung und Zeitstempel-Normalisierung über Segmentgrenzen hinweg.
👥 Globales Sprecher-Management
- Speaker Bar: Eine Übersicht aller im Dokument gefundenen Sprecher.
- Global Rename: Mit einem Klick kann ein Sprecher (z.B. "Speaker A") im gesamten Dokument dauerhaft umbenannt werden (z.B. "Thomas").
✂️ Präzises Schneiden (Trimming)
- Trim Start: Löscht alles vor einer ausgewählten Zeile (ideal zum Entfernen von Vorgesprächen).
- Trim End: Löscht alles nach einer ausgewählten Zeile (entfernt Verabschiedungen).
- Single Line Delete: Einzelne Zeilen oder Störgeräusche können individuell entfernt werden.
📝 Editor & Export
- Inline-Edit: Jeder Textblock und jeder Sprechername kann durch direktes Anklicken korrigiert werden.
- Copy Full Transcript: Kopiert das gesamte, bereinigte Transkript inkl. Timestamps in die Zwischenablage.
3. API Endpunkte
| Methode | Pfad | Beschreibung |
|---|---|---|
GET |
/meetings |
Liste aller Meetings. |
POST |
/upload |
Audio-Upload & Prozess-Start. |
POST |
.../rename_speaker |
Neu: Globale Umbenennung in der DB. |
PUT |
/chunks/{id} |
Speichert manuelle Text-Korrekturen. |
DELETE |
/meetings/{id} |
Vollständiges Löschen. |
4. Roadmap
- v0.6: AI Insights: Extraktion von Aufgaben (Action Items) und Zusammenfassungen per Button.
- v0.7: Search: Globale Suche über alle Transkripte hinweg.