- Backend: Added global speaker rename endpoint - Backend: Hardened JSON parsing and timestamp offsets - Frontend: Integrated Speaker Management Bar - Frontend: Added Trim Start/End (Scissors) and Single Line Delete - Frontend: Fixed various TypeScript and Syntax issues - Docs: Full documentation of v0.5.0 features
56 lines
2.3 KiB
Markdown
56 lines
2.3 KiB
Markdown
# Meeting Assistant (Transcription Tool)
|
|
|
|
**Version:** 0.5.0
|
|
**Status:** Beta (Full Content Management)
|
|
|
|
Der **Meeting Assistant** ist eine leistungsstarke Suite zur Transkription und Bearbeitung von Audio-Aufnahmen. Er kombiniert lokale FFmpeg-Verarbeitung mit der Gemini 2.0 Flash AI.
|
|
|
|
---
|
|
|
|
## 1. Architektur & Stack
|
|
|
|
* **FFmpeg Engine:** Automatisches Splitting großer Dateien in 30-Minuten-Segmente.
|
|
* **Gemini 2.0 Flash:** AI-Transkription mit Fokus auf JSON-Struktur (Sprecher, Timestamps).
|
|
* **Structured Storage:** SQLite speichert jedes Segment als editierbares JSON-Array.
|
|
* **Unified UI:** Das Frontend fügt alle Segmente zu einem nahtlosen Dokument zusammen.
|
|
|
|
---
|
|
|
|
## 2. Key Features (v0.5.0)
|
|
|
|
### 🎙️ Intelligente Transkription
|
|
* Unterstützt MP3/WAV bis 500MB.
|
|
* Native Sprechererkennung und Zeitstempel-Normalisierung über Segmentgrenzen hinweg.
|
|
|
|
### 👥 Globales Sprecher-Management
|
|
* **Speaker Bar:** Eine Übersicht aller im Dokument gefundenen Sprecher.
|
|
* **Global Rename:** Mit einem Klick kann ein Sprecher (z.B. "Speaker A") im gesamten Dokument dauerhaft umbenannt werden (z.B. "Thomas").
|
|
|
|
### ✂️ Präzises Schneiden (Trimming)
|
|
* **Trim Start:** Löscht alles *vor* einer ausgewählten Zeile (ideal zum Entfernen von Vorgesprächen).
|
|
* **Trim End:** Löscht alles *nach* einer ausgewählten Zeile (entfernt Verabschiedungen).
|
|
* **Single Line Delete:** Einzelne Zeilen oder Störgeräusche können individuell entfernt werden.
|
|
|
|
### 📝 Editor & Export
|
|
* **Inline-Edit:** Jeder Textblock und jeder Sprechername kann durch direktes Anklicken korrigiert werden.
|
|
* **Copy Full Transcript:** Kopiert das gesamte, bereinigte Transkript inkl. Timestamps in die Zwischenablage.
|
|
|
|
---
|
|
|
|
## 3. API Endpunkte
|
|
|
|
| Methode | Pfad | Beschreibung |
|
|
| :--- | :--- | :--- |
|
|
| `GET` | `/meetings` | Liste aller Meetings. |
|
|
| `POST` | `/upload` | Audio-Upload & Prozess-Start. |
|
|
| `POST` | `.../rename_speaker` | **Neu:** Globale Umbenennung in der DB. |
|
|
| `PUT` | `/chunks/{id}` | Speichert manuelle Text-Korrekturen. |
|
|
| `DELETE` | `/meetings/{id}` | Vollständiges Löschen. |
|
|
|
|
---
|
|
|
|
## 4. Roadmap
|
|
|
|
* **v0.6: AI Insights:** Extraktion von Aufgaben (Action Items) und Zusammenfassungen per Button.
|
|
* **v0.7: Search:** Globale Suche über alle Transkripte hinweg.
|