Files
Brancheneinstufung2/TRANSCRIPTION_TOOL.md
Floke e294553529 feat(transcription): v0.5.0 with global speaker management and trimming
- Backend: Added global speaker rename endpoint
- Backend: Hardened JSON parsing and timestamp offsets
- Frontend: Integrated Speaker Management Bar
- Frontend: Added Trim Start/End (Scissors) and Single Line Delete
- Frontend: Fixed various TypeScript and Syntax issues
- Docs: Full documentation of v0.5.0 features
2026-01-24 21:26:01 +00:00

2.3 KiB

Meeting Assistant (Transcription Tool)

Version: 0.5.0 Status: Beta (Full Content Management)

Der Meeting Assistant ist eine leistungsstarke Suite zur Transkription und Bearbeitung von Audio-Aufnahmen. Er kombiniert lokale FFmpeg-Verarbeitung mit der Gemini 2.0 Flash AI.


1. Architektur & Stack

  • FFmpeg Engine: Automatisches Splitting großer Dateien in 30-Minuten-Segmente.
  • Gemini 2.0 Flash: AI-Transkription mit Fokus auf JSON-Struktur (Sprecher, Timestamps).
  • Structured Storage: SQLite speichert jedes Segment als editierbares JSON-Array.
  • Unified UI: Das Frontend fügt alle Segmente zu einem nahtlosen Dokument zusammen.

2. Key Features (v0.5.0)

🎙️ Intelligente Transkription

  • Unterstützt MP3/WAV bis 500MB.
  • Native Sprechererkennung und Zeitstempel-Normalisierung über Segmentgrenzen hinweg.

👥 Globales Sprecher-Management

  • Speaker Bar: Eine Übersicht aller im Dokument gefundenen Sprecher.
  • Global Rename: Mit einem Klick kann ein Sprecher (z.B. "Speaker A") im gesamten Dokument dauerhaft umbenannt werden (z.B. "Thomas").

✂️ Präzises Schneiden (Trimming)

  • Trim Start: Löscht alles vor einer ausgewählten Zeile (ideal zum Entfernen von Vorgesprächen).
  • Trim End: Löscht alles nach einer ausgewählten Zeile (entfernt Verabschiedungen).
  • Single Line Delete: Einzelne Zeilen oder Störgeräusche können individuell entfernt werden.

📝 Editor & Export

  • Inline-Edit: Jeder Textblock und jeder Sprechername kann durch direktes Anklicken korrigiert werden.
  • Copy Full Transcript: Kopiert das gesamte, bereinigte Transkript inkl. Timestamps in die Zwischenablage.

3. API Endpunkte

Methode Pfad Beschreibung
GET /meetings Liste aller Meetings.
POST /upload Audio-Upload & Prozess-Start.
POST .../rename_speaker Neu: Globale Umbenennung in der DB.
PUT /chunks/{id} Speichert manuelle Text-Korrekturen.
DELETE /meetings/{id} Vollständiges Löschen.

4. Roadmap

  • v0.6: AI Insights: Extraktion von Aufgaben (Action Items) und Zusammenfassungen per Button.
  • v0.7: Search: Globale Suche über alle Transkripte hinweg.