Files
Brancheneinstufung2/planning.md
2025-08-04 09:01:03 +00:00

2.5 KiB

Projektplanung v2.1.1

1. Übergeordnete Ziele

  • Priorität 1: Stabilität: Wiederherstellung einer zuverlässigen, fehlerfreien Ausführung der Kernprozesse zur Datenanreicherung.
  • Priorität 2: Finalisierung: Abschluss der Entwicklungsarbeiten an den neuen Modulen (Duplikats-Check, Marketing-Texte).
  • Priorität 3: Automatisierung: Vorbereitung der Skripte für den regelmäßigen, automatisierten Betrieb.

2. Aktueller Stand (v2.1.1) - NEUSTART ERFORDERLICH

  • [X] Modularisierung abgeschlossen: Die Codebasis wurde erfolgreich in eine modulare Architektur überführt.
  • [!] Kernfunktionalität instabil: Während des Refactorings und der Weiterentwicklung sind kritische Fehler in den Hauptprozessen (Brancheneinstufung, ML-Training) aufgetreten. Die Ergebnisse sind unzuverlässig oder die Ausführung bricht ab.
  • [ ] Neue Module im Prototypen-Stadium: Die Konzepte und erste Implementierungen für den Duplikats-Check und die Marketing-Text-Generierung sind vorhanden, aber noch nicht finalisiert oder robust.
  • [X] Wissensbasis-Konzept validiert: Die Strategie, eine reichhaltige Wissensbasis (config.py, marketing_wissen.yaml) zu nutzen, hat sich als vielversprechend erwiesen.

3. Strategischer Plan für den Neustart

Phase 1: Stabilisierung der Kernfunktionalität (brancheneinstufung.py)

  • [ ] Schritt 1.1 (Code Review): Analyse des gesamten aktuellen Code-Stands aller .py-Dateien, um Inkonsistenzen und Fehler (z.B. falsche Funktionsaufrufe, veraltete Logik) zu identifizieren.
  • [ ] Schritt 1.2 (Bugfixing): Systematische Behebung der identifizierten Fehler, beginnend mit den kritischsten Blockern:
    • [ ] Fehler AttributeError: 'GoogleSheetHandler' object has no attribute 'sheet_values' im ML-Training beheben.
    • [ ] Sicherstellen, dass die Brancheneinstufung 2.0 (kontextbasiert) korrekt implementiert und aufgerufen wird.
  • [ ] Schritt 1.3 (Validierung): Durchführung eines vollständigen, fehlerfreien reeval-Laufs zur Bestätigung der Stabilität.

Phase 2: Finalisierung der neuen Module

  • [ ] Schritt 2.1 (Duplikats-Check): Entwicklung einer finalen, robusten Version von duplicate_checker.py, die die beste Balance aus Sensitivität und Präzision liefert.
  • [ ] Schritt 2.2 (Marketing-Texte): Finalisierung des generate_marketing_text.py-Skripts und Durchführung des vollständigen Generierungslaufs für alle Branchen.