Files
Brancheneinstufung2/tasks.md
2025-08-04 09:01:22 +00:00

2.0 KiB

Projektaufgaben & Offene Punkte v2.1.1

1. Kritische offene Punkte (Blocker)

  • Stabilität der DataProcessor-Klasse: Die Methoden prepare_data_for_modeling und reclassify_all_branches enthalten Fehler, die zu Abstürzen führen. Die Interaktion mit dem GoogleSheetHandler ist an mehreren Stellen fehlerhaft.
  • Konsistenz der GoogleSheetHandler-Klasse: Die Klasse wurde mehrfach umgebaut. Es muss eine finale, saubere Version etabliert werden, die von allen anderen Skripten konsistent genutzt wird.
  • Brancheneinstufung 2.0: Das Konzept zur Nutzung der detaillierten Branchen-Definitionen ist klar, aber die Implementierung in helpers.py und data_processor.py ist noch nicht abgeschlossen oder fehlerhaft.

2. Unmittelbare nächste Aufgaben (Systematischer Neustart)

  • Übergabe des vollständigen Projektstandes: Im nächsten Chat werden alle .py-Dateien, die config.py und die marketing_wissen.yaml bereitgestellt.
  • Code-Analyse:
    • Den gesamten Code auf veraltete Funktionsaufrufe prüfen (z.B. generate_fsm_argument vs. generate_fsm_pitch).
    • Den Zugriff auf Konfigurationsvariablen vereinheitlichen (Config.VARIABLE vs. VARIABLE).
    • Den Datenzugriff im GoogleSheetHandler finalisieren (z.B. _all_data_with_headers als einzige Quelle).
  • Fehlerbehebung (Priorität 1): train_technician_model
    • prepare_data_for_modeling in data_processor.py korrigieren, sodass es die Daten korrekt aus dem GoogleSheetHandler liest.
  • Fehlerbehebung (Priorität 2): reclassify_branches
    • Sicherstellen, dass der neue Modus korrekt im brancheneinstufung.py-Dispatcher aufgerufen wird.
    • Die evaluate_branche_chatgpt-Funktion in helpers.py final implementieren.
  • Validierungslauf:
    • Einen Testlauf mit --mode train_technician_model erfolgreich durchführen.
    • Einen Testlauf mit --mode reclassify_branches --limit 5 erfolgreich durchführen.