Commit Graph

320 Commits

Author SHA1 Message Date
b33bea2dbd bugfix 2025-04-18 14:08:09 +00:00
6d2a50dcdf bugfix 2025-04-18 10:57:37 +00:00
a9695a4473 bugfix 2025-04-18 09:53:40 +00:00
4489d8f8c2 bugfix 2025-04-18 09:49:46 +00:00
e3ccb5c81b bugfix 2025-04-18 06:44:42 +00:00
1e4492e9ce bugfix 2025-04-18 06:40:17 +00:00
a0b8ca5f41 bugfix 2025-04-18 06:35:55 +00:00
d422260fff bugfix 2025-04-18 06:30:48 +00:00
45441ae4d7 bugfix 2025-04-18 06:25:05 +00:00
4d3c2ded52 bugfix 2025-04-18 06:18:56 +00:00
5ca84818e9 bugfix 2025-04-18 06:10:21 +00:00
a45e1a3109 bugfix 2025-04-17 19:32:37 +00:00
faac14c91b bugfix 2025-04-17 19:19:44 +00:00
c27e608913 bugfix 2025-04-17 18:50:28 +00:00
45b96f296b bugfix 2025-04-17 18:34:42 +00:00
605a85450f bugfix 2025-04-17 18:28:45 +00:00
6759e45843 debug 2025-04-17 18:16:24 +00:00
da0d1e18aa bugfix 2025-04-17 16:53:26 +00:00
bc96d6d943 bugfix 2025-04-17 15:28:11 +00:00
d13e84779d bugfix 2025-04-17 15:18:14 +00:00
98cd36f21c bugfix 2025-04-17 14:53:46 +00:00
4ea7468031 bugfix 2025-04-17 14:48:10 +00:00
4163f14855 bugfix 2025-04-17 14:36:23 +00:00
eb3308a41e v1.6.4: Implementiere ML-Modelltraining zur Technikerschätzung
- Füge neuen Betriebsmodus `--mode train_technician_model` hinzu.
- Implementiere Datenvorbereitung in `DataProcessor.prepare_data_for_modeling`:
    - Lädt relevante Spalten.
    - Konsolidiert Umsatz/Mitarbeiter (Wiki > CRM Priorität).
    - Filtert nach gültiger Technikerzahl (>0).
    - Erstellt Zielvariable `Techniker_Bucket` (7 Kategorien).
    - Führt One-Hot Encoding für Branchen durch.
- Implementiere Logik im `train_technician_model`-Modus in `main`:
    - Führt Train/Test-Split durch (stratifiziert).
    - Imputiert fehlende numerische Werte mit Median (fittet auf Train, transformiert Train/Test).
    - Trainiert einen `DecisionTreeClassifier` mittels `GridSearchCV` zur Hyperparameter-Optimierung (Fokus auf `f1_weighted`).
    - Evaluiert das beste Modell auf dem Test-Set (Accuracy, Classification Report, Confusion Matrix).
    - Extrahiert Baumregeln mittels `export_text`.
    - Speichert den trainierten Imputer, das beste Modell (`.pkl`) und die extrahierten Regeln (`.txt`).
- Füge notwendige Imports für `pandas`, `numpy`, `sklearn`, `pickle`, `json` hinzu.
- Ergänze neue Konfigurationsparameter für ML in `Config` (Worker, Limits).
- Füge Kommandozeilenargumente für Modell-Ausgabedateien hinzu.
2025-04-17 14:00:30 +00:00
b2316b9337 bugfix 2025-04-17 13:08:19 +00:00
a46843cafc bugfix 2025-04-17 13:03:25 +00:00
4c1cdf5b72 bugfix 2025-04-17 12:53:10 +00:00
f386bf885f bugfix 2025-04-17 12:48:03 +00:00
f259307b19 bugfix 2025-04-17 12:26:07 +00:00
4ffb57268d bugfix 2025-04-17 11:01:49 +00:00
4d02ac4910 bugfix 2025-04-17 10:56:02 +00:00
6fe8254733 bugfix 2025-04-17 10:55:04 +00:00
66b03d6583 bugfix 2025-04-17 10:53:59 +00:00
8acf404479 bugfix 2025-04-17 10:52:30 +00:00
392ecfde2e bugfix 2025-04-17 10:28:13 +00:00
8e6d263a64 bugfix 2025-04-17 10:23:09 +00:00
d9d33db2eb bugfix 2025-04-17 10:05:07 +00:00
a2d5ffcd66 bugfix 2025-04-17 09:57:44 +00:00
35c8ea21cb bugfix 2025-04-17 09:53:56 +00:00
bcdc045877 bugfix 2025-04-17 09:48:32 +00:00
115d83c363 bugfix 2025-04-17 09:39:57 +00:00
da1910186f bugfix 2025-04-17 09:31:25 +00:00
f44eb0f83b bugfix 2025-04-17 09:19:48 +00:00
1ca96f09b9 bugfix 2025-04-17 09:12:23 +00:00
71b081b169 bugfix 2025-04-17 09:02:42 +00:00
8922c7d41b v1.6.3: Beschleunige Website-Scraping durch gebündelte Sheet-Updates
- Überarbeite `process_website_batch` zur Leistungssteigerung.
- Implementiere das Sammeln von Zell-Updates (`AR`, `AS`, `AT`, `AP`) für mehrere Zeilen in einer Liste (`all_sheet_updates`).
- Sende die gesammelten Updates gebündelt über einen einzigen `batch_update_cells`-Aufruf an Google Sheets, wenn ein Limit (`update_batch_row_limit`) erreicht ist oder die Schleife endet.
- Ziel: Reduzierung der Anzahl von Google Sheets API-Aufrufen und Beschleunigung des Website-Scraping-Prozesses.
- Stelle sicher, dass auch ein letzter, unvollständiger Batch nach der Hauptschleife gesendet wird.
2025-04-17 08:45:18 +00:00
b0c792d706 bugfix 2025-04-16 16:08:49 +00:00
ba00d81ae5 bugfix 2025-04-16 15:38:57 +00:00
30415a4968 bugfix 2025-04-16 15:31:29 +00:00
90f1ac9ef9 bugfix 2025-04-16 15:20:33 +00:00