Brancheneinstufung2

Go to file

Floke 8d2674bcef Refactor: ML-Datenvorbereitung mit neuen Features & Klassen, Bugfixes

- Refactoring der Funktion `prepare_data_for_modeling`:
  - Neue Bucket-Einteilung: Die Anzahl der Zielklassen (Techniker-Buckets) wurde zur Verbesserung der Robustheit von 7 auf 3 Klassen reduziert ('Klein', 'Mittel', 'Gross').
  - Feature Engineering: Zusätzliche Features (`Umsatz_pro_MA`, `Log_Umsatz`, `Log_Mitarbeiter`) werden nun dynamisch erstellt und für das Training verwendet, um die Vorhersagekraft zu erhöhen.
  - Feature-Auswahl: Die finalen Features für das Modelltraining wurden auf die neuen, transformierten numerischen Features umgestellt.
  - Datenfilterung: Filter für DACH-Region und Plausibilität (Ausschluss von `FEHLER`-Fällen) wurden direkt in die Datenvorbereitung integriert.
- Bugfix: Ein `NameError` in `prepare_data_for_modeling` wurde behoben. Der Code zur Erstellung des 'is_part_of_group'-Features greift nun korrekt auf die Spalten des Pandas DataFrames statt auf eine nicht existierende `row_data`-Variable zu.
- Bugfix: Ein `SyntaxError` im `col_keys_mapping`-Dictionary wurde durch ein fehlendes Komma behoben.
- Code-Struktur: Der gesamte Datenverarbeitungsfluss innerhalb von `prepare_data_for_modeling` wurde für bessere Lesbarkeit und Konsistenz überarbeitet.

2025-06-18 08:32:29 +00:00

@eaDir

Erste Version

2025-03-29 18:47:15 +01:00

templates

templates/index.html hinzugefügt

2025-05-27 12:29:05 +00:00

api_key.txt

Erste Version

2025-03-29 18:47:15 +01:00

app.py

app.py aktualisiert

2025-05-27 12:39:45 +00:00

Bestandsfirmen.xlsx

Erste Version

2025-03-29 18:47:15 +01:00

brancheneinstufung - Kopie.py

Erste Version

2025-03-29 18:47:15 +01:00

brancheneinstufung.py

Refactor: ML-Datenvorbereitung mit neuen Features & Klassen, Bugfixes

2025-06-18 08:32:29 +00:00

Labyrinth.py

Font changed

2025-04-04 17:04:06 +00:00

list_generator.py

reset

2025-05-28 12:07:31 +00:00

service_account.json

Erste Version

2025-03-29 18:47:15 +01:00

test_pytube.py

test_pytube.py aktualisiert

2025-05-27 12:48:05 +00:00

update.log

Erste Version

2025-03-29 18:47:15 +01:00

Languages

Python 61.8%

TypeScript 20.2%

JavaScript 14.5%

HTML 2.5%

Dockerfile 0.4%

Other 0.6%