bugfix

2025-06-17 18:11:58 +00:00
parent 8dfbaafabf
commit 4b126026f8
1 changed files with 7 additions and 2 deletions
--- a/brancheneinstufung.py
+++ b/brancheneinstufung.py
@@ -9103,8 +9103,13 @@ class DataProcessor:
        # Die Bin-Definition muss so sein, dass alle Werte > 0 einem Bucket zugeordnet werden.
        # Beispiel: (-1, 0] -> Bucket 1 (0), (0, 19] -> Bucket 2 (<20), (19, 49] -> Bucket 3 (<50) etc.
        # Da wir auf >0 filtern, landet 0 nie im Trainingsset, aber die Bin-Definition muss trotzdem Sinn ergeben.
-        bins = [-1, 0, 19, 49, 99, 249, 499, float('inf')] # Definiere die Grenzen der Buckets
-        labels = ['Bucket_1_(0)', 'Bucket_2_(<20)', 'Bucket_3_(<50)', 'Bucket_4_(<100)', 'Bucket_5_(<250)', 'Bucket_6_(<500)', 'Bucket_7_(>499)'] # Namen fuer die Buckets
+        # Alter Code:
+        # bins = [-1, 0, 19, 49, 99, 249, 499, float('inf')] 
+        # labels = ['Bucket_1_(0)', 'Bucket_2_(<20)', 'Bucket_3_(<50)', 'Bucket_4_(<100)', 'Bucket_5_(<250)', 'Bucket_6_(<500)', 'Bucket_7_(>499)']
+        
+        # NEUER VORSCHLAG (z.B. 3 Klassen):
+        bins_new = [-1, 49, 249, float('inf')]  # Grenzen: (<=49), (50-249), (>=250)
+        labels_new = ['Techniker_Klein (0-49)', 'Techniker_Mittel (50-249)', 'Techniker_Gross (250+)']

        try:
             # Erstellen Sie die Bucket-Spalte mit pd.cut