diff --git a/brancheneinstufung.py b/brancheneinstufung.py index 526772a9..b5c53768 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -9103,8 +9103,13 @@ class DataProcessor: # Die Bin-Definition muss so sein, dass alle Werte > 0 einem Bucket zugeordnet werden. # Beispiel: (-1, 0] -> Bucket 1 (0), (0, 19] -> Bucket 2 (<20), (19, 49] -> Bucket 3 (<50) etc. # Da wir auf >0 filtern, landet 0 nie im Trainingsset, aber die Bin-Definition muss trotzdem Sinn ergeben. - bins = [-1, 0, 19, 49, 99, 249, 499, float('inf')] # Definiere die Grenzen der Buckets - labels = ['Bucket_1_(0)', 'Bucket_2_(<20)', 'Bucket_3_(<50)', 'Bucket_4_(<100)', 'Bucket_5_(<250)', 'Bucket_6_(<500)', 'Bucket_7_(>499)'] # Namen fuer die Buckets + # Alter Code: + # bins = [-1, 0, 19, 49, 99, 249, 499, float('inf')] + # labels = ['Bucket_1_(0)', 'Bucket_2_(<20)', 'Bucket_3_(<50)', 'Bucket_4_(<100)', 'Bucket_5_(<250)', 'Bucket_6_(<500)', 'Bucket_7_(>499)'] + + # NEUER VORSCHLAG (z.B. 3 Klassen): + bins_new = [-1, 49, 249, float('inf')] # Grenzen: (<=49), (50-249), (>=250) + labels_new = ['Techniker_Klein (0-49)', 'Techniker_Mittel (50-249)', 'Techniker_Gross (250+)'] try: # Erstellen Sie die Bucket-Spalte mit pd.cut