This commit is contained in:
2025-06-17 18:11:58 +00:00
parent 8dfbaafabf
commit 4b126026f8

View File

@@ -9103,8 +9103,13 @@ class DataProcessor:
# Die Bin-Definition muss so sein, dass alle Werte > 0 einem Bucket zugeordnet werden.
# Beispiel: (-1, 0] -> Bucket 1 (0), (0, 19] -> Bucket 2 (<20), (19, 49] -> Bucket 3 (<50) etc.
# Da wir auf >0 filtern, landet 0 nie im Trainingsset, aber die Bin-Definition muss trotzdem Sinn ergeben.
bins = [-1, 0, 19, 49, 99, 249, 499, float('inf')] # Definiere die Grenzen der Buckets
labels = ['Bucket_1_(0)', 'Bucket_2_(<20)', 'Bucket_3_(<50)', 'Bucket_4_(<100)', 'Bucket_5_(<250)', 'Bucket_6_(<500)', 'Bucket_7_(>499)'] # Namen fuer die Buckets
# Alter Code:
# bins = [-1, 0, 19, 49, 99, 249, 499, float('inf')]
# labels = ['Bucket_1_(0)', 'Bucket_2_(<20)', 'Bucket_3_(<50)', 'Bucket_4_(<100)', 'Bucket_5_(<250)', 'Bucket_6_(<500)', 'Bucket_7_(>499)']
# NEUER VORSCHLAG (z.B. 3 Klassen):
bins_new = [-1, 49, 249, float('inf')] # Grenzen: (<=49), (50-249), (>=250)
labels_new = ['Techniker_Klein (0-49)', 'Techniker_Mittel (50-249)', 'Techniker_Gross (250+)']
try:
# Erstellen Sie die Bucket-Spalte mit pd.cut