From e861ff4fb0a5d8da30fda385ff89e5c2cf06c10b Mon Sep 17 00:00:00 2001 From: Floke Date: Mon, 2 Jun 2025 13:43:24 +0000 Subject: [PATCH] bugfix --- brancheneinstufung.py | 19 ------------------- 1 file changed, 19 deletions(-) diff --git a/brancheneinstufung.py b/brancheneinstufung.py index d543714b..e268cd75 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -9016,9 +9016,6 @@ class DataProcessor: self.logger.info(f"Benötigte Spalten fuer Modellierung ausgewaehlt und umbenannt: {list(df_subset.columns)}") # <<< GEÄNDERT - # +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ - # +++ NEUER BLOCK: Erstellung des 'is_part_of_group' Features +++++++++++++ - # +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ self.logger.info("Erstelle Feature 'is_part_of_group'...") # Zugreifen auf die Spalten im DataFrame df_subset @@ -9038,9 +9035,6 @@ class DataProcessor: self.logger.info(f"Feature 'is_part_of_group' erstellt. {df_subset['is_part_of_group'].sum()} Unternehmen als Teil einer Gruppe markiert.") self.logger.debug(f"Verteilung von 'is_part_of_group':\n{df_subset['is_part_of_group'].value_counts(normalize=True, dropna=False)}") - # +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ - # +++ ENDE NEUER BLOCK ++++++++++++++++++++++++++++++++++++++++++++++++++++ - # +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ @@ -9161,19 +9155,6 @@ class DataProcessor: # .str.strip() entfernt führende/endende Leerzeichen. df_filtered[branche_col_internal] = df_filtered[branche_col_internal].astype(str).fillna('Unbekannt').str.strip() - parent_d_val = self._get_cell_value_safe(row_data, "Parent Account Name").strip().lower() - parent_o_val = self._get_cell_value_safe(row_data, "System Vorschlag Parent Account").strip().lower() - parent_p_val = self._get_cell_value_safe(row_data, "Parent Vorschlag Status").strip().lower() - - cond1_pred = bool(parent_d_val and parent_d_val != 'k.a.') - cond2_o_pred = bool(parent_o_val and parent_o_val != 'k.a.') - cond2_p_pred = parent_p_val == 'x' - cond2_pred = cond2_o_pred and cond2_p_pred - - # df_single_row ist hier der DataFrame mit einer Zeile - df_single_row['is_part_of_group'] = 1 if cond1_pred | cond2_pred else 0 - self.logger.debug(f" ML Pred: 'is_part_of_group' gesetzt auf {df_single_row['is_part_of_group'].iloc[0]}") - # One-Hot Encoding (pd.get_dummies) # dummy_na=False, da wir NaNs bereits mit 'Unbekannt' gefuellt haben.