duplicate_checker.py aktualisiert

2025-08-01 11:24:51 +00:00
parent beaf8d65bf
commit f5e288241e
1 changed files with 8 additions and 3 deletions
--- a/duplicate_checker.py
+++ b/duplicate_checker.py
@@ -94,10 +94,15 @@ def main():
    logging.info("Matching abgeschlossen. Schreibe Ergebnisse zurück ins Sheet...")
    result_df = pd.DataFrame(results)
    
-    # Originale Spalten aus matching_df für die Ausgabe nehmen
-    original_cols = [col for col in ['CRM Name', 'CRM Website', 'CRM Ort', 'CRM Land'] if col in matching_df.columns]
-    output_df = pd.concat([matching_df[original_cols].reset_index(drop=True), result_df], axis=1)
+    # KORRIGIERTE LOGIK: Hole die Originaldaten aus dem DataFrame, bevor er normalisiert wurde.
+    # `matching_df` enthält hier bereits die normalisierten Spalten, die wir nicht wollen.
+    # Wir laden die Originaldaten neu oder verwenden eine Kopie. Der einfachste Weg:
+    original_matching_df = sheet_handler.get_sheet_as_dataframe(MATCHING_SHEET_NAME)
    
+    # Füge die Ergebnisse zu den Originaldaten hinzu
+    output_df = pd.concat([original_matching_df.reset_index(drop=True), result_df], axis=1)
+    
+    # Konvertiere DataFrame in Liste von Listen für den Upload
    data_to_write = [output_df.columns.values.tolist()] + output_df.values.tolist()
    
    success = sheet_handler.clear_and_write_data(MATCHING_SHEET_NAME, data_to_write)