duplicate_checker.py aktualisiert

This commit is contained in:
2025-08-01 11:24:51 +00:00
parent beaf8d65bf
commit f5e288241e

View File

@@ -94,10 +94,15 @@ def main():
logging.info("Matching abgeschlossen. Schreibe Ergebnisse zurück ins Sheet...")
result_df = pd.DataFrame(results)
# Originale Spalten aus matching_df für die Ausgabe nehmen
original_cols = [col for col in ['CRM Name', 'CRM Website', 'CRM Ort', 'CRM Land'] if col in matching_df.columns]
output_df = pd.concat([matching_df[original_cols].reset_index(drop=True), result_df], axis=1)
# KORRIGIERTE LOGIK: Hole die Originaldaten aus dem DataFrame, bevor er normalisiert wurde.
# `matching_df` enthält hier bereits die normalisierten Spalten, die wir nicht wollen.
# Wir laden die Originaldaten neu oder verwenden eine Kopie. Der einfachste Weg:
original_matching_df = sheet_handler.get_sheet_as_dataframe(MATCHING_SHEET_NAME)
# Füge die Ergebnisse zu den Originaldaten hinzu
output_df = pd.concat([original_matching_df.reset_index(drop=True), result_df], axis=1)
# Konvertiere DataFrame in Liste von Listen für den Upload
data_to_write = [output_df.columns.values.tolist()] + output_df.values.tolist()
success = sheet_handler.clear_and_write_data(MATCHING_SHEET_NAME, data_to_write)