diff --git a/brancheneinstufung.py b/brancheneinstufung.py index 7661b628..fcfa9b46 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -14,7 +14,7 @@ import csv # ==================== KONFIGURATION ==================== class Config: - VERSION = "v1.3.0" # v1.3.0: Validierung des Wikipedia-Artikels implementiert + VERSION = "v1.3.1" # v1.3.1: Validierung des Wikipedia-Artikels implementiert LANG = "de" CREDENTIALS_FILE = "service_account.json" SHEET_URL = "https://docs.google.com/spreadsheets/d/1u_gHr9JUfmV1-iviRzbSe3575QEp7KLhK5jFV_gJcgo" @@ -67,7 +67,7 @@ def normalize_company_name(name): ] pattern = r'\b(' + '|'.join(forms) + r')\b' normalized = re.sub(pattern, '', name, flags=re.IGNORECASE) - normalized = re.sub(r'[\-–]', ' ', normalized) + normalized = re.sub(r'[\-–]', ' ', normalized) normalized = re.sub(r'\s+', ' ', normalized).strip() return normalized.lower() @@ -169,7 +169,7 @@ def validate_article_with_chatgpt(crm_data, wiki_data): "Die erste Zeile sind Daten aus unserem CRM-System, die zweite Zeile stammen aus Wikipedia. " "Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können toleriert werden, " "solange sie im Rahmen von 10% liegen. Falls die Datensätze übereinstimmen, antworte ausschließlich mit 'OK'. " - "Falls nicht, nenne bitte den wichtigsten Grund (z. B. abweichender Firmenname oder Ort). \n\n" + "Falls nicht, nenne bitte den wichtigsten Grund (z. B. abweichender Firmenname oder Ort). \n\n" f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n" f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n" "Antwort: " @@ -541,4 +541,4 @@ if __name__ == "__main__": num_rows = None processor = DataProcessor() processor.process_rows(num_rows) - print(f"\n✅ Wikipedia-Auswertung abgeschlossen ({Config.VERSION})") + print(f"\n✅ Wikipedia-Auswertung abgeschlossen ({Config.VERSION})") \ No newline at end of file