Rollback auf 1.3.1

This commit is contained in:
2025-04-02 10:57:15 +00:00
parent cf97446c04
commit 79c9c77832

View File

@@ -14,7 +14,7 @@ import csv
# ==================== KONFIGURATION ====================
class Config:
VERSION = "v1.3.0" # v1.3.0: Validierung des Wikipedia-Artikels implementiert
VERSION = "v1.3.1" # v1.3.1: Validierung des Wikipedia-Artikels implementiert
LANG = "de"
CREDENTIALS_FILE = "service_account.json"
SHEET_URL = "https://docs.google.com/spreadsheets/d/1u_gHr9JUfmV1-iviRzbSe3575QEp7KLhK5jFV_gJcgo"
@@ -67,7 +67,7 @@ def normalize_company_name(name):
]
pattern = r'\b(' + '|'.join(forms) + r')\b'
normalized = re.sub(pattern, '', name, flags=re.IGNORECASE)
normalized = re.sub(r'[\-]', ' ', normalized)
normalized = re.sub(r'[\-]', ' ', normalized)
normalized = re.sub(r'\s+', ' ', normalized).strip()
return normalized.lower()
@@ -169,7 +169,7 @@ def validate_article_with_chatgpt(crm_data, wiki_data):
"Die erste Zeile sind Daten aus unserem CRM-System, die zweite Zeile stammen aus Wikipedia. "
"Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können toleriert werden, "
"solange sie im Rahmen von 10% liegen. Falls die Datensätze übereinstimmen, antworte ausschließlich mit 'OK'. "
"Falls nicht, nenne bitte den wichtigsten Grund (z.B. abweichender Firmenname oder Ort). \n\n"
"Falls nicht, nenne bitte den wichtigsten Grund (z.B. abweichender Firmenname oder Ort). \n\n"
f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n"
f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n"
"Antwort: "
@@ -541,4 +541,4 @@ if __name__ == "__main__":
num_rows = None
processor = DataProcessor()
processor.process_rows(num_rows)
print(f"\n✅ Wikipedia-Auswertung abgeschlossen ({Config.VERSION})")
print(f"\n✅ Wikipedia-Auswertung abgeschlossen ({Config.VERSION})")