Rollback auf 1.3.1
This commit is contained in:
@@ -14,7 +14,7 @@ import csv
|
||||
|
||||
# ==================== KONFIGURATION ====================
|
||||
class Config:
|
||||
VERSION = "v1.3.0" # v1.3.0: Validierung des Wikipedia-Artikels implementiert
|
||||
VERSION = "v1.3.1" # v1.3.1: Validierung des Wikipedia-Artikels implementiert
|
||||
LANG = "de"
|
||||
CREDENTIALS_FILE = "service_account.json"
|
||||
SHEET_URL = "https://docs.google.com/spreadsheets/d/1u_gHr9JUfmV1-iviRzbSe3575QEp7KLhK5jFV_gJcgo"
|
||||
@@ -67,7 +67,7 @@ def normalize_company_name(name):
|
||||
]
|
||||
pattern = r'\b(' + '|'.join(forms) + r')\b'
|
||||
normalized = re.sub(pattern, '', name, flags=re.IGNORECASE)
|
||||
normalized = re.sub(r'[\-–]', ' ', normalized)
|
||||
normalized = re.sub(r'[\-–]', ' ', normalized)
|
||||
normalized = re.sub(r'\s+', ' ', normalized).strip()
|
||||
return normalized.lower()
|
||||
|
||||
@@ -169,7 +169,7 @@ def validate_article_with_chatgpt(crm_data, wiki_data):
|
||||
"Die erste Zeile sind Daten aus unserem CRM-System, die zweite Zeile stammen aus Wikipedia. "
|
||||
"Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können toleriert werden, "
|
||||
"solange sie im Rahmen von 10% liegen. Falls die Datensätze übereinstimmen, antworte ausschließlich mit 'OK'. "
|
||||
"Falls nicht, nenne bitte den wichtigsten Grund (z. B. abweichender Firmenname oder Ort). \n\n"
|
||||
"Falls nicht, nenne bitte den wichtigsten Grund (z. B. abweichender Firmenname oder Ort). \n\n"
|
||||
f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n"
|
||||
f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n"
|
||||
"Antwort: "
|
||||
@@ -541,4 +541,4 @@ if __name__ == "__main__":
|
||||
num_rows = None
|
||||
processor = DataProcessor()
|
||||
processor.process_rows(num_rows)
|
||||
print(f"\n✅ Wikipedia-Auswertung abgeschlossen ({Config.VERSION})")
|
||||
print(f"\n✅ Wikipedia-Auswertung abgeschlossen ({Config.VERSION})")
|
||||
Reference in New Issue
Block a user