From e4780684f945a97b76fe7fa84d0d40a61b5eb9ff Mon Sep 17 00:00:00 2001 From: Floke Date: Wed, 2 Apr 2025 15:42:15 +0000 Subject: [PATCH] Prompt angepasst Prompt zur Validierung angepasst. --- brancheneinstufung.py | 25 +++++++++++++------------ 1 file changed, 13 insertions(+), 12 deletions(-) diff --git a/brancheneinstufung.py b/brancheneinstufung.py index a383d0ab..4f9d082e 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -166,18 +166,19 @@ def evaluate_umsatz_chatgpt(company_name, wiki_umsatz): return "k.A." def validate_article_with_chatgpt(crm_data, wiki_data): - crm_headers = "Firmenname;Website;Ort;Beschreibung;Aktuelle Branche;Beschreibung Branche extern;Anzahl Techniker;Umsatz (CRM);Anzahl Mitarbeiter (CRM)" - wiki_headers = "Wikipedia URL;Wikipedia Absatz;Wikipedia Branche;Wikipedia Umsatz;Wikipedia Mitarbeiter;Wikipedia Kategorien" - prompt_text = ( - "Bitte überprüfe, ob die folgenden beiden Datensätze zum gleichen Unternehmen gehören. " - "Die erste Zeile sind Daten aus unserem CRM-System, die zweite Zeile stammen aus Wikipedia. " - "Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können toleriert werden, " - "solange sie im Rahmen von 10% liegen. Falls die Datensätze übereinstimmen, antworte ausschließlich mit 'OK'. " - "Falls nicht, nenne bitte den wichtigsten Grund (z. B. abweichender Firmenname oder Ort). \n\n" - f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n" - f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n" - "Antwort: " - ) + wiki_headers = "Wikipedia URL;Wikipedia Absatz;Wikipedia Branche;Wikipedia Umsatz;Wikipedia Mitarbeiter;Wikipedia Kategorien" + prompt_text = ( + "Bitte überprüfe, ob die folgenden beiden Datensätze grundsätzlich zum gleichen Unternehmen gehören. " + "Berücksichtige dabei, dass leichte Abweichungen in Firmennamen (z. B. unterschiedliche Schreibweisen, Mutter-Tochter-Beziehungen) " + "oder im Ort (z. B. 'Oberndorf' vs. 'Oberndorf/Neckar') tolerierbar sind. " + "Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können bis zu 10% abweichen. " + "Wenn die Daten im Wesentlichen übereinstimmen, antworte ausschließlich mit 'OK'. " + "Falls nicht, nenne bitte den wichtigsten Grund und eine kurze Begründung, warum die Abweichung plausibel sein könnte.\n\n" + f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n" + f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n" + "Antwort: " + ) + try: with open("api_key.txt", "r") as f: api_key = f.read().strip()