Prompt angepasst

Prompt zur Validierung angepasst.
This commit is contained in:
2025-04-02 15:42:15 +00:00
parent b206ef9767
commit 40d99da0d9

View File

@@ -166,18 +166,19 @@ def evaluate_umsatz_chatgpt(company_name, wiki_umsatz):
return "k.A." return "k.A."
def validate_article_with_chatgpt(crm_data, wiki_data): def validate_article_with_chatgpt(crm_data, wiki_data):
crm_headers = "Firmenname;Website;Ort;Beschreibung;Aktuelle Branche;Beschreibung Branche extern;Anzahl Techniker;Umsatz (CRM);Anzahl Mitarbeiter (CRM)"
wiki_headers = "Wikipedia URL;Wikipedia Absatz;Wikipedia Branche;Wikipedia Umsatz;Wikipedia Mitarbeiter;Wikipedia Kategorien" wiki_headers = "Wikipedia URL;Wikipedia Absatz;Wikipedia Branche;Wikipedia Umsatz;Wikipedia Mitarbeiter;Wikipedia Kategorien"
prompt_text = ( prompt_text = (
"Bitte überprüfe, ob die folgenden beiden Datensätze zum gleichen Unternehmen gehören. " "Bitte überprüfe, ob die folgenden beiden Datensätze grundsätzlich zum gleichen Unternehmen gehören. "
"Die erste Zeile sind Daten aus unserem CRM-System, die zweite Zeile stammen aus Wikipedia. " "Berücksichtige dabei, dass leichte Abweichungen in Firmennamen (z.B. unterschiedliche Schreibweisen, Mutter-Tochter-Beziehungen) "
"Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können toleriert werden, " "oder im Ort (z.B. 'Oberndorf' vs. 'Oberndorf/Neckar') tolerierbar sind. "
"solange sie im Rahmen von 10% liegen. Falls die Datensätze übereinstimmen, antworte ausschließlich mit 'OK'. " "Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können bis zu 10% abweichen. "
"Falls nicht, nenne bitte den wichtigsten Grund (z.B. abweichender Firmenname oder Ort). \n\n" "Wenn die Daten im Wesentlichen übereinstimmen, antworte ausschließlich mit 'OK'. "
"Falls nicht, nenne bitte den wichtigsten Grund und eine kurze Begründung, warum die Abweichung plausibel sein könnte.\n\n"
f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n" f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n"
f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n" f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n"
"Antwort: " "Antwort: "
) )
try: try:
with open("api_key.txt", "r") as f: with open("api_key.txt", "r") as f:
api_key = f.read().strip() api_key = f.read().strip()