Prompt angepasst

Prompt zur Validierung angepasst.
This commit is contained in:
2025-04-02 15:42:15 +00:00
parent b206ef9767
commit 40d99da0d9

View File

@@ -166,18 +166,19 @@ def evaluate_umsatz_chatgpt(company_name, wiki_umsatz):
return "k.A." return "k.A."
def validate_article_with_chatgpt(crm_data, wiki_data): def validate_article_with_chatgpt(crm_data, wiki_data):
crm_headers = "Firmenname;Website;Ort;Beschreibung;Aktuelle Branche;Beschreibung Branche extern;Anzahl Techniker;Umsatz (CRM);Anzahl Mitarbeiter (CRM)" wiki_headers = "Wikipedia URL;Wikipedia Absatz;Wikipedia Branche;Wikipedia Umsatz;Wikipedia Mitarbeiter;Wikipedia Kategorien"
wiki_headers = "Wikipedia URL;Wikipedia Absatz;Wikipedia Branche;Wikipedia Umsatz;Wikipedia Mitarbeiter;Wikipedia Kategorien" prompt_text = (
prompt_text = ( "Bitte überprüfe, ob die folgenden beiden Datensätze grundsätzlich zum gleichen Unternehmen gehören. "
"Bitte überprüfe, ob die folgenden beiden Datensätze zum gleichen Unternehmen gehören. " "Berücksichtige dabei, dass leichte Abweichungen in Firmennamen (z.B. unterschiedliche Schreibweisen, Mutter-Tochter-Beziehungen) "
"Die erste Zeile sind Daten aus unserem CRM-System, die zweite Zeile stammen aus Wikipedia. " "oder im Ort (z.B. 'Oberndorf' vs. 'Oberndorf/Neckar') tolerierbar sind. "
"Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können toleriert werden, " "Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können bis zu 10% abweichen. "
"solange sie im Rahmen von 10% liegen. Falls die Datensätze übereinstimmen, antworte ausschließlich mit 'OK'. " "Wenn die Daten im Wesentlichen übereinstimmen, antworte ausschließlich mit 'OK'. "
"Falls nicht, nenne bitte den wichtigsten Grund (z.B. abweichender Firmenname oder Ort). \n\n" "Falls nicht, nenne bitte den wichtigsten Grund und eine kurze Begründung, warum die Abweichung plausibel sein könnte.\n\n"
f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n" f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n"
f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n" f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n"
"Antwort: " "Antwort: "
) )
try: try:
with open("api_key.txt", "r") as f: with open("api_key.txt", "r") as f:
api_key = f.read().strip() api_key = f.read().strip()