diff --git a/brancheneinstufung.py b/brancheneinstufung.py index 4f9d082eb..8b8ddca47 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -166,26 +166,28 @@ def evaluate_umsatz_chatgpt(company_name, wiki_umsatz): return "k.A." def validate_article_with_chatgpt(crm_data, wiki_data): - wiki_headers = "Wikipedia URL;Wikipedia Absatz;Wikipedia Branche;Wikipedia Umsatz;Wikipedia Mitarbeiter;Wikipedia Kategorien" - prompt_text = ( - "Bitte überprüfe, ob die folgenden beiden Datensätze grundsätzlich zum gleichen Unternehmen gehören. " - "Berücksichtige dabei, dass leichte Abweichungen in Firmennamen (z. B. unterschiedliche Schreibweisen, Mutter-Tochter-Beziehungen) " - "oder im Ort (z. B. 'Oberndorf' vs. 'Oberndorf/Neckar') tolerierbar sind. " - "Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können bis zu 10% abweichen. " - "Wenn die Daten im Wesentlichen übereinstimmen, antworte ausschließlich mit 'OK'. " - "Falls nicht, nenne bitte den wichtigsten Grund und eine kurze Begründung, warum die Abweichung plausibel sein könnte.\n\n" - f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n" - f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n" - "Antwort: " - ) - + crm_headers = "Firmenname;Website;Ort;Beschreibung;Aktuelle Branche;Beschreibung Branche extern;Anzahl Techniker;Umsatz (CRM);Anzahl Mitarbeiter (CRM)" + wiki_headers = "Wikipedia URL;Wikipedia Absatz;Wikipedia Branche;Wikipedia Umsatz;Wikipedia Mitarbeiter;Wikipedia Kategorien" + prompt_text = ( + "Bitte überprüfe, ob die folgenden beiden Datensätze grundsätzlich zum gleichen Unternehmen gehören. " + "Berücksichtige dabei, dass leichte Abweichungen in Firmennamen (z. B. unterschiedliche Schreibweisen, Mutter-Tochter-Beziehungen) " + "oder im Ort (z. B. 'Oberndorf' vs. 'Oberndorf/Neckar') tolerierbar sind. " + "Vergleiche insbesondere den Firmennamen, den Ort und die Branche. Unterschiede im Umsatz können bis zu 10% abweichen. " + "Wenn die Daten im Wesentlichen übereinstimmen, antworte ausschließlich mit 'OK'. " + "Falls nicht, nenne bitte den wichtigsten Grund und eine kurze Begründung, warum die Abweichung plausibel sein könnte.\n\n" + f"CRM-Daten:\n{crm_headers}\n{crm_data}\n\n" + f"Wikipedia-Daten:\n{wiki_headers}\n{wiki_data}\n\n" + "Antwort: " + ) try: with open("api_key.txt", "r") as f: api_key = f.read().strip() except Exception as e: debug_print(f"Fehler beim Lesen des API-Tokens: {e}") return "k.A." + openai.api_key = api_key + try: response = openai.ChatCompletion.create( model="gpt-3.5-turbo", @@ -199,6 +201,7 @@ def validate_article_with_chatgpt(crm_data, wiki_data): debug_print(f"Fehler beim Validierungs-API-Aufruf: {e}") return "k.A." + # ==================== NEUE FUNKTION: FSM-EIGNUNGSPRÜFUNG ==================== def evaluate_fsm_suitability(company_name, company_data): try: