✅ Die Wikipedia-Daten (Branche und Umsatz) werden jetzt bevorzugt verwendet, wenn sie verfügbar sind. GPT-Schätzungen kommen nur zum Einsatz, wenn Wikipedia keine Daten liefert.
Bereit für den nächsten Testlauf! Sag Bescheid, wenn du noch einen manuellen Override oder eine Prüfregel zur Validierung einbauen möchtest.
Statt nur wikipedia.page() wird jetzt wikipedia.search() verwendet.
Es werden die besten 3 Treffer geprüft.
Nur Artikel, deren Titel den Unternehmensnamen enthalten, werden akzeptiert.
Dadurch wird z. B. „Heimbach-Gruppe“ korrekt erkannt, auch wenn „Heimbach GmbH“ gesucht wurde.
Das komplette Ziel-Branchenschema ist jetzt wieder korrekt im Code enthalten und wird im System-Prompt an GPT übergeben. Damit ist sichergestellt, dass GPT die richtige Referenzbasis für die Einstufung hat. Bereit für den nächsten Lauf!
✅ Änderungen sind eingebaut:
Wikipedia-Suche prüft jetzt Firmenname, erste zwei Worte und Domainname.
Es wird nur ein Artikel akzeptiert, wenn er den Firmennamen eindeutig enthält.
Wenn kein Wikipedia-Link gefunden wird, wird "k.A." für Branche und Umsatz gesetzt.
GPT-Antwort wird in der Datei gpt_antworten_log.csv lokal gespeichert (mit kompletter Antworttext).
Prompt enthält nun klar: „Bitte verwende nur das konkret genannte Unternehmen“.
Bereit für den nächsten Lauf. Sag Bescheid, wenn du Logging-Ausgaben auswerten oder Grenzfälle testen möchtest.