Die Wikipedia-Suchfunktion wurde überarbeitet
Statt nur wikipedia.page() wird jetzt wikipedia.search() verwendet. Es werden die besten 3 Treffer geprüft. Nur Artikel, deren Titel den Unternehmensnamen enthalten, werden akzeptiert. Dadurch wird z. B. „Heimbach-Gruppe“ korrekt erkannt, auch wenn „Heimbach GmbH“ gesucht wurde.
This commit is contained in:
@@ -99,10 +99,15 @@ system_prompt = {
|
||||
def get_wikipedia_data(name, website_hint=""):
|
||||
begriffe = [name.strip(), " ".join(name.split()[:2])]
|
||||
if website_hint:
|
||||
begriffe.append(website_hint.split(".")[1])
|
||||
parts = website_hint.replace("https://", "").replace("http://", "").split(".")
|
||||
if len(parts) > 1:
|
||||
begriffe.append(parts[0]) # z. B. "heimbach" aus "www.heimbach.com"
|
||||
|
||||
for suchbegriff in begriffe:
|
||||
results = wikipedia.search(suchbegriff, results=3)
|
||||
for title in results:
|
||||
try:
|
||||
page = wikipedia.page(suchbegriff, auto_suggest=False)
|
||||
page = wikipedia.page(title)
|
||||
if name.lower().split()[0] not in page.title.lower():
|
||||
continue
|
||||
url = page.url
|
||||
|
||||
Reference in New Issue
Block a user