diff --git a/brancheneinstufung.py b/brancheneinstufung.py index 02532a25..5fe04f87 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -123,6 +123,7 @@ def get_wikipedia_data(name, website_hint=""): # Titelprüfung verbessern if any(x in page.title.lower() for x in ["krankenkasse", "versicherung"]): continue + url = page.url html = requests.get(url).text if website_hint: domain_fragment = website_hint.lower().split(".")[0] @@ -195,7 +196,7 @@ for i in range(start, min(start + DURCHLÄUFE, len(sheet_values))): url, wiki_branche, umsatz = get_wikipedia_data(row[0], row[1]) wiki, linkedin, umsatz_chat, new_cat, reason, fsm, techniker, techniker_reason = classify_company(row) - wiki_final = wiki_branche if wiki_branche != "k.A." else wiki + wiki_final = wiki_branche umsatz_final = umsatz if umsatz != "k.A." else umsatz_chat values = [