From d159bba3ef2efda856af5ec622c515733ebc9118 Mon Sep 17 00:00:00 2001 From: Floke Date: Tue, 8 Apr 2025 19:20:34 +0000 Subject: [PATCH] bugfix --- brancheneinstufung.py | 10 ++++++---- 1 file changed, 6 insertions(+), 4 deletions(-) diff --git a/brancheneinstufung.py b/brancheneinstufung.py index 1ad828c7..a840c175 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -246,12 +246,12 @@ def serp_website_lookup(company_name): """ Ermittelt über SERPAPI (Google-Suche) die Website zum Unternehmen. - Verwendet als Query den Firmennamen. - - Filtert Ergebnisse anhand einer Blacklist (z.B. bloomberg.com, northdata.de). + - Filtert Ergebnisse anhand einer Blacklist (z.B. bloomberg.com, northdata.de, finanzen.net, handelsblatt.com). Returns: Die gefundene Website-URL oder "k.A.", falls kein passendes Ergebnis gefunden wurde. """ - # Blacklist von Domains, die wir nicht verwenden wollen + # Blacklist unerwünschter Domains blacklist = ["bloomberg.com", "northdata.de", "finanzen.net", "handelsblatt.com"] try: with open("serpApiKey.txt", "r") as f: @@ -267,14 +267,15 @@ def serp_website_lookup(company_name): "api_key": serp_key, "hl": "de" } + try: response = requests.get("https://serpapi.com/search", params=params, timeout=10) data = response.json() if "organic_results" in data: for result in data["organic_results"]: - # Extrahiere URL und prüfe, ob sie in der Blacklist enthalten ist url = result.get("link", "") - if url and not any(black_item in url for black_item in blacklist): + # Überprüfe, ob die URL nicht in der Blacklist enthalten ist + if url and not any(bad in url for bad in blacklist): debug_print(f"SERP-Website Lookup: Gefundene Website '{url}' für {company_name}") return url return "k.A." @@ -283,6 +284,7 @@ def serp_website_lookup(company_name): return "k.A." + # ==================== NEUE FUNKTION: process_verification_only ==================== def process_verification_only(): debug_print("Starte Verifizierungsmodus (Modus 51) im Batch-Prozess...")