diff --git a/brancheneinstufung.py b/brancheneinstufung.py index 5ec47b4a..77220b2c 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -1160,7 +1160,7 @@ def _process_single_row(self, row_num, row_data, process_wiki=True, process_chat # Hole den Firmennamen aus Spalte B (Index 1) company_name = row_data[1] if len(row_data) > 1 else "" - # Hole die CRM-Website aus Spalte D (Index 3). + # Hole die CRM-Website (Spalte D, Index 3). Falls keine Website vorhanden ist, führe den SERP-API Lookup durch. website_url = row_data[3] if len(row_data) > 3 else "" if website_url.strip() == "" or website_url.strip().lower() == "k.a.": new_website = serp_website_lookup(company_name) @@ -1174,47 +1174,20 @@ def _process_single_row(self, row_num, row_data, process_wiki=True, process_chat else: debug_print(f"Zeile {row_num}: Keine Website gefunden für {company_name}.") - # Website-Scraping: Wenn Wiki URL (Spalte M) "k.A." ist, nutze scrape_website_details, - # ansonsten führe den bisherigen Block aus. - website_raw = "k.A." - website_summary = "k.A." - if row_data[11].strip().lower() == "k.a.": - # Fallback: Es liegt kein Wikipedia-Eintrag vor, also extrahiere Details von der CRM-Website. - if website_url.strip() != "" and website_url.strip().lower() != "k.a.": - website_details = scrape_website_details(website_url) - website_summary = website_details # Das Ergebnis wird als Fallback genutzt - try: - self.sheet_handler.sheet.update(values=[[website_details]], range_name=f"AR{row_num}") - debug_print(f"Zeile {row_num}: Website-Scraping Fallback durchgeführt, Ergebnis in Spalte AR eingetragen: {website_details[:100]}...") - except Exception as e: - debug_print(f"Zeile {row_num}: Fehler beim Update von Spalte AR (Fallback): {e}") - else: - debug_print(f"Zeile {row_num}: Kein gültiger Website-URL vorhanden, Fallback-Website-Scraping wird übersprungen.") + # Website-Scraping: Für jeden Account soll die Website gescrapt werden. + # Das Ergebnis (Title, Description, H1, H2, H3) wird in Spalte AQ ausgegeben. + website_details = "k.A." + if website_url.strip() != "" and website_url.strip().lower() != "k.a.": + website_details = scrape_website_details(website_url) + debug_print(f"Zeile {row_num}: Gescrappte Website-Details (erste 100 Zeichen): {website_details[:100]}") + try: + self.sheet_handler.sheet.update(values=[[website_details]], range_name=f"AQ{row_num}") + debug_print(f"Zeile {row_num}: Spalte AQ Update erfolgreich.") + except Exception as e: + debug_print(f"Zeile {row_num}: Fehler beim Update von Spalte AQ: {e}") else: - # Falls ein Wikipedia-Eintrag vorhanden ist, fahre mit der herkömmlichen Website-Auswertung fort. - if website_url.strip() != "" and website_url.strip().lower() != "k.a.": - website_raw = get_website_raw(website_url) - website_summary = summarize_website_content(website_raw) - - debug_print(f"Zeile {row_num}: Gescrappter Website-Rohtext Länge: {len(website_raw)}; erster Ausschnitt: {website_raw[:100]}") - debug_print(f"Zeile {row_num}: Website-Zusammenfassung: {website_summary}") - - try: - update_result_ar = self.sheet_handler.sheet.update(values=[[website_raw]], range_name=f"AR{row_num}") - debug_print(f"Zeile {row_num}: Spalte AR Update erfolgreich: {update_result_ar}") - except Exception as e: - debug_print(f"Zeile {row_num}: Fehler beim Update von Spalte AR: {e}") - - try: - update_result_as = self.sheet_handler.sheet.update(values=[[website_summary]], range_name=f"AS{row_num}") - debug_print(f"Zeile {row_num}: Spalte AS Update erfolgreich: {update_result_as}") - except Exception as e: - debug_print(f"Zeile {row_num}: Fehler beim Update von Spalte AS: {e}") - - debug_print(f"Zeile {row_num}: Website-Daten gescrapt. Rohtext (Länge {len(website_raw)}): {website_raw[:100]}..., Zusammenfassung: {website_summary}") - else: - debug_print(f"Zeile {row_num}: Kein gültiger Website-URL vorhanden, Website-Scraping wird übersprungen.") - + debug_print(f"Zeile {row_num}: Kein gültiger Website-URL vorhanden, Website-Scraping wird übersprungen.") + # Weiterer Verarbeitungsteil: Wikipedia-Verarbeitung (falls process_wiki True) wiki_update_range = f"L{row_num}:R{row_num}" dt_wiki_range = f"AN{row_num}" @@ -1305,8 +1278,6 @@ def _process_single_row(self, row_num, row_data, process_wiki=True, process_chat f"Servicetechniker-Schätzung: {st_estimate}") time.sleep(Config.RETRY_DELAY) - - # ==================== ALIGNMENT DEMO FÜR HAUPTBLATT UND CONTACTS ==================== def alignment_demo_full():