diff --git a/brancheneinstufung.py b/brancheneinstufung.py index 09dbf870..da9cdbe1 100644 --- a/brancheneinstufung.py +++ b/brancheneinstufung.py @@ -1160,7 +1160,7 @@ def _process_single_row(self, row_num, row_data, process_wiki=True, process_chat # Hole den Firmennamen aus Spalte B (Index 1) company_name = row_data[1] if len(row_data) > 1 else "" - # Hole die CRM-Website aus Spalte D (Index 3). Falls keine Website vorhanden, führe den SERP-API Lookup durch. + # Hole die CRM-Website aus Spalte D (Index 3). Falls keine Website vorhanden ist, führe SERP-API Lookup durch. website_url = row_data[3] if len(row_data) > 3 else "" if website_url.strip() == "" or website_url.strip().lower() == "k.a.": new_website = serp_website_lookup(company_name) @@ -1173,8 +1173,8 @@ def _process_single_row(self, row_num, row_data, process_wiki=True, process_chat debug_print(f"Zeile {row_num}: Fehler beim Updaten der CRM-Website in Spalte D: {e}") else: debug_print(f"Zeile {row_num}: Keine Website gefunden für {company_name}.") - - # Unabhängig vom process_wiki-Flag: Führe Website-Scraping durch, sofern eine Website vorliegt. + + # Website-Scraping: Unabhängig vom process_wiki-Flag website_raw = "k.A." website_summary = "k.A." if website_url.strip() != "" and website_url.strip().lower() != "k.a.": @@ -1183,7 +1183,7 @@ def _process_single_row(self, row_num, row_data, process_wiki=True, process_chat # Erstelle eine Zusammenfassung des Website-Contents website_summary = summarize_website_content(website_raw) - # Debug-Ausgabe: Ausgabe der Länge und eines Ausschnitts des gescrapten Textes + # Debug-Ausgabe: Länge und erster Ausschnitt des Rohtexts debug_print(f"Zeile {row_num}: Gescrappter Website-Rohtext Länge: {len(website_raw)}; erster Ausschnitt: {website_raw[:100]}") debug_print(f"Zeile {row_num}: Website-Zusammenfassung: {website_summary}") @@ -1205,7 +1205,7 @@ def _process_single_row(self, row_num, row_data, process_wiki=True, process_chat else: debug_print(f"Zeile {row_num}: Kein gültiger Website-URL vorhanden, Website-Scraping wird übersprungen.") - # Weiterer Verarbeitungsteil: Wikipedia-Verarbeitung (falls process_wiki True) + # --- Weiterer Verarbeitungsteil: Wikipedia-Verarbeitung --- wiki_update_range = f"L{row_num}:R{row_num}" dt_wiki_range = f"AN{row_num}" company_data = {} @@ -1243,7 +1243,7 @@ def _process_single_row(self, row_num, row_data, process_wiki=True, process_chat else: debug_print(f"Zeile {row_num}: Wikipedia-Timestamp bereits gesetzt – überspringe Wiki-Auswertung.") - # ChatGPT-Verarbeitung (Umsatz, FSM, Mitarbeiter, Branchenevaluierung) + # --- ChatGPT-Verarbeitung (Umsatz, FSM, Mitarbeiter, Branchenevaluierung) --- dt_chat_range = f"AO{row_num}" ver_range = f"AP{row_num}" if process_chatgpt: