bugfix
This commit is contained in:
@@ -535,7 +535,7 @@ def process_verification_only():
|
|||||||
"""
|
"""
|
||||||
Überarbeiteter Batch‑Prozess (Modus 51):
|
Überarbeiteter Batch‑Prozess (Modus 51):
|
||||||
- Fragt in der Konsole ab, wie viele Zeilen insgesamt verarbeitet werden sollen.
|
- Fragt in der Konsole ab, wie viele Zeilen insgesamt verarbeitet werden sollen.
|
||||||
- Alle Zeilen, bei denen Spalte AO (Index 40) leer ist (oder die Spaltenanzahl < 41 beträgt), werden verarbeitet.
|
- Alle Zeilen, bei denen Spalte AO (Index 40) nicht vorhanden oder leer ist, werden verarbeitet.
|
||||||
- Die zu verarbeitenden Zeilen werden in Paketen der Größe Config.BATCH_SIZE (z. B. 10 Zeilen) gebündelt.
|
- Die zu verarbeitenden Zeilen werden in Paketen der Größe Config.BATCH_SIZE (z. B. 10 Zeilen) gebündelt.
|
||||||
- Für jedes Batch wird ein aggregierter Prompt erstellt, an ChatGPT gesendet und die aggregierte Antwort
|
- Für jedes Batch wird ein aggregierter Prompt erstellt, an ChatGPT gesendet und die aggregierte Antwort
|
||||||
zeilenweise geparst.
|
zeilenweise geparst.
|
||||||
@@ -560,22 +560,23 @@ def process_verification_only():
|
|||||||
main_sheet = sh.sheet1
|
main_sheet = sh.sheet1
|
||||||
data = main_sheet.get_all_values()
|
data = main_sheet.get_all_values()
|
||||||
|
|
||||||
# Definiere die Anzahl der zu verarbeitenden Zeilen.
|
# Bestimme die Anzahl der zu verarbeitenden Zeilen (ohne Header)
|
||||||
available_rows = len(data) - 1 # ohne Header
|
available_rows = len(data) - 1
|
||||||
if total_rows is not None and total_rows < available_rows:
|
if total_rows is not None and total_rows < available_rows:
|
||||||
available_rows = total_rows
|
available_rows = total_rows
|
||||||
|
|
||||||
batch_size = Config.BATCH_SIZE # z. B. 10, einstellbar in der Config
|
batch_size = Config.BATCH_SIZE # z. B. 10, einstellbar in der Config
|
||||||
batches = []
|
batches = []
|
||||||
row_numbers = []
|
row_numbers = []
|
||||||
# VERARBEITE JEDEN Datensatz, bei dem entweder nicht mindestens 41 Spalten existieren oder Spalte AO leer ist.
|
|
||||||
|
# Verarbeite jede Zeile (Index ab 2, da Header in Zeile 1)
|
||||||
for i, row in enumerate(data[1:], start=2):
|
for i, row in enumerate(data[1:], start=2):
|
||||||
if i > available_rows + 1:
|
if i > available_rows + 1: # +1 wegen Header
|
||||||
break
|
break
|
||||||
# Überspringe Zeilen, bei denen Spalte AO (Index 40) bereits gefüllt ist.
|
# Überspringe Zeilen, bei denen Spalte AO (Index 40) existiert und nicht leer ist.
|
||||||
if len(row) >= 41 and row[40].strip() != "":
|
if len(row) >= 41 and row[40].strip() != "":
|
||||||
continue
|
continue
|
||||||
# Nehme die Zeile in den Batch auf.
|
# Nimm diese Zeile in den Batch auf – keine weiteren Bedingungen!
|
||||||
entry_text = (
|
entry_text = (
|
||||||
f"Eintrag {i}:\n"
|
f"Eintrag {i}:\n"
|
||||||
f"Firmenname: {row[1] if len(row) > 1 else ''}\n"
|
f"Firmenname: {row[1] if len(row) > 1 else ''}\n"
|
||||||
@@ -587,6 +588,7 @@ def process_verification_only():
|
|||||||
)
|
)
|
||||||
batches.append(entry_text)
|
batches.append(entry_text)
|
||||||
row_numbers.append(i)
|
row_numbers.append(i)
|
||||||
|
|
||||||
if len(batches) == batch_size:
|
if len(batches) == batch_size:
|
||||||
aggregated_prompt = (
|
aggregated_prompt = (
|
||||||
"Du bist ein Experte in der Verifizierung von Wikipedia-Artikeln für Unternehmen. "
|
"Du bist ein Experte in der Verifizierung von Wikipedia-Artikeln für Unternehmen. "
|
||||||
@@ -654,7 +656,6 @@ def process_verification_only():
|
|||||||
main_sheet.update(values=[[wiki_confirm]], range_name=f"S{current_row}")
|
main_sheet.update(values=[[wiki_confirm]], range_name=f"S{current_row}")
|
||||||
main_sheet.update(values=[[alt_article]], range_name=f"T{current_row}")
|
main_sheet.update(values=[[alt_article]], range_name=f"T{current_row}")
|
||||||
main_sheet.update(values=[[wiki_explanation]], range_name=f"U{current_row}")
|
main_sheet.update(values=[[wiki_explanation]], range_name=f"U{current_row}")
|
||||||
# Setze die Spalten V bis Y (Platzhalter) auf leere Strings
|
|
||||||
main_sheet.update(values=[["", "", "", ""]], range_name=f"V{current_row}:Y{current_row}")
|
main_sheet.update(values=[["", "", "", ""]], range_name=f"V{current_row}:Y{current_row}")
|
||||||
debug_print(f"Zeile {current_row} verifiziert: Antwort: {answer}")
|
debug_print(f"Zeile {current_row} verifiziert: Antwort: {answer}")
|
||||||
except Exception as e:
|
except Exception as e:
|
||||||
@@ -732,6 +733,7 @@ def process_verification_only():
|
|||||||
time.sleep(Config.RETRY_DELAY)
|
time.sleep(Config.RETRY_DELAY)
|
||||||
debug_print("Verifizierungs-Batch abgeschlossen.")
|
debug_print("Verifizierungs-Batch abgeschlossen.")
|
||||||
|
|
||||||
|
|
||||||
# ==================== List Metatitel, Description und Überschriften aus Websiten aus ====================
|
# ==================== List Metatitel, Description und Überschriften aus Websiten aus ====================
|
||||||
def scrape_website_details(url):
|
def scrape_website_details(url):
|
||||||
"""
|
"""
|
||||||
|
|||||||
Reference in New Issue
Block a user