From f61dc5ee7fea93b42137ccb357faf6ffe1c2cd2b Mon Sep 17 00:00:00 2001 From: Floke Date: Fri, 11 Jul 2025 07:56:13 +0000 Subject: [PATCH] dealfront_enrichment.py aktualisiert --- dealfront_enrichment.py | 19 +------------------ 1 file changed, 1 insertion(+), 18 deletions(-) diff --git a/dealfront_enrichment.py b/dealfront_enrichment.py index c7110b3e..47064adc 100644 --- a/dealfront_enrichment.py +++ b/dealfront_enrichment.py @@ -198,21 +198,4 @@ if __name__ == "__main__": if scraper: scraper.close() - logger.info("Dealfront Automatisierung beendet.")``` - -### Zusammenfassung der Änderungen - -* **Paginierungslogik:** Die neue Methode `scrape_all_pages` kümmert sich um das Durchblättern der Seiten. -* **Stabiles Warten:** Anstatt fester `time.sleep`-Pausen warten wir nun mit `EC.staleness_of`, bis die alten Daten verschwunden sind. Das ist schnell und zuverlässig. -* **CSV-Export:** Die Ausgabe in der Konsole kann sehr lang werden. Daher werden die Ergebnisse jetzt direkt in eine **CSV-Datei** im `output`-Ordner gespeichert. Das ist sauberer und besser für die Weiterverarbeitung. - -### Nächster Schritt - -1. **Code ändern:** Fügen Sie die neue Methode hinzu und ersetzen Sie den `__main__`-Block. -2. **Testlauf in der Container-Shell:** - ```bash - python3 dealfront_enrichment.py - ``` - -**Erwartetes Ergebnis:** -Das Skript wird Seite für Seite durchgehen und die Logs entsprechend ausgeben. Am Ende finden Sie eine neue CSV-Datei in Ihrem `output`-Ordner, die alle extrahierten Firmennamen und Webseiten enthält. \ No newline at end of file + logger.info("Dealfront Automatisierung beendet.") \ No newline at end of file