dealfront_enrichment.py aktualisiert

This commit is contained in:
2025-07-03 19:54:57 +00:00
parent c70c4a8bab
commit 6b69fe3d17

View File

@@ -9,6 +9,7 @@ from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException, NoSuchElementException
from selenium.webdriver.common.keys import Keys
import pandas as pd
from config import Config, DEALFRONT_LOGIN_URL, DEALFRONT_CREDENTIALS_FILE, DEALFRONT_TARGET_URL, TARGET_SEARCH_NAME
@@ -232,13 +233,30 @@ if __name__ == "__main__":
# Ergebnisse extrahieren
companies = scraper.extract_current_page_results()
# === NEUE, SAUBERE AUSGABE ===
if companies:
logger.info("===== Extrahierte Firmen (erste Seite) =====")
for company in companies:
logger.info(f" - Name: {company['name']}, Webseite: {company['website']}")
logger.info("===========================================")
# Erstelle einen pandas DataFrame aus der Ergebnisliste
df = pd.DataFrame(companies)
# Konfiguriere pandas, um den vollen Text in den Spalten anzuzeigen
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth', None)
print("\n" + "="*80)
print(" EXTRAHIERTE FIRMEN (ERSTE SEITE) ".center(80, "="))
print("="*80)
if not df.empty:
print(df.to_string(index=False))
else:
print(" DataFrame ist leer, obwohl Ergebnisse vorhanden waren. Überprüfung nötig. ".center(80, "-"))
print("="*80 + "\n")
logger.info(f"{len(df)} Firmen erfolgreich in der Konsole ausgegeben.")
else:
logger.warning("Keine Firmen auf der ersten Seite extrahiert.")
logger.warning("Keine Firmen auf der ersten Seite extrahiert oder gefunden.")
logger.info("Phase 2a Test erfolgreich abgeschlossen. Warte vor dem Schließen...")
time.sleep(10)