diff --git a/dealfront_enrichment.py b/dealfront_enrichment.py index 71865680..4d491c04 100644 --- a/dealfront_enrichment.py +++ b/dealfront_enrichment.py @@ -9,6 +9,7 @@ from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.common.exceptions import TimeoutException, NoSuchElementException from selenium.webdriver.common.keys import Keys +import pandas as pd from config import Config, DEALFRONT_LOGIN_URL, DEALFRONT_CREDENTIALS_FILE, DEALFRONT_TARGET_URL, TARGET_SEARCH_NAME @@ -232,13 +233,30 @@ if __name__ == "__main__": # Ergebnisse extrahieren companies = scraper.extract_current_page_results() + # === NEUE, SAUBERE AUSGABE === if companies: - logger.info("===== Extrahierte Firmen (erste Seite) =====") - for company in companies: - logger.info(f" - Name: {company['name']}, Webseite: {company['website']}") - logger.info("===========================================") + # Erstelle einen pandas DataFrame aus der Ergebnisliste + df = pd.DataFrame(companies) + + # Konfiguriere pandas, um den vollen Text in den Spalten anzuzeigen + pd.set_option('display.max_rows', None) + pd.set_option('display.max_columns', None) + pd.set_option('display.width', 1000) + pd.set_option('display.max_colwidth', None) + + print("\n" + "="*80) + print(" EXTRAHIERTE FIRMEN (ERSTE SEITE) ".center(80, "=")) + print("="*80) + if not df.empty: + print(df.to_string(index=False)) + else: + print(" DataFrame ist leer, obwohl Ergebnisse vorhanden waren. Überprüfung nötig. ".center(80, "-")) + print("="*80 + "\n") + + logger.info(f"{len(df)} Firmen erfolgreich in der Konsole ausgegeben.") + else: - logger.warning("Keine Firmen auf der ersten Seite extrahiert.") + logger.warning("Keine Firmen auf der ersten Seite extrahiert oder gefunden.") logger.info("Phase 2a Test erfolgreich abgeschlossen. Warte vor dem Schließen...") time.sleep(10)