Files
Brancheneinstufung2/readme.md
2025-08-18 12:48:19 +00:00

2.3 KiB

Projekt: Automatisierte Unternehmensbewertung & Lead-Generierung v2.2.0

1. Projektübersicht

Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten Anreicherung, Analyse und Nutzung von Unternehmensdaten, die über eine Weboberfläche in Google Sheets gesteuert werden können.

  1. Bestandsanreicherung (brancheneinstufung.py):

    • Ziel: Systematische Anreicherung von Unternehmensdaten.
    • Kernfunktionen: Web/Wikipedia-Scraping, KI-Zusammenfassung, kontextbasierte Brancheneinstufung 2.0 (Batch-fähig & kostenoptimiert), ML-basierte Schätzung der Technikeranzahl.
    • Status: Weitgehend stabil. Die neue Brancheneinstufung 2.0 ist implementiert.
  2. Duplikats-Check (duplicate_checker.py):

    • Ziel: Intelligenter Abgleich neuer Firmenlisten gegen den CRM-Bestand.
    • Methode: Robuster, transparenter "Brute-Force"-Abgleich mit gewichtetem Scoring basierend auf Name, Domain und Standort.
    • Status: Kritischer Fehler. Der Prozess läuft durch, aber der finale Schreibvorgang der Ergebnisse ins Google Sheet schlägt fehl. Dies ist der unmittelbar zu behebende Blocker.
  3. Marketing-Content-Generierung (generate_marketing_text.py):

    • Ziel: Automatische Erstellung von hochpersonalisierten E-Mail-Textbausteinen.
    • Methode: Nutzt eine reichhaltige, teils KI-generierte Wissensbasis (marketing_wissen.yaml), um branchen- und positionsspezifische Texte zu erstellen.
    • Status: Funktional. Die Wissensbasis muss noch für alle Branchen vervollständigt werden.
  4. Remote-Steuerung (app.py & Docker):

    • Ziel: Bereitstellung einer benutzerfreundlichen Oberfläche in Google Sheets.
    • Methode: Ein Docker-Container betreibt einen Flask-Webserver und einen ngrok-Tunnel, der Anfragen aus einem Google Apps Script empfängt und die lokalen Python-Skripte startet.
    • Status: Funktional. Für den produktiven Einsatz ist eine permanente ngrok-URL (Paid Plan) erforderlich.

2. Nächste Schritte

Priorität 1: Behebung des Schreibfehlers im duplicate_checker.py. Priorität 2: Finalisierung der Wissensbasis und Generierung aller Marketing-Texte. Priorität 3: Umstellung auf eine permanente ngrok-URL für den produktiven Betrieb.