# Projekt: Automatisierte Unternehmensbewertung & Lead-Generierung v2.2.0 ## 1. Projektübersicht Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten Anreicherung, Analyse und Nutzung von Unternehmensdaten, die über eine Weboberfläche in Google Sheets gesteuert werden können. 1. **Bestandsanreicherung (`brancheneinstufung.py`):** * **Ziel:** Systematische Anreicherung von Unternehmensdaten. * **Kernfunktionen:** Web/Wikipedia-Scraping, KI-Zusammenfassung, kontextbasierte Brancheneinstufung 2.0 (Batch-fähig & kostenoptimiert), ML-basierte Schätzung der Technikeranzahl. * **Status:** Weitgehend stabil. Die neue Brancheneinstufung 2.0 ist implementiert. 2. **Duplikats-Check (`duplicate_checker.py`):** * **Ziel:** Intelligenter Abgleich neuer Firmenlisten gegen den CRM-Bestand. * **Methode:** Robuster, transparenter "Brute-Force"-Abgleich mit gewichtetem Scoring basierend auf Name, Domain und Standort. * **Status:** **Kritischer Fehler.** Der Prozess läuft durch, aber der finale Schreibvorgang der Ergebnisse ins Google Sheet schlägt fehl. **Dies ist der unmittelbar zu behebende Blocker.** 3. **Marketing-Content-Generierung (`generate_marketing_text.py`):** * **Ziel:** Automatische Erstellung von hochpersonalisierten E-Mail-Textbausteinen. * **Methode:** Nutzt eine reichhaltige, teils KI-generierte Wissensbasis (`marketing_wissen.yaml`), um branchen- und positionsspezifische Texte zu erstellen. * **Status:** Funktional. Die Wissensbasis muss noch für alle Branchen vervollständigt werden. 4. **Remote-Steuerung (`app.py` & Docker):** * **Ziel:** Bereitstellung einer benutzerfreundlichen Oberfläche in Google Sheets. * **Methode:** Ein Docker-Container betreibt einen Flask-Webserver und einen `ngrok`-Tunnel, der Anfragen aus einem Google Apps Script empfängt und die lokalen Python-Skripte startet. * **Status:** Funktional. Für den produktiven Einsatz ist eine permanente `ngrok`-URL (Paid Plan) erforderlich. ## 2. Nächste Schritte **Priorität 1:** Behebung des Schreibfehlers im `duplicate_checker.py`. **Priorität 2:** Finalisierung der Wissensbasis und Generierung aller Marketing-Texte. **Priorität 3:** Umstellung auf eine permanente `ngrok`-URL für den produktiven Betrieb.