ebcc83dc8b80a165c21f95d25a080695cbb05aae
Projekt: Automatisierte Unternehmensbewertung & Lead-Generierung v2.2.0
1. Projektübersicht
Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten Anreicherung, Analyse und Nutzung von Unternehmensdaten, die über eine Weboberfläche in Google Sheets gesteuert werden können.
-
Bestandsanreicherung (
brancheneinstufung.py):- Ziel: Systematische Anreicherung von Unternehmensdaten.
- Kernfunktionen: Web/Wikipedia-Scraping, KI-Zusammenfassung, kontextbasierte Brancheneinstufung 2.0 (Batch-fähig & kostenoptimiert), ML-basierte Schätzung der Technikeranzahl.
- Status: Weitgehend stabil. Die neue Brancheneinstufung 2.0 ist implementiert.
-
Duplikats-Check (
duplicate_checker.py):- Ziel: Intelligenter Abgleich neuer Firmenlisten gegen den CRM-Bestand.
- Methode: Robuster, transparenter "Brute-Force"-Abgleich mit gewichtetem Scoring basierend auf Name, Domain und Standort.
- Status: Kritischer Fehler. Der Prozess läuft durch, aber der finale Schreibvorgang der Ergebnisse ins Google Sheet schlägt fehl. Dies ist der unmittelbar zu behebende Blocker.
-
Marketing-Content-Generierung (
generate_marketing_text.py):- Ziel: Automatische Erstellung von hochpersonalisierten E-Mail-Textbausteinen.
- Methode: Nutzt eine reichhaltige, teils KI-generierte Wissensbasis (
marketing_wissen.yaml), um branchen- und positionsspezifische Texte zu erstellen. - Status: Funktional. Die Wissensbasis muss noch für alle Branchen vervollständigt werden.
-
Remote-Steuerung (
app.py& Docker):- Ziel: Bereitstellung einer benutzerfreundlichen Oberfläche in Google Sheets.
- Methode: Ein Docker-Container betreibt einen Flask-Webserver und einen
ngrok-Tunnel, der Anfragen aus einem Google Apps Script empfängt und die lokalen Python-Skripte startet. - Status: Funktional. Für den produktiven Einsatz ist eine permanente
ngrok-URL (Paid Plan) erforderlich.
2. Nächste Schritte
Priorität 1: Behebung des Schreibfehlers im duplicate_checker.py.
Priorität 2: Finalisierung der Wissensbasis und Generierung aller Marketing-Texte.
Priorität 3: Umstellung auf eine permanente ngrok-URL für den produktiven Betrieb.
Description
Languages
Python
63.6%
TypeScript
19.2%
JavaScript
15.6%
HTML
0.7%
Dockerfile
0.4%
Other
0.5%