readme.md aktualisiert
This commit is contained in:
53
readme.md
53
readme.md
@@ -1,30 +1,39 @@
|
||||
# Projekt: Automatisierte Unternehmensbewertung & Lead-Generierung v2.2.0
|
||||
# Projekt: Automatisierte Unternehmensbewertung & Lead-Generierung v2.2.1
|
||||
|
||||
## 1. Projektübersicht
|
||||
|
||||
Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten Anreicherung, Analyse und Nutzung von Unternehmensdaten, die über eine Weboberfläche in Google Sheets gesteuert werden können.
|
||||
Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten Anreicherung und Analyse von Unternehmensdaten. Das System ist modular aufgebaut und für den Betrieb in einem Docker-Container ausgelegt.
|
||||
|
||||
1. **Bestandsanreicherung (`brancheneinstufung.py`):**
|
||||
* **Ziel:** Systematische Anreicherung von Unternehmensdaten.
|
||||
* **Kernfunktionen:** Web/Wikipedia-Scraping, KI-Zusammenfassung, kontextbasierte Brancheneinstufung 2.0 (Batch-fähig & kostenoptimiert), ML-basierte Schätzung der Technikeranzahl.
|
||||
* **Status:** Weitgehend stabil. Die neue Brancheneinstufung 2.0 ist implementiert.
|
||||
* **`brancheneinstufung.py`:** Das Kernmodul zur Datenanreicherung (Web, Wikipedia, KI-Analyse).
|
||||
* **`duplicate_checker.py`:** Ein Modul zur intelligenten Duplikatsprüfung.
|
||||
* **`generate_marketing_text.py`:** Eine Engine zur Erstellung personalisierter Marketing-Texte.
|
||||
* **`app.py` & Docker:** Eine fernsteuerbare Schnittstelle via Google Sheets.
|
||||
|
||||
2. **Duplikats-Check (`duplicate_checker.py`):**
|
||||
* **Ziel:** Intelligenter Abgleich neuer Firmenlisten gegen den CRM-Bestand.
|
||||
* **Methode:** Robuster, transparenter "Brute-Force"-Abgleich mit gewichtetem Scoring basierend auf Name, Domain und Standort.
|
||||
* **Status:** **Kritischer Fehler.** Der Prozess läuft durch, aber der finale Schreibvorgang der Ergebnisse ins Google Sheet schlägt fehl. **Dies ist der unmittelbar zu behebende Blocker.**
|
||||
## 2. Aktueller Status: **KRITISCHER FEHLER (BLOCKER)**
|
||||
|
||||
3. **Marketing-Content-Generierung (`generate_marketing_text.py`):**
|
||||
* **Ziel:** Automatische Erstellung von hochpersonalisierten E-Mail-Textbausteinen.
|
||||
* **Methode:** Nutzt eine reichhaltige, teils KI-generierte Wissensbasis (`marketing_wissen.yaml`), um branchen- und positionsspezifische Texte zu erstellen.
|
||||
* **Status:** Funktional. Die Wissensbasis muss noch für alle Branchen vervollständigt werden.
|
||||
Das gesamte System ist derzeit **nicht lauffähig**. Ein Inkompatibilitätsproblem zwischen dem bestehenden Code und der installierten Version der `openai`-Python-Bibliothek führt zu einem `ModuleNotFoundError` bei jedem Versuch, eine KI-Funktion aufzurufen. Dies verhindert jegliche Weiterentwicklung und Nutzung.
|
||||
|
||||
4. **Remote-Steuerung (`app.py` & Docker):**
|
||||
* **Ziel:** Bereitstellung einer benutzerfreundlichen Oberfläche in Google Sheets.
|
||||
* **Methode:** Ein Docker-Container betreibt einen Flask-Webserver und einen `ngrok`-Tunnel, der Anfragen aus einem Google Apps Script empfängt und die lokalen Python-Skripte startet.
|
||||
* **Status:** Funktional. Für den produktiven Einsatz ist eine permanente `ngrok`-URL (Paid Plan) erforderlich.
|
||||
## 3. Nächster Schritt
|
||||
|
||||
## 2. Nächste Schritte
|
||||
**Priorität 1:** Behebung des Schreibfehlers im `duplicate_checker.py`.
|
||||
**Priorität 2:** Finalisierung der Wissensbasis und Generierung aller Marketing-Texte.
|
||||
**Priorität 3:** Umstellung auf eine permanente `ngrok`-URL für den produktiven Betrieb.
|
||||
**Priorität 1:** Behebung des `openai`-Abhängigkeitskonflikts. Die gewählte Strategie ist ein gezieltes Downgrade der `openai`-Bibliothek auf eine mit dem Code kompatible Version, um die Funktionalität schnellstmöglich wiederherzustellen.
|
||||
planning.md (v2.2.1)
|
||||
code
|
||||
Markdown
|
||||
# Projektplanung v2.2.1
|
||||
|
||||
## 1. Aktueller Stand
|
||||
* **[X] Architektur & Module:** Alle Kernmodule sind konzipiert und implementiert.
|
||||
* **[!] System-Blocker:** Ein Versionskonflikt der `openai`-Bibliothek legt das gesamte System lahm. Alle Funktionen, die auf die KI zugreifen, stürzen mit einem `ModuleNotFoundError` ab.
|
||||
|
||||
## 2. Strategischer Plan
|
||||
|
||||
**Phase 1: Stabilität wiederherstellen (Hotfix)**
|
||||
* **[ ]** **Schritt 1.1 (Analyse):** Überprüfung aller Code-Stellen, die `openai`-Fehlerklassen importieren oder verwenden, um den Umfang des Problems zu bestätigen.
|
||||
* **[ ]** **Schritt 1.2 (Downgrade):** Modifikation der `requirements.txt`, um die `openai`-Bibliothek auf eine stabile, kompatible Version (z.B. `0.28.0`) festzuschreiben.
|
||||
* **[ ]** **Schritt 1.3 (Anwendung):** Neubau des Docker-Images (`docker build`), um die Installation der korrekten Bibliotheksversion zu erzwingen.
|
||||
* **[ ]** **Schritt 1.4 (Validierung):** Durchführung eines Testlaufs (z.B. `reclassify_branches`), um zu bestätigen, dass der `ModuleNotFoundError` behoben ist und die KI-Aufrufe wieder funktionieren.
|
||||
|
||||
**Phase 2: Geplante Weiterentwicklung (nach Hotfix)**
|
||||
* **[ ]** Finalisierung des Duplikats-Checks.
|
||||
* **[ ]** Vervollständigung der Wissensbasis und Generierung aller Marketing-Texte.
|
||||
* **[ ]** (Zukünftig) Planung des Code-Refactorings, um die neue `openai` v1.x API zu unterstützen.
|
||||
Reference in New Issue
Block a user