readme.md aktualisiert

2025-11-07 19:16:08 +00:00
parent c442c589b5
commit b0687abfa8
1 changed files with 33 additions and 0 deletions
--- a/readme.md
+++ b/readme.md
@@ -9,6 +9,39 @@ Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten An
 *   **`generate_marketing_text.py`:** Eine Engine zur Erstellung personalisierter Marketing-Texte.
 *   **`app.py` & Docker:** Eine fernsteuerbare Schnittstelle via Google Sheets.
 ## Architektur im Überblick
 I. DIE STEUERUNGS-EBENE (API & Ausführung)
   └── app.py (Flask API Server, startet Jobs)
   └── brancheneinstufung2.py (Der zentrale Orchestrator / Kommandozeile)
 II. DIE KERN-PRODUKTIONSLINIE (Datenanreicherung)
    └── data_processor.py (Der "Motor", führt die Arbeit aus)
        ├── google_sheet_handler.py (Spezialist für Google Sheets)
        ├── wikipedia_scraper.py (Spezialist für Wikipedia-Daten)
        ├── sync_manager.py (Spezialist für den D365-Abgleich)
        └── helpers.py (Der "Werkzeugkasten" für alle)
 III. DIE MARKETING-PRODUKTIONSLINIE (Content-Erstellung)
     └── generate_marketing_text.py (Erstellt E-Mail-Texte)
         └── INPUT: marketing_wissen_final.yaml (Die Wissensbasis)
 IV. DIE WISSENSBASIS-FABRIK (ETL-Pipelines zur Erstellung der Wissensbasis)
    ├── build_knowledge_base.py (Baut die Marketing-KB aus der config.py)
    ├── expand_knowledge_base.py (Erweitert die Marketing-KB)
    ├── extract_insights.py (Baut die Marketing-KB aus Word-Dokumenten)
    └── generate_knowledge_base.py (Erstellt einen Entwurf für die Marketing-KB)
 V. DAS KLASSIFIZIERUNGS-SYSTEM (Job-Titel-Analyse)
   ├── contact_grouping.py (Klassifiziert Job-Titel)
   └── knowledge_base_builder.py (Baut die Wissensbasis FÜR die Klassifizierung)
 VI. DAS STANDALONE-WERKZEUG
    └── duplicate_checker_old.py (Eigenständiger Duplikats-Check)
 VII. DAS FUNDAMENT
     └── config.py (Einstellungen & Konstanten für ALLE)
 ## Projektbeschreibung
 Dieses Projekt automatisiert die Anreicherung von Unternehmensdaten aus einem D365-CRM-System. Es nutzt externe APIs (Google, Wikipedia, OpenAI) und Web-Scraping, um Stammdaten zu validieren, zu ergänzen und neue, marketing-relevante Informationen (z.B. FSM-Pitches) zu generieren. Die Verarbeitung und Speicherung der angereicherten Daten erfolgt in einem Google Sheet.