From 7297eeb4af30adc7308d1b7e9d4bc78a531dd69e Mon Sep 17 00:00:00 2001 From: Floke Date: Fri, 7 Nov 2025 19:16:08 +0000 Subject: [PATCH] readme.md aktualisiert --- readme.md | 33 +++++++++++++++++++++++++++++++++ 1 file changed, 33 insertions(+) diff --git a/readme.md b/readme.md index e815955d..02a17114 100644 --- a/readme.md +++ b/readme.md @@ -9,6 +9,39 @@ Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten An * **`generate_marketing_text.py`:** Eine Engine zur Erstellung personalisierter Marketing-Texte. * **`app.py` & Docker:** Eine fernsteuerbare Schnittstelle via Google Sheets. +## Architektur im Überblick + +I. DIE STEUERUNGS-EBENE (API & Ausführung) + └── app.py (Flask API Server, startet Jobs) + └── brancheneinstufung2.py (Der zentrale Orchestrator / Kommandozeile) + +II. DIE KERN-PRODUKTIONSLINIE (Datenanreicherung) + └── data_processor.py (Der "Motor", führt die Arbeit aus) + ├── google_sheet_handler.py (Spezialist für Google Sheets) + ├── wikipedia_scraper.py (Spezialist für Wikipedia-Daten) + ├── sync_manager.py (Spezialist für den D365-Abgleich) + └── helpers.py (Der "Werkzeugkasten" für alle) + +III. DIE MARKETING-PRODUKTIONSLINIE (Content-Erstellung) + └── generate_marketing_text.py (Erstellt E-Mail-Texte) + └── INPUT: marketing_wissen_final.yaml (Die Wissensbasis) + +IV. DIE WISSENSBASIS-FABRIK (ETL-Pipelines zur Erstellung der Wissensbasis) + ├── build_knowledge_base.py (Baut die Marketing-KB aus der config.py) + ├── expand_knowledge_base.py (Erweitert die Marketing-KB) + ├── extract_insights.py (Baut die Marketing-KB aus Word-Dokumenten) + └── generate_knowledge_base.py (Erstellt einen Entwurf für die Marketing-KB) + +V. DAS KLASSIFIZIERUNGS-SYSTEM (Job-Titel-Analyse) + ├── contact_grouping.py (Klassifiziert Job-Titel) + └── knowledge_base_builder.py (Baut die Wissensbasis FÜR die Klassifizierung) + +VI. DAS STANDALONE-WERKZEUG + └── duplicate_checker_old.py (Eigenständiger Duplikats-Check) + +VII. DAS FUNDAMENT + └── config.py (Einstellungen & Konstanten für ALLE) + ## Projektbeschreibung Dieses Projekt automatisiert die Anreicherung von Unternehmensdaten aus einem D365-CRM-System. Es nutzt externe APIs (Google, Wikipedia, OpenAI) und Web-Scraping, um Stammdaten zu validieren, zu ergänzen und neue, marketing-relevante Informationen (z.B. FSM-Pitches) zu generieren. Die Verarbeitung und Speicherung der angereicherten Daten erfolgt in einem Google Sheet.