From 7297eeb4af30adc7308d1b7e9d4bc78a531dd69e Mon Sep 17 00:00:00 2001
From: Floke <floke.com@gmail.com>
Date: Fri, 7 Nov 2025 19:16:08 +0000
Subject: [PATCH] readme.md aktualisiert

---
 readme.md | 33 +++++++++++++++++++++++++++++++++
 1 file changed, 33 insertions(+)

diff --git a/readme.md b/readme.md
index e815955d..02a17114 100644
--- a/readme.md
+++ b/readme.md
@@ -9,6 +9,39 @@ Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten An
 *   **`generate_marketing_text.py`:** Eine Engine zur Erstellung personalisierter Marketing-Texte.
 *   **`app.py` & Docker:** Eine fernsteuerbare Schnittstelle via Google Sheets.
 
+## Architektur im Überblick
+
+I. DIE STEUERUNGS-EBENE (API & Ausführung)
+   └── app.py (Flask API Server, startet Jobs)
+   └── brancheneinstufung2.py (Der zentrale Orchestrator / Kommandozeile)
+
+II. DIE KERN-PRODUKTIONSLINIE (Datenanreicherung)
+    └── data_processor.py (Der "Motor", führt die Arbeit aus)
+        ├── google_sheet_handler.py (Spezialist für Google Sheets)
+        ├── wikipedia_scraper.py (Spezialist für Wikipedia-Daten)
+        ├── sync_manager.py (Spezialist für den D365-Abgleich)
+        └── helpers.py (Der "Werkzeugkasten" für alle)
+
+III. DIE MARKETING-PRODUKTIONSLINIE (Content-Erstellung)
+     └── generate_marketing_text.py (Erstellt E-Mail-Texte)
+         └── INPUT: marketing_wissen_final.yaml (Die Wissensbasis)
+
+IV. DIE WISSENSBASIS-FABRIK (ETL-Pipelines zur Erstellung der Wissensbasis)
+    ├── build_knowledge_base.py (Baut die Marketing-KB aus der config.py)
+    ├── expand_knowledge_base.py (Erweitert die Marketing-KB)
+    ├── extract_insights.py (Baut die Marketing-KB aus Word-Dokumenten)
+    └── generate_knowledge_base.py (Erstellt einen Entwurf für die Marketing-KB)
+
+V. DAS KLASSIFIZIERUNGS-SYSTEM (Job-Titel-Analyse)
+   ├── contact_grouping.py (Klassifiziert Job-Titel)
+   └── knowledge_base_builder.py (Baut die Wissensbasis FÜR die Klassifizierung)
+
+VI. DAS STANDALONE-WERKZEUG
+    └── duplicate_checker_old.py (Eigenständiger Duplikats-Check)
+
+VII. DAS FUNDAMENT
+     └── config.py (Einstellungen & Konstanten für ALLE)
+
 ## Projektbeschreibung
 
 Dieses Projekt automatisiert die Anreicherung von Unternehmensdaten aus einem D365-CRM-System. Es nutzt externe APIs (Google, Wikipedia, OpenAI) und Web-Scraping, um Stammdaten zu validieren, zu ergänzen und neue, marketing-relevante Informationen (z.B. FSM-Pitches) zu generieren. Die Verarbeitung und Speicherung der angereicherten Daten erfolgt in einem Google Sheet.