readme.md aktualisiert
This commit is contained in:
33
readme.md
33
readme.md
@@ -9,6 +9,39 @@ Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten An
|
|||||||
* **`generate_marketing_text.py`:** Eine Engine zur Erstellung personalisierter Marketing-Texte.
|
* **`generate_marketing_text.py`:** Eine Engine zur Erstellung personalisierter Marketing-Texte.
|
||||||
* **`app.py` & Docker:** Eine fernsteuerbare Schnittstelle via Google Sheets.
|
* **`app.py` & Docker:** Eine fernsteuerbare Schnittstelle via Google Sheets.
|
||||||
|
|
||||||
|
## Architektur im Überblick
|
||||||
|
|
||||||
|
I. DIE STEUERUNGS-EBENE (API & Ausführung)
|
||||||
|
└── app.py (Flask API Server, startet Jobs)
|
||||||
|
└── brancheneinstufung2.py (Der zentrale Orchestrator / Kommandozeile)
|
||||||
|
|
||||||
|
II. DIE KERN-PRODUKTIONSLINIE (Datenanreicherung)
|
||||||
|
└── data_processor.py (Der "Motor", führt die Arbeit aus)
|
||||||
|
├── google_sheet_handler.py (Spezialist für Google Sheets)
|
||||||
|
├── wikipedia_scraper.py (Spezialist für Wikipedia-Daten)
|
||||||
|
├── sync_manager.py (Spezialist für den D365-Abgleich)
|
||||||
|
└── helpers.py (Der "Werkzeugkasten" für alle)
|
||||||
|
|
||||||
|
III. DIE MARKETING-PRODUKTIONSLINIE (Content-Erstellung)
|
||||||
|
└── generate_marketing_text.py (Erstellt E-Mail-Texte)
|
||||||
|
└── INPUT: marketing_wissen_final.yaml (Die Wissensbasis)
|
||||||
|
|
||||||
|
IV. DIE WISSENSBASIS-FABRIK (ETL-Pipelines zur Erstellung der Wissensbasis)
|
||||||
|
├── build_knowledge_base.py (Baut die Marketing-KB aus der config.py)
|
||||||
|
├── expand_knowledge_base.py (Erweitert die Marketing-KB)
|
||||||
|
├── extract_insights.py (Baut die Marketing-KB aus Word-Dokumenten)
|
||||||
|
└── generate_knowledge_base.py (Erstellt einen Entwurf für die Marketing-KB)
|
||||||
|
|
||||||
|
V. DAS KLASSIFIZIERUNGS-SYSTEM (Job-Titel-Analyse)
|
||||||
|
├── contact_grouping.py (Klassifiziert Job-Titel)
|
||||||
|
└── knowledge_base_builder.py (Baut die Wissensbasis FÜR die Klassifizierung)
|
||||||
|
|
||||||
|
VI. DAS STANDALONE-WERKZEUG
|
||||||
|
└── duplicate_checker_old.py (Eigenständiger Duplikats-Check)
|
||||||
|
|
||||||
|
VII. DAS FUNDAMENT
|
||||||
|
└── config.py (Einstellungen & Konstanten für ALLE)
|
||||||
|
|
||||||
## Projektbeschreibung
|
## Projektbeschreibung
|
||||||
|
|
||||||
Dieses Projekt automatisiert die Anreicherung von Unternehmensdaten aus einem D365-CRM-System. Es nutzt externe APIs (Google, Wikipedia, OpenAI) und Web-Scraping, um Stammdaten zu validieren, zu ergänzen und neue, marketing-relevante Informationen (z.B. FSM-Pitches) zu generieren. Die Verarbeitung und Speicherung der angereicherten Daten erfolgt in einem Google Sheet.
|
Dieses Projekt automatisiert die Anreicherung von Unternehmensdaten aus einem D365-CRM-System. Es nutzt externe APIs (Google, Wikipedia, OpenAI) und Web-Scraping, um Stammdaten zu validieren, zu ergänzen und neue, marketing-relevante Informationen (z.B. FSM-Pitches) zu generieren. Die Verarbeitung und Speicherung der angereicherten Daten erfolgt in einem Google Sheet.
|
||||||
|
|||||||
Reference in New Issue
Block a user