Go to file

Floke cd9a2ffc55 contact_grouping.py aktualisiert

- Detailliertere Log-Ausgaben während des gesamten Prozesses für eine bessere Nachvollziehbarkeit.
- Loggt die Anzahl der Zeilen direkt nach dem erfolgreichen Laden aus dem Google Sheet.
- Fügt explizite Start- und End-Meldungen für die regel-basierte Zuordnung (Stufe 1 & 2) hinzu.
- Loggt die genaue Anzahl der 'Undefined'-Fälle, die an die KI zur Klassifizierung gesendet werden.
- Gibt eine klare Meldung aus, wenn keine KI-Anfrage nötig ist, weil alle Fälle durch Regeln gelöst wurden.
- Verbessert die allgemeine Klarheit der Log-Nachrichten, um die Analyse von Laufzeitverhalten und potenziellen Fehlern zu erleichtern.

- Bugfix: Behebt einen kritischen APIError [400] 'Invalid list_value', der beim Zurückschreiben der Daten in das Google Sheet auftrat.
- Die Funktion `_find_best_match` gab in manchen Fällen fälschlicherweise eine Liste anstelle eines einzelnen Strings als Department zurück.
- Die Rückgabewerte der Funktion wurden korrigiert, um sicherzustellen, dass immer ein String übergeben wird.
- Dies stellt die Kompatibilität mit der Google Sheets API wieder her und macht den Schreibvorgang robust.

2025-09-18 07:59:31 +00:00

@eaDir

Erste Version

2025-03-29 18:47:15 +01:00

templates

templates/index.html hinzugefügt

2025-05-27 12:29:05 +00:00

app.py

app.py aktualisiert

2025-08-21 10:58:01 +00:00

Bestandsfirmen.xlsx

Erste Version

2025-03-29 18:47:15 +01:00

brancheneinstufung2.py

brancheneinstufung2.py aktualisiert

2025-08-29 06:20:48 +00:00

brancheneinstufung - Kopie.py

Erste Version

2025-03-29 18:47:15 +01:00

build_knowledge_base.py

build_knowledge_base.py hinzugefügt

2025-07-29 11:27:23 +00:00

config.py

config.py aktualisiert

2025-08-28 09:20:27 +00:00

contact_grouping.py

contact_grouping.py aktualisiert

2025-09-18 07:59:31 +00:00

create_weights.py

create_weights.py hinzugefügt

2025-09-08 11:31:53 +00:00

data_processor.py

data_processor.py aktualisiert

2025-08-22 12:02:17 +00:00

dealfront_enrichment.py

dealfront_enrichment.py aktualisiert

2025-07-14 08:17:41 +00:00

debug_screenshot.py

debug_screenshot.py aktualisiert

2025-07-05 21:15:45 +00:00

Dockerfile

Dockerfile aktualisiert

2025-07-16 12:58:47 +00:00

Dockerfile.brancheneinstufung

Dockerfile.brancheneinstufung aktualisiert

2025-08-21 14:49:11 +00:00

duplicate_checker.py

duplicate_checker.py aktualisiert

2025-09-10 11:26:28 +00:00

expand_knowledge_base.py

Anpassung Extraction Prompt

2025-07-23 15:26:23 +00:00

extract_insights.py

extract_insights.py aktualisiert

2025-07-16 08:06:30 +00:00

generate_knowledge_base.py

generate_knowledge_base.py hinzugefügt

2025-07-15 19:32:00 +00:00

generate_marketing_text.py

Fallback wenn keine Referenzen vorhanden

2025-07-31 09:30:51 +00:00

google_sheet_handler.py

google_sheet_handler.py aktualisiert

2025-08-28 05:14:40 +00:00

HA_automations.yaml

HA_automations.yaml aktualisiert

2025-07-23 10:10:59 +00:00

HA_configuration.yaml

HA_configuration.yaml hinzugefügt

2025-07-23 10:10:39 +00:00

HA_jbd_bms.yaml

HA_jbd_bms.yaml hinzugefügt

2025-07-23 10:19:02 +00:00

helpers.py

helpers.py aktualisiert

2025-08-25 18:19:45 +00:00

knowledge_base_builder.py

knowledge_base_builder.py aktualisiert

2025-09-18 07:12:43 +00:00

Labyrinth.py

Font changed

2025-04-04 17:04:06 +00:00

list_generator.py

list_generator.py aktualisiert

2025-06-29 14:53:15 +00:00

marketing_wissen.yaml

marketing_wissen.yaml aktualisiert

2025-07-21 16:03:05 +00:00

old_brancheneinstufung.py

old_brancheneinstufung.py aktualisiert

2025-08-04 12:02:19 +00:00

planning.md

planning.md aktualisiert

2025-08-29 08:34:07 +00:00

readme.md

readme.md aktualisiert

2025-08-29 08:32:40 +00:00

reindent.py

Add reindent.py script

2025-06-27 11:08:42 +02:00

requirements.txt

requirements.txt aktualisiert

2025-09-10 20:03:36 +00:00

scrape_fotograf.py

Code-Karte beim Zählen der Downloads ausgeschlossen

2025-07-17 11:11:34 +00:00

service_account.json

Erste Version

2025-03-29 18:47:15 +01:00

start.sh

start.sh aktualisiert

2025-08-22 06:59:56 +00:00

sync_manager.py

sync_manager.py aktualisiert

2025-08-29 07:11:48 +00:00

take_screenshot.sh

take_screenshot.sh hinzugefügt

2025-07-05 20:37:16 +00:00

tasks.md

tasks.md aktualisiert

2025-08-29 08:33:31 +00:00

test_core_functionality.py

test_core_functionality.py hinzugefügt

2025-08-04 09:37:04 +00:00

test_pytube.py

test_pytube.py aktualisiert

2025-05-27 12:48:05 +00:00

test_selenium.py

test_selenium.py hinzugefügt

2025-07-14 08:36:01 +00:00

train_model.py

train_model.py aktualisiert

2025-09-10 08:25:50 +00:00

update.log

Erste Version

2025-03-29 18:47:15 +01:00

wikipedia_scraper.py

v2.0.2: feat: Implement Google-First Wikipedia Search

2025-08-04 18:39:16 +00:00

xgb_model.json

xgb_model.json hinzugefügt

2025-09-08 11:30:45 +00:00

readme.md

Projekt: Automatisierte Unternehmensbewertung & Lead-Generierung v2.2.1

1. Projektübersicht

Dieses Repository enthält eine Suite von Python-Skripten zur automatisierten Anreicherung und Analyse von Unternehmensdaten. Das System ist modular aufgebaut und für den Betrieb in einem Docker-Container ausgelegt.

brancheneinstufung.py: Das Kernmodul zur Datenanreicherung (Web, Wikipedia, KI-Analyse).
duplicate_checker.py: Ein Modul zur intelligenten Duplikatsprüfung.
generate_marketing_text.py: Eine Engine zur Erstellung personalisierter Marketing-Texte.
app.py & Docker: Eine fernsteuerbare Schnittstelle via Google Sheets.

2. Aktueller Status: KRITISCHER FEHLER (BLOCKER)

Das gesamte System ist derzeit nicht lauffähig. Ein Inkompatibilitätsproblem zwischen dem bestehenden Code und der installierten Version der openai-Python-Bibliothek führt zu einem ModuleNotFoundError bei jedem Versuch, eine KI-Funktion aufzurufen. Dies verhindert jegliche Weiterentwicklung und Nutzung.

3. Nächster Schritt

Priorität 1: Behebung des openai-Abhängigkeitskonflikts. Die gewählte Strategie ist ein gezieltes Downgrade der openai-Bibliothek auf eine mit dem Code kompatible Version, um die Funktionalität schnellstmöglich wiederherzustellen. planning.md (v2.2.1) code Markdown

Projektplanung v2.2.1

1. Aktueller Stand

[X] Architektur & Module: Alle Kernmodule sind konzipiert und implementiert.
[!] System-Blocker: Ein Versionskonflikt der openai-Bibliothek legt das gesamte System lahm. Alle Funktionen, die auf die KI zugreifen, stürzen mit einem ModuleNotFoundError ab.

2. Strategischer Plan

Phase 1: Stabilität wiederherstellen (Hotfix)

[ ] Schritt 1.1 (Analyse): Überprüfung aller Code-Stellen, die openai-Fehlerklassen importieren oder verwenden, um den Umfang des Problems zu bestätigen.
[ ] Schritt 1.2 (Downgrade): Modifikation der requirements.txt, um die openai-Bibliothek auf eine stabile, kompatible Version (z.B. 0.28.0) festzuschreiben.
[ ] Schritt 1.3 (Anwendung): Neubau des Docker-Images (docker build), um die Installation der korrekten Bibliotheksversion zu erzwingen.
[ ] Schritt 1.4 (Validierung): Durchführung eines Testlaufs (z.B. reclassify_branches), um zu bestätigen, dass der ModuleNotFoundError behoben ist und die KI-Aufrufe wieder funktionieren.

Phase 2: Geplante Weiterentwicklung (nach Hotfix)

[ ] Finalisierung des Duplikats-Checks.
[ ] Vervollständigung der Wissensbasis und Generierung aller Marketing-Texte.
[ ] (Zukünftig) Planung des Code-Refactorings, um die neue openai v1.x API zu unterstützen.

Automatisierte Unternehmensbewertung & Lead-Generierung

Version: 2.1.0 (nach Implementierung des Sync-Moduls)

Projektbeschreibung

Dieses Projekt automatisiert die Anreicherung von Unternehmensdaten aus einem D365-CRM-System. Es nutzt externe APIs (Google, Wikipedia, OpenAI) und Web-Scraping, um Stammdaten zu validieren, zu ergänzen und neue, marketing-relevante Informationen (z.B. FSM-Pitches) zu generieren. Die Verarbeitung und Speicherung der angereicherten Daten erfolgt in einem Google Sheet.

Aktueller Status (August 2025)

Systemstabilität: Das System ist nach der Behebung von Inkompatibilitäten mit der OpenAI-Bibliothek stabil und voll lauffähig.
Daten-Import: Ein robuster, intelligenter Synchronisations-Mechanismus (sync_manager.py) wurde implementiert. Er gleicht einen vollständigen D365-Excel-Export mit dem Google Sheet ab, aktualisiert Stammdaten nach definierten Fachregeln und markiert Datensätze für die Neu-Anreicherung.
Kernfunktionen: Datenanreicherung (Wikipedia, Website-Scraping) und KI-basierte Analysen (Brancheneinstufung, Text-Zusammenfassungen) sind operational.
Nächster Schritt: Implementierung des Daten-Exports aus dem Google Sheet zur Aktualisierung des D365-Systems.

Languages

Python 61.8%

TypeScript 20.2%

JavaScript 14.5%

HTML 2.5%

Dockerfile 0.4%

Other 0.6%