Erfasst den aktuellen Stand des Projekts, einschließlich des Wechsels zu Docker zur Lösung des 'cygrpc'-Problems und des zuletzt aufgetretenen 'TypeError'. Detailliert die nächsten Schritte für die nächste Sitzung.
8.7 KiB
Plan: Umsetzung des "General Market Intelligence" Backends als Python-Service
Dieses Dokument beschreibt den Plan zur Umsetzung der Backend-Logik für die React-Anwendung unter /general-market-intelligence als robusten, faktenbasierten Python-Service. Dieser Ansatz ersetzt die ursprüngliche Idee einer n8n-Migration.
1. Zielsetzung & Architektur-Entscheidung
Das primäre Ziel ist die Schaffung eines transparenten, kontrollierbaren und faktenbasierten Backend-Prozesses. Die ursprüngliche Implementierung der React-App zeigte Schwankungen in der Ergebnisqualität und mangelnde Nachvollziehbarkeit, da die KI-Aufrufe nicht auf verifizierbaren Daten basierten ("Grounding").
Nach einer Analyse wurde entschieden, von einer n8n-basierten Lösung Abstand zu nehmen und stattdessen einen dedizierten Python-Service zu entwickeln.
Gründe für Python statt n8n:
- Maximale Kontrolle & Transparenz: Ein Python-Skript ermöglicht detailliertes Logging, schrittweises Debugging und die volle Kontrolle über jeden Aspekt der Logik – von Web-Scraping bis zu den API-Aufrufen. Dies ist entscheidend, um die Ergebnisqualität sicherzustellen.
- Nahtlose Projekt-Integration: Das Python-Skript fügt sich perfekt in die bestehende, Python-basierte Projektstruktur ein und kann auf geteilte Module (
config.py,helpers.py) zugreifen. - Robuste Fehlerbehandlung: Komplexe Fehler- und Wiederholungslogiken lassen sich in Python präziser und robuster implementieren als in einer visuellen Workflow-Engine.
- Vermeidung von Plattform-Limitierungen: Wir umgehen technische Hürden wie die eingeschränkte REST-API der selbstgehosteten n8n-Version.
2. Architektur: React-Frontend mit Python-Backend
Die Architektur besteht aus drei Kernkomponenten, die in einem Docker-Container gekapselt werden:
- React-Frontend (unverändert): Die bestehende Anwendung in
/general-market-intelligencebleibt die interaktive Benutzeroberfläche. - Node.js API-Brücke (
server.js): Ein minimaler Express.js-Server, der im selben Verzeichnis wie die React-App läuft. Seine einzige Aufgabe ist es, HTTP-Anfragen vom Frontend entgegenzunehmen und sie sicher an das Python-Skript weiterzuleiten. - Python-Orchestrator (
market_intel_orchestrator.py): Das Herzstück der Logik. Dieses Kommandozeilen-Skript ist zuständig für:- Web-Scraping zur Gewinnung von Rohdaten ("Ground Truth").
- Text-Extraktion und -Bereinigung.
- Gezielte und "geerdete" Aufrufe an die Gemini-API.
- Rückgabe der strukturierten Ergebnisse als JSON über die Konsole (stdout).
Deployment: Der gesamte Backend-Service (Node.js-Brücke und Python-Skript) wird in einem Docker-Container verpackt, um eine konsistente, "immer online" verfügbare Umgebung zu schaffen.
3. Kernfunktionen als Python-Module
Die Logik aus geminiService.ts wird in Python-Funktionen innerhalb von market_intel_orchestrator.py nachgebildet, wobei der Fokus auf Faktenbasiertheit liegt.
Funktion 1: generate_search_strategy
- Trigger: Aufruf durch die Node.js-Brücke mit
--mode generate_strategy. - Input:
reference_urlundcontext_content(Strategie-Dokument). - Prozess:
- Scraping (Grounding): Lädt den HTML-Inhalt der
reference_url. - Text-Extraktion: Bereinigt das HTML zu sauberem Text.
- KI-Analyse: Ruft die Gemini-API mit einem Prompt auf, der explizit anweist, die digitalen Signale aus dem bereitgestellten Website-Text und dem Strategie-Kontext abzuleiten.
- Scraping (Grounding): Lädt den HTML-Inhalt der
- Output: Gibt das
SearchStrategy-JSON auf der Konsole aus.
Funktion 2: identify_competitors
- Trigger: Aufruf mit
--mode identify_competitors. - Input:
reference_urlundtarget_market. - Prozess:
- Ruft die Gemini-API mit einem Google-Search-Tool auf, um ähnliche Unternehmen zu finden.
- Output: Gibt eine JSON-Liste der gefundenen Unternehmen aus.
Funktion 3: run_full_analysis
- Trigger: Aufruf mit
--mode run_analysis. - Input: Eine Liste von Unternehmensnamen und die zuvor generierte Suchstrategie.
- Prozess:
- Iteriert über die Unternehmensliste.
- Für jedes Unternehmen:
- Sucht die offizielle Website (z.B. über SerpAPI).
- Scrapt die relevanten Seiten basierend auf den
targetPageKeywordsder digitalen Signale. - Ruft die Gemini-API auf, um die Signale basierend auf dem gescrapten Inhalt zu bewerten.
- Output: Gibt eine Liste von
AnalysisResult-Objekten aus.
Funktion 4: generate_outreach_campaign
- Trigger: Aufruf mit
--mode generate_outreach. - Input:
company_data(einAnalysisResult-Objekt),knowledge_base(Strategie-Dokument) undreference_url. - Prozess:
- Baut den Prompt für die Erstellung der E-Mail-Kampagne, wobei die faktenbasierten
dynamicAnalysis-Ergebnisse als Kern der Personalisierung dienen. - Ruft die Gemini-API auf.
- Baut den Prompt für die Erstellung der E-Mail-Kampagne, wobei die faktenbasierten
- Output: Gibt die
EmailDraft-Objekte als JSON-Array aus.
4. Nächste Schritte
- Implementierung (Python): Erstellen der Datei
market_intel_orchestrator.pyund Implementierung der oben genannten Funktionen. - Implementierung (Node.js): Erstellen der
server.jsals API-Brücke im React-Projekt. - Anpassung (React): Modifizieren der
geminiService.ts, um die Aufrufe an die lokale API-Brücke (/api/...) statt direkt an die Gemini-API zu senden. - Containerisierung (Docker): Erstellen eines
Dockerfile, das die Python- und Node.js-Umgebung aufsetzt und den Service startet. - Testen: Umfassendes Testen des gesamten End-to-End-Flows.
5. Aktuelle Probleme und Debugging-Protokoll (Stand: 2025-12-21)
Status: End-to-End-Test erfolgreich, nächster Fehler identifiziert.
Wir haben erfolgreich eine Docker-Umgebung eingerichtet, die das hartnäckige ImportError: cannot import name 'cygrpc' from 'grpc._cython'-Problem löst. Die Kommunikationskette von der React-App über die Node.js-Brücke zum Python-Skript im Docker-Container funktioniert.
Aktueller Fehler (behoben am 2025-12-21):
- Fehler:
TypeError: GenerationConfig.__init__() got an unexpected keyword argument 'response_mime_type' - Ursache: Die gepinnte, ältere Version der
google-generativeai-Bibliothek (0.4.0) unterstützt diesen Parameter nicht, der in einem früheren Debugging-Schritt hinzugefügt wurde. - Lösung: Der Parameter
generation_configwurde aus demmodel.generate_content-Aufruf inmarket_intel_orchestrator.pyentfernt.
Nächster Schritt (für die nächste Sitzung):
- Die neuesten Code-Änderungen pullen (
git pull). - Das Docker-Image neu bauen, um die Korrektur zu übernehmen:
docker build -t market-intel-backend . - Den alten Container stoppen/entfernen und den neuen starten:
docker run -p 3001:3001 --name market-intel-backend-instance market-intel-backend - Den React-Dev-Server starten und den End-to-End-Test erneut durchführen.
Debugging-Historie (gelöste Probleme)
- Problem:
externally-managed-environmentim Docker-Build.- Lösung: Expliziter Pfad zum
pip-Executable der venv imDockerfile(/app/.venv/bin/pip install ...).
- Lösung: Expliziter Pfad zum
- Problem:
ImportError: cannot import name 'cygrpc' from 'grpc._cython'.- Lösungsversuche:
- Version-Pinning von
requests,urllib3,typing-extensions,grpcio,google-api-core,google-generativeai. (Erfolglos) - Deinstallation und Neu-Kompilierung von
grpcioaus dem Quellcode. (Erfolglos in der lokalen Umgebung)
- Version-Pinning von
- Finale Lösung: Umstieg auf eine vollständig gekapselte Docker-Umgebung, in der die Installation der Python-Pakete in einer sauberen und kontrollierten Umgebung von Grund auf neu erfolgt.
- Lösungsversuche:
- Problem:
TypeError: 'type' object is not subscriptable.- Lösung: Version von
urllib3undrequestsauf1.26.18bzw.2.28.2gepinnt.
- Lösung: Version von
- Problem:
AttributeError: module 'typing' has no attribute '_SpecialGenericAlias'.- Lösung: Version von
typing-extensionsauf4.5.0gepinnt.
- Lösung: Version von
- Problem:
ModuleNotFoundError: No module named 'requests'.- Lösung:
PYTHONPATHimspawn-Befehl inserver.cjsexplizit gesetzt.
- Lösung:
- Problem:
net::ERR_CONNECTION_REFUSEDin der React-App.- Lösung: API-URL in
geminiService.tsvonlocalhostaufwindow.location.hostnameumgestellt.
- Lösung: API-URL in
- Problem:
require is not defined in ES module scopein Node.js.- Lösung:
server.jsinserver.cjsumbenannt undpackage.jsonangepasst.
- Lösung:
- Problem: Diverse Python-Umgebungsprobleme (
ensurepip,apt-Pakete).- Lösung:
python3-venv,build-essential,python3-devinstalliert und eine virtuelle Umgebung (venv) eingerichtet.
- Lösung: