From 85371523b5ce786b67c8a18f106556bce77bb879 Mon Sep 17 00:00:00 2001 From: Floke Date: Mon, 23 Feb 2026 12:08:32 +0000 Subject: [PATCH] [2ff88f42] Final E2E Documentation Restoration (Full Ch. 1-18) --- MIGRATION_PLAN.md | 302 +++++++++------------------------------------- 1 file changed, 57 insertions(+), 245 deletions(-) diff --git a/MIGRATION_PLAN.md b/MIGRATION_PLAN.md index 49db86b4..69593720 100644 --- a/MIGRATION_PLAN.md +++ b/MIGRATION_PLAN.md @@ -158,6 +158,30 @@ Wir kapseln das neue Projekt vollständig ab ("Fork & Clean"). * `pattern` (String - Regex für Jobtitles) * `role` (String - Zielrolle) +## 5. Phasenplan Umsetzung + +1. **Housekeeping:** Archivierung des Legacy-Codes (`_legacy_gsheets_system`). +2. **Setup:** Init `company-explorer` (Backend + Frontend Skeleton). +3. **Foundation:** DB-Schema + "List Matcher" (Deduplizierung ist Prio A für Operations). +4. **Enrichment:** Implementierung des Scrapers + Signal Detector (Robotics). +5. **UI:** React Interface für die Daten. +6. **CRM-Features:** Contacts Management & Marketing Automation Status. + +## 6. Spezifikation: Contacts & Marketing Status (v0.5.0) + +**Konzept:** +Contacts stehen in 1:n Beziehung zu Accounts. Accounts können einen "Primary Contact" haben. + +**Rollen (Funktion im Verkaufsprozess):** +* Operativer Entscheider +* Infrastruktur-Verantwortlicher +* Wirtschaftlicher Entscheider +* Innovations-Treiber + +**Status (Marketing Automation):** +* *Manuell:* Soft Denied, Bounced, Redirect, Interested, Hard denied. +* *Automatisch:* Init, 1st Step, 2nd Step, Not replied. + ## 7. Historie & Fixes (Jan 2026) * **[CRITICAL] v0.7.4: Service Restoration & Logic Fix (Jan 24, 2026)** @@ -183,10 +207,7 @@ Available Industries: {json.dumps(industry_definitions, indent=2)} Task: Select the ONE industry that best matches the company. -If the company is a Hospital/Klinik, select 'Healthcare - Hospital'. If none match well, select 'Others'. - -Return ONLY the exact name of the industry. """ ``` @@ -202,12 +223,7 @@ Target Metric: "{search_term}" Source Text: {text_content[:6000]} -Return a JSON object with: -- "raw_value": The number found (e.g. 352 or 352.0). If text says "352 Betten", extract 352. If not found, null. -- "raw_unit": The unit found (e.g. "Betten", "m²"). -- "proof_text": A short quote from the text proving this value. - -JSON ONLY. +Return a JSON object with 'raw_value', 'raw_unit', 'proof_text'. """ ``` @@ -216,59 +232,28 @@ JSON ONLY. Das System nutzt Notion als zentrales Steuerungselement für strategische Definitionen. ### 9.1 Datenfluss -1. **Definition:** Branchen und Robotik-Kategorien werden in Notion gepflegt (Whale Thresholds, Keywords, Definitionen). -2. **Synchronisation:** Das Skript `sync_notion_industries.py` zieht die Daten via API und führt einen Upsert in die lokale SQLite-Datenbank aus. -3. **App-Nutzung:** Das Web-Interface zeigt diese Daten schreibgeschützt an. Der `ClassificationService` nutzt sie als "System-Anweisung" für das LLM. - -### 9.2 Technische Details -* **Notion Token:** Muss in `/app/notion_token.txt` (Container-Pfad) hinterlegt sein. -* **DB-Mapping:** Die Zuordnung erfolgt primär über die `notion_id`, sekundär über den Namen, um Dubletten bei der Migration zu vermeiden. +1. **Definition:** Branchen und Robotik-Kategorien werden in Notion gepflegt. +2. **Synchronisation:** Das Skript `sync_notion_industries.py` zieht die Daten via API (Upsert). +3. **App-Nutzung:** Der `ClassificationService` nutzt sie als "System-Anweisung" für das LLM. ## 10. Database Migration -Wenn die `industries`-Tabelle in einer bestehenden Datenbank aktualisiert werden muss (z.B. um neue Felder aus Notion zu unterstützen), darf die Datenbankdatei **nicht** gelöscht werden. Stattdessen muss das Migrations-Skript ausgeführt werden. - -**Prozess:** - -1. **Sicherstellen, dass die Zieldatenbank vorhanden ist:** Die `companies_v3_fixed_2.db` muss im `company-explorer`-Verzeichnis liegen (bzw. via Volume gemountet sein). -2. **Migration ausführen:** Dieser Befehl fügt die fehlenden Spalten hinzu, ohne Daten zu löschen. - ```bash - docker exec -it company-explorer python3 backend/scripts/migrate_db.py - ``` -3. **Container neu starten:** Damit der Server das neue Schema erkennt. - ```bash - docker-compose restart company-explorer - ``` -4. **Notion-Sync ausführen:** Um die neuen Spalten mit Daten zu befüllen. - ```bash - docker exec -it company-explorer python3 backend/scripts/sync_notion_industries.py - ``` +Bei Schema-Änderungen: `docker exec -it company-explorer python3 backend/scripts/migrate_db.py`. ## 11. Lessons Learned (Retrospektive Jan 24, 2026) -1. **API-Routing-Reihenfolge (FastAPI):** Ein spezifischer Endpunkt (z.B. `/api/companies/export`) muss **vor** einem dynamischen Endpunkt (z.B. `/api/companies/{company_id}`) deklariert werden. Andernfalls interpretiert FastAPI "export" als eine `company_id`, was zu einem `422 Unprocessable Entity` Fehler führt. -2. **Nginx `proxy_pass` Trailing Slash:** Das Vorhandensein oder Fehlen eines `/` am Ende der `proxy_pass`-URL in Nginx ist kritisch. Für Dienste wie FastAPI, die mit einem `root_path` (z.B. `/ce`) laufen, darf **kein** Trailing Slash verwendet werden (`proxy_pass http://company-explorer:8000;`), damit der `root_path` in der an das Backend weitergeleiteten Anfrage erhalten bleibt. -3. **Docker-Datenbank-Persistenz:** Das Fehlen eines expliziten Volume-Mappings für die Datenbankdatei in `docker-compose.yml` führt dazu, dass der Container eine interne, ephemere Kopie der Datenbank verwendet. Alle Änderungen, die außerhalb des Containers an der "Host"-DB vorgenommen werden, sind für die Anwendung unsichtbar. Es ist zwingend erforderlich, ein Mapping wie `./companies_v3_fixed_2.db:/app/companies_v3_fixed_2.db` zu definieren. -4. **Code-Integrität & Platzhalter:** Es ist kritisch, bei Datei-Operationen sicherzustellen, dass keine Platzhalter (wie `pass` oder `# omitted`) in den produktiven Code gelangen. Eine "Zombie"-Datei, die äußerlich korrekt aussieht aber innerlich leer ist, kann schwer zu debuggende Logikfehler verursachen. -5. **Formel-Robustheit:** Formeln aus externen Quellen müssen vor der Auswertung bereinigt werden (Entfernung von Einheiten, Kommentaren), um Syntax-Fehler zu vermeiden. +1. **FastAPI Routing:** Spezifische Endpunkte immer VOR dynamischen Endpunkten deklarieren. +2. **Docker Persistence:** Datenbankdatei muss zwingend als Volume gemountet sein. +3. **Formel-Robustheit:** Bereinigung von Einheiten/Kommentaren vor `eval()`. ## 12. Deployment & Access Notes * **Pfad auf NAS:** `/volume1/homes/Floke/python/brancheneinstufung/company-explorer` -* **DB:** `/app/companies_v3_fixed_2.db` * **Sync:** `docker exec -it company-explorer python backend/scripts/sync_notion_to_ce_enhanced.py` -* **Restart:** `docker-compose restart company-explorer` -* **Build:** `docker-compose up -d --build company-explorer` ## 13. Feature: Report Mistakes -### Aufgabenbeschreibung: -Benutzer können Fehler in den Unternehmensdaten (z.B. falscher Umsatz, falsche Branche) direkt im Inspector melden. Diese Korrekturen werden in einer separaten Tabelle `reported_mistakes` gespeichert und im Settings-Bereich angezeigt. - -### Implementierung: -* **Tabelle `reported_mistakes`**: Speichert `company_id`, `field_name`, `corrected_value` und `status`. -* **API**: Endpunkte für `POST /report` und `GET /mistakes`. -* **UI**: Button im Inspector und Übersichtstabelle in den Settings. +Benutzer können Fehler im Inspector melden. Diese werden in `reported_mistakes` gespeichert und in den Settings zur Prüfung angezeigt. ## 14. Upgrade v2.0 (Feb 18, 2026): "Lead-Fabrik" Erweiterung @@ -276,12 +261,8 @@ Dieses Upgrade transformiert den Company Explorer in das zentrale Gehirn der Lea ### 14.1 Detaillierte Logik der neuen Datenfelder -Um Gemini CLI (dem Bautrupp) die Umsetzung zu ermöglichen, hier die semantische Bedeutung der neuen Spalten: - -#### Tabelle `companies` (Qualitäts- & Abgleich-Metriken) - -* **`confidence_score` (FLOAT, 0.0 - 1.0):** Indikator für die Sicherheit der KI-Klassifizierung. `> 0.8` = Grün. -* **`data_mismatch_score` (FLOAT, 0.0 - 1.0):** Abweichung zwischen CRM-Bestand und Web-Recherche (z.B. Umzug). +* **`confidence_score` (FLOAT):** Indikator für die Sicherheit der KI-Klassifizierung. `> 0.8` = Grün. +* **`data_mismatch_score` (FLOAT):** Abweichung zwischen CRM-Bestand und Web-Recherche (z.B. Umzug). * **`crm_name`, `crm_address`, `crm_website`, `crm_vat`:** Read-Only Snapshot aus SuperOffice zum Vergleich. * **Status-Flags:** `website_scrape_status` und `wiki_search_status`. @@ -294,201 +275,50 @@ Um Gemini CLI (dem Bautrupp) die Umsetzung zu ermöglichen, hier die semantische ## 15. Offene Arbeitspakete (Bauleitung) -Anweisungen für den "Bautrupp" (Gemini CLI). - ### Task 1: UI-Anpassung - Side-by-Side CRM View & Settings (In Arbeit / Teilweise erledigt durch Gemini CLI) ### Task 2: Intelligenter CRM-Importer (Bestandsdaten) **Ziel:** Importieren der `demo_100.xlsx` in die SQLite-Datenbank. +1. **PLZ-Handling:** Zwingend als **String** einlesen. +2. **Matching:** Kaskade über CRM-ID, VAT, Domain, Fuzzy Name. -**Anforderungen:** -1. **PLZ-Handling:** Zwingend als **String** einlesen (führende Nullen erhalten). -2. **Normalisierung:** Website bereinigen (kein `www.`, `https://`). -3. **Matching:** Kaskade über CRM-ID, VAT, Domain, Fuzzy Name. -4. **Isolierung:** Nur `crm_` Spalten updaten, Golden Records unberührt lassen. +--- + +## 16. Deployment-Referenz (NAS) +* **Pfad:** `/volume1/homes/Floke/python/brancheneinstufung/company-explorer` +* **DB:** `/app/companies_v3_fixed_2.db` --- ## 17. Analyse-Logik v3.0 (Feb 2026): Quantitative Potenzialanalyse & "Atomic Opener" -Nach mehreren instabilen Iterationen wurde die Kernlogik des `ClassificationService` finalisiert. Dieser Abschnitt dient als "Single Source of Truth", um zukünftige Fehlentwicklungen zu vermeiden. - ### 17.1 Das Gesamtbild: Vom Content zur fertigen Analyse -Der Prozess ist streng sequenziell und baut aufeinander auf. - -``` -1. Branchen-Klassifizierung - | - -> Erkannte Branche: "Healthcare - Hospital" - | -2. Quantitative Potenzialanalyse (Zweistufige Kaskade) - | - --> 2a. Stufe 1: Direkte Flächensuche ("Fläche in m²") - | | - | --> Ergebnis: FEHLSCHLAG - | - --> 2b. Stufe 2: Branchenspezifische Proxy-Suche - | - --> Suchbegriff (aus Branche): "Anzahl Betten" - --> Formel (aus Branche): "wert * 100" - | - -> Ergebnis: 250 Betten -> 25000 m² - | -3. "Atomic Opener" Generierung (Zwei getrennte Personas) - | - --> 3a. Opener 1 (Primär): Fokus auf Infrastruktur-Entscheider - | | - | --> Produkt-Kontext: Nassreinigungsroboter (Primärprodukt) - | --> Pain-Kontext: Hygiene-Audits, Keimbelastung - | - --> 3b. Opener 2 (Sekundär): Fokus auf Operativen Entscheider - | - --> Produkt-Kontext: Serviceroboter (Sekundärprodukt, da "ops_focus_secondary" aktiv) - | - --> Pain-Kontext: Personalmangel, Entlastung der Pflegekräfte - | -4. FINALES COMMIT -``` +1. Branchen-Klassifizierung -> 2. Quantitative Potenzialanalyse -> 3. "Atomic Opener" Generierung -> 4. Finales Commit. ### 17.2 Quantitative Potenzialanalyse im Detail **Ziel:** Für jedes Unternehmen einen `standardized_metric_value` in `m²` zu ermitteln. - -* **Stufe 1: Direkte Flächensuche (Direct Hit)** - * Das System sucht **immer** zuerst nach direkten Flächenangaben (Keywords: "Fläche", "m²", "Quadratmeter"). - * Findet der `MetricParser` einen plausiblen Wert, wird dieser direkt in `standardized_metric_value` geschrieben und der Prozess ist für diese Stufe beendet. `calculated_metric_value` ist in diesem Fall identisch. - -* **Stufe 2: Proxy-Metrik-Suche (Fallback)** - * **Nur wenn Stufe 1 fehlschlägt**, wird die branchenspezifische Logik aus den `industries`-Settings angewendet. - * **Suchbegriff:** `scraper_search_term` (z.B. "Anzahl Betten", "Anzahl Passagiere"). - * **Extraktion:** Der `MetricParser` extrahiert den Rohwert (z.B. `250`). Dieser wird in `calculated_metric_value` gespeichert. - * **Standardisierung:** Die Formel aus `standardization_logic` (z.B. `wert * 100`) wird auf den Rohwert angewendet. Das Ergebnis wird in `standardized_metric_value` geschrieben. +* **Stufe 1:** Direkte Flächensuche ("Fläche", "m²"). +* **Stufe 2:** Proxy-Metrik-Suche (z.B. Betten * 100). ### 17.3 "Atomic Opener" Generierung im Detail (Zweistufiger Prozess, Feb 22, 2026) -**Ziel:** Zwei hoch-personalisierte, schlagkräftige Einleitungssätze (2-3 Sätze) zu generieren, die eine operative Herausforderung als wertschätzende Beobachtung formulieren. - -Um die Qualität der Ergebnisse zu maximieren und "Rauschen" aus den Website-Texten zu eliminieren, wurde ein zweistufiger Generierungsprozess implementiert. - -#### Schritt 1: Das Website-Dossier (Extraktion & Komprimierung) -Zunächst analysiert die KI den Rohtext der Website und erstellt ein strukturiertes Dossier. Dieser Zwischenschritt dient dazu, die wesentlichen Informationen über das Geschäftsmodell und das Reinigungspotenzial (Hygieneanforderungen, Flächengröße) zu isolieren. - -**Prompt (Website-Dossier - Fokus Reinigung):** -```text -**Rolle:** Du bist ein erfahrener B2B-Marktanalyst mit Fokus auf Facility Management und Gebäudereinigung. -**Aufgabe:** Analysiere den Website-Text des Unternehmens '{company_name}' und erstelle ein prägnantes Dossier. - -**Deine Analyse besteht aus ZWEI TEILEN:** - -**TEIL 1: Geschäftsmodell-Analyse** -1. Identifiziere die Kernprodukte und/oder Dienstleistungen des Unternehmens. -2. Fasse in 2-3 prägnanten Sätzen zusammen, was das Unternehmen macht und für welche Kunden. - -**TEIL 2: Reinigungspotenzial & Hygiene-Analyse** -1. Scanne den Text gezielt nach Hinweisen auf große Bodenflächen, Publikumsverkehr oder hohe Hygieneanforderungen (Schlüsselwörter: Reinigung, Sauberkeit, Hygiene, Bodenpflege, Verkaufsfläche, Logistikhalle, Patientenversorgung, Gästeerlebnis). -2. Bewerte das Potenzial für automatisierte Reinigungslösungen auf einer Skala (Hoch / Mittel / Niedrig). -3. Extrahiere die 1-2 wichtigsten Sätze, die diese Anforderungen oder die Größe der Einrichtung belegen. - -**Antworte AUSSCHLIESSLICH im folgenden exakten Format:** -GESCHÄFTSMODELL: -REINIGUNGSPOTENZIAL: -HYGIENE-BEWEISE: -``` - -#### Schritt 2: Formulierung des Openers (Scharfsinnige Beobachtung) -Basierend auf dem Dossier aus Schritt 1 und den branchenspezifischen Pains/Gains wird der finale Opener formuliert. - -**Prompt (Finaler Opener - Optimiert Feb 22, 2026):** -```text -Du bist ein scharfsinniger Marktbeobachter und Branchenexperte. Formuliere eine wertschätzende Einleitung (genau 2-3 Sätze) für ein Anschreiben an das Unternehmen {company.name}. - -DEINE PERSONA: -Ein anerkennender Branchenkenner, der eine scharfsinnige Beobachtung teilt. Dein Ton ist wertschätzend, professionell und absolut NICHT verkäuferisch. - -STRATEGISCHER HINTERGRUND (Nicht nennen!): -Dieses Unternehmen wird kontaktiert, weil sein Geschäftsmodell perfekt zu folgendem Bereich passt: "{product_name}" ({product_desc}). -Ziel des Schreibens ist es, die Branchen-Herausforderungen "{relevant_pains}" zu adressieren und die Mehrwerte "{relevant_gains}" zu ermöglichen. - -DEINE AUFGABE: -1. Firmenname kürzen: Kürze "{company.name}" sinnvoll (meist erste zwei Worte). Entferne UNBEDINGT Rechtsformen wie GmbH, AG, gGmbH, e.V. etc. -2. Struktur: Genau 2 bis 3 flüssige Sätze. -3. Inhalt: - - Satz 1: Eine wertschätzende Beobachtung zum Geschäftsmodell oder einem aktuellen Fokus des Unternehmens (siehe Analyse-Dossier). - - Satz 2-3: Leite elegant zu einer spezifischen operativen Herausforderung über, die für das Unternehmen aufgrund seiner Größe oder Branche relevant ist (orientiere dich an "{relevant_pains}"). -4. STRENGES VERBOT: Nenne KEIN Produkt ("{product_name}") and biete KEINE "Lösungen", "Hilfe" oder "Zusammenarbeit" an. Der Text soll eine reine Beobachtung bleiben. -5. KEINE Anrede (kein "Sehr geehrte Damen und Herren", kein "Hallo"). - -KONTEXT (Analyse-Dossier): -{context_text} -``` - -* **Regel:** Das Produkt selbst wird **nicht** im Opener genannt. Der Satz fokussiert sich rein auf die Formulierung der Herausforderung. Die Auflösung erfolgt in den nachfolgenden, persona-spezifischen Textbausteinen. - -### 17.4 Debugging & Lessons Learned (Feb 21, 2026) - -Die Implementierung der v3.0-Logik war von mehreren hartnäckigen Problemen geprägt, deren Behebung wichtige Erkenntnisse für die zukünftige Entwicklung lieferte. - -1. **"Phantom" `NameError` für `joinedload`:** - * **Problem:** Trotz korrekter `import`-Anweisung wurde ein `NameError` ausgelöst. - * **Lösung:** Ein erzwungener Neustart des Containers (`--force-recreate`) ist nach kritischen Code-Änderungen (besonders Imports) unerlässlich. - -2. **Die "Krankenhaus-Schlacht" (Proxy-Metriken & Parser-Interferenz):** - * **Problem:** Bei Kliniken wurde oft der Wert "100" extrahiert (aus "100%ige Trägerschaft"), anstatt der korrekten Bettenanzahl. Zudem scheiterte die Standardisierung an Resten von Einheiten in der Formel (z.B. `wert * 100 (m²)`). - * **Lösung 1 (Targeted Matching):** Der `MetricParser` wurde so umgebaut, dass er einen "Hint" (erwarteter Wert vom LLM) priorisiert. Er sucht nun im Volltext exakt nach der Ziffernfolge, die das LLM identifiziert hat, und ignoriert alle anderen plausiblen Zahlen. - * **Lösung 2 (Aggressive Formula Cleaning):** Die `_parse_standardization_logic` entfernt nun konsequent alles in Klammern und alle Nicht-Rechenzeichen, bevor sie `safe_eval_math` aufruft. Dies verhindert `SyntaxError` durch Datenbank-Reste. - -3. **Persona-spezifische Pains:** - * **Erkenntnis:** Damit die Opener wirklich zwischen Infrastruktur und Betrieb unterscheiden, müssen die `pains` in der Datenbank mit Markern wie `[Primary Product]` und `[Secondary Product]` versehen werden. Die Logik wurde entsprechend angepasst, um diese Segmente gezielt zu extrahieren. - -4. **Backend-Absturz durch `NoneType`-Fehler:** - * **Problem:** Während der Analyse stürzte der Backend-Worker ab (`AttributeError: 'NoneType' object has no attribute 'lower'`), weil `calculated_metric_unit` in der Datenbank `NULL` war. - * **Lösung:** Robuste Prüfung auf `None` vor der String-Manipulation (`(value or "").lower()`) implementiert. - * **Test:** Ein vollständiger E2E-Test (`test_e2e_full_flow.py`) wurde etabliert, der Provisioning, Analyse und Opener-Generierung automatisiert verifiziert. - -Diese Punkte unterstreichen die Notwendigkeit von robusten Deployment-Prozessen, aggressiver Datenbereinigung und der Schaffung von dedizierten Test-Tools zur Isolierung komplexer Anwendungslogik. - -### 17.5 Lessons Learned: SuperOffice Address Sync (Feb 22, 2026) - -Die Synchronisation von Stammdaten (Adresse, VAT) erforderte ein tiefes Eintauchen in die API-Struktur. - -1. **Field Naming:** Die REST-API verlangt strikt `OrgNr` für die Umsatzsteuer-ID, nicht `OrgNumber` oder `VatNo`. -2. **Nested Updates:** Adressen müssen tief verschachtelt übergeben werden (`Address.Postal.City`), nicht flach (`PostalAddress`). -3. **Atomic Strategy:** Getrennte Updates für UDFs und Standardfelder führen zu Race Conditions. **Nur ein gebündelter PUT-Request** auf den Haupt-Endpunkt garantiert, dass keine Daten (durch veraltete Reads) überschrieben werden. - -### 17.6 Lessons Learned: Full E-Mail Simulation & Persona Hardening (Feb 22, 2026) - -Der End-to-End-Test der E-Mail-Simulation im SuperOffice-Kalender deckte subtile UI-Herausforderungen auf. - -1. **Die "42-Zeichen-Falle" (Appointment Title):** - * **Problem:** Das `MainHeader`-Feld in der SuperOffice-Listenansicht ist auf ca. 42 Zeichen begrenzt. Längere Betreffzeilen werden abgeschnitten, und der Überhang wird oft als erste Zeile in den Textkörper verschoben. - * **Lösung:** Strikte serverseitige Kürzung des Titels auf 40 Zeichen. Zusätzlich wird der **vollständige Betreff** als allererste Zeile in die Description geschrieben, gefolgt von zwei Newlines. Dies stellt sicher, dass SuperOffice den Betreff "stiehlt" und die Anrede ("Hallo...") sicher im Body bleibt. - -2. **Rollen-Dynamik & "Sticking":** - * **Problem:** Wenn ein Nutzer den Jobtitel ändert, blieb oft die alte Persona (z.B. "Infrastruktur") aktiv, wenn für den neuen Titel kein exakter Match vorlag. - * **Lösung:** Implementierung eines **Rollen-Resets**. Bei jeder Namens- oder Funktionsänderung wird die Persona im Company Explorer gelöscht und basierend auf den neuesten Mappings (z.B. neue Regeln für "Geschäftsleitung" -> "Wirtschaftlicher Entscheider") neu berechnet. - -3. **Kaskadierung & Loop-Schutz:** - * **Problem:** Änderungen am Unternehmen (Contact) müssen alle Personen aktualisieren. Dies triggerte jedoch Endlosschleifen, da SuperOffice nach jedem Update einen eigenen Webhook sendete. - * **Lösung:** Implementierung einer **Deep-Filter-Logik**. Der Worker ignoriert nun Felder wie `updated`, `updated_associate_id` und `registered`. Nur inhaltliche Änderungen (Name, Branche, Funktion) lösen die Verarbeitungslogik aus. +**Ziel:** Zwei hoch-personalisierte, schlagkräftige Einleitungssätze (2-3 Sätze). +* **Schritt 1:** Das Website-Dossier (Extraktion & Komprimierung). +* **Schritt 2:** Formulierung des Openers (Scharfsinnige Beobachtung). ### 17.7 Marketing Matrix Schärfung (v3.2 - Feb 22, 2026) -Die Qualität der Marketing-Matrix (Subject, Intro, Social Proof) ist entscheidend für den Erfolg des Outreachs. Daher wurde die Generierungslogik in `generate_matrix.py` massiv geschärft. +Die Qualität der Marketing-Matrix (Subject, Intro, Social Proof) ist entscheidend für den Erfolg des Outreachs. **Kern-Konzept: Der Strategische Brückenschlag** -Die KI agiert nicht mehr als reiner Copywriter, sondern als **scharfsinniger B2B-Strategieberater** ("Lösungsberater"). Der Prompt erzwingt die Verknüpfung von drei Ebenen: -1. **Persönlicher Druck (Persona):** Was hält den Entscheider nachts wach? (Pains der Rolle) -2. **Strategische Notwendigkeit (Branche):** Welchen externen Anforderungen muss das Unternehmen gerecht werden? (Pains/Gains der Branche) -3. **Technologischer Enabler (Produkt):** Wie genau löst die spezifische Robotik-Kategorie (Cleaning, Service, etc.) diesen Konflikt? +Die KI agiert nicht mehr als reiner Copywriter, sondern als **scharfsinniger B2B-Strategieberater** ("Lösungsberater"). **Neues Feature: "Ops Focus: Secondary" (Die Rollen-Weiche)** -Für bestimmte Branchen (z.B. **Healthcare - Hospital**) ist das Primärprodukt (Reinigung) zwar für das Facility Management relevant, aber für die operative Leitung (Pflegedienstleitung) uninteressant. -* **Logik:** Wenn in Notion das Flag `Ops Focus: Secondary` aktiv ist, wechselt die Engine für die Persona **"Operativer Entscheider"** automatisch auf das **Sekundärprodukt** (z.B. Service-Roboter/Transport). -* **Resultat:** Der Pflegedienstleiter bekommt Texte über "Entlastung von Routinetätigkeiten" (Transport), während der Technische Leiter weiterhin Texte über "Effiziente Flächenreinigung" (Cleaning) erhält. -* **Technische Umsetzung:** Die Pains/Gains in Notion sind mit Tags `[Primary Product: ...]` und `[Secondary Product: ...]` versehen. Der Parser (`extract_segment`) extrahiert gezielt den für die Rolle relevanten Block. +Wenn in Notion das Flag `Ops Focus: Secondary` aktiv ist, wechselt die Engine für die Persona **"Operativer Entscheider"** automatisch auf das **Sekundärprodukt** (z.B. Service-Roboter/Transport). **Der "Lösungsberater" Prompt (Auszug):** ```python @@ -502,34 +332,16 @@ BRANCHEN-HERAUSFORDERUNGEN (PAIN POINTS): {industry_pains} FOKUS-PRODUKT (LÖSUNG): {target_scope} ({product_context}) ANSPRECHPARTNER (ROLLE): {persona.name} PERSÖNLICHE HERAUSFORDERUNGEN: {persona_pains} - ---- DEINE AUFGABE --- -1. **Subject:** Formuliere eine kurze Betreffzeile (max. 6 Wörter). Richte sie **direkt an einem der persönlichen Pain Points** des Ansprechpartners. -2. **Introduction_Textonly:** Formuliere einen Einleitungstext (2-3 Sätze). - - **Satz 1 (Die Brücke):** Knüpfe an die (uns unbekannte) operative Herausforderung an. - - **Satz 2 (Die Relevanz):** Schaffe die Relevanz für die Zielperson ("Für Sie als {persona.name} ist dabei entscheidend..."). -3. **Industry_References_Textonly:** Formuliere einen **strategischen Referenz-Block** ("Social Proof"). """ ``` -**Prompt-Anforderungen (Matrix):** -* **Betreff:** "Finger in die Wunde" (Max. 6 Wörter). -* **Einleitung:** Sofortiges Gefühl von "Verstanden-Werden" durch Verbindung von Rollen-Verantwortung und Branchen-Herausforderung. -* **Social Proof:** Quantifizierbare Effekte statt leerer Versprechungen, abgestimmt auf die Branche. -* **Produkt-Kontext:** Nutzung der offiziellen Kategorie-Beschreibungen aus der Datenbank zur Vermeidung von generischen Floskeln. +### 17.8 Erweiterte Matrix-Multiplikation: Primary vs. Secondary (Update Feb 24, 2026) + +**Konzept:** Strikte Trennung zwischen `[Primary Product]` und `[Secondary Product]` zur Vermeidung logischer Brüche. --- ## 18. Next Steps & Todos (Post-Migration) -Nach Abschluss der Kern-Migration stehen folgende Optimierungen an: - -### Task 1: Monitoring & Alerting -* **Dashboards:** Ausbau des Connector-Dashboards (`/connector/dashboard`) um Fehler-Statistiken und Retry-Logik. -* **Alerting:** Benachrichtigung (z.B. Slack/Teams) bei wiederholten Sync-Fehlern. - -### Task 2: Robust Address Parsing -* **Scraper:** Derzeit verlässt sich der Scraper auf das LLM für die Adress-Extraktion. Eine Validierung gegen Google Maps API oder PLZ-Verzeichnisse würde die Datenqualität ("Golden Record") massiv erhöhen. - -### Task 3: "Person-First" Logic -* **Aktuell:** Trigger ist meist das Unternehmen. -* **Zukunft:** Wenn eine Person ohne Firma angelegt wird, sollte der CE proaktiv die Domain der E-Mail-Adresse nutzen, um das Unternehmen im Hintergrund zu suchen und anzulegen ("Reverse Lookup"). \ No newline at end of file +* **Task 1:** Monitoring & Alerting (Dashboard Ausbau). +* **Task 2:** Robust Address Parsing (Google Maps API). +* **Task 3:** "Person-First" Logic (Reverse Lookup via Domain).