Files
Brancheneinstufung2/general-market-intelligence/README.md

54 lines
2.9 KiB
Markdown

# Market Intelligence Tool (v2.2)
Das **Market Intelligence Tool** ist ein spezialisierter Agent zur tiefen Marktanalyse und Recherche. Es kombiniert Web-Scraping, Suchmaschinen-Abfragen (SerpAPI) und LLM-Synthese, um umfassende Reports über Unternehmen zu erstellen.
## 🛠️ Funktionsweise v2.2 (Update Dez. 2025)
### Neue Features
1. **Robuste Audit-Strategie (Graceful Fallback):**
* **Problem:** Blockierte Webseiten (403 Forbidden, Timeouts) führten früher zum Abbruch.
* **Lösung:** Wenn der Scraper blockiert wird, schaltet das System automatisch in einen "Digital Footprint Mode". Es analysiert dann Snippets aus der Google-Suche (Tech-Stack-Spuren, Job-Postings, News), um trotzdem eine Bewertung abzugeben.
* **Status:** Wird transparent als "Website Access Denied - Relying on External Signals" gekennzeichnet.
2. **Präzisere Lookalike-Suche:**
* Die KI wurde neu instruiert, strikt zwischen dem "Jäger" (Context/Hochgeladener Report) und der "Beute" (Referenzkunde/URL) zu unterscheiden.
* Die Suche nach "Lookalikes" basiert nun explizit auf dem Geschäftszweck des Referenzkunden.
3. **Erweiterter Report:**
* **Search Strategy ICP:** Detaillierte Beschreibung des idealen Kundenprofils.
* **Digital Signals:** Konkrete digitale Indikatoren (z.B. "Nutzt MS Teams", "Sucht Projektleiter").
* **Target Pages:** Liste der wichtigsten Unterseiten (Karriere, Über uns) für die Recherche.
### Technische Verbesserungen
* **URL Auto-Fix:** URLs ohne `https://` werden automatisch korrigiert.
* **Modern User-Agent:** Der Scraper gibt sich als moderner Chrome-Browser aus, um Blockaden zu minimieren.
* **Frontend-Integration:** Die neuen Datenfelder werden nahtlos im React-Frontend angezeigt.
---
## 🔍 Funktionsweise im Detail: "Digital Signals"
Die Identifizierung von digitalen Signalen erfolgt über einen pragmatischen, zweistufigen Prozess:
1. **Vollständiges Parsen der Unternehmens-Homepage:**
* Die Haupt-URL wird einmalig vollständig gecrawlt. Der extrahierte Text dient dem LLM als Kontext.
2. **Analyse von Suchergebnis-Snippets:**
* Für die gezielte Suche nach spezifischen Signalen (z.B. eingesetzte Konkurrenzprodukte, offene Stellen) wird die SerpAPI (Google-Suche) genutzt.
* **Wichtig:** Gefundene Unterseiten werden **nicht** erneut gecrawlt. Stattdessen werden **Titel** und **Snippet** der Suchergebnisse als "Beweismittel" (`evidence`) an das Sprachmodell übergeben.
* **Vorteil:** Extrem schnell und kosteneffizient.
### Zukünftige Erweiterung: Job-Analyse
Detaillierte Analyse von Stellenausschreibungen zur Ermittlung des Tech-Stacks (z.B. "Kenntnisse in SAP Ariba gewünscht").
---
## 🚀 Deployment
Das Tool ist als Full-Stack Service (React + Python/Node.js) in den Docker-Stack integriert.
* **URL:** `https://<HOST>:8090/market/`
* **Service:** `market-intelligence`
* **Port:** 3001 (intern)