From fe335cd5f3182bc72f01cf66234ba2fd20169b7b Mon Sep 17 00:00:00 2001 From: Jarvis Date: Mon, 9 Feb 2026 07:56:44 +0000 Subject: [PATCH] fix: Restore deleted API docs and ensure full file integrity --- ARCHITEKTUR_GCP_SETUP.md | 61 ++++++++++++++++++++++++++++++++++++++++ 1 file changed, 61 insertions(+) diff --git a/ARCHITEKTUR_GCP_SETUP.md b/ARCHITEKTUR_GCP_SETUP.md index 9e8dd2a3..1af81113 100644 --- a/ARCHITEKTUR_GCP_SETUP.md +++ b/ARCHITEKTUR_GCP_SETUP.md @@ -184,6 +184,27 @@ flowchart TD * Vorteil: Wir nutzen die sichere Enterprise-API, ohne Office-Lizenzen ändern zu müssen. * Daten bleiben im kontrollierten GCP-Bereich. +## Datenschutz & Compliance Strategie + +### Grundsatz: "Safe Space" & Transparenz +Wir verfolgen einen zweistufigen Ansatz ("Salami-Taktik"), um Datenschutzrisiken zu minimieren und Vertrauen aufzubauen. + +**Phase 1: Der "Safe Space" (Aktueller Status)** +* **Datenbasis:** Ausschließlich öffentlich zugängliche B2B-Firmendaten (Handelsregister, Webseiten). +* **Personenbezug:** Keiner (oder nur reine B2B-Kontaktdaten gem. DSGVO Erwägungsgrund 47 / berechtigtes Interesse). +* **Infrastruktur:** Nutzung der bestehenden Google Workspace Enterprise Umgebung ("Walled Garden"). +* **Training:** Expliziter Ausschluss der Datennutzung zu Trainingszwecken in der Google Admin Konsole (Enterprise Data Protection). + +**Phase 2: Erweiterte Szenarien (Zukunft / Genehmigungspflichtig)** +* **Szenario:** Nutzung interner Daten (z.B. Support-Tickets) zur Mustererkennung. +* **Voraussetzung:** Vorherige Abstimmung eines separaten Datenschutzkonzeptes (z.B. PII-Redaction/Schwärzung vor API-Transfer, Nutzung lokaler LLMs). +* **Commitment:** Keine Verarbeitung kritischer Daten ohne explizites "Go" durch den Datenschutzbeauftragten. + +### Technische Maßnahmen +1. **Vertrag:** Nutzung von Vertex AI im Rahmen des bestehenden Google Workspace Enterprise-Vertrags (DPA). +2. **Zero Retention:** Nutzung der API im Modus ohne Datenspeicherung seitens Google. +3. **Data Residency:** Konfiguration der Datenverarbeitung in EU-Rechenzentren (Frankfurt/Belgien) wo möglich. + ## Strategie zur Lizenzierung & Kosten (Der "Cloud Identity Free" Ansatz) **Ausgangslage:** @@ -236,3 +257,43 @@ Könntet ihr mir bitte **zwei Projekte** anlegen und mit dem zentralen Firmen-Re Danach könnt ihr mir einfach **Owner-Rechte** auf diese beiden Projekte geben. Den Rest (API-Aktivierung, Service Accounts, Region-Lock auf Frankfurt) richte ich dann selbst ein. Das wäre die sauberste Lösung: Keine Fixkosten durch Lizenz-Upgrades, klare Trennung von Spielwiese und Produktion, und volle Kostentransparenz. + +## Backend API (Company Explorer) + +Das System verfügt bereits über eine standardisierte, dokumentierte API (FastAPI) zur Datenverarbeitung. Dies ermöglicht eine saubere Trennung von Frontend und Backend sowie eine granulare Zugriffskontrolle. + +**Core Endpoints:** + +| Methode | Pfad | Beschreibung | +| :--- | :--- | :--- | +| `GET` | `/api/health` | System Status Check | +| `GET` | `/api/companies` | Liste von Unternehmen (Filterbar, Sortierbar) | +| `GET` | `/api/companies/{id}` | Detailansicht eines Unternehmens | +| `POST` | `/api/companies` | Manuelle Anlage eines Unternehmens | +| `POST` | `/api/companies/bulk` | Massenimport (Batch-Processing) | +| `GET` | `/api/companies/export` | CSV Export der angereicherten Daten | + +**Enrichment & KI-Analyse:** + +| Methode | Pfad | Beschreibung | +| :--- | :--- | :--- | +| `POST` | `/api/enrich/discover` | Startet Discovery-Prozess (Website-Suche) | +| `POST` | `/api/enrich/analyze` | Startet KI-Analyse (Scraping + Klassifizierung) | +| `PUT` | `/api/companies/{id}/industry` | Manuelle Korrektur der KI-Branchenzuordnung | +| `POST` | `/api/companies/{id}/override/*` | Manuelle Overrides für kritische Datenquellen (Website, Wikipedia, Impressum) | + +**Quality Assurance:** + +| Methode | Pfad | Beschreibung | +| :--- | :--- | :--- | +| `POST` | `/api/companies/{id}/report-mistake` | Melden von Datenfehlern ("Human in the Loop") | +| `GET` | `/api/mistakes` | Übersicht gemeldeter Fehler zur Überprüfung | +| `PUT` | `/api/mistakes/{id}` | Status-Update für Fehlermeldungen (Approved/Rejected) | + +**Stammdaten & Kataloge:** + +| Methode | Pfad | Beschreibung | +| :--- | :--- | :--- | +| `GET` | `/api/robotics/categories` | Katalog der Robotik-Kategorien | +| `GET` | `/api/industries` | Katalog der Branchen | +| `GET` | `/api/job_roles` | Katalog der Job-Rollen |