Commit Graph

1456 Commits

Author SHA1 Message Date
54cad18fc8 Dateien nach "general-market-intelligence" hochladen 2025-12-20 20:57:09 +00:00
e64c5ba90f general-market-intelligence/tsconfig.json hinzugefügt 2025-12-20 20:55:37 +00:00
16d059c001 Docs: Update readme.md with company_deduplicator.py changes 2025-11-09 09:05:53 +00:00
c0d97dd672 Docs: Update GEMINI.md with project overview, Git workflow, and important notes. 2025-11-09 09:04:13 +00:00
00edd44b46 feat: Parent Account Logik für interne Deduplizierung integriert
- Spalte 'Parent Account' wird geladen und normalisiert
- 'calculate_similarity' erkennt Parent-Child-Beziehungen und markiert diese
- 'run_internal_deduplication' ignoriert bekannte Hierarchien bei der Duplikatsfindung
- Neue Spalte 'Duplicate_Hint' für Hinweise auf fehlende Parent Accounts hinzugefügt
2025-11-09 08:48:06 +00:00
37182b3a7f feat: Interne Deduplizierung implementieren und Skript refaktorieren
- Skript zu company_deduplicator.py umbenannt mit Erhalt der Git-Historie
- Hauptlogik in externen und internen Modus refaktorisiert
- Interaktive Modus-Auswahl für den Benutzer hinzugefügt
- Interne Deduplizierung zum Finden von Duplikaten innerhalb der CRM-Liste implementiert
- Logik zur Gruppierung von Duplikatspaaren zu eindeutigen Clustern hinzugefügt
- Eindeutige Dup_XXXX IDs den Duplikatsgruppen zugewiesen
- Neue Spalte Duplicate_ID zurück in das Google Sheet geschrieben
2025-11-09 08:09:45 +00:00
Gemini CLI
f09b3dac15 fix(helpers): Verbesserte SerpAPI-Website-Suche
- Ersetzt starre Namensprüfung durch flexible Token-basierte Validierung

- Erhöht die Trefferquote für Firmennamen, die nicht exakt im Suchergebnis erscheinen

- Löst das Problem, dass für bekannte Firmen wie 'Rohde & Schwarz' keine Website gefunden wurde
2025-11-08 12:37:40 +00:00
Gemini CLI
6bdc0f891f feat(git): Add .gitignore for common exclusions
- Ignoriert temporäre Dateien, Logs, Secrets und generierte Artefakte

- Verbessert die Repository-Sauberkeit und vermeidet versehentliche Commits sensibler Daten
2025-11-08 12:21:50 +00:00
Gemini CLI
9986722554 feat(duplicate_checker): Verbesserte Kandidatenauswahl und Match-Priorisierung
- Kandidatensuche sammelt Treffer aus allen Quellen (Domain, Token, Name)

- Exakte Namens-Matches werden durch einen hohen Score priorisiert

- Verhindert, dass Domain-Matches exaktere Namens-Matches überschatten
2025-11-08 11:48:40 +00:00
bb0c6db85b Strukturanpassung übernommen, Inhalt wie Ursprung 2025-11-08 07:36:05 +00:00
1dd8cb2de9 aktualisierte Version, Reihenfolge sinnvoll angepasst. 2025-11-07 19:55:01 +00:00
7e92e00dfb readme.md aktualisiert 2025-11-07 19:24:41 +00:00
ca0832c68c readme.md aktualisiert 2025-11-07 19:20:54 +00:00
b0687abfa8 readme.md aktualisiert 2025-11-07 19:16:08 +00:00
c442c589b5 readme.md aktualisiert 2025-11-07 15:02:53 +00:00
269fc7b1e7 Docs: Add documentation for generate_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 16:00:13 +01:00
2dda388874 Docs: Add documentation for extract_insights.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:55:51 +01:00
6973b5c205 Docs: Add documentation for expand_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:50:14 +01:00
f15ff14f1e Docs: Add documentation for build_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:47:24 +01:00
fafabb5b63 Docs: Add documentation for generate_marketing_text.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:43:54 +01:00
0fc414024d Docs: Add documentation for app.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:36:20 +01:00
452dea5328 Docs: Add documentation for config.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:30:54 +01:00
c0713abbb9 Docs: Add documentation for sync_manager.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:26:08 +01:00
57bd3e524a Docs: Add documentation for contact_grouping.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:22:37 +01:00
e3b09c55a7 Docs: Add documentation for wikipedia_scraper.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:05:17 +01:00
f450942dac Docs: Add documentation for google_sheet_handler.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:00:00 +01:00
93b825cfef Refactor(helpers): Remove duplicate code 2025-11-07 14:59:40 +01:00
a684d788d7 Refactor(data_processor): Remove obsolete version of process_verification_batch 2025-11-07 11:21:57 +01:00
8fea3b9b1d Add documentation for data processor and helpers 2025-11-07 10:29:07 +01:00
d567afd0c5 Docs: Add documentation for duplicate_checker_old.py 2025-11-07 09:37:02 +01:00
4a3f64062e gemini.Dockerfile aktualisiert 2025-11-06 18:26:50 +00:00
c33713045d gemini.Dockerfile aktualisiert 2025-11-06 15:38:17 +00:00
ea9fc4e93b gemini.Dockerfile aktualisiert 2025-11-06 15:23:30 +00:00
a9cbe0cbc3 gemini.Dockerfile aktualisiert 2025-11-06 14:44:20 +00:00
b2cd644c37 gemini.Dockerfile hinzugefügt 2025-11-06 14:32:49 +00:00
1dd86d8e3e duplicate_checker_old.py aktualisiert 2025-11-06 14:00:44 +00:00
0a729f2df7 duplicate_checker_old.py aktualisiert 2025-11-06 13:56:14 +00:00
a67615ad55 duplicate_checker_old.py aktualisiert 2025-11-06 10:14:36 +00:00
2df8441b4f duplicate?checker_old.py hinzugefügt 2025-11-06 10:13:39 +00:00
12ac707001 requirements.txt aktualisiert 2025-09-24 19:29:27 +00:00
e052933704 train_model.py aktualisiert 2025-09-24 19:21:45 +00:00
1e996a0023 train_model.py aktualisiert 2025-09-24 15:47:22 +00:00
da9d97dae7 duplicate_checker.py aktualisiert 2025-09-24 15:37:12 +00:00
c2184dd004 train_model.py aktualisiert 2025-09-24 14:31:17 +00:00
fa58a870bc duplicate_checker.py aktualisiert 2025-09-24 14:23:45 +00:00
9ff6f97513 train_model.py aktualisiert 2025-09-24 14:23:15 +00:00
894d6f50df train_model.py aktualisiert 2025-09-24 14:17:29 +00:00
3ef2465cdc requirements_diskstation.txt hinzugefügt 2025-09-24 14:14:39 +00:00
2b2d25c111 train_model.py aktualisiert 2025-09-24 14:11:12 +00:00
673fe18347 train_model.py aktualisiert 2025-09-24 14:06:54 +00:00