Commit Graph

1463 Commits

Author SHA1 Message Date
ae5992b3f4 n8n_api_Token_git.txt hinzugefügt 2025-12-20 20:50:45 +00:00
d0e5f65ffa Docs: Update readme.md with company_deduplicator.py changes 2025-11-09 09:05:53 +00:00
5e9e0766c8 Docs: Update GEMINI.md with project overview, Git workflow, and important notes. 2025-11-09 09:04:13 +00:00
f3af4150fb feat: Parent Account Logik für interne Deduplizierung integriert
- Spalte 'Parent Account' wird geladen und normalisiert
- 'calculate_similarity' erkennt Parent-Child-Beziehungen und markiert diese
- 'run_internal_deduplication' ignoriert bekannte Hierarchien bei der Duplikatsfindung
- Neue Spalte 'Duplicate_Hint' für Hinweise auf fehlende Parent Accounts hinzugefügt
2025-11-09 08:48:06 +00:00
fe96789f6b feat: Interne Deduplizierung implementieren und Skript refaktorieren
- Skript zu company_deduplicator.py umbenannt mit Erhalt der Git-Historie
- Hauptlogik in externen und internen Modus refaktorisiert
- Interaktive Modus-Auswahl für den Benutzer hinzugefügt
- Interne Deduplizierung zum Finden von Duplikaten innerhalb der CRM-Liste implementiert
- Logik zur Gruppierung von Duplikatspaaren zu eindeutigen Clustern hinzugefügt
- Eindeutige Dup_XXXX IDs den Duplikatsgruppen zugewiesen
- Neue Spalte Duplicate_ID zurück in das Google Sheet geschrieben
2025-11-09 08:09:45 +00:00
Gemini CLI
44f83ac661 fix(helpers): Verbesserte SerpAPI-Website-Suche
- Ersetzt starre Namensprüfung durch flexible Token-basierte Validierung

- Erhöht die Trefferquote für Firmennamen, die nicht exakt im Suchergebnis erscheinen

- Löst das Problem, dass für bekannte Firmen wie 'Rohde & Schwarz' keine Website gefunden wurde
2025-11-08 12:37:40 +00:00
Gemini CLI
c956bf058e feat(git): Add .gitignore for common exclusions
- Ignoriert temporäre Dateien, Logs, Secrets und generierte Artefakte

- Verbessert die Repository-Sauberkeit und vermeidet versehentliche Commits sensibler Daten
2025-11-08 12:21:50 +00:00
Gemini CLI
1aff227865 feat(duplicate_checker): Verbesserte Kandidatenauswahl und Match-Priorisierung
- Kandidatensuche sammelt Treffer aus allen Quellen (Domain, Token, Name)

- Exakte Namens-Matches werden durch einen hohen Score priorisiert

- Verhindert, dass Domain-Matches exaktere Namens-Matches überschatten
2025-11-08 11:48:40 +00:00
3f9f66b52b Strukturanpassung übernommen, Inhalt wie Ursprung 2025-11-08 07:36:05 +00:00
c7891ac6ae aktualisierte Version, Reihenfolge sinnvoll angepasst. 2025-11-07 19:55:01 +00:00
66b27cd17a readme.md aktualisiert 2025-11-07 19:24:41 +00:00
0a3f6f7717 readme.md aktualisiert 2025-11-07 19:20:54 +00:00
7297eeb4af readme.md aktualisiert 2025-11-07 19:16:08 +00:00
91053640bb readme.md aktualisiert 2025-11-07 15:02:53 +00:00
75239da1c2 Docs: Add documentation for generate_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 16:00:13 +01:00
ff4d1e3fe6 Docs: Add documentation for extract_insights.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:55:51 +01:00
2a13171dbf Docs: Add documentation for expand_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:50:14 +01:00
53582f90c5 Docs: Add documentation for build_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:47:24 +01:00
ca7e3f50a4 Docs: Add documentation for generate_marketing_text.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:43:54 +01:00
38662f0f67 Docs: Add documentation for app.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:36:20 +01:00
5d714ae8a3 Docs: Add documentation for config.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:30:54 +01:00
79c6d43e6c Docs: Add documentation for sync_manager.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:26:08 +01:00
231467cd45 Docs: Add documentation for contact_grouping.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:22:37 +01:00
a403c27481 Docs: Add documentation for wikipedia_scraper.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:05:17 +01:00
d3be23b251 Docs: Add documentation for google_sheet_handler.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:00:00 +01:00
84410a41c1 Refactor(helpers): Remove duplicate code 2025-11-07 14:59:40 +01:00
f6a5e0e160 Refactor(data_processor): Remove obsolete version of process_verification_batch 2025-11-07 11:21:57 +01:00
1686c304bd Add documentation for data processor and helpers 2025-11-07 10:29:07 +01:00
9ce6a0db42 Docs: Add documentation for duplicate_checker_old.py 2025-11-07 09:37:02 +01:00
6c01e4fa48 gemini.Dockerfile aktualisiert 2025-11-06 18:26:50 +00:00
0bd60399da gemini.Dockerfile aktualisiert 2025-11-06 15:38:17 +00:00
921042e640 gemini.Dockerfile aktualisiert 2025-11-06 15:23:30 +00:00
d1cb210785 gemini.Dockerfile aktualisiert 2025-11-06 14:44:20 +00:00
55e9a33684 gemini.Dockerfile hinzugefügt 2025-11-06 14:32:49 +00:00
405d2d00bd duplicate_checker_old.py aktualisiert 2025-11-06 14:00:44 +00:00
757cb38706 duplicate_checker_old.py aktualisiert 2025-11-06 13:56:14 +00:00
53d6c49945 duplicate_checker_old.py aktualisiert 2025-11-06 10:14:36 +00:00
fd94b189f5 duplicate?checker_old.py hinzugefügt 2025-11-06 10:13:39 +00:00
7014dd05d9 requirements.txt aktualisiert 2025-09-24 19:29:27 +00:00
23a368153c train_model.py aktualisiert 2025-09-24 19:21:45 +00:00
1f4984f80b train_model.py aktualisiert 2025-09-24 15:47:22 +00:00
6cfd22f586 duplicate_checker.py aktualisiert 2025-09-24 15:37:12 +00:00
df4df18125 train_model.py aktualisiert 2025-09-24 14:31:17 +00:00
e3efe46cf6 duplicate_checker.py aktualisiert 2025-09-24 14:23:45 +00:00
93ae387840 train_model.py aktualisiert 2025-09-24 14:23:15 +00:00
820e88e045 train_model.py aktualisiert 2025-09-24 14:17:29 +00:00
2f8711c0ce requirements_diskstation.txt hinzugefügt 2025-09-24 14:14:39 +00:00
a1fef95079 train_model.py aktualisiert 2025-09-24 14:11:12 +00:00
55854c62c6 train_model.py aktualisiert 2025-09-24 14:06:54 +00:00
7e2f057357 v1.2.4 - Priorisierung nach Geschäfts-Relevanz & Keyword-Optimierung
- Das Priorisierungsmodell wurde grundlegend überarbeitet und orientiert sich nun an der tatsächlichen Häufigkeit und Relevanz der Departments, anstatt an semantischer Eindeutigkeit.
- Die `STOP_WORDS`-Liste wurde signifikant angepasst. Wichtige Signalwörter wie 'service', 'customer', 'care' und 'support' wurden entfernt, um die Erkennungsrate für 'Field Service Management' drastisch zu verbessern.
- Dies korrigiert systematische Fehlzuordnungen und stellt sicher, dass die generierte Wissensbasis die Geschäftsrealität korrekt abbildet.
2025-09-19 08:58:06 +00:00