ae5992b3f4
n8n_api_Token_git.txt hinzugefügt
2025-12-20 20:50:45 +00:00
d0e5f65ffa
Docs: Update readme.md with company_deduplicator.py changes
2025-11-09 09:05:53 +00:00
5e9e0766c8
Docs: Update GEMINI.md with project overview, Git workflow, and important notes.
2025-11-09 09:04:13 +00:00
f3af4150fb
feat: Parent Account Logik für interne Deduplizierung integriert
...
- Spalte 'Parent Account' wird geladen und normalisiert
- 'calculate_similarity' erkennt Parent-Child-Beziehungen und markiert diese
- 'run_internal_deduplication' ignoriert bekannte Hierarchien bei der Duplikatsfindung
- Neue Spalte 'Duplicate_Hint' für Hinweise auf fehlende Parent Accounts hinzugefügt
2025-11-09 08:48:06 +00:00
fe96789f6b
feat: Interne Deduplizierung implementieren und Skript refaktorieren
...
- Skript zu company_deduplicator.py umbenannt mit Erhalt der Git-Historie
- Hauptlogik in externen und internen Modus refaktorisiert
- Interaktive Modus-Auswahl für den Benutzer hinzugefügt
- Interne Deduplizierung zum Finden von Duplikaten innerhalb der CRM-Liste implementiert
- Logik zur Gruppierung von Duplikatspaaren zu eindeutigen Clustern hinzugefügt
- Eindeutige Dup_XXXX IDs den Duplikatsgruppen zugewiesen
- Neue Spalte Duplicate_ID zurück in das Google Sheet geschrieben
2025-11-09 08:09:45 +00:00
Gemini CLI
44f83ac661
fix(helpers): Verbesserte SerpAPI-Website-Suche
...
- Ersetzt starre Namensprüfung durch flexible Token-basierte Validierung
- Erhöht die Trefferquote für Firmennamen, die nicht exakt im Suchergebnis erscheinen
- Löst das Problem, dass für bekannte Firmen wie 'Rohde & Schwarz' keine Website gefunden wurde
2025-11-08 12:37:40 +00:00
Gemini CLI
c956bf058e
feat(git): Add .gitignore for common exclusions
...
- Ignoriert temporäre Dateien, Logs, Secrets und generierte Artefakte
- Verbessert die Repository-Sauberkeit und vermeidet versehentliche Commits sensibler Daten
2025-11-08 12:21:50 +00:00
Gemini CLI
1aff227865
feat(duplicate_checker): Verbesserte Kandidatenauswahl und Match-Priorisierung
...
- Kandidatensuche sammelt Treffer aus allen Quellen (Domain, Token, Name)
- Exakte Namens-Matches werden durch einen hohen Score priorisiert
- Verhindert, dass Domain-Matches exaktere Namens-Matches überschatten
2025-11-08 11:48:40 +00:00
3f9f66b52b
Strukturanpassung übernommen, Inhalt wie Ursprung
2025-11-08 07:36:05 +00:00
c7891ac6ae
aktualisierte Version, Reihenfolge sinnvoll angepasst.
2025-11-07 19:55:01 +00:00
66b27cd17a
readme.md aktualisiert
2025-11-07 19:24:41 +00:00
0a3f6f7717
readme.md aktualisiert
2025-11-07 19:20:54 +00:00
7297eeb4af
readme.md aktualisiert
2025-11-07 19:16:08 +00:00
91053640bb
readme.md aktualisiert
2025-11-07 15:02:53 +00:00
75239da1c2
Docs: Add documentation for generate_knowledge_base.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 16:00:13 +01:00
ff4d1e3fe6
Docs: Add documentation for extract_insights.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:55:51 +01:00
2a13171dbf
Docs: Add documentation for expand_knowledge_base.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:50:14 +01:00
53582f90c5
Docs: Add documentation for build_knowledge_base.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:47:24 +01:00
ca7e3f50a4
Docs: Add documentation for generate_marketing_text.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:43:54 +01:00
38662f0f67
Docs: Add documentation for app.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:36:20 +01:00
5d714ae8a3
Docs: Add documentation for config.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:30:54 +01:00
79c6d43e6c
Docs: Add documentation for sync_manager.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:26:08 +01:00
231467cd45
Docs: Add documentation for contact_grouping.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:22:37 +01:00
a403c27481
Docs: Add documentation for wikipedia_scraper.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:05:17 +01:00
d3be23b251
Docs: Add documentation for google_sheet_handler.py
...
- Beschreibt die Hauptfunktion und den Zweck des Moduls.
- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:00:00 +01:00
84410a41c1
Refactor(helpers): Remove duplicate code
2025-11-07 14:59:40 +01:00
f6a5e0e160
Refactor(data_processor): Remove obsolete version of process_verification_batch
2025-11-07 11:21:57 +01:00
1686c304bd
Add documentation for data processor and helpers
2025-11-07 10:29:07 +01:00
9ce6a0db42
Docs: Add documentation for duplicate_checker_old.py
2025-11-07 09:37:02 +01:00
6c01e4fa48
gemini.Dockerfile aktualisiert
2025-11-06 18:26:50 +00:00
0bd60399da
gemini.Dockerfile aktualisiert
2025-11-06 15:38:17 +00:00
921042e640
gemini.Dockerfile aktualisiert
2025-11-06 15:23:30 +00:00
d1cb210785
gemini.Dockerfile aktualisiert
2025-11-06 14:44:20 +00:00
55e9a33684
gemini.Dockerfile hinzugefügt
2025-11-06 14:32:49 +00:00
405d2d00bd
duplicate_checker_old.py aktualisiert
2025-11-06 14:00:44 +00:00
757cb38706
duplicate_checker_old.py aktualisiert
2025-11-06 13:56:14 +00:00
53d6c49945
duplicate_checker_old.py aktualisiert
2025-11-06 10:14:36 +00:00
fd94b189f5
duplicate?checker_old.py hinzugefügt
2025-11-06 10:13:39 +00:00
7014dd05d9
requirements.txt aktualisiert
2025-09-24 19:29:27 +00:00
23a368153c
train_model.py aktualisiert
2025-09-24 19:21:45 +00:00
1f4984f80b
train_model.py aktualisiert
2025-09-24 15:47:22 +00:00
6cfd22f586
duplicate_checker.py aktualisiert
2025-09-24 15:37:12 +00:00
df4df18125
train_model.py aktualisiert
2025-09-24 14:31:17 +00:00
e3efe46cf6
duplicate_checker.py aktualisiert
2025-09-24 14:23:45 +00:00
93ae387840
train_model.py aktualisiert
2025-09-24 14:23:15 +00:00
820e88e045
train_model.py aktualisiert
2025-09-24 14:17:29 +00:00
2f8711c0ce
requirements_diskstation.txt hinzugefügt
2025-09-24 14:14:39 +00:00
a1fef95079
train_model.py aktualisiert
2025-09-24 14:11:12 +00:00
55854c62c6
train_model.py aktualisiert
2025-09-24 14:06:54 +00:00
7e2f057357
v1.2.4 - Priorisierung nach Geschäfts-Relevanz & Keyword-Optimierung
...
- Das Priorisierungsmodell wurde grundlegend überarbeitet und orientiert sich nun an der tatsächlichen Häufigkeit und Relevanz der Departments, anstatt an semantischer Eindeutigkeit.
- Die `STOP_WORDS`-Liste wurde signifikant angepasst. Wichtige Signalwörter wie 'service', 'customer', 'care' und 'support' wurden entfernt, um die Erkennungsrate für 'Field Service Management' drastisch zu verbessern.
- Dies korrigiert systematische Fehlzuordnungen und stellt sicher, dass die generierte Wissensbasis die Geschäftsrealität korrekt abbildet.
2025-09-19 08:58:06 +00:00