Commit Graph

1459 Commits

Author SHA1 Message Date
54bda62d9e feat: Interne Deduplizierung implementieren und Skript refaktorieren
- Skript zu company_deduplicator.py umbenannt mit Erhalt der Git-Historie
- Hauptlogik in externen und internen Modus refaktorisiert
- Interaktive Modus-Auswahl für den Benutzer hinzugefügt
- Interne Deduplizierung zum Finden von Duplikaten innerhalb der CRM-Liste implementiert
- Logik zur Gruppierung von Duplikatspaaren zu eindeutigen Clustern hinzugefügt
- Eindeutige Dup_XXXX IDs den Duplikatsgruppen zugewiesen
- Neue Spalte Duplicate_ID zurück in das Google Sheet geschrieben
2025-11-09 08:09:45 +00:00
Gemini CLI
ad965f3509 fix(helpers): Verbesserte SerpAPI-Website-Suche
- Ersetzt starre Namensprüfung durch flexible Token-basierte Validierung

- Erhöht die Trefferquote für Firmennamen, die nicht exakt im Suchergebnis erscheinen

- Löst das Problem, dass für bekannte Firmen wie 'Rohde & Schwarz' keine Website gefunden wurde
2025-11-08 12:37:40 +00:00
Gemini CLI
7e7c1819f3 feat(git): Add .gitignore for common exclusions
- Ignoriert temporäre Dateien, Logs, Secrets und generierte Artefakte

- Verbessert die Repository-Sauberkeit und vermeidet versehentliche Commits sensibler Daten
2025-11-08 12:21:50 +00:00
Gemini CLI
dcb2b206f4 feat(duplicate_checker): Verbesserte Kandidatenauswahl und Match-Priorisierung
- Kandidatensuche sammelt Treffer aus allen Quellen (Domain, Token, Name)

- Exakte Namens-Matches werden durch einen hohen Score priorisiert

- Verhindert, dass Domain-Matches exaktere Namens-Matches überschatten
2025-11-08 11:48:40 +00:00
17a3d05a14 Strukturanpassung übernommen, Inhalt wie Ursprung 2025-11-08 07:36:05 +00:00
0c819d9e4f aktualisierte Version, Reihenfolge sinnvoll angepasst. 2025-11-07 19:55:01 +00:00
ae12771f2e readme.md aktualisiert 2025-11-07 19:24:41 +00:00
1af5ce8ef8 readme.md aktualisiert 2025-11-07 19:20:54 +00:00
76d906e8d4 readme.md aktualisiert 2025-11-07 19:16:08 +00:00
ad52fde419 readme.md aktualisiert 2025-11-07 15:02:53 +00:00
3f9ea21b97 Docs: Add documentation for generate_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 16:00:13 +01:00
4f2b7b10c8 Docs: Add documentation for extract_insights.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:55:51 +01:00
fe96cba8bf Docs: Add documentation for expand_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:50:14 +01:00
e5223436fe Docs: Add documentation for build_knowledge_base.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:47:24 +01:00
25d201aecf Docs: Add documentation for generate_marketing_text.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:43:54 +01:00
287ffec1c1 Docs: Add documentation for app.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:36:20 +01:00
e9975f26c4 Docs: Add documentation for config.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:30:54 +01:00
58932a2116 Docs: Add documentation for sync_manager.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:26:08 +01:00
7246e9ed5e Docs: Add documentation for contact_grouping.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:22:37 +01:00
cee77cd6b6 Docs: Add documentation for wikipedia_scraper.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:05:17 +01:00
a062097888 Docs: Add documentation for google_sheet_handler.py
- Beschreibt die Hauptfunktion und den Zweck des Moduls.

- Dokumentiert die wichtigsten öffentlichen Methoden.
2025-11-07 15:00:00 +01:00
688da12f53 Refactor(helpers): Remove duplicate code 2025-11-07 14:59:40 +01:00
560320e273 Refactor(data_processor): Remove obsolete version of process_verification_batch 2025-11-07 11:21:57 +01:00
a4664ea5c4 Add documentation for data processor and helpers 2025-11-07 10:29:07 +01:00
d836d5ad36 Docs: Add documentation for duplicate_checker_old.py 2025-11-07 09:37:02 +01:00
32ba90c962 gemini.Dockerfile aktualisiert 2025-11-06 18:26:50 +00:00
249a7d3126 gemini.Dockerfile aktualisiert 2025-11-06 15:38:17 +00:00
6e6b5b23f4 gemini.Dockerfile aktualisiert 2025-11-06 15:23:30 +00:00
4c81e69363 gemini.Dockerfile aktualisiert 2025-11-06 14:44:20 +00:00
d0f349fe54 gemini.Dockerfile hinzugefügt 2025-11-06 14:32:49 +00:00
e0a491f3c9 duplicate_checker_old.py aktualisiert 2025-11-06 14:00:44 +00:00
a2e4e26fcb duplicate_checker_old.py aktualisiert 2025-11-06 13:56:14 +00:00
f770db9060 duplicate_checker_old.py aktualisiert 2025-11-06 10:14:36 +00:00
bfce392afc duplicate?checker_old.py hinzugefügt 2025-11-06 10:13:39 +00:00
9b18ef908b requirements.txt aktualisiert 2025-09-24 19:29:27 +00:00
88f791d2d0 train_model.py aktualisiert 2025-09-24 19:21:45 +00:00
67e63140bf train_model.py aktualisiert 2025-09-24 15:47:22 +00:00
d5d54fa37c duplicate_checker.py aktualisiert 2025-09-24 15:37:12 +00:00
f4a2964b3f train_model.py aktualisiert 2025-09-24 14:31:17 +00:00
4eea3f0f80 duplicate_checker.py aktualisiert 2025-09-24 14:23:45 +00:00
b74116c821 train_model.py aktualisiert 2025-09-24 14:23:15 +00:00
6245c78a42 train_model.py aktualisiert 2025-09-24 14:17:29 +00:00
cc3cc0d798 requirements_diskstation.txt hinzugefügt 2025-09-24 14:14:39 +00:00
9649243e13 train_model.py aktualisiert 2025-09-24 14:11:12 +00:00
086290359a train_model.py aktualisiert 2025-09-24 14:06:54 +00:00
9b00153688 v1.2.4 - Priorisierung nach Geschäfts-Relevanz & Keyword-Optimierung
- Das Priorisierungsmodell wurde grundlegend überarbeitet und orientiert sich nun an der tatsächlichen Häufigkeit und Relevanz der Departments, anstatt an semantischer Eindeutigkeit.
- Die `STOP_WORDS`-Liste wurde signifikant angepasst. Wichtige Signalwörter wie 'service', 'customer', 'care' und 'support' wurden entfernt, um die Erkennungsrate für 'Field Service Management' drastisch zu verbessern.
- Dies korrigiert systematische Fehlzuordnungen und stellt sicher, dass die generierte Wissensbasis die Geschäftsrealität korrekt abbildet.
2025-09-19 08:58:06 +00:00
68442d1af9 contact_grouping.py aktualisiert 2025-09-18 13:48:28 +00:00
f5a686403d knowledge_base_builder.py aktualisiert 2025-09-18 13:45:27 +00:00
7f3d6c603a v1.2.3 - Bugfix SyntaxError bei KI-Beispiel-Generierung
- Bugfix: Behebt einen `SyntaxError: invalid syntax` in der Funktion `_generate_ai_examples`.
- Die fehlerhafte f-String-Formatierung, die einen Backslash innerhalb eines Ausdrucks enthielt, wurde durch eine robuste String-Verkettung ersetzt.
- Dies stellt die Lauffähigkeit des Skripts auf allen Python-Versionen sicher.
2025-09-18 13:43:56 +00:00
a0c7d26e9f v1.2.2 - Kalibrierung der Branchen-Logik
- Passt den Schwellenwert für die Branchenspezifität (`BRANCH_SPECIFICITY_THRESHOLD`) von 70% auf 60% an.
- Diese Anpassung basiert auf den Analyse-Ergebnissen der Log-Dateien und stellt sicher, dass hoch-konzentrierte Departments wie 'Baustofflogistik' und 'Production Maintenance' nun korrekt als branchenspezifisch erkannt werden.
- Die Regel für die minimale Sample-Anzahl bleibt bei 5, um statistisch irrelevante Regeln zu vermeiden.
2025-09-18 12:35:39 +00:00