Brancheneinstufung2

Author	SHA1	Message	Date
Floke	f160fc0fc5	duplicate_checker.py aktualisiert - Dynamische Stopword-Erkennung entfernt, da sie zu aggressiv war. Häufige Wörter erhalten nun nur ein niedriges Gewicht. - Score-Berechnung und Schwellenwerte (Thresholds) komplett neu kalibriert für bessere Balance und Treffsicherheit. - "Domain-Gate" wieder eingeführt: Ein Domain-Match zählt nur dann stark, wenn auch eine minimale Namensähnlichkeit besteht. - Golden-Rule und Interaktiver Modus beibehalten.	2025-09-05 07:34:23 +00:00
Floke	491254a84e	Feat: Matching-Logik mit gewichtetem Scoring & Interaktiv-Modus (v3.0) Diese Version überarbeitet den Kern des Matching-Algorithmus grundlegend, um die Genauigkeit drastisch zu erhöhen und die manuelle Nachbearbeitung zu reduzieren. Die Änderungen basieren auf der Analyse eines umfangreichen Testdatensatzes und setzen die neue Philosophie des "großzügigen Matchens" von wirtschaftlichen Einheiten um. Gewichtetes Namens-Scoring (TF-IDF): - Einzigartige Namensbestandteile (z.B. "Warema") erhalten nun ein höheres Gewicht als generische Füllwörter (z.B. "Stadtwerke", "Gruppe"). - Dies löst das Problem von Fehlzuordnungen bei häufig vorkommenden, aber nicht-identifizierenden Begriffen und verbessert die Treffsicherheit bei unklaren Firmennamen signifikant. Golden-Rule für exakte Namens-Matches: - Eine Namensübereinstimmung von >98% führt zu einem sofortigen "Golden Match" mit einem sehr hohen Score. - Damit wird verhindert, dass klare Treffer durch abweichende Signale (z.B. unterschiedliche URLs von Tochterfirmen) fälschlicherweise bestraft werden. Optionaler Interaktiver Modus: - Kann mit dem Flag --interactive gestartet werden. - Bei uneindeutigen Ergebnissen, bei denen die Top-Kandidaten sehr ähnliche Scores haben, hält das Skript an und ermöglicht dem Benutzer die direkte Auswahl des korrekten Matches aus einer übersichtlichen Liste. Überarbeitete Scoring-Formel: - Die Gesamtbewertung wurde neu balanciert, um dem jetzt deutlich aussagekräftigeren Namens-Score mehr Gewicht zu verleihen.	2025-09-04 14:34:28 +00:00
Floke	fc3e90ac83	planning.md aktualisiert	2025-08-29 08:34:07 +00:00
Floke	49f935ea9d	tasks.md aktualisiert	2025-08-29 08:33:31 +00:00
Floke	3e545fe5a6	readme.md aktualisiert	2025-08-29 08:32:40 +00:00
Floke	7c9db71c77	sync_manager.py aktualisiert	2025-08-29 07:11:48 +00:00
Floke	4ada486206	sync_manager.py aktualisiert	2025-08-29 06:33:12 +00:00
Floke	6189d64b38	sync_manager.py aktualisiert	2025-08-29 06:30:08 +00:00
Floke	0319833c20	brancheneinstufung2.py aktualisiert	2025-08-29 06:20:48 +00:00
Floke	9628e8f181	sync_manager.py aktualisiert	2025-08-29 06:12:03 +00:00
Floke	f36816f49a	brancheneinstufung2.py aktualisiert	2025-08-29 06:11:04 +00:00
Floke	f5c6e87ae3	sync_manager.py aktualisiert	2025-08-28 19:02:12 +00:00
Floke	e9e33d7cfe	sync_manager.py aktualisiert	2025-08-28 18:42:36 +00:00
Floke	22f873e1dc	sync_manager.py aktualisiert	2025-08-28 18:37:36 +00:00
Floke	edec30652d	sync_manager.py aktualisiert	2025-08-28 18:22:42 +00:00
Floke	0273174a57	sync_manager.py aktualisiert	2025-08-28 18:07:17 +00:00
Floke	cf4a0178d6	sync_manager.py aktualisiert	2025-08-28 18:04:19 +00:00
Floke	a5e4a21580	sync_manager.py aktualisiert	2025-08-28 18:01:24 +00:00
Floke	e71c11c432	sync_manager.py aktualisiert	2025-08-28 17:57:44 +00:00
Floke	1068243ca9	sync_manager.py aktualisiert	2025-08-28 17:44:31 +00:00
Floke	123a48f53e	brancheneinstufung2.py aktualisiert	2025-08-28 17:38:25 +00:00
Floke	f90618e722	sync_manager.py aktualisiert	2025-08-28 17:34:52 +00:00
Floke	f1b18ddde4	sync_manager.py aktualisiert	2025-08-28 14:40:02 +00:00
Floke	59bba0276d	sync_manager.py aktualisiert	2025-08-28 14:22:48 +00:00
Floke	ad7618dff9	sync_manager.py aktualisiert	2025-08-28 14:18:24 +00:00
Floke	80be6d81ef	sync_manager.py aktualisiert	2025-08-28 14:08:08 +00:00
Floke	e629a83caa	sync_manager.py aktualisiert	2025-08-28 12:48:10 +00:00
Floke	dbcd80221e	sync_manager.py aktualisiert	2025-08-28 12:23:46 +00:00
Floke	6c1f5852eb	sync_manager.py aktualisiert	2025-08-28 12:17:32 +00:00
Floke	0bf2df1ee8	sync_manager.py aktualisiert	2025-08-28 11:55:31 +00:00
Floke	70dbad8282	sync_manager.py aktualisiert	2025-08-28 11:47:59 +00:00
Floke	1e694bd137	sync_manager.py aktualisiert	2025-08-28 11:41:41 +00:00
Floke	48133631d6	sync_manager.py aktualisiert	2025-08-28 11:29:38 +00:00
Floke	bcd771b8a0	sync_manager.py aktualisiert	2025-08-28 11:27:15 +00:00
Floke	5ad2f1bf1f	sync_manager.py aktualisiert	2025-08-28 11:17:20 +00:00
Floke	bb62a73dee	sync_manager.py aktualisiert	2025-08-28 11:03:16 +00:00
Floke	c5162bb63d	sync_manager.py aktualisiert	2025-08-28 10:58:22 +00:00
Floke	cf196a2a4c	sync_manager.py aktualisiert	2025-08-28 09:33:19 +00:00
Floke	d765f3a42f	sync_manager.py aktualisiert	2025-08-28 09:29:57 +00:00
Floke	124e8a054a	sync_manager.py aktualisiert	2025-08-28 09:22:55 +00:00
Floke	50561a193a	config.py aktualisiert	2025-08-28 09:20:27 +00:00
Floke	f959de76b6	sync_manager.py aktualisiert	2025-08-28 09:15:48 +00:00
Floke	35b491633e	sync_manager.py aktualisiert	2025-08-28 08:22:20 +00:00
Floke	fddd0311d7	sync_manager.py aktualisiert	2025-08-28 07:23:28 +00:00
Floke	0f39c39272	sync_manager.py aktualisiert	2025-08-28 07:16:45 +00:00
Floke	b347b029c2	sync_manager.py aktualisiert	2025-08-28 07:15:43 +00:00
Floke	9fee872fc6	sync_manager.py aktualisiert	2025-08-28 07:01:52 +00:00
Floke	6dba377e2e	brancheneinstufung2.py aktualisiert	2025-08-28 07:00:48 +00:00
Floke	cb8e50cfb3	sync_manager.py aktualisiert	2025-08-28 06:43:14 +00:00
Floke	ea6f9cbacc	sync_manager.py aktualisiert	2025-08-28 06:22:55 +00:00

1 2 3 4 5 ...

1369 Commits