diff --git a/knowledge_base_builder.py b/knowledge_base_builder.py index 8f4d7b92..43cc93c2 100644 --- a/knowledge_base_builder.py +++ b/knowledge_base_builder.py @@ -20,24 +20,31 @@ KEYWORD_RULES_OUTPUT_FILE = "keyword_rules.json" # Priorisierung der Departments (von spezifisch zu allgemein) # Niedrigere Zahl = höhere Priorität DEPARTMENT_PRIORITIES = { + # --- Tier 1: Ultra-spezifische Nischen (höchste Priorität) --- "Fuhrparkmanagement": 1, - "Production Maintenance / Wartung Produktion": 1, - "Utility Maintenance": 1, + "Legal": 1, "Baustofflogistik": 1, "Baustoffherstellung": 1, - "Legal": 1, - "Technik": 2, - "IT": 2, - "Finanzen": 3, - "Procurement / Einkauf": 3, - "Supply Chain Management": 3, - "Field Service Management / Kundenservice": 4, - "Logistik": 4, - "Transportwesen": 4, - "Vertrieb": 5, - "Berater": 6, - "Management / GF / C-Level": 7, - "Undefined": 99 # Niedrigste Priorität + + # --- Tier 2: Kern-Fachbereiche (sortiert nach Kontakthäufigkeit) --- + "Field Service Management / Kundenservice": 2, + "IT": 3, + "Production Maintenance / Wartung Produktion": 4, + "Utility Maintenance": 5, + "Procurement / Einkauf": 6, + "Supply Chain Management": 7, + "Finanzen": 8, + "Technik": 8, # Gleiche Prio wie Finanzen, da sehr ähnliche Frequenz + + # --- Tier 3: Übergreifende & Allgemeine Funktionen --- + "Management / GF / C-Level": 10, # Muss niedriger als Fachbereiche sein! + "Logistik": 11, + "Vertrieb": 12, + "Transportwesen": 13, + + # --- Tier 4: Auffang-Kategorien (niedrigste Priorität) --- + "Berater": 20, + "Undefined": 99 } # Stoppwörter: Häufige Wörter in Jobtiteln, die wenig Aussagekraft für die Abteilung haben