v1.2.2 - Kalibrierung der Branchen-Logik

- Passt den Schwellenwert für die Branchenspezifität (`BRANCH_SPECIFICITY_THRESHOLD`) von 70% auf 60% an.
- Diese Anpassung basiert auf den Analyse-Ergebnissen der Log-Dateien und stellt sicher, dass hoch-konzentrierte Departments wie 'Baustofflogistik' und 'Production Maintenance' nun korrekt als branchenspezifisch erkannt werden.
- Die Regel für die minimale Sample-Anzahl bleibt bei 5, um statistisch irrelevante Regeln zu vermeiden.
This commit is contained in:
2025-09-18 12:35:39 +00:00
parent c302fb3a3f
commit 22c4a3418b

View File

@@ -1,6 +1,6 @@
# knowledge_base_builder.py
__version__ = "v1.2.1"
__version__ = "v1.2.2"
import logging
import json
@@ -58,7 +58,8 @@ BRANCH_GROUP_RULES = {
}
MIN_SAMPLES_FOR_BRANCH_RULE = 5
BRANCH_SPECIFICITY_THRESHOLD = 0.7
# --- MODIFIZIERT: Schwellenwert auf 60% gesenkt ---
BRANCH_SPECIFICITY_THRESHOLD = 0.6
STOP_WORDS = {
'manager', 'leiter', 'head', 'lead', 'senior', 'junior', 'direktor', 'director',
@@ -70,7 +71,6 @@ STOP_WORDS = {
}
def setup_logging():
"""Konfiguriert das Logging, um sowohl in der Konsole als auch in einer Datei zu loggen."""
log_filename = create_log_filename("knowledge_base_builder")
if not log_filename:
print("KRITISCHER FEHLER: Log-Datei konnte nicht erstellt werden. Logge nur in die Konsole.")
@@ -100,9 +100,6 @@ def setup_logging():
def build_knowledge_base():
"""
Hauptfunktion zur Erstellung der Wissensbasis.
"""
logger = logging.getLogger(__name__)
logger.info(f"Starte Erstellung der Wissensbasis (Version {__version__})...")