Commit Graph

186 Commits

Author SHA1 Message Date
9dfff201d6 v1.4.7 Fallback Website-Details: Mehr Logging & Fallback in Branchenbewertung
- In evaluate_branche_chatgpt() wird geprüft, ob sowohl Wiki- als auch externe Beschreibung 'k.A.' sind.
- Falls ja, wird der Website-Zusammenfassungstext als Fallback zur Branchenbewertung genutzt.
- Zusätzliche debug_print()-Ausgaben wurden eingefügt, um anzuzeigen, welche Informationen für die Entscheidungsfindung herangezogen wurden.
- Nach der ChatGPT-Antwort wird das Endergebnis ebenfalls geloggt.
2025-04-09 07:04:45 +00:00
1202b2c2f4 v1.4.6 Erweiterte Modi: Neuer Modus 23 Website-Detail Extraction + SERP Lookup
- Neuer Modus 23 implementiert: Website Detail Extraction für Zeilen mit "x" in Spalte A.
- scrape_website_details() extrahiert Seitentitel, Meta-Description und h1/h2/h3 aus der Startseite.
- SERP-API Website Lookup (Modus 22) integriert: Fehlt in Spalte D eine Website, wird diese ermittelt und normalisiert.
- Alignment Demo bleibt unverändert; neue Spalten AR (Website Rohtext) und AS (Website Zusammenfassung) werden beibehalten.
- Main-Funktion und DataProcessor entsprechend der neuen Betriebsmodi angepasst.
2025-04-09 06:36:35 +00:00
621cc67df7 URL normalisierung 2025-04-09 05:27:31 +00:00
6e768a092b bugfix 2025-04-08 19:39:55 +00:00
5d60447009 bugfix 2025-04-08 19:37:22 +00:00
d773ca4b40 bugfix 2025-04-08 19:31:38 +00:00
de78507bff Bugfix 2025-04-08 19:26:05 +00:00
d159bba3ef bugfix 2025-04-08 19:20:34 +00:00
824f521dc0 v1.4.6 Neue Website-Funktionen: SERP Lookup & Detail-Scraper integriert
- Modus 22: Neue Funktion 'serp_website_lookup' ermittelt per SERPAPI die Website, wenn CRM-Daten fehlen.
- Neue Funktion 'scrape_website_details' extrahiert Seitentitel, Meta-Description und h1/h2/h3-Überschriften.
- Beide Funktionen werden als Testmodule bereitgestellt und können in das Gesamtworkflow integriert werden.
- Main und Betriebsmodus-Menü wurden um die neuen Modi ergänzt.
- Alignment-Demo um neue Spalten erweitert
2025-04-08 18:24:46 +00:00
1d6c0c4b5a v1.4.6 Neue Betriebsmodi: Untermodi für Re-Evaluation, Website, SERP, ChatGPT implementiert
- Umstellung des Modus-Menüs auf ein neues Zahlensystem (1, 11, 21, 22, 31, 41, 51, 6)
- Modus 11: Re-Evaluation markierter Zeilen (ehemals Modus 2)
- Modus 21: Testmodus Website-Scraping (nur Website-Rohtext & Zusammenfassung)
- Modus 22: SERP-API basierter Website Lookup
- Modus 31: Vollständige ChatGPT-Auswertung
- Modus 41: Nur Wikipedia-Scraping
- Re-Evaluation-Untermodi (z. B. 11.1) können bei Bedarf später hinzugefügt werden
- Main-Funktion angepasst, um neue Modusauswahl zu ermöglichen
2025-04-08 17:58:02 +00:00
7b625e454f v1.4.5 Timestamp-Skip und URL-Scheme ergänzt, Website-Fallback bleibt, Alignment Demo vollständig be
- In _process_single_row() und process_verification_only() wird nun geprüft, ob in Spalte AO bereits ein Timestamp steht – in diesem Fall wird die Zeile übersprungen.
- In get_website_raw() wird vor dem Abruf geprüft, ob der URL mit "http" beginnt; andernfalls wird "https://" vorangestellt.
- Ansonsten bleibt die bisherige Logik (inklusive Website-Extraktion und -Zusammenfassung, Fallback in evaluate_branche_chatgpt und vollständige Alignment Demo) unverändert.
2025-04-08 14:43:32 +00:00
13ab783364 bugfix 2025-04-08 14:15:55 +00:00
7ddb2744a3 bugfix 2025-04-08 14:05:57 +00:00
acda922262 v1.4.4 Fallback über Website-Startseite integriert, Anpassung Branchenprompt, Zeilenabfrage in Modus
- Falls weder Wikipedia-Branche noch externe Branchenbeschreibung vorliegen, wird der Website-Inhalt (Startseite, Spalte D) ausgelesen.
- Eine neue Funktion `get_website_summary(url)` extrahiert den Text der Startseite (bis 1000 Zeichen) und übernimmt diesen als externe Information, falls nötig.
- Die Funktion `evaluate_branche_chatgpt()` wurde um einen Parameter `website_url` erweitert und prüft, ob bei fehlender Wikipedia-Branche und fehlender externer Beschreibung der Website-Text verwendet wird.
- In der Batch-Verarbeitung (Modus 51) wird der Website-URL aus Spalte D als fünfter Parameter übergeben.
- Die Alignment Demo bleibt ansonsten unverändert.
2025-04-08 13:51:14 +00:00
a918131b90 bugfix 2025-04-08 12:05:59 +00:00
2f4333e0e5 bugfix 2025-04-08 11:55:23 +00:00
f40d8d8a4f Update brancheneinstufung.py 2025-04-08 09:56:03 +00:00
2fa9aeed75 bugfix
Ergänzung der Fallunterscheidung:
Falls wiki_branche "k.A." ist, wird der Prompt so generiert, dass nur die Angaben aus CRM (Spalte G) und externe Branchenbeschreibung (Spalte H) verwendet werden. Andernfalls werden auch die Werte aus Wikipedia (Spalte N und Q) herangezogen.

Erhaltung der Fokus-Branchen:
Die Focus-Liste wird beibehalten, sodass die Entscheidungsfindung über den endgültigen Vorschlag weiterhin auch diese Branchen berücksichtigt.

Postprocessing:
Nach der Antwort werden Ergebnisse geprüft, und sofern der von ChatGPT vorgeschlagene Branchentext nicht exakt im Ziel-Branchenschema enthalten ist, wird „k.A.“ mit Konsistenz "X" zurückgegeben. Stimmt der Vorschlag exakt mit der in CRM (Spalte G) überein, wird die Begründung geleert und die Konsistenz auf "ok" gesetzt.
2025-04-08 09:55:19 +00:00
2fb083a8c8 v1.4.3 Anpassung Branchenbewertung im Batch, Ziel-Branchenschema streng prüfen, Zeilenabfrage in Mod
- Alignment Demo (Zeilen A1–AQ5) wurde exakt wie in der Ausgangsversion integriert.
- Im Batch-Modus (Modus 51) wird nun zusätzlich die Branchenbewertung (bis Spalte Y) ausgeführt:
    • Spalte W: Chat Vorschlag Branche
    • Spalte X: Chat Konsistenz Branche
    • Spalte Y: Chat Begründung Abweichung Branche
- In evaluate_branche_chatgpt wird überprüft, ob der von ChatGPT vorgeschlagene Branchentext exakt im Ziel-Branchenschema enthalten ist.
  Falls nicht, wird „k.A.“ mit Konsistenz "X" und entsprechender Begründung zurückgegeben.
- Wenn der Vorschlag mit der in CRM festgelegten Branche übereinstimmt, wird keine Begründung (leere Zeichenkette) ausgegeben.
- Vor Start im Batch wird abgefragt, wieviele Zeilen verarbeitet werden sollen.
- Bei Wikipedia: Wird _nicht_ erneut gesucht, wenn first_paragraph "k.A." ist.
2025-04-08 08:56:03 +00:00
4822da3337 v1.4.2 Branchenbewertung im Batch, Wikipedia k.A.-Handling optimiert, Zeilenabfrage in Modus 51
- Alignment Demo (Zeilen A1–AQ5) exakt gemäß der vorgegebenen Ausgangsversion eingebaut.
- Im Batch-Prozess (Modus 51) wird jetzt zusätzlich die Branchenbewertung (bis einschließlich Spalte Y) durchgeführt.
  - Spalte W: Chat Vorschlag Branche
  - Spalte X: Chat Konsistenz Branche
  - Spalte Y: Chat Begründung Abweichung Branche
- Wenn der extrahierte Wikipedia-Artikel "k.A." enthält, wird nicht erneut nach einem Artikel gesucht; stattdessen bleibt der Wert "k.A.".
- Vor Start im Batch (Modus 51) wird abgefragt, wie viele Zeilen verarbeitet werden sollen.
- Weitere Schritte im Vollverarbeitungsmodus (insb. Mitarbeiter‑Schätzung und Kontaktsuche) sind vorerst noch nicht vollständig implementiert.
2025-04-08 08:36:04 +00:00
f31dd63dba v1.4.1 Anpassung Spaltenzuordnung, erneute Suche bei k.A. und Zeilenabfrage im Modus 51
- Wikipedia-Daten werden nun von Spalte L bis R geschrieben (statt von K bis Q).
- Falls Wikipedia-Daten "k.A." liefern, wird eine erneute Suche durchgeführt und ChatGPT soll den Artikel recherchieren.
- Im Modus 51 wird nun abgefragt, wieviele Zeilen verarbeitet werden sollen.
- Konsistenzprüfung mit der Alignment Demo sichergestellt.
2025-04-08 08:10:13 +00:00
10cb0b7881 debug 2025-04-08 05:48:17 +00:00
86fff9272d v1.4.0 Erweiterung Betriebsmodi, robuste ChatGPT-Verarbeitung, Logging-Verbesserungen
- Betriebsmodus wird im Dateinamen integriert (z.B. 02-04-2025_16-51_v14_Modus4.txt)
- Logfile startet mit der Anzeige der gewählten Modus-Auswahl und einer Übersicht der verwendeten Prompts
- Umbenennung der Funktion "validate_article_with_chatgpt" in "process_wiki_verification" (inkl. Prüfung auf "k.A.")
- Neue Funktionen process_employee_estimation und process_employee_consistency zur robusten Mitarbeiterschätzung und -vergleich
- Separates Token-Counting pro Modul (Wiki, Chat, Mitarbeiter) und Ausgabe in Spalte AQ
- Timestamp-Prüfung: Vor jedem Verarbeitungsschritt wird geprüft, ob bereits ein Timestamp gesetzt wurde (sodass doppelte Verarbeitung verhindert wird)
- Weitere Anpassungen in den Betriebsmodi (Modus 1, 2, 3, 4, 5, 51, 6 und Batch-Modus 8) gemäß Abstimmung
2025-04-08 05:20:10 +00:00
d934a026f6 bugfix 2025-04-07 19:10:01 +00:00
614ff003e1 1.4.0 von 4.o 2025-04-07 19:06:22 +00:00
238dddbb82 Bugfix 2025-04-07 19:01:03 +00:00
9e98f1d054 v1.4.0 Erweiterung Betriebsmodi, robuste ChatGPT-Verarbeitung, Logging-Verbesserungen
- Betriebsmodus im Dateinamen ergänzt, inkl. Beginn des Logs mit Modusauswahl
- Funktion 'Chat Vorschlag Wiki Artikel' umbenannt für bessere Lesbarkeit
- ChatGPT Mitarbeiter-Schätzung robust, 'k.A.' wird als fehlender Artikel interpretiert
- ChatGPT Konsistenzprüfung Mitarbeiterzahl mit Begründung für abweichende Werte
- Token-Zählung pro Modul ergänzt für detaillierte Auswertung
- Batch-Modus bleibt bestehen, Optimierung später geplant
- Branchenvorschlag wird immer ausgegeben, unabhängig vom Batch-Modus
- Timestamp-Prüfung integriert, um doppelte Bearbeitung zu vermeiden
- Alle Betriebsmodi geprüft, Modus 1 funktionsfähig bestätigt
2025-04-07 18:50:51 +00:00
639f0c5733 Alignment Update 2025-04-07 12:45:54 +00:00
febe00d213 Bugfix 2025-04-07 12:32:32 +00:00
4d9efa8a70 Alignment Update 2025-04-07 12:19:23 +00:00
1ef10605b2 Headder Aktualisierung 2025-04-07 07:39:05 +00:00
167a03f2e3 Alignment Demo 2025-04-07 07:28:01 +00:00
8f81d31995 Headder Aktualisierung 2025-04-07 07:24:18 +00:00
81bdf6b06c Headder Aktualisierung 2025-04-07 07:20:50 +00:00
2eb52df347 Aignment Demo angepasst 2025-04-06 18:58:47 +00:00
24289150fc 1.3.18: Fixiere verbindliche Spaltenzuweisung in der Alignment Demo für Hauptblatt
Es wurden feste Spaltenzuweisungen im Alignment Demo definiert.

- Die Header werden in Zeile 11200 von Spalte A bis AA gesetzt.
- Nur die für den Hauptprozess relevanten Spalten werden zugewiesen.
- Zusätzliche Spalten (z. B. für Kontakte oder spezifische Verifizierungen) sind bewusst nicht enthalten, da sie in separaten Modi oder zukünftigen Versionen ergänzt werden.
2025-04-06 18:37:04 +00:00
a953ac49da bugfix 2025-04-05 20:04:43 +00:00
d71ecb7f93 Rollback auf 1.3.5
Hier ist eine aktualisierte Version, die alle oben beschriebenen Anpassungen berücksichtigt. Ich habe Folgendes vorgenommen:

Versionsupdate: Die Versionsnummer wurde auf v1.3.16 gesetzt.

Neue Modi integriert:

Modus 8 (Batch-Token-Zählung in Spalte AQ)

Modus 51 (Verifizierung: Nur Wikipedia + Brancheneinordnung in einem Batch-Prozess)

Die bestehenden Modi (1, 2, 3, 4, 5, 6, 7) bleiben erhalten.

Verbesserte Header-Definitionen: Sowohl im Hauptblatt als auch im „Contacts“-Blatt.

Verbesserte Fehlerbehandlung und Logging: Kleinere Anpassungen beim Logging und beim Warten auf Updates.

Im Folgenden findest Du den vollständigen, aktualisierten Code (v1.3.16):
2025-04-05 19:57:55 +00:00
03745c646d bugfix2 2025-04-05 19:03:11 +00:00
b75995309e Modus 51: Zielgerichtete Branchen & FSM-Bewertung; AO/AP/AQ werden aktualisiert 2025-04-05 18:59:08 +00:00
e2aba5e9ac Bugfix 2025-04-04 19:34:13 +00:00
a0e0bd50eb Font changed
font = pygame.font.Font(None, 24)
2025-04-04 17:04:06 +00:00
051e8ada4a V0.1
Labyrinthgenerierung: Es wird ein „perfektes“ Labyrinth erstellt (ohne Schleifen), das dennoch Sackgassen enthalten kann.

Steuerung: Mit den Pfeiltasten bewegst Du den Ball, wobei vor jedem Schritt geprüft wird, ob eine Wand den Weg blockiert.

Timer & Anzeige: Vor Spielstart bleibt das Labyrinth unsichtbar. Erst nach Drücken der Leertaste wird es angezeigt und der Timer startet.
2025-04-04 16:55:47 +00:00
6b631cd80a bugfix 2025-04-04 16:31:42 +00:00
7ce990f929 bugfix 2025-04-04 16:27:48 +00:00
934dc3dbc2 Bugfix 2025-04-04 16:26:40 +00:00
b819a1c226 bugfix 2025-04-04 16:12:21 +00:00
082b3da318 v1.3.17 – Batch-Debug-Ausgabe und Zeilenanzahl-Abfrage in allen Modi
Debug-Ausgabe im Verifizierungsmodus zeigt jetzt die Zeilennummern und Firmennamen des aktuellen Batches.

In allen relevanten Modi wird nun abgefragt, wieviele Zeilen verarbeitet werden sollen (Batch-Modus erwartet Vielfaches von 10).

Alle sonstigen Funktionen bleiben erhalten – die Spaltenpositionen müssen unverändert sein, um den Code nicht anzupassen.
2025-04-04 13:33:46 +00:00
37e0dd92a2 v1.3.16 – Modus 51 Verifizierung in Batch, Spaltenanpassungen für Wiki und Brancheneinordnung
Modus 51 wurde so angepasst, dass im Batch jeweils 10 Einträge aggregiert werden.

Für jeden Eintrag wird aus ChatGPT das Ergebnis verarbeitet:
– Spalte S erhält „OK“ (falls passend) oder bleibt leer.
– Falls ein alternativer Artikel vorgeschlagen wird, wird die URL in Spalte U und die Begründung in Spalte V geschrieben; bei fehlendem Artikel wird in Spalte U „Kein Wikipedia-Eintrag vorhanden.“ eingetragen.

Der Branchenvorschlag (basierend auf den Branchenangaben in Spalte G, H, O, R) wird in Spalte W geschrieben und das Konsistenzresultat in Spalte Y.

Der Verifizierungs‑Timestamp wird in Spalte AO, die Version in Spalte AP und der Batch Token Count in Spalte AQ eingetragen.
2025-04-04 12:54:08 +00:00
16f45d8668 v1.3.15 – Modus 51 Batch-Verifizierung, separate Startindizes, Token-Ausgabe in Spalte AQ
In Modus 51 werden nun jeweils 10 Einträge in einem Batch aggregiert und an ChatGPT gesendet.

Die Antwort wird so geparst, dass in Spalte W der Branchenvorschlag, in Spalte X der Konsistenzstatus und in Spalte Y die Begründung bei Abweichung eingetragen wird.

Zusätzlich wird die Token-Zahl des aggregierten Prompts in Spalte AQ geschrieben.

Es wurden separate Startindex-Funktionen implementiert, um Wiki- und ChatGPT-Runs über unterschiedliche Spalten zu steuern.
2025-04-04 12:19:12 +00:00