Commit Graph

1070 Commits

Author SHA1 Message Date
37e3ba59f6 Chain-of-Thought FSM Pitch Generation (Final)
- FEATURE: Der FSM-Pitch-Prompt wurde grundlegend überarbeitet und implementiert nun einen "Chain of Thought"-Ansatz für drastisch verbesserte Ergebnisse.
- Die KI analysiert nun schrittweise das Geschäftsmodell und die Service-Art, bevor sie einen strategischen, positiv formulierten Pitch generiert.
- Das Ergebnis ist nun eine Kombination aus interner Analyse und einem für die Marketing-Automation optimierten Ausgabesatz.
2025-07-21 08:31:02 +00:00
86f0870b47 Strategic Observation Pitch (Final)
- REFACTOR: Der FSM-Pitch-Prompt wurde final optimiert. Er kombiniert nun die strategische "Pain Point"-Analyse mit einer positiven, beobachtenden Tonalität für die E-Mail-Ansprache.
- Die KI fokussiert sich auf die Implikationen von Service-Prozessen (z.B. Uptime, Qualität), ohne das Unternehmen direkt zu kritisieren.
- Dies stellt den finalen, qualitativ hochwertigsten Stand für die automatische Pitch-Generierung dar.
2025-07-21 08:23:08 +00:00
2f94b51b36 Final Refined & Positive-Toned FSM Pitch
- REFACTOR: Der FSM-Pitch-Prompt wurde final überarbeitet, um eine positive, lösungsorientierte Tonalität für die direkte Kundenansprache zu gewährleisten.
- FIX: Die "FEHLER_DATEN"-Regel wurde gelockert, um die Erfolgsquote bei der Pitch-Generierung auch bei dünnerer Datenlage zu erhöhen.
- Die generierten Pitches sind nun strategisch fundiert UND für die Marketing-Automation geeignet.
2025-07-21 08:12:50 +00:00
67096e440a Refined Data Input for FSM Pitch
- FIX: Die `generate_fsm_pitch`-Funktion in `helpers.py` extrahiert nun korrekt nur den reinen Beschreibungstext aus der Website-Analyse.
- Dies verhindert, dass die KI durch Meta-Informationen (wie "FSM-POTENZIAL") im Prompt verwirrt wird, und verbessert die Qualität der generierten Pitches.
2025-07-21 08:02:59 +00:00
cb6019c7ac Anpassung FSM Pitch
Rolle geschärft: Von "Texter" zu "Lösungsberater", der "Pain Points" findet.
Aufgabe präzisiert: Von "Herausforderung beschreiben" zu "Schmerzpunkt adressieren".
Denkprozess explizit gemacht: Wir geben der KI klare, regelbasierte Anweisungen, wie sie von der Tätigkeit zum geschäftlichen Problem kommen soll.
Ihre Struktur bleibt erhalten: Der Rest Ihrer Funktion (call_openai_chat, Fehlerbehandlung etc.) bleibt exakt gleich. Wir tauschen nur das "Gehirn" (den Prompt) aus.
Modell-Empfehlung: Ich belasse in Ihrem call_openai_chat-Aufruf model="gpt-4o". Für diese strategische Aufgabe liefert dieses Modell signifikant bessere Ergebnisse als gpt-3.5-turbo oder gpt-4o-mini.
2025-07-21 07:38:38 +00:00
f424642b98 helpers.py aktualisiert 2025-07-21 06:53:29 +00:00
598f5956db Balanced Website Analysis Prompt
- REFACTOR: Prompt für Website-Zusammenfassung in `helpers.py` optimiert, um eine ausgewogene Analyse von Geschäftsmodell und Service-Potenzial zu liefern.
- Die KI fasst nun zuerst die Kerntätigkeit des Unternehmens zusammen und bewertet danach gezielt die Relevanz des technischen Außendienstes.
- Das Ergebnis ist nun eine umfassendere und strategisch wertvollere Analyse für die Lead-Qualifizierung.
2025-07-21 06:36:53 +00:00
c5ebe99867 Feat: Add thin content and cookie banner detection
- Enhances the `_scrape_website_task_batch` worker to improve data quality assessment.
- Implements a "Thin Content" check: If the extracted text is less than 200 characters, the URL status is set to `URL_SCRAPE_THIN_CONTENT`.
- Adds a heuristic for detecting cookie banners: If the text is short (< 500 chars) and contains a high density of cookie-related keywords, the status is set to `URL_SCRAPE_COOKIE_BANNER`.
- These new statuses provide more granular insights into scraping issues, allowing for better-targeted reprocessing and quality control.
2025-07-20 19:22:11 +00:00
36a2e8ebfb data_processor.py aktualisiert 2025-07-20 18:22:26 +00:00
e8d7f4b421 data_processor.py aktualisiert 2025-07-20 12:46:55 +00:00
3ba15de979 data_processor.py aktualisiert 2025-07-20 12:42:23 +00:00
5797012bf7 data_processor.py aktualisiert 2025-07-20 12:41:31 +00:00
36ea1477e7 helpers.py aktualisiert 2025-07-20 12:38:45 +00:00
4653116a3b data_processor.py aktualisiert 2025-07-20 12:37:45 +00:00
38974d3961 data_processor.py aktualisiert 2025-07-20 10:43:42 +00:00
72313d701b großes rework, vieles gelöscht
- Refactors the website scraping batch process to fix critical stability issues.
- Replaces multiple redundant and conflicting scraping functions (`_scrape_website_task`, `_scrape_raw_text_task`, `_scrape_and_summarize_task`) with a single, robust worker function: `_scrape_website_task_batch`.
- The new worker function now consistently returns a structured dictionary, resolving the `TypeError` that prevented results from being written to the sheet.
- The main batch function `process_website_scraping_batch` is updated to correctly handle this new dictionary structure, including error states.
- Functionality is now aligned with the single-row processing mode by also fetching meta-details in the batch process, not just raw text.
- The two large, duplicated, and now obsolete `process_website_scraping` functions have been removed to improve code clarity and maintainability.
2025-07-20 09:18:49 +00:00
2cb8fdd0b3 data_processor.py aktualisiert 2025-07-20 08:49:15 +00:00
979ca436c5 data_processor.py aktualisiert 2025-07-20 08:47:54 +00:00
c77cf5c065 data_processor.py aktualisiert 2025-07-20 08:33:21 +00:00
90a99794fa data_processor.py aktualisiert 2025-07-20 08:05:15 +00:00
6e6d78fcde data_processor.py aktualisiert 2025-07-20 07:57:06 +00:00
6b335f8158 data_processor.py aktualisiert 2025-07-20 07:56:31 +00:00
07d8596eb9 data_processor.py aktualisiert 2025-07-20 07:52:24 +00:00
15db01fe61 data_processor.py aktualisiert 2025-07-20 07:48:03 +00:00
3845ad42f5 data_processor.py aktualisiert 2025-07-20 07:46:35 +00:00
ce827a73bd data_processor.py aktualisiert 2025-07-20 07:40:30 +00:00
0b07cb1e50 data_processor.py aktualisiert 2025-07-20 07:21:01 +00:00
4569c71e0d wikipedia_scraper.py aktualisiert 2025-07-20 06:53:02 +00:00
f12b6564e0 Robuste, lineare Wikipedia-Suche
- REFACTOR: Die komplexe, rekursive `search_company_article`-Funktion in `wikipedia_scraper.py` wurde durch eine einfache, lineare Implementierung ersetzt.
- FIX: Der hartnäckige `TypeError` bei der Parameter-Übergabe wurde durch die neue, übersichtlichere Struktur endgültig behoben.
- FEATURE: Die Suche prüft nun intelligent eine Liste von Suchbegriffen und validiert jeden potenziellen Treffer, was die Zuverlässigkeit erhöht.
2025-07-20 06:39:29 +00:00
57ee2d2fb6 wikipedia_scraper.py aktualisiert 2025-07-20 06:34:33 +00:00
12cd240c26 wikipedia_scraper.py aktualisiert 2025-07-20 06:28:43 +00:00
c41b84a44c data_processor.py aktualisiert 2025-07-20 06:04:56 +00:00
c3434c03aa data_processor.py aktualisiert 2025-07-20 06:03:11 +00:00
09c9bf3090 helpers.py aktualisiert 2025-07-20 05:44:56 +00:00
73030d3ed5 helpers.py aktualisiert 2025-07-20 05:35:57 +00:00
815b4cddea data_processor.py aktualisiert 2025-07-20 05:26:00 +00:00
b36b46c691 google_sheet_handler.py aktualisiert 2025-07-20 05:07:03 +00:00
1b04070d2c data_processor.py aktualisiert 2025-07-20 04:47:04 +00:00
b48acba690 data_processor.py aktualisiert 2025-07-20 04:28:51 +00:00
4f2b6247cd data_processor.py aktualisiert 2025-07-19 20:25:35 +00:00
ddd41d523e data_processor.py aktualisiert 2025-07-19 20:24:50 +00:00
9c958c19c1 data_processor.py aktualisiert 2025-07-19 20:23:56 +00:00
d9844b0e3e wikipedia_scraper.py aktualisiert 2025-07-19 20:10:19 +00:00
67c9300de0 data_processor.py aktualisiert 2025-07-19 20:03:28 +00:00
410875c085 data_processor.py aktualisiert 2025-07-19 19:56:18 +00:00
7ffe14bf39 helpers.py aktualisiert 2025-07-19 19:53:33 +00:00
34af35142b Regex anpassung
COLUMN_MAP\["([^"]+)"\]
get_col_idx("$1")
2025-07-19 19:45:01 +00:00
2268306605 data_processor.py aktualisiert 2025-07-19 19:14:16 +00:00
bc761ed783 wikipedia_scraper.py aktualisiert 2025-07-19 19:03:02 +00:00
82496a2df3 helpers.py aktualisiert 2025-07-19 18:45:43 +00:00