Alignment Update
This commit is contained in:
@@ -629,7 +629,7 @@ class GoogleSheetHandler:
|
||||
# ==================== ALIGNMENT DEMO (Hauptblatt) ====================
|
||||
def alignment_demo(sheet):
|
||||
new_headers = [
|
||||
[
|
||||
[ # Zeile 1
|
||||
"ReEval Flag", # A
|
||||
"CRM Name", # B
|
||||
"CRM Kurzform", # C
|
||||
@@ -674,7 +674,7 @@ def alignment_demo(sheet):
|
||||
"Version", # AP
|
||||
"Tokens" # AQ
|
||||
],
|
||||
[
|
||||
[ # Zeile 2
|
||||
"CRM",
|
||||
"CRM",
|
||||
"CRM",
|
||||
@@ -719,7 +719,7 @@ def alignment_demo(sheet):
|
||||
"System",
|
||||
"System"
|
||||
],
|
||||
[
|
||||
[ # Zeile 3
|
||||
"Prozess",
|
||||
"Firmenname",
|
||||
"Firmenname",
|
||||
@@ -763,12 +763,103 @@ def alignment_demo(sheet):
|
||||
"Timestamp",
|
||||
"Version des Skripts die verwendet wurde",
|
||||
"ChatGPT Tokens"
|
||||
],
|
||||
[ # Zeile 4
|
||||
"Systemspalte, irrelevant für den Prompt. Wird genutzt um die manuelle Neuprüfung dieses Accounts durchzuführen.",
|
||||
"Enthält den Firmennamen nach bestem Gewissen. Firmennamen sind manchmal herausfordernd, insbesondere was unterschiedliche Schreibweisen, Firmierung, Tochter/Mutterfirmen etc. anbelangt. Zur besseren Trefferquote in der Wikipedia-Suche normalisieren wir den Firmennamen und entfernen sämtliche Firmenformen, wie z.B. AG, GmbH, SE etc.",
|
||||
"Enthält eine manuell gepflegte (normalisierte) Kurzform des Firmennamens, wie auch ein Mensch die Firma nennen würde. Dies bedeutet insbesondere, dass die Firmenform wie z.B. GmbH oder AG aus dem Namen entfernt wird. Meist entspricht die Kurzform den ersten beiden Worten des Firmennamens. Manchmal sind auch Worte nötig, wenn die ersten beiden worte zu wenig Aussagekraft haben. Beispiele dafür sind beispielsweise Firmen wie 'Schmidt & Söhne', bei denen 'Schmidt &' wenig Sinn machen würde, oder 'Philip Morris Tabakwaren' - weil in diesem Fall 'Philip Morris' zu generisch wäre bzw. wenig eindeutig.",
|
||||
"Von uns ermittelte Website des Unternehmens, sofern verfügbar.",
|
||||
"von uns ermittelter Ort des Unternehmens",
|
||||
"Kurze Beschreibung des Unternehmens",
|
||||
"Aktuelle Branchenzuweisung entsprechend unserem Ziel-Branchenschema",
|
||||
"Von Dealfront gelieferte externe Beschreibung der Branche. Diese Branchenbeschreibung sollte in den allermeisten Fällen sehr zutreffend sein und ist vermutlich verlässlicher als die aktuelle Branche aus Spalte F",
|
||||
"Von uns Recherchierte Anzahl der Servicetechniker. Diese ist in den meisten Fällen korrekt. Dieser Wert gilt als guter Lernwert um zu verstehen, wie ein Unternehmen aussieht, das viele bzw. wenige Techniker hat. Dies ist je nach Branche und Art des Unternehmens unterschiedlich. Es gibt Unternehmen, die hauptsächlich auf die Produktion fokussiert sind, bei denen Service nur einen kleinen Anteil am Geschäft ausmacht und wiederum andere Unternehmen, die fast nur von Kundenservice leben (z.B. Dienstleister). Es gibt allerdings keine 100% verlässliche Faustformel. Das System soll später seine eigene Schätzung mit den von uns recherchierten Werten vergleichen, um dadurch selbst zu lernen Unternehmen besser einzuschätzen.",
|
||||
"Von uns recherchierter Umsatz in Mio. €",
|
||||
"Von uns recherchierte Anzahl der Mitarbeiter",
|
||||
"Enthält aus einer alten Recherche Vorschläge für die Wikipedia URL zum Unternehmen. Dieser muss aber nicht stimmen. Sollte als Ausgangs- und Vergleichspunkt für die nachgelagerte Wikipedia-Suche dienen. Der Wert soll mit den üblichen Methoden geprüft werden z.B. kommt die normalisierte Website vor, Ähnlichkeitsprüfung des Firmennamens mit dem Artikelnamen von Wikipedia etc.",
|
||||
"Wikipedia URL aus der Recherche im laufenden Prozess",
|
||||
"Erster Absatz des Wikipedia-Artikels",
|
||||
"Branche aus Wikipedia-Artikel soweit verfügbar",
|
||||
"Umsatz aus Wikipediaartikel soweit verfügbar.",
|
||||
"Anzahl Mitarbeiter laut Wikipedia sofern verfügbar.",
|
||||
"\"Komma-separierte Liste der Kategorien, denen der Artikel in Wikipedia zugewiesen wurde. Hier ist auch häufig eine Branche enthalten, häufig auch noch weitere Informationen etwa zur Gründung, ob sie etwa im DAX gelistet ist etc. Guter Anhaltspunkt zur Differenzierung von Unternehmenseinträgen und Wikipedia-Seiten, die kein Unternehmen beschreiben und fälschlicherweise zugewiesen wurden. \nBei jeder Unternehmensseite MUSS das Wort unternehmen in irgendeiner Art und Weise vorkommen.\nNEGATIVSIGNAL: EHEMALIGES UNTERNEHMEN -> Weist darauf hin, dass das Unternehmen nicht mehr besteht.\"",
|
||||
"\"OK\" wird bei Firmen eingetragen, wo Firma und Wikipedia-Eintrag zusammenpassen. \"X\" wird bei Firmen eingetragen, wo Firma und Wikipedia-Eintrag nicht zusammenpassen.",
|
||||
"Begründung welche Inkonsistenz aus den Daten hervorgeht.",
|
||||
"URL des durch ChatGPT recherchierten Wikipedia-Artikels",
|
||||
"XXX derzeit nicht verwendet, wird vermutlich gelöscht xxx",
|
||||
"Durch ChatGPT ermittelte Branche des Unternehmens",
|
||||
"\"OK\" wird bei Firmen eingetragen, wo die Einschätzung zur Branche mit der CRM Branche übereinstimmt. \"X\" wird ausgegeben, wenn die Einschätzungen nicht zusammenpassen.",
|
||||
"Begründung für Abweichung der Branche von CRM Branche",
|
||||
"\"OK\" wird bei Firmen eingetragen, für die FSM relevant ist, \"X\" für Firmen, für die FSM irrelevant ist.",
|
||||
"Begründung für die Beurteilung in Spalte Chat Begründung für FSM Relevanz",
|
||||
"Anzahl der Mitarbeiter durch ChatGPT geschätzt.",
|
||||
"\"OK\" wird bei Firmen eingetragen, für die Anzahl der Mitarbeiter grob mit der aus Spalte CRM Anzahl Mitarbeiter bzw. der Spalte Wiki Mitarbeiter übereinstimmt. \"X\" für Firmen, bei denen dies nicht zutrifft.",
|
||||
"Begründung für Abweichende Mitarbeiterzahl",
|
||||
"Anzahl der Servicetechniker geschätzt durch Chat GPT",
|
||||
"Begründung für Abweichungen zur Anzahl der Techniker",
|
||||
"Umsatz durch ChatGTP geschätzt",
|
||||
"Begründung für Abweichungen zum Umsatz",
|
||||
"Anzahl der Kontakte die zur Suche Serviceleiter gefunden wurden",
|
||||
"Anzahl der Kontakte die zur Suche IT-Leiter gefunden wurden",
|
||||
"Anzahl der Kontakte die zur Suche Management gefunden wurden",
|
||||
"Anzahl der Kontakte die zur Suche Disponent gefunden wurden",
|
||||
"Timestamp des Zeitpunkts zu dem die Kontaktsuche fertiggestellt wurde",
|
||||
"Timestamp des Zeitpunkts zu dem der Wikipedia-Artikel eingelesen wurde",
|
||||
"Timestamp des Zeitpunkts zu dem die Validierung durch ChatGPT durchgeführt wurde",
|
||||
"Systemspalte zur Ausgabe der Skriptversion die das Ergebnis generiert hat",
|
||||
"Zeigt an, wie viele Tokens für den Request benötigt wurden"
|
||||
],
|
||||
[ # Zeile 5
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Datenquelle",
|
||||
"Wird durch Wikipedia Scraper bereitgestellt",
|
||||
"Wird zunächst nicht verwendet, kann möglicherweise in einem späteren Schritt z.B. zum Vergleich mit der CRM Beschreibung genutzt werden, um auf Textähnlichkeit / Übereinstimmende Worte geprüft zu werden und damit eine Validierung des Artikels zum Account sicherzustellen.",
|
||||
"Wird u.a. zur finalen Ermittlung der Branche im Ziel-Branchenschema genutzt und mit der CRM Branche bzw. CRM Beschreibung Branche Extern verglichen. Stimmen alle drei Einstufungen grob überein, bestärkt dies die urpsrüngliche Einstufung. Laufen diese Branchen weit auseinander, soll, sofern der Wikipedia-Artikel verifiziert ist, die Branche von Wikipedia als zuverlässigste Quelle bewertet werden, danach folgen die CRM Beschreibung Branche Extern und die CRM Branche an dritter Stelle.",
|
||||
"Wird u.a. mit CRM Umsatz zur Validierung des Unternehmens verglichen bzw. zur Bewertung der größe / Einschätzung Anzahl der Techniker bzw. Bewertung der Relevanz für FSM genutzt.",
|
||||
"Wird u.a. mit CRM Anzahl Mitarbeiter zur Validierung des Unternehmens verglichen bzw. zur Bewertung der größe / Einschätzung Anzahl der Techniker bzw. Bewertung der Relevanz für FSM genutzt.",
|
||||
"Wenn Wiki Branche nicht gepflegt ist, wird dieses Feld zur finalen Ermittlung der Branche im Ziel-Branchenschema genutzt und mit der CRM Branche bzw. CRM Beschreibung Branche Extern verglichen. Dabei muss aus dem Feld natürlich die Branche ermittelt werden, die auch hier nicht zwingend eingetragen ist. Stimmen alle drei Einstufungen grob überein, bestärkt dies die urpsrüngliche Einstufung. Laufen diese Branchen weit auseinander, soll, sofern der Wikipedia-Artikel verifiziert ist, die Branche von Wikipedia als zuverlässigste Quelle bewertet werden, danach folgen die CRM Beschreibung Branche Extern und die CRM Branche an dritter Stelle.",
|
||||
"\"Es soll durch ChatGPT geprüft werden, ob anhand der vorliegenden Daten bestätigt werden kann, dass der Wikipedia-Eintrag sicher das Unternehmen beschreibt. Hierzu können sämtliche Daten miteinander verglichen werden. u.a. stimmt die Website überein, ist der Umsatz in einer ähnlichen größenordnung, passt die mitarbeiterzahl etc. Bei allen daten darf eine gewisse Unschärfe zum Vergleich (+-30%) gelten.\n Es muss teilweise etwas großzügig bewertet werden, insbesondere bei Konzernstrukturen, wo oft Töchter keinen eigenen Wikipedia-Artikel haben, aber quasi am Umsatz der Mutter hängen und damit prinzipiell die gleichen Daten zur Bewertung herangezogen werden können wie für die Mutter.\nAbweichungen sollen in der Spalte Chat Begründung Wiki Inkonsistenz begründet werden.\"",
|
||||
"\"Liegt eine Inkonsistenz zwischen gefundenem Wikipedia-Artikel und dem Unternehmen vor, soll dies hier kurz begründet werden.\nWurde der Artikel als unpassend identifiziert, soll Chat GPT selbst einen passenden wikipedia-Artikel zum Unternehmen finden und diesen in Spalte Chat Vorschlag Wiki Artikel ausgeben.\"",
|
||||
"\"Sollte durch die Wikipedia-Suche kein Artikel gefunden werden, oder der Artikel von Chat GPT als nicht zum Unternehmen passend identifiziert werden, soll Chat GPT eigenständig nach einem Wikipedia-Artikel recherchieren. Auch dieser soll die gleichen Stufen zur Qualitätsprüfung durchlaufen wie bei der Wikipedia-Suche üblich.\nDer von ChatGPT gefundene Artikel muss vom als falsch bewerteten Artikel abweichen. Wurde kein passender Artikel gefunden, soll 'kein Artikel verfügbar' ausgegeben werden\"",
|
||||
"XXX derzeit nicht verwendet, wird vermutlich gelöscht xxx",
|
||||
"\"Chat GPT soll anhand der vorliegenden Informationen prüfen, welcher Branche des Ziel-Branchenschemas das Unternehmen am ehesten zugeordnet werden kann. Das Ziel-Branchenschema darf nicht verändert oder erweitert werden, sondern die Vorschläge müssen genau dem Ziel-Branchenschema entsprechen.\nDie Bewertung soll möglichst ohne Abgleich mit der CRM Branche bewertet werden, da diese falsch sein könnte. ChatGPT soll auch die Firmenwebsite und ähnliche Quellen zur Bewertung des Unernehmens heranziehen.\"",
|
||||
"Die durch uns festgelegte Branche in Spalte CRM Branche soll mit der von ChatGPT ermittelten Branche in Spalte Chat Vorschlag Branche verglichen werden.",
|
||||
"Weicht die Branche von unserer Eisntufung in Spalte CRM Branche ab, soll ChatGPT die Abweichung kurz begründen.",
|
||||
"Chat GPT soll anhand der vorliegenden Informationen sowie eigener Recherche prüfen, ob für das Unternehmen der Einsatz einer Fieldservice Management Lösung vorteilhaft ist. Sprich hat das Unternehmen mutmaßlich einen technischen Außendienst bzw. Disponenten die mit der Planung mobiler Resourcen beschäftigt sind.",
|
||||
"Die in Spalte Chat Begründung für FSM Relevanz soll begründet werden.",
|
||||
"Nur wenn kein Wikipedia-Eintrag vorliegt (Wiki URL = \"\") soll ChatGPT auf Basis öffentlich verfügbarer Informationen z.B. durch Auswertung der Firmen-Website herausfinden oder schätzen, wieviele Mitarbeiter das Unternehmen hat. Wenn keine Schätzung möglich ist, soll \"keine Schätzung möglich\" ausgegeben werden.",
|
||||
"Entspricht die durch ChatGPT ermittelte Mitarbeiterzahl der von uns ermittelten (Spalte CRM Anzahl Mitarbeiter) bzw. der durch Wikipedia ermittelten Mitarbeiterzahl (Spalte Wiki Mitarbeiter). Begründung bei Abweichung über +-30% in Spalte Chat Begründung Abweichung Mitarbeiter",
|
||||
"Weicht die durch Chat GPT ermittelte Mitarbeiterzahl erheblich von der Anzahl der Mitarbeiter aus dem CRM (Spalte CRM Anzahl Mitarbeiter) bzw. der von Wikipedia ermittelten Anzahl (Spalte Wiki Mitarbeiter) ab, soll dies kurz begründet werden.",
|
||||
"Chat GPT soll auf basis öffentlich zugänglicher Information eine Schätzung abgeben, wieviele Servicetechniker das Unternehmen hat. Hierzu können auch Querverbindungen zwischen Anzahl der Mitarbeiter, Umsatz, Branche hergestellt werden, um eine möglichst solide Schätzung abgeben zu können. Die Schätzung soll in den Abstufungen 0, <50 , >100, >200, >500 Techniker abgegeben werden. In Entwicklung ist eine Aggegierung von branchenspezifischen Merkmalen (z.B. Umsatz, Mitarbeiterzahl) die für jede Gruppe typisch ist. In weiterer Zukunft kann hierzu möglicherweise auf ein RAG-System (Retrieval-Augmented Generation) zurückgegriffen werden. Abweichungen der Einschätzung von der durch uns ermittelten Anzahl Servicetechniker (die relativ zuverlässig ist) sollen in Spalte Chat Begründung Abweichung Anzahl Servicetechniker ausgegeben werden. Wenn die Einschätzung zu einem ähnlichen Ergebnis kommt, soll \"OK\" ausgegeben werden.",
|
||||
"Weicht die Einschätzung in Spalte Chat Einschätzung Anzahl Servicetechniker von den durch uns recherchierten Ergebnissen in Spalte CRM Anzahl Techniker ab, soll dies begründet werden.",
|
||||
"Nur wenn kein wikipedia-Eintrag vorliegt (Wiki URL = \"\") soll ChatGPT den Umsatz auf Basis seiner Daten oder der Unternehmenswebsite ermitteln. Wenn keine Schätzung möglich ist, soll \"keine Schätzung möglich\" ausgegeben werden.",
|
||||
"ChatGPT soll erhebliche Abweichungen beim Umsatz zwischen Chat Schätzung Umsatz, Wiki Umsatz und CRM Umsatz begründen. Sind alle Umsätze einigermaßen deckungsgleich (+-30%) soll \"OK\" ausgegeben werden.",
|
||||
"\"über SerpAPI wird gemeinsam mit der Kurzform des Unternehmensnamens (Spalte CRM Kurzform) und der folgenden Liste per ODER verknüpfung gesucht.\n- \"Serviceleiter\"\n- \"Leiter Service\"\n- \"technischer Leiter\"\n- \"Service Manager\"\n- \"Leiter Kundendienst\"",
|
||||
"\"über SerpAPI wird gemeinsam mit der Kurzform des Unternehmensnamens (Spalte CRM Kurzform) und der folgenden Liste per ODER verknüpfung gesucht.\n- \"Leiter IT\"\n- \"IT Leiter\"\n- \"Head of IT\"\n- \"IT-Leiter\"\n- \"CIO\"",
|
||||
"\"über SerpAPI wird gemeinsam mit der Kurzform des Unternehmensnamens (Spalte CRM Kurzform) und der folgenden Liste per ODER verknüpfung gesucht.\n- \"Geschäftsführer\"\n- \"Geschäftsführung\"\n- \"GF\"\n- \"CEO\"\n- \"Geschäftsführerin\"\n- \"Managing Director\"\n- \"Geschäftsführender Gesellschafter\"",
|
||||
"\"über SerpAPI wird gemeinsam mit der Kurzform des Unternehmensnamens (Spalte CRM Kurzform) und der folgenden Liste per ODER verknüpfung gesucht.\n- \"Serviceleiter\"\n- \"Leiter Service\"\n- \"technischer Leiter\"\n- \"Service Manager\"\n- \"Leiter Kundendienst\"",
|
||||
"Wenn die Kontaktsuche gestartet wird, wird der erste Eintrag ohne Zeitstempel in dieser Spalte gesucht und die Bearbeitung ab hier forgesetzt. Zeilen die bereits einen Zeitstempel haben werden bei der Bearbeitung übersprungen",
|
||||
"Wenn die Wikipediasuche gestartet wird, wird der erste Eintrag ohne Zeitstempel in dieser Spalte gesucht und die Bearbeitung ab hier forgesetzt. Zeilen die bereits einen Zeitstempel haben werden bei der Bearbeitung übersprungen",
|
||||
"Wenn die ChatGPT Bewertung gestartet wird, wird der erste Eintrag ohne Zeitstempel in dieser Spalte gesucht und die Bearbeitung ab hier forgesetzt. Zeilen die bereits einen Zeitstempel haben werden bei der Bearbeitung übersprungen",
|
||||
"Wird durch das System befüllt",
|
||||
"Wird durch Ticktokens berechnet"
|
||||
]
|
||||
]
|
||||
header_range = "A1:AQ3"
|
||||
header_range = "A1:AQ5"
|
||||
sheet.update(values=new_headers, range_name=header_range)
|
||||
|
||||
print("Alignment-Demo abgeschlossen: Neue Spaltenüberschriften in Zeile 11200 geschrieben.")
|
||||
print("Alignment-Demo abgeschlossen: Neues Spaltenschema in Zeilen A1 bis AQ5 geschrieben.")
|
||||
|
||||
|
||||
|
||||
# ==================== WIKIPEDIA SCRAPER ====================
|
||||
|
||||
Reference in New Issue
Block a user