Zum Inhalt wechseln

Die neue Ära der Chatbot-Entwicklung 

Technology

21 April 2023 - 4 Minuten lesen

3132 Blog The New Era Of Creating Dedicated Chatbots 416X300
Objectivity’s Data Science Team

Das Data Science Team von Objectivity ist eine Gruppe von Experten, die sich auf maschinelles Lernen, statistische Analysen, Simulationen, MLOps und Datenvisualisierungen spezialisiert haben. Sie widmen sich der Bereitstellung innovativer Lösungen, die dazu beitragen, das Geschäftswachstum in allen Branchen voranzutreiben. 

Das gesamte Team teilt eine Leidenschaft für künstliche Intelligenz und ist immer über die neuesten Fortschritte auf diesem Gebiet informiert. 

Alle Beiträge von Objectivity’s anzeigen

1394 DE Resources Thumbs

Teilen

Das Wichtigste zuerst – dieser Artikel wurde NICHT von einer KI geschrieben. 

Heutzutage ist es schwierig, eine Person in der Softwareentwicklungsbranche zu finden, die noch nichts von ChatGPT gehört hat. Das neue generative KI-Modell hat sich schnell einem breiteren Publikum bekannt gemacht. Mit einem großartigen Verständnis der natürlichen Sprache und einem umfassenden Wissen über vergangene Ereignisse oder enzyklopädische Fakten bietet ChatGPT eine umfassende Verwendung in Gesprächen, die rund um den Globus stattfinden. Die Qualität des Modells wurde bereits in vielen Bereichen bewiesen. Es konnte rein menschliche Aufgaben übernehmen, die Kreativität und Textgenerierung erfordern. 

Der Titel dieses Artikels impliziert, dass die Kernanwendung des generativen Modells von OpenAI, wie der Name schon sagt, ein Chatbot ist. Aus der Sicht eines IT-Softwareentwicklers erscheint die Idee dieses Modell als Motor für alle Chatbots auf Unternehmensebene zu verwenden natürlich und einfach. Leider hat das Konzept mehr als einen Haken: 

  1. Nicht jeder ist naiv genug, vertrauliche Daten zur Verarbeitung an eine Drittanbieter-API zu senden. 
  2. Der externe ChatGPT-Service kostet pro gestellte Frage. 
  3. Der gesamte Service befindet sich außerhalb des Unternehmens, was die Kontrolle über die IT erheblich einschränkt (z. B. gibt es keine Garantie für den Service-Betrieb). 

Bedeutet dies also, dass es nur zwei Möglichkeiten gibt, entweder beim Status quo von Unternehmens-Chatbots zu bleiben oder die Einschränkungen zu akzeptieren und auf das neue Modell umzusteigen? Nein, nicht wirklich. 

Eine dritte Möglichkeit, die Einführung der neuen Qualität von Chatbots voranzutreiben, besteht darin, dass Unternehmen einen domänenspezifischen Chatbot trainieren und hosten. Das mag genauso klingen wie die früheren Lösungen, die vom Training kleiner (0,34 B-Parameter) Deep-Learning-Modelle profitierten. Der Hauptunterschied liegt jedoch in den technischen Details, die von der breiten Öffentlichkeit noch nicht erkannt wurden. 

Zu den wichtigsten technischen Errungenschaften, die den Wandel ermöglichen, gehören: 

  • Die Einführung neuer generativer Open-Source-Sprachmodelle, die größer sein werden (3 oder 7 oder 13 B-Parameter) als ihre Vorgänger, aber immer noch relativ klein im Vergleich zum ChatGPT-Pendant (175 B-Parameter). Die Größe von ChatGPT macht es einem typischen Unternehmen fast unmöglich, ähnliche Open-Source-Modelle dieser Größe zu hosten – während bis zu 60-mal kleinere Modelle machbar wären. 
  • Änderungen im Trainingsparadigma. Die neuen, relativ kleinen Modelle werden für das sogenannte „Instruktions-Feintuning“ vorbereitet. Hinter der technischen Sprache verbirgt sich das Konzept eines neueren Trainingsansatzes, der darauf basiert, dem Modell beizubringen, verschiedene Anweisungen zu verstehen und darauf zu reagieren, die in natürlicher Sprache bereitgestellt werden. Mit anderen Worten, die neuesten Modelle lernen schnell neue Arten von Anweisungen, die in natürlicher Sprache bereitgestellt werden. Die neuen Modelle sollten eigentlich schon „out of the box“ gute Antworten auf allgemeine Fragen liefern können – allerdings werden die Ausgaben aufgrund der Größe der Modelle nicht so spektakulär sein wie die von ChatGPT. 
  • Ein neues kostengünstiges und dennoch qualitativ hochwertiges Verfahren zur Erfassung von Trainingsdaten. Die Idee der „Anweisungsfeinabstimmung“ wäre für unternehmensspezifische Chatbots nicht ohne weiteres anwendbar, wenn es umfangreiche menschliche Arbeit erfordern würde, um die Trainingsdaten zu erhalten. Glücklicherweise haben Large Language Models (LLM) wie ChatGPT bewiesen, dass sie qualitativ hochwertige Trainingsdaten generieren. Im diskutierten Kontext bestehen die Trainingsdaten aus Benutzeraufforderungen oder -fragen, die an das LLM weitergeleitet werden, sowie aus den Antworten, die von dem LLM erhalten werden. Daher kann das Unternehmen eine Reihe von Fragen erstellen, die für die Domäne relevant sind und Antworten auswählen, die über das externe LLM erhalten wurden und seinen Wünschen entsprechen. 

Kurz gesagt, das Verfahren zum Erstellen eines dedizierten Chatbots der „neuen Ära“ besteht aus 1) einer Auswahl eines relativ kleinen Open-Source-LLM, das in der Lage ist, das Regime der „Anweisungsfeinabstimmung“ zu trainieren, 2) dem Erstellen eines Datensatzes von Eingabeaufforderungen bzw. Fragen und Antworten unter Verwendung eines nicht Open-Source-externen LLM und 3) Durchführung des Verfahrens zur „Instruktions-Feinabstimmung“ im Haus. Das resultierende Modell wird weniger allgemein oder auf den trainierten Bereich beschränkt sein. Aber es wird ein höheres Qualitätsniveau erreichen, wenn es darum geht Fragen in natürlicher Sprache zu verstehen und Antworten in derselben Art und Weise bereitzustellen. 

Mögliche Einsatzgebiete von Chatbots ist der Kundenservice, als Webservice-Assistenten und andere. Vielleicht liegt der Schlüssel zum Verständnis der enormen Möglichkeiten, die sich dank der neuen Qualität der diskutierten Technologie ergeben können darin, zu betonen, dass sie auf bestimmte technische, finanzielle, rechtliche und andere Bereiche zugeschnitten werden kann. Um Ihnen nur ein Beispiel für die Art von Spezifität zu geben, auf die ich mich beziehe – es sollte möglich sein, einen hilfreichen Zoofachhändler zu erstellen, der Fragen zur Ernährung von Hamstern beantwortet. Mit anderen Worten, die Grenzen dieser Art von Modellen können so weit erweitert werden, wie es unsere eigene Vorstellungskraft und Kreativität zulassen. 

Wenn Sie mehr über diese Technologie und ihre Auswirkungen erfahren möchten oder eine Lösung entwickeln möchten, die auf die spezifischen Bedürfnisse Ihres Unternehmens zugeschnitten ist, besuchen Sie unsere Webseite über Daten- und KI-Lösungen oder kontaktieren Sie uns direkt. 

1394 DE Resources Thumbs
Objectivity’s Data Science Team

Das Data Science Team von Objectivity ist eine Gruppe von Experten, die sich auf maschinelles Lernen, statistische Analysen, Simulationen, MLOps und Datenvisualisierungen spezialisiert haben. Sie widmen sich der Bereitstellung innovativer Lösungen, die dazu beitragen, das Geschäftswachstum in allen Branchen voranzutreiben. 

Das gesamte Team teilt eine Leidenschaft für künstliche Intelligenz und ist immer über die neuesten Fortschritte auf diesem Gebiet informiert. 

Alle Beiträge von Objectivity’s anzeigen

Was Sie noch interesieren könnte

Kontakt

Starten Sie Ihr Projekt mit Objectivity

CTA Pattern - Contact - Middle