Künstliche Sprachassistenz - Die nächste Generation der Social Tools
Der ein oder anderen Person könnte dieser Artikel vertraut erscheinen, hatten wir doch im Service Provider für die interne Kommunikation vom Beyond Guide einen Beitrag zu den Einflüssen von künstlicher Sprachassistenz verfasst. Für alle, die neu dabei sind, rollen wir das Thema frisch und in erweitertem Umfang auf.
Gewohnheiten und Handlungen - ein Duo, dass im Privatleben und am Arbeitsplatz gleichermaßen anzutreffen ist. Haben wir eine Anwendung erst einmal angenommen und in den Kreis der täglichen Tools aufgenommen, so wie Word, PowerPoint oder Excel, fällt ein Wegdenken schwer. Auch die Vorstellung neuer Tools ist zu Beginn heikel – so wie die Frage zum „Nutzen oder Nicht-Nutzen“ von künstlicher Intelligenz.
Die Antwort auf die Frage lautet einer ifo-Umfrage zur Folge nach „Ja“ – 13,3 % der in Deutschland ansässigen Unternehmen nutzen KI im Jahr 2023. Im Kontrast: Im Jahr 2019 setzen laut Bundesministerium für Wirtschaft und Energie 5,5 % der Unternehmen auf die Technologie. Nun rückt eine Komponente verstärkt in den Fokus: die sogenannten „Voice Assistants“ (VA) als Novum der Social Tools. Weg vom Text, hin zu Klang und Stimme. Was das bedeutet und wie das Unternehmen Meta mit Llama 3 die KI-Welt aufmischt und worum es sich bei vimGPT handelt, jetzt im Blog.
Voice Assistants – klangvolle Unterstützung
Worum es sich bei Sprachassistenten handelt
Siri, Alexa oder der Google-Assistent sind alte Bekannte. Per Sprachsteuerung ein Lied auswählen ode Video öffnen ist derart gewohnt, dass es als Tätigkeit selten wahrgenommen wird. Ganz anders verhält es sich mit den „neueren“ KI-Tools wie ChatGPT von OpenAI, Gemini von Google (ehemals Bard) oder Claude von Anthropic – all jene sind neuwertige Entwicklungen und Tools, die sich am Setzen sind.
Seit ChatGPT 2022 zu Aufmerksamkeit gelangte, steigen auch die Forschungen zu generativen KI-Integrationen. Ein Fokusfeld: Sprachassistenten, die mit KI angetrieben werden. Alexa, Siri, der Google-Assistent oder Microsofts Cortana – sie alle existieren bereits und werden rege genutzt. Insbesondere „Smarthome Devices“ für intelligente Gebäude erfreuen sich großer Beliebtheit. Weltweit wird die Nutzung von Sprachassistenten bis zu Jahr 2024 auf 8,4 Milliarden Nutzende eingeschätzt.
Der Nutzungsstand im Jahr 2022 beträgt 54 % für Deutschland. In der Erhebung enthalten sind sowohl Personen, die VAs täglich als auch mindestens einmonatlich verwenden.
Multi-Modal-Modelle und künstliche Sprachassistenz
Die Kosten zur Entwicklung und dem Einsatz von multifunktionalen Sprachassistenten sind mit hohen Investments verbunden und an Zusammenarbeit mit Marktführern wie bspw. Google geknüpft. In kurzer Zeit haben sich neue Entwicklungen im Bereich KI aufgetan:
- April 2023: Microsoft wagt sich an eine Synkrise aus KI-Modellen und lanciert ein Open Source KI-Projekt namens „JARVIS“, dass LLMS und ML verbindet. Eine Integration von Sprachassistenz ist (noch) nicht vorgesehen.
- September 2023: Meta kündigt KI-Chatbots mit Persönlichkeit an. Diese spezialisieren sich auf selektierte Themen oder können für den Versand von Nachrichten genutzt werden – Ziel ist die Interaktion.
- Februar 2024: vimGPT geht in die Testphase und ist der erste (uns bekannte) AI-Voice-Assistant. Die Sprach-KI basiert auf dem GPT-4V-Modell von OpenAi. Der Entwickler Ishan Shah gibt in einem Interview mit Wired an, dass er für die Zukunft weniger Klicken und mehr mündliches Chatten in Kombination mit Computern voraussieht.
- April 2024: Den nächsten Schritt auf dem Entwicklungsweg von künstlicher Intelligenz setzt das Unternehmen Meta: Mit Llama 3 existiert nun eine KI, die in der Lage ist, auf aktuelle Suchergebnisse im Internet zuzugreifen. Zusätzlich testet das Unternehmen seit 2024 die Bild- und Bewegtbildgenerierung. Verfügbar ist die KI aktuell in den USA und weiteren Ländern, für Deutschland ist diese noch nicht erhältlich.
Mit vimGPT nähern sich LLM wie ChatGPT und Sprachassistenten wie Siri und Alexa immer stärker an. Entwickelt wurde vimGPT, um komplexe Aufgaben speziell im Zusammenhang mit dem World Wide Web zu verrichten. Aktuell befindet sich der experimentelle AI-Voice-Assistant nicht in offizieller Produktentwicklung. Da es sich jedoch um ein Open-Source-Projekt handelt, sind zukünftige Produkte seitens der „Big Player“ zu erwarten.
Vorteile von künstlicher Intelligenz
KI im Jalios Digital Workplace
Multinetworking oder Sprachsuche: Informations-Overloads dezimieren und per Sprachsteuerung das Wichtigste summieren. Eine E-Mail direkt in den Laptop sprechen und nur noch Gegenlesen und auf Senden drücken – KI-gesteuerte Sprachassistenzen können viele Vorteile verschaffen. Für die Zusammenarbeit ist der schnelle Austausch nach wie vor über den Chat möglich, jedoch durch das gesprochene Wort, statt die Tastatur. Für Personen mit geringer Literalität kann dies potenziell zu einer höheren Nutzung und vermehrten Austausch führen und somit die Zusammenarbeit beeinflussen. Doch auch für das effiziente, reibungslose Arbeiten sind Vorzüge im Gepäck: eine Nachfrage zu im Affekt relevanten Themen oder die Recherche durch die Sprachsuche – was die Zukunft der KI-gesteuerten Vas für den Arbeitskontext bringt, bleibt abzuwarten. Auch rechtliche Regularien, technische Möglichkeiten oder die Form der Arbeit (Home-Office, Großraumbüro) beeinflusst die künftige Entwicklung.
Bei Jalios wird KI bereits in den digitalen Arbeitsplatz mit eingebunden – sei es für die Untertitelung von Videos, das Zusammenfassen von Chats oder seit 2024 die Erstellung von internen KI-Assistenten. Mit Jalios und dem Digital Workplace wählen Sie den Anbieter für das LLM und wir erledigen den Rest. Der Vorteil von den kombinierten KI internen Funktionen mit Jalios:
- Nutzung von intern selektierten Dokumenten in jedem Format
- Kein Training
- Rechtemanagement und Verhaltensregeln für den Umgang
- Datenkontrolle
Aktuelle Anwendungsfälle bei Jalios beziehen sich auf die Personalabteilung, das Training von Teams und Neuankömmlingen sowie Chatbots für das Kundenbeziehungsmanagement.
Erfahren Sie mehr über den digitalen Arbeitsplatz und das kombinierte Leistungsspektrum an künstlicher Intelligenz, Effizienz und Zusammenarbeit: https://www.jalios.de/kontakt