Wer per Sprache sucht, der findet… oder: Amazon Kendra meets Alexa for Business (Teil 2)

Auf der Hausmesse re:invent hat AWS seinen neuen, Machine-Learning-gestützten Suchservice Amazon Kendra vorgestellt. Der vorangegangene Beitrag hat sich zunächst der natürlichen Sprachsteuerung gewidmet – und Alexa for Business als geeignetes Interface dafür vorgestellt. Nun richten wir den Blick auf Kendra an sich.

Teil 2: „Kendra, informiere mich!“

Amazon selbst bezeichnet Kendra als „hochpräzisen Suchdienst für Unternehmen, der auf maschinellem Lernen basiert“. Im Kern geht es darum, eine eigene leistungsfähige Suchmaschine für verteiltes Wissen und interne Dokumente zur Verfügung zu stellen, die sich mit natürlicher Sprache bedienen lässt.

Nun liegt die Schwierigkeit bei der unternehmensinternen Suche im Gegensatz zur Websuche mit beispielsweise Google darin, dass sich die Daten oft unstrukturiert und in verschiedenen, teils abgeschotteten Systemen befinden. Hinzu kommt, dass Dokumente häufig unterschiedliches Vokabular benutzen und in unterschiedlichsten Formaten vorliegen.

Kendra bietet für jedes dieser Probleme eine Lösung. So werden Daten für Kendra über so genannte Konnektoren verfügbar gemacht. Amazon hat bereits Konnektoren für Dateisysteme, Webseiten, DropBox, Salesforce, SharePoint, relationale Datenbanken und Amazon S3 entwickelt. Weitere Datenquellen können über eine API angebunden werden. Kendra unterstützt unstrukturierte und halbstrukturierte Daten in den Formaten HTML, Microsoft Word und PowerPoint, PDF sowie reine Textformate.

Kendra versteht, worum es geht…

Weil jede Branche auch eine eigene Sprache mit sich bringt, ist Kendra aktuell für 16 verschiedene Branchen optimiert, darunter Schlüsselbranchen wie Telekommunikation, Automotive und zahlreiche mehr.

Zusätzlich nutzt Kendra Deep-Learning-Modelle, um die Struktur, den Inhalt von Dokumenten und – im Gegensatz zu einer klassischen Suche, basierend auf der Häufigkeit eines Suchbegriffs – den Kontext der Frage zu verstehen. Eine Suche nach „Wie ist die Urlaubsregelung?“ wird demnach auch Ergebnisse finden, bei denen es um das Thema geht, ohne dass die Schlüsselbegriffe explizit genannt werden.

…und wird stetig besser

Kendra zu nutzen, bietet zahlreiche Vorteile. Ganz grundlegend, indem der Suchservice die Mitarbeiter und Nutzer befähigt, die Inhalte von Handbüchern, Berichten und Dokumentationen, FAQs und vielem mehr zielgenau zu durchsuchen und unternehmensinterne Fragen selbstständig zu beantworten.

Der Service unterstützt eine Vielzahl von Datenquellen und vereinfacht das Auffinden von Informationen, indem beispielsweise gängige Abkürzungen („AU“, „BAV“) aufgelöst und auch mit branchenspezifischem Wissen verbunden werden – sodass etwa UPS für „Unterbrechungsfreie Stromversorgung“ steht und nicht für den Paketdienstleister oder „BMI“ als Bundesministerium des Inneren“ statt als „Body-Mass-Index“ erkannt wird.

Außerdem wird der Suchservice intelligenter, je länger er genutzt wird. So ermöglicht Kendra die Analyse der gestellten Fragen, um eventuelle Wissenslücken oder weiteres Verbesserungspotenzial aufzudecken und die Qualität der Resultate laufend zu verbessern, da seine Machine-Learning-Algorithmen stetig dazulernen.

Aktuell ist Amazon Kendra noch in der Preview-Phase. So sind etwa noch nicht alle Konnektoren implementiert, und der Service ist noch nicht in allen Regionen verfügbar. Der Rollout ist für 2020 angekündigt.

Weiter in Kürze mit Teil 3: „Alexa, hilf Kendra!
Basics in Teil 1: „Alexa, let’s talk business!

Ben Freiberg ist Senior Data Engineer und ausgewiesener AWS-Experte am *um Standort und AWS Competence Center in Frankfurt.

This post is also available in: Englisch