Natural Language Processing (NLP)
Glossar | |
---|---|
Schlüsselwörter | Natural Language Processing, NLP, Natürliche Sprachverarbeitung |
Typ | KI-Methode |
Das NLP befasst sich hauptsächlich mit der Struktur und Form von Sprache, einschließlich der Grammatik. Es geht darum die Regeln und Prinzipien zu fassen, wie Sätze in einer bestimmte Sprache gebildet und formuliert werden.
Es gibt daher nicht den „einen“ NLP-Ansatz der es ermöglicht Sprache zu generieren. Vielmehr gibt es eine Vielzahl verschiedener Ansätze die kombiniert werden müssen, um für einen spezifischen Anforderungsbereich den notwendigen Sprachgebrauch anwenden zu können. Zum Beispiel können im Rahmen des NER-Ansatzes Entitäten nur zugeordnet werden, wenn zuvor durch den POS-Ansatz die Nomen (oder Nominalphrasen) in einem Satz identifiziert wurden.
Die Umsetzung der einzelnen Ansätze erfolgt wiederum je nach Aufgabe und Umfang des Anforderungsbereich über verschiedene Lernmethoden der künstlichen Intelligenz.
- Regelbasiert - für vordefinierte Antworten für einfach Sachverhalte (z.B. FAQ).
- Machine Learning - für komplexere Sachverhalte wie stimmungsabhängiger Satzbau.
- Deep Learning - für komplexe Sachverhalte stimmungsabhängiger Satzbau in unterschiedlichen Sprachen.
NLP-Ansätze
Wortart-Annotation/ part-of-speech tagging (POS)
Der POS-Ansatz kennzeichnet Wortarten in einem Satz. So können z.B. Nomen, Verben, Adjektive, Adverbien, etc. in einem identifiziert werden. Diese Informationen können in Kombination mit anderen NLP-Ansätzen sehr nützlich sein, da sie mehr die Rolle jedes Wortes in einem Satz bzw. dem Kontext liefert.
Syntaktisches Parsen/ Syntactic parsing
Dieser Ansatz bezieht sich ebenfalls auf die Satzstruktur und analysiert die grammatikalische Satzstruktur. In einem sogenannten „Parse Tree“ werden Wörter die in Beziehung zueinander stehen dargestellt, wie z.B. die Zugehörigkeit von einzelnen Verben zu Nomen. Dies ist z.B. besonders nützlich in Übersetzungsaufgaben.
Eigennamenerkennung/ named entity recognition (NER)
Der NER-Ansatz identifiziert sogenannte „Entitäten“. Dabei handelt es sich um das Zuschreiben von Elementen in einem Satz, wie z.B. Person, Organisation, Ort, Datum, etc.
Koreferenzauflösung/ coreference resolution
Der Ansatz der Koreferenzauflösung analysiert die Beziehung von Ausdrücken auf gleiche Entitäten. Zum Beispiel in dem Satz „Herr Mustermann sagt, dass er keine Ahnung von Satzstrukturen hat“, beziehen sich „Herr Mustermann“ und „er“ auf dieselbe Entität „Person“.
WEITERFÜHRENDE LITERATUR
- Understanding natural language understanding. (2014)
Bill MacCartney