Glossar | |
---|---|
Schlüsselwörter | Übersetzungstools, Maschinelles Übersetzen, maschinell übersetzen |
Typ | KI-UseCase |
Maschinelle Übersetzungssysteme stellen mehr oder weniger ein Teilbereich der Dokumentenanalyse dar, mit dem Unterschied, dass sie nicht darauf ausgelegt sind, nützliche Informationen oder Erkenntnisse zu extrahieren. Sie konzentrieren sich ausschließlich auf die Übersetzung von Texten von einer Sprache in eine andere.
Der Fokus liegt darauf, die semantische Bedeutung des Originaltextes beizubehalten und diese in einer anderen Sprache korrekt darzustellen. Daher kann das maschinelle Übersetzen auch ein Bestandteil oder die Voraussetzung für ein Dokumentenanalysesystem sein. Maschinelle Übersetzungssysteme werden u.a. benötigt für technische Dokumentationen ( wie z.B. Bedienungsanleitungen), Kunden-Support und Echtzeit-Übersetzung in Konferenztools.
Die Herausforderungen im maschinellen Übersetzen liegen in der Fähigkeit, Sprache zu verstehen und zu reproduzieren, die voller Nuancen, Idiome, Redewendungen und Kontextabhängigkeiten ist. Sprache ist etwas sehr komplexes und geht über das einfache „Wörterbuch-Übersetzen“ hinaus. Die Komplexität im Verständnis liegt zum einen %%an der sehr schnellen Wandlung von Umgangssprache, weshalb die Bedeutung einzelner Wörter oder Phrasen möglicherweise nicht bekannt ist. Zum anderen müssen in der Zielsprache oft kreative Lösungen für eine passende Entsprechung der Ausgangssprache gefunden werden, um die vielschichtige Bedeutung und die transportierten Informationen abzubilden. Die Anforderungen sind daher nahtlose, präzise, skalierbare, flüssige und menschenähnliche Übersetzungsleistung in einer Vielzahl von Sprachen (im besten Fall inkl. Dialekte) und Textarten.
Das Übersetzen von Sprache setzt das Verstehen voraus. Daher gilt das Natural Language Processing (NLP) und u.a. Large Language Modelle als Voraussetzung für solche Use Cases. Das erlernen der Sprache(n) kann hingegen über verschiedene Lernansätze erfolgen. Allerdings haben sich aus der Erfahrung heraus besonders Ansätze des Deep-Learning als eine sehr natürliche Übersetzung erwiesen, da Sie den gesamten Eingabetext als Einheit („Sequenz“) modellieren und versuchen, den Kontext jedes Wortes in Bezug auf den gesamten Text zu berücksichtigen.
Folgende Lernansätze kommen dabei häufig zum Einsatz: