WiWiEn

Plattform zur Entwicklung KI-basierter Geschäftsmodelle

Computer Vision

Glossar
SchlüsselwörterComputer Vision, Bildverarbeitung, Bildanalyse
TypKI-UseCase

Unter Computer Vision auch als Natural-Image-Processing bezeichnet, versteht man die Verarbeitung von Signalen, die Bilder repräsentieren.

Computer Vision zielt darauf ab, dem Computer das „Sehen“ nach menschlichem Vorbild zu ermöglichen bzw. die Fähigkeit zu geben Standbilder (Fotos) und Bewegtbilder (Videos) zu interpretieren, sowie die darauf basierende Generierung/Synthese von Bildern. Wobei „sehen“ und „verstehen“ für einen Computer nur eine Reihe von Datenpunkten sind, die über spezielle Algorithmen in nützliche Informationen umgewandelt werden können. Ziele im Computer Vision liegen in der Identifikation von:

  • Objekterkennung und -klassifikation (inkl. Szenen- und Kontextverständnis)
  • Bildsegmentierung
  • Erkennung von Gesichtsmerkmalen und -ausdrücken
  • Bewegungserkennung und -verfolgung
  • 3D-Rekonstruktion aus 2D-Vorlagen

Problemstellung & Zielsetzung

Um maschinelles Lernen und Deep Learning auch bei grafischen Elementen zu ermöglichen, müssen Bilder als Daten vorliegen. Computer Vision ermöglicht es komplexe menschliche Aktionen im Multimedia-Stream zu identifizieren wie in Gesundheit, Bildung oder auch dem Transport. Daten werden so gesammelt, um zu verstehen und darauf aufbauend Entscheidungen aus Vergangenem und zukünftigen Annahmen zu ermöglichen.

Mögliche KI-Methodiken

Das Computer Vision wird hauptsächlich über das Deep Learning realisiert. Als besonders genau und geeignet haben sich Convolutional Neural Networks (CNNs) erwiesen.

  • Beim Computer Vision kommen insgesamt Methoden zum Einsatz, welche die Segmentierung, die Klassifizierung und die Objekt-Deduktion umfassen:

- Machine Learning - Überwachung von In- und Output-Daten.

  1. Supervised Learning - Erkennung von Anomalien bzw. Abweichungen von erwarteten Werten in Bildern.
  2. Unsupervised Learning- Erkennung von Strukturen oder Mustern in den Daten.
  3. Instance Based Learning - Vorhersagen auf Basis des Abgleichens von Eingabe-/Datenpaaren.

In Kombination mit anderen Ansätzen lassen sich aus Bilddaten optimale und verbesserte Handlungsstrategien ableiten.

- Deep Learning - Überwachung von In- und Output-Daten auf Basis mehrerer Layer.

  1. Convolutional Neural Networks (CNNs)- für Bildanalysen von Standbildern (Fotos, Grafiken, Diagramme, etc.) und Bewegtbilder (Videos, Live-Streams, etc.).
  2. Recurrent neural network (RNN) - Ermöglichen eine bessere sequentielle Erfassung von Mustern in Daten.

Risiken & Chancen

  • Mangelhafte Lernsätze führen zu falschen Aussagen.
  • Ermöglicht ganz neue Anwendungsfelder wie das autonome Fahren.

Best Practices

Weiterführende Literatur