Technische Aspekte - Datenmenge

Wie Sie schon erfahren haben, benötigen KI-Anwendungen eine große Menge an Daten. Doch wie viele Daten sind überhaupt ausreichend? Die Datenmenge hängt grundlegend von verschiedenen Rahmenbedingungen ab und zwar unter anderem:

Wie daran deutlich wird, ist die Menge an benötigten Daten von Anwendungsfall zu Anwendungsfall individuell und hängt von verschiedenen Faktoren ab. Verallgemeinert kann gesagt werden, dass mit der Komplexität (also mit einer steigenden Anzahl an Eingangsgrößen) des Anwendungsfall auch die Menge an benötigten Daten wächst. Soll eine KI bspw. Entscheidungen in einem Prozess mit einer Vielzahl unterschiedlicher Varianten treffen, sollten dementsprechend auch möglichst viele Daten für all diese verschiedenen Szenarien vorliegen. Nur durch ein ausreichendes Training von verschiedenen Situationen kann das Modell auch auf unbekannte Situationen zufriedenstellend reagieren. Die Modellwahl hat zwar einen Einfluss auf die benötigte Menge an Daten, in der Praxis wird aber eher das Modell auf Grundlage der verfügbaren Datenpunkte gewählt. Mit mehr Daten können komplexere Zusammenhänge festgestellt werden und folglich wird auch ein komplexeres Modell benötigt. Doch die Menge der Daten ist nicht der einzige Faktor, um ein gutes Modell zu bilden. Andere Bereiche wie die Datenqualität können ebenso einen großen Einfluss haben.

Quellen

Wie viele Daten braucht Künstliche Intelligenz?
Dorina Weichert - Lamarr (Juni 2021)