Technische Aspekte - Interne vs. Externe Daten
Unternehmensdaten oder auch generell Big Data können in interne und externe Daten unterteilt werden. Daten, die ein Unternehmen selbst generiert, besitzt oder verwaltet, werden als interne Daten bezeichnet. Mögliche Quellen sind bspw. ERP-Module, interne Dokumente, Sensoren oder andere Möglichkeiten der Datenerfassung, Kundenbestellungen oder auch Website Logs. Unter externen Daten werden hingegen Daten bezeichnet, die ein Unternehmen nicht selbst besitzt oder verwaltet. Solche Daten sind öffentlich oder werden außerhalb des eigenen Unternehmens erzeugt. Externe Datenquellen sind unter anderen Produktionsdaten anderer Unternehmen, soziale Medien, offizielle Statistiken, Wettervorhersagen oder auch öffentlich zugängliche Datensätze, die für maschinelles Lernen geeignet sind. Die Beschaffung solcher Daten kann ggf. kostenpflichtig sein. Für KI-Anwendungen kann es zudem erforderlich sein, über Schnittstellen kontinuierlich oder in bestimmten Intervallen benötigte Daten anzufordern. Beispiele für öffentlich zugängliche Datenquellen:
Quellen
- Was ist Big Data?
Alex Bekker - ScienceSoft (Juni 2018) - Kombination von internen und externen Datenquellen
Erich Kern - Polynorm (o.J.)