Insbesondere wenn Daten aus verschiedenen Quellen stammen und in eine einheitliche Datenbank oder ein anderes Speicherformat integriert werden, ist auf die Einheiten und Bezeichnungen der Daten zu achten.
So ist bspw. bei Gewichts- oder Längenmaßen auf einheitliche Einheiten zu achten (z.B. einheitlich in kg statt g oder in m statt cm). Vor allem Zeiteinheiten können vielfältig dargestellt werden, auch hier ist auf eine einheitliche Darstellungsweise zu achten (z.B. dd-mm-yyyy (01.01.2001) oder dd-mm-yy (01.01.01)).
Die „beängstigende“ Sieben: Herausforderungen von Big Data und deren Lösungswege
Alex Becker - ScienceSoft (Juni 2018)
Zehn Big-Data-Herausforderungen und wie man sie bewältigt
George Lawton - ComputerWeekly (Oktober 2022)