Data Warehouse und Data Lake
Ein Data Warehouse ist eine zentrale Datenbank, bei der die Daten aus mehreren Datenquelle zusammengeführt werden. Eine Datenanalyse kann nach einer Aufbereitung erfolgen, nachdem die Daten in ein strukturiertes und striktes Datenmodell eingeordnet worden sind. Das Data Warehouse ist besonders auf die Analyse großer Datenmenge ausgelegt.
Ein Data Warehouse verarbeitet überwiegend strukturierte Daten und wertet diese aus.
In einem Big-Data Umfeld fallen eine Vielzahl an unstrukturierten Daten an. Die Datenmengen sind deutlich größer, deshalb stößt das klassische Data Warehouse an seine Grenzen.
Ein Data Lake bietet dagegen eine sehr hohe Speicherkapazität, um große Datenmengen zu speichern. Die Flexibilität ermöglich, das Daten aus sehr vielfältigen Quellen verarbeitet und auswertet können. Moderne und fortgeschrittene Analyse Verfahren ermöglich dieses. Insofern sind Data Lakes Datenanalyse Plattformen für Big Data Bereich.