View on GitHub

Today I Learned

Software Engineering Blog

クラウドデータレイクとは何か、どのようなメリットがあるか。

ビッグデータ処理とは、データのソース、サイズ、形式についての制限や想定を設けることなく、データを格納、管理、分析するためのツールとテクノロジー。

ビッグデータ処理の目標は、品質にばらつきのあるデータを分析して高価値のインサイトを生み出すこと。

6つのV

データインフラは、あらゆる形式、サイズ、形状のデータを格納できるだけでなく、このような多様なデータをインポート、処理、活用して価値のあるインサイトを引き出せなければならない。

データの増加と多様性の拡大にスケーリングできるようにならなければならない。

IT部門は、ハードウェアの調達やサポート、OSやアプリケーションのインストールや更新をするためのリソースが必要だった。さらにこれらはスケーリングできなかった。

クラウドコンピューティングは企業のこれらのITリソースの管理を大きく変えた。

クラウドコンピューティングの用語

クラウド化のROI

トラディッショナルなオンプレミスデータウェアハウスの3層構造

オンプレミスデータウェアハウスの問題点

クラウドデータウェアハウスは上記の問題を解決する。

未加工のデータをインポートし、インサイトを生み出すために高価値のデータに変換してから活用する。

クラウドデータレイクアーキtクチャの利点

クラウドデータレイク導入のポイント

クラウドデータレイクアーキテクチャ検討の際の目標