View on GitHub

Today I Learned

Software Engineering Blog

1. Big Data: Beyond the Buzz

クラウドデータレイクとは何か、どのようなメリットがあるか。

1.1 What Is Big Data?

ビッグデータ処理とは、データのソース、サイズ、形式についての制限や想定を設けることなく、データを格納、管理、分析するためのツールとテクノロジー。

ビッグデータ処理の目標は、品質にばらつきのあるデータを分析して高価値のインサイトを生み出すこと。

6つのV

1.2 Elastic Data Infrastructure: The Challenge

データインフラは、あらゆる形式、サイズ、形状のデータを格納できるだけでなく、このような多様なデータをインポート、処理、活用して価値のあるインサイトを引き出せなければならない。

データの増加と多様性の拡大にスケーリングできるようにならなければならない。

1.3 Cloud Computing Fundamentals

IT部門は、ハードウェアの調達やサポート、OSやアプリケーションのインストールや更新をするためのリソースが必要だった。さらにこれらはスケーリングできなかった。

クラウドコンピューティングは企業のこれらのITリソースの管理を大きく変えた。

1.3.1 Cloud Computing Terminology

クラウドコンピューティングの用語

1.3.2 Value Proposition of the Cloud

クラウド化のROI

1.4 Cloud Data Lake Architecture

トラディッショナルなオンプレミスデータウェアハウスの3層構造

1.4.1 Limitations of On-Premises Data Warehouse Solutions

オンプレミスデータウェアハウスの問題点

1.4.2 What Is a Cloud Data Lake Architecture?

クラウドデータウェアハウスは上記の問題を解決する。

未加工のデータをインポートし、インサイトを生み出すために高価値のデータに変換してから活用する。

1.4.3 Benefits of a Cloud Data Lake Architecture

クラウドデータレイクアーキtクチャの利点

1.5 Defining Your Cloud Data Lake Journey

クラウドデータレイク導入のポイント

クラウドデータレイクアーキテクチャ検討の際の目標