GCP Handon
アカウント
- GoogleアカウントとプロジェクトはN:N、プロジェクトと支払いはN:1
Compute Engine
- クラウドシェル、もしくはターミナルからアクセスできる
- defaultのネットワークがデフォルト。別リージョンでもネットワークを共有できる
CI/CD
データ分析
- 運用保守に時間がかかるのでGoogle Cloudがインフラを担当するので分析にフォーカスできる
- BigQuery
- 分析のためのエンタープライズ向けDWH
- ペタバイトスケールで便利で高速なSQL
- 暗号化、耐久性、高可用性
- フルマネージドでサーバレス
- プロジェクト配下にデータセット、データセット配下にテーブルが作られる。クエリやデータの入力の単位はジョブ
- ローカルのアップロード上限は10MB
- 一般公開データセットと呼ばれる大きめのデータが用意されている
- バイクステーションの数を調べる
- GCS
- Google Cloud Storage
- 統合型オブジェクトストレージ
- 安全で耐久性のあるデータ保存
- S3のGCP版
- パフォーマンスとコストのバランス
- Multi-Regional
- Regional
- Nearline
- Cloudline
- バケット経由でGCSにデータをアップロードしてBigQueryに取り込む
- AI Platform Nodebooks
- インタラクティブな分析ツール
- マネージドなJupyter notebook
- 「%%bigquery」に続いてSQLを記述するとBigQueryにクエリを投げることができます
- Data Portal
- Webベースのデータ可視化
- BigQueryを含む様々なデータソースへのアクセス
- 美しいレポートも作れる
- レポートをデータソースに接続し、その情報を可視化する。
- 既にデータソースにある情報をレポーティング。可視化に特化
- Dataprep
- GUIベースのデータ準備ツール
- Dataflow上に構築されコードは不要
- trifactaと呼ばれるサービスをGCPベースにインテグレートしたもの