Google Cloud Datalabデータ サイエンティスト生産性を向上させるツール で、 Google Cloud Storage、BigQuery、Machine LearningなどGoogle Cloud Platform利用につながります。
Python や SQL スキルを持つ開発者、Datalab を使用することで、データサ イエンスや機械学習使用を素早く開始し、秘訣を短時間で習得できます。
Datalab 以下場合に役立ちます。
- 元データからインサイトを取 得する。
- 迅、シンプル、かつ費用 対効果高い方法でデータ やインサイトを提示、共同編 集、公開する。
- Jupyter や IPython エコ システムなど多種多様な オープンソース ライブラリを 分析、可視化、機械学習に 使用する。
目次
Toggle特長
統合
Cloud Datalab により、Cloud BigQuery、Cloud Machine Learning Engine、Cloud Storage、Stackdriver Monitoring によるデータ処理が簡単になります。認証やクラウド コンピューティング、ソース コントロールはすぐに使えます。
多言語対応
現時点で、Cloud Datalab では Python、SQL、JavaScript(BigQuery ユーザー定義関数用)がサポートされています。
ノートブック形式
Cloud Datalab は、わかりやすいノートブック形式でコードやドキュメント、実行結果、可視化結果をまとめています。
従量課金
Google Compute Engine VM、BigQuery のクラウド リソースや、Cloud Storage など、利用する追加リソースを使った分だけ課金されます。
インタラクティブなデータの可視化
Google Chart や matplotlib で簡単に可視化できます。
機械学習
scikit-learn に加えて、TensorFlow ベースのディープ ML モデルがサポートされます。Cloud Machine Learning Engine 専用のライブラリでトレーニングや予測をスケーリングします。
IPython サポート
Datalab は Jupyter(旧 IPython)をベースとしているため、統計情報、機械学習などの数多くの既存パッケージを利用できます。また、公開されているノートブックから学んだり、活気ある IPython コミュニティで情報交換したりできます。
オープンソース
Datalab を拡張したい場合、デベロッパーは GitHub ホステッド プロジェクトを fork することができます。プロジェクトに pull リクエストを送ることも可能です。
ユースケース
機械学習モデル構築
「従来機械学習エキスパートを必要 としていた機能を開発者やアナリストが 使用できるようにしたい。ゼロからスター トしたり解説書を読んだりせずに、基礎 的な予測モデルをすぐに構築し、レ ビューやコメントなどユーザー作成コン テンツテキスト分析に使用したい」
- 学習アルゴリズム ライブラリ
- トレーニング データに基づいてモデルを構築し、 新規データに基づいてモデルを評価するため ツールキットやサービスが利用可能
- モデル評価や反復的な調整に使用するインタラ クティブなエクスペリエンス
- サービスとしてモデルデプロイ
データ分析と可視化
「データ アナリストとして、時間や地理 的な場所変化により、データがど ように変化するかを把握したい。また、 これをグラフ化して把握し、そ意味を 他チームメンバーに伝えたい」
- 豊富な可視化ライブラリ
- サードパーティやカスタム可視化機能を広 範にサポート
- 時系列や地理的な場所を考慮した分析機能や レンダリング機能を組み込み済み
- ユーザー セグメントやコンバージョン プロセスを可視化
ビッグデータで使用を開始する
「小規模なチームで開発者として働いて おり、データ分析タスクを任されることが 多い。データを利用して何ができるか や、分析実装までロードマップを簡 単に把握できるようにしてほしい。ツール やサービスを連携させて興味深い結果 が得られるなら、より高度なデータ パイプラインを反復的に構築できる。 データ アナリストやデータ サイエンティス ト役割を担当することが可能になり、 新しいスキルを習得しながら自社に貢献 することもできる」
- 一般的な各種プラグアンドプレイ方式で分析 や可視化
- クラウド プロジェクト統合 – ノートブックや認証 使用を簡単に開始できる
- Google Cloud Storage、BigQuery、DataStore、Cloud SQL コネクタでデータを ノートブックに移動
- エンドツーエンドツールやサービスにより、ロ グやそ他半構化データから構化デー タ分析や可視化までが可能
Datalab を活用する 3 つ方法
ローカルで Docker を実行自身 CPU を使用 ディスクにノートブックを保存
Compute Engine で Docker を実行GCP で処理を実行
GCE ディスクにノートブックを保存
Docker + ゲートウェイ
GCP で処理を実行
ローカル ディスクにノートブッ クを保存
Datalab 料金
Datalab を使用しても、Datalab を実行した際に使用したGoogle Cloud Platform リソース分 以外料金まったく発生しません。
無償でご利用いただけます。