エンジニア

Google Cloud Datalabを触ってみた

投稿日:2015年11月10日 更新日:

今回のエンジニアブログを担当する藤岡です。
宜しくお願い致します。

2015年10月半ば頃ローンチされた、Google Cloud Datalabを触ってみたいと思います。

このサービスはIPython Notebookが活用されており、コードをnotebook上に書き込み実行、可視化をすることが可能です。
ディレクトリ単位でのnotebookファイルの分割が可能なので、データの整理も非常にやりやすいように感じます。

今回は、BigQueryからデータを取り出し、Datalab上での可視化を行います。

1, 導入

お手軽です。

Getting Start
https://cloud.google.com/datalab/getting-started

Cloud Datalab Deployerでサインイン後、Deploy Datalabを押して暫く待つだけです。
Google App Engineへのデプロイを自動で行ってくれます。

Introduction_1
また、デプロイ中にlog(下線部)を押すことでデプロイログを確認することも可能です。
Introduction_2

これでGoogle Cloud Datalabのデプロイが完了しました。
Start DatalabでDatalabの画面に飛べるかと思います。

2, Notebookの作成、準備

datalab_root

上記 + メニューから、Notebookの追加、Folderの追加、NotebookのUploadが可能です。
今回は、notebook/datalab/bigquery_sample配下にnotebookを作成し、データを可視化します。

ちなみに、BigQuery APIを扱うためのtutorialは、notebook/datalab/tutorials/BigQuery配下に配置されております。

3, クエリの作成

では、クエリを投げてみましょう。

下記クエリは、全世界で竜巻(Tornado)が発生した件数を2000年1月から1ヶ月分表示するクエリです。
(publicdata:samples.gsodテーブルのデータをお借りしました)

tornado_occurrence_sql

4, データの可視化

先ほどの竜巻発生件数の可視化を行います。
Pythonでの可視化 & コマンドでの可視化の2パターン実行してみます。

Python
python_plot_1

Command
chart_cmd_plot_1

Datalab上で使うことが出来るBigQuery Commandsのtutorialは
notebooks/datalab/tutorials/BigQuery/BigQuery Commands.ipynbに記載されています。

ワンライナーでもPythonコードでもグラフのプロットが可能です。
ですが、pandas + matplotlibという強力なライブラリを使えるので、複雑なグラフをプロットする場合は、Pythonでコードを書くことになるかと思います。

5, まとめ

BigQueryのデータを可視化するところまで実装してみました。

データさえBigQueryへ入れておけば、Datalab上でKPIデータ、ログデータを整理、運用することが出来るように感じました。
可視化が簡単に行えるので皆様も是非触ってみては如何でしょうか。

採用情報

ワンダープラネットでは、一緒に働く仲間を幅広い職種で募集しております。

-エンジニア
-,

© WonderPlanet Inc.