オンライン動画学習サービス「udemy」で、LookerStudio と BigQuery を使用したデータ活用の講座を受けたので、レポートを書きます。
BigQuery とは?
Google が提供するデータ分析プラットフォーム。数TB以上のデータ量(ビッグデータ)であっても、高速で処理・解析が可能。
その他特長
・サーバーレスで利用可能
・Google Cloud の他のサービスとの親和性が高い
・使用にかかる料金が安い
・無料枠(サンドボックス)で利用可能
※従来の無料枠とは違い、クレジットカードが必要なく、アカウントさえあれば、無料枠内で試すことができる
BigQuery の使い方
サンドボックスで利用していきます。
1.下記URLへアクセス
https://cloud.google.com/bigquery/docs/sandbox/?hl=ja
2.サイトから「[BigQuery]に移動」をクリックし、googleアカウントでログインします。


3.プロジェクトの作成
左上のボタン(画像だとEvoLiNQ-homepage)をクリックし、ポップアップから「新しいプロジェクト」を選択します。


表示された画面から任意のプロジェクト名を入力し、作成をクリックします。

4.データセットの作成
作成したプロジェクト画面の左にあるエクスプローラーから、メニューを開き、「データセットを作成」をクリックします。

データセットの情報を入力するポップアップが表示されるので、任意のデータセットIDとリージョンを選択し、
「データセットを作成」をクリックします。

5.テーブルの作成
エクスプローラーの作成したデータセットから、メニューを開き、「テーブルを作成」をクリックします。

テーブルの情報を入力するポップアップが表示されるので、入力していきます。
【ソース】
テーブルの作成元を選択します。
今回は、csvのサンプルデータを用いてテーブル作成を行ったため、ソースの部分は、アップロードにし、CSVファイルを選択しています。(customers.csv を選択)

【送信先】
テーブルをどこに作成するかを選択します。
プロジェクト名とデータセットは、前項で作成したものを指定し、任意のテーブル名を入力します。

【スキーマ】
スキーマは自動検出を選択します。

【パーティショニング設定】
パーティショニングなしを選択します。

上記を入力後、テーブルを作成をクリックします。

customers.csv から作成したテーブルが表示されます。

プレビューをクリックするとテーブル内のデータを確認することができます。

BigQuery の構成について
BigQueryの構成には、大まかにアカウント,プロジェクト,データセットがあり、最小単位としてテーブルやビューが存在します。

クエリを使用してみる
作成したテーブルに対し、クエリを使用してみます。
テーブル名のタブ横から +ボタン(SQLクエリ)を選択し、無題のクエリを開きます。


表示された領域にクエリ文を書きます。
(画像は、customersテーブルからprefectureフィールドを抽出するクエリ)

※クエリの実行には無料枠のデータ量からデータを使用します。実行前に下記を確認することで、使用されるデータ量を事前に確認できます。

使用されるデータ量を確認し、問題なければ実行をクリックします。

実行すると、クエリ文の下にクエリ結果の欄ができ、結果が出力されます。

LookerStudio とは?
Google が提供する無料のBIツール。UI上の操作でダッシュボードを作成でき、高度なプログラミング技術がなくとも利用可能。
その他特長
・無料で利用可能
・Google Cloud の他のサービス(BigQuery,Googleアナリティクスなど)との親和性が高い
・作成されたダッシュボードの共有が可能
LookerStudio の使い方
1.LookerStudioのURLへアクセス
googleアカウントにログインした状態で、下記URLへアクセスします。
https://lookerstudio.google.com
アクセスすると、LookerStudioのトップ画面が表示されます。

2.レポートを作成する
レポートを新しく作成する場合は、トップ画面の「空のレポート」または「+作成」ボタンをクリックします。

クリックすると、レポート作成に使用するデータを選択する画面が表示されます。

今回はBigQueryの講習で使用したサンプルデータを使用したいので、BigQueryをクリックします。

BigQueryをクリックすると、ログインしているgoogleアカウントに紐づけられたプロジェクトが一覧として表示されます。

今回はBigqueryの講習で使用していたプロジェクトを選択します。

プロジェクトを選択すると、プロジェクト内にあるデータセットが一覧で表示されます。
次にデータセットを選択すると、テーブルの一覧が表示されるので、順を追ってテーブルまでを選択します。

テーブルまで選択後、追加ボタンをクリックします。

クリックすると下記のようなポップアップが表示されるので、レポートに追加をクリックします。

レポートの画面上に選択したテーブルをもとにしたグラフが追加されます。(不要な場合はグラフを選択し、DELETEボタンで削除可能)
右側のデータ欄で選択したテーブルとそのフィールドが表示されていることを確認します。

3.レポート画面の使い方・編集方法
(1)グラフの追加
グラフを追加するには、ツールバー上にある「グラフを追加」をクリックします。

クリックで呼び出されたメニューから任意のグラフを選択します。今回は縦棒グラフを選択してみます。


ディメンションと指標を指定し、グラフを作成します。今回は、店舗ごとの売上をグラフ化します。
ディメンションに「shop_id」,指標に「revenue」を指定します。

指標が「revenue」のままだとわかりづらいので、「合計売上」に書き換えます。


(2)フィルタの追加
グラフに対しフィルタを追加するには、グラフの設定から「フィルタを追加」をクリックします。



(3)コントロールの追加
(2)で追加したフィルタは、ダッシュボード作成時に選択したフィルタで固定されるため、閲覧権限のみの利用者はフィルタを自由に編集してデータを分析することができません。
コントロールとしてフィルタを追加することで、閲覧権限のみの利用者も使えるフィルタが生成されます。
上部のツールバーから、「コントロールを追加」をクリックします。

表示されたリストには入力ボックスや、チェックボックスなどもありますが、ここでは「プルダウンリスト」を選択してみます。

レポート上の置きたい位置をクリックして、プルダウンリストのボックスを追加します。

追加したプルダウンリストをクリックすると、shop_id の一覧が表示されます。
閲覧権限のみを持つ利用者が見た際は、shop_id でグラフをフィルタリングするコントロールとして機能します。
また、右のメニューのコントロールフィールドから、フィルタリングする項目を選択できます。
まとめ
Bigquery と LookerStudio について、初めて触ってみました。
触ってみる前は、Bigquery で取り込んだデータを、LookerStudioに接続した上、ビジュアライズするのは手間なのでは… と勝手に思っていたのですが、UIからクリックして進めていくだけで簡単に接続できたので驚きました。
前回、Tableau も使用してみていますが、より大量のデータを取り扱う場合、無料版のTableau Public だとデータベースとの接続はできず、手元のデータを手動で接続するしかないので、BigQuery + LookerStudio の方が、BigQuery 上でクエリを使用でき、無料でありながら使いやすいと感じました。