読者です 読者をやめる 読者になる 読者になる

トレジャーデータ(Treasure Data)公式ブログ

トレジャーデータ(Treasure Data)公式ブログです。

トレジャーデータが生きるベストフィットケース7: 3. 単調な定型レポーティング業務はもうたくさんだと思っている 〜その1〜

ベストフィットケース

トレジャーデータはクラウドでデータマネージメントサービスを提供しています。

 

トレジャーデータが生きるベストフィットケースを7つ紹介します。前回までは1と2について紹介しましたが、今回は、3.について解説します。

  1. 何から始めればよいか迷っている
  2. 現場から「即答」を求められる
  3. 単調な定型レポーティング業務はもうたくさんだと思っている
  4. データが散在していて管理できていない
  5. パフォーマンス低下を恐れ、古いデータやテンポラリデータを消している
  6. わかりやすくて視覚にも訴えるレポートを要求されている
  7. 分析の用途以外に、異常を検知する仕組みを導入したい

3. 単調な定型レポーティング業務はもうたくさんだと思っている

毎月の定型レポーティング作りにうんざりしている分析者は今でもたくさんいると思います。

ここでは、すでにTreasure Data Serviceを利用していて、集計のためのデータソースは一元管理され、レポート用のおのおののKPI がバッチクエリーで定時的に集計されていることを前提とします。

「定型」レポーティングは出力するテーブルやチャートは毎回変更がないのですが、それを作るための集計ソースが以下の理由で自動化できない状況が多々あります:

  1. 集計されたデータを Excelなどでピボットテーブルにかけるステップがある。
  2. 最終アウトプットが ExcelまたはPower Pointであるために、集計結果をローカルに集めてこなこなければならない。
  3. 集計結果のソースが異なるために、それぞれ別のアクセス方法でデータにアクセスし、取得してこなければならない。
  4. Google AnalyticsやBIといった統一的レポーティング機能をもつツールは使っているが、個々のレポーティングにアクセス、ダウンロード、張り付けをしなければならない。

Google Spreadsheet

まず、1. 2. の負担を軽減するためのツールとして、「Google Spreadsheet」を紹介します。実は、次のような理由で、Treasure Data ServiceはGoogle Spreadsheetと非常に相性がよいのです:

  1. スプレッドシートへの自動書出、自動更新:Resut Output(集計結果の自動プッシュ機能)がGoogle Spreadsheetに対応。
  2. クラウド to クラウド:クライアントマシンを経由せず、クラウドのみでレポートが作れる。
  3. 必要十分かつ容易なチャートを完備:スプレッドシートからのチャート作成は、実は簡単でしかも多機能。
  4. アドオンによる機能拡張:Google Spreadsheetにはアドオン機能があり、集計機能を拡張するsolverやテーブルをきれいに着色するアドオンによって、より効果的なレポートが作成可能 。

スプレッドシートへの自動書出、自動更新

f:id:treasure-data:20150323103435p:plain

Treasure Data Serviceの管理コンソールのクエリーエディタの設定で、集計結果の書き出し先としてGoogle Spreadsheetを設定できます。

また、ファイル名や、ワークシートがなければ、自動的に作成してくれます。

この設定に加え、Treasure Data Serviceのスケジューリング機能によってデイリーやマンスリーで定期的に自動実行させることができます。

必要十分かつ容易なチャートを完備

f:id:treasure-data:20150323103921p:plain

Google Spreadsheetは、豊富で高機能なチャート機能をもっています。もちろん Tableauなどには劣りますが、基本的なチャートほぼすべて完備されています。

f:id:treasure-data:20150323104146p:plain

さらに、おのおののチャートを描くには、どんなテーブルが必要かをわかりやすく説明してくれます。

Treasure Result Push → Google Spreadsheet で実現できること

後に紹介するTableauのように1つの画面に多数のテーブルやチャートを添えたダッシュボードは作成できませんが、個々のシートにテーブルと複数のチャートを表示し、これをTreasure Data ServiceのResult Pushに応じて自動更新していくことまでは可能です。

いくつかのパターンを見ていきましょう。

時系列データ × トレンドライン

f:id:treasure-data:20150323104808p:plain

集計結果が時系列(デイリー・マンスリーのPVやUU)の場合は、スプレッドシートのトレンドラインが活用できます。

これは日々シートに追記されるデータを自動更新して時系列チャートを表示してくれます。また、マウス操作によって時間範囲の選択がスプレッドシート上で可能です。

集計済データ × 多軸チャート

f:id:treasure-data:20150323104948p:plain

トレンドライン機能は時系列カラムと数値カラムの2カラムからなるシンプルな出力を前提としていますが、もちろん複数のカラムをもつ集計結果に対する多軸チャートを作成することが可能です。

こちらの場合も、レコートの追記分を自動的にチャートに反映させることが可能です。

ピボットテーブル × 多機能チャート

f:id:treasure-data:20150323105232p:plain

スプレッドシートを使う最大のメリットは、ピボットテーブルがオンライン上でできてしまうところです。

書き出されたデータシートに対してピボットテーブルを簡単に作成することが可能です。そして、そのピボットテーブルに合わせたチャートを表示させることができます。

こちらも、更新または追記されるデータシートの範囲を適切に設定しておけば、ピボットテーブル自身も自動更新してくれます。

上図では、アドオンを用いてピボットテーブルにきれいなカラーテンプレートを反映しています。

Google Spreadsheet ←→ Excel 同期

さらに、Insync などのGoogle DocsとMicrosoft Ofificeを同期してくれるツールを導入すれば、ローカルマシンにもレポートを自動更新させることができます!

これは、ExcelやPower Pointベースでレポートを作っている人にとってはたいへん便利な機能ですね。