トレジャーデータ(Treasure Data)公式ブログ

トレジャーデータ(Treasure Data)公式ブログです。

トレジャーデータ管理コンソールからクエリを実行する

トレジャーデータはクラウドでデータマネージメントサービスを提供しています。

トレジャーデータにサインアップしていただいた全てのユーザーに対して、管理コンソールが用意されております。従来のコマンドラインベースでの操作に比べてこの管理コンソールは操作のわかりやすさ・簡潔さにおいて優れています。

本章ではこの管理コンソールからクエリを実行することを目的として,解説を行っていきます。管理コンソール全体のイントロは以下のチュートリアルビデオをご参照下さい。

New Query 画面

f:id:treasure-data:20141020141724p:plain

トレジャーのクエリ実行画面は上図のように4つのパーツ構成をとります。

  1. 「Query 記述画面」:実行するクエリを記述します。
  2. 「Schedule画面」:定時実行する場合のスケジューリングを行います。
  3. 「Option画面」:参照するデータベース,実行するクエリのタイプを選択します。
  4. 「Result Export画面」:集計結果を外部に出力します。

Query 記述画面

f:id:treasure-data:20141020142119p:plain

トレジャーデータのユーザー皆様は、バッチ処理(Hiveクエリ:SQL-Like Language)が実行できます。例えばあるアクセスログに対してPV,UUを計算するクエリは上記のようなものになります。

Schedule 画面

f:id:treasure-data:20141020142541p:plain

これはその場でクエリの結果を見たいというよりも,クエリを定時時間毎に実行するようなスケジューリングを行いたい場合に,この画面から簡単に設定できます。@daily や @hourly なら選択肢から選択するだけ,細かいスケジューリングはcronのような書式で簡単に登録できます。

Option 画面

f:id:treasure-data:20141020142725p:plain

実行対象のデータベースを選択します。

f:id:treasure-data:20141020142753p:plain

続いて実行するクエリのタイプを選択します。スタンダードユーザーはバッチ処理系である Hive と Pig を使用できます。さらにオプションを契約していただくとアドホック処理エンジンである Presto を使用する事が可能です。

バッチクエリとアドホッククエリの違いについては以下の記事を参照下さい。

さらにアドホッククエリであるPrestoに興味のある方は以下の記事を参照下さい。


Result Export 画面

f:id:treasure-data:20141020143257p:plain

実行したクエリは,コンソール上に出力→CSVダウンロード,という形で簡単に取得できますが,その他にもたくさんの外部ソースに結果のプッシュ(出力)が可能となっております。

f:id:treasure-data:20141020143506p:plain

出力先をトレジャーデータとするならばそれは非常に簡単で,出力先のDB名とTable名を設定するだけです。

f:id:treasure-data:20141020143630p:plain

また,Tableau Server に直接結果を書き出すことが可能で,これは定型レポーティングの完全自動化を実現するための非常に有効かつ強力な機能です。

実行例

f:id:treasure-data:20141020143819p:plain

上図は最も基本的な設定での実行画面です。記述したクエリをコンソール上で受け取ります。

f:id:treasure-data:20141020143858p:plain

実行中はその進捗が随時出力されていきます。

f:id:treasure-data:20141020143928p:plain

集計が終わり,結果のテーブルが表示されました!

f:id:treasure-data:20141020143956p:plain

この結果をCSVで保存する場合は右上の「Browser Donwload」よりCSVを選択するだけです。

今回はトレジャーデータ管理コンソールから,クエリ実行に関する説明を行いました。機会があれば他の機能についても紹介させていただきます。

 

トレジャーデータに関するお問合せはこちら

お問い合わせ | Treasure Data

 まで宜しくお願い致します。