読者です 読者をやめる 読者になる 読者になる

トレジャーデータ(Treasure Data)公式ブログ

トレジャーデータ(Treasure Data)公式ブログです。

データ分析で大切な4つのこと:3. 一人で全部背負わない事の大切さ

データ分析で大切な4つのこと

トレジャーデータはクラウドでデータマネージメントサービスを提供しています。

 

3. 一人で全部背負わない事の大切さ

このブログで何度も何度もお話してきましたことですが,一口に分析といっても,それはログ収集から可視化までの様々なレイヤーを下から積み上げていかないといけません。

f:id:doryokujin:20141022141113p:plain

もしも分析者がそれを一人で全て担うとしたら,これは大変なことです。

分析者がデータを集めて、解析して結果を出す、その仕事を全て1人で背負う事は非常に大変なことであり、あまり良くないことだと感じています。私も現在のポジションとは違う,特定のサービス専任の分析者であった時には「全てを自分でやってどんどん良い結果を提示していかないといけない」と気負いがありましたが,だんだんとその困難さに気付くようになってきました。

日々増え続け・変わり続けるサービスの全てを把握するのは困難

周囲に助けを求められない分析者は,自社・あるいは顧客先のたくさんのサービスの解析を一手に引き受けなくてはなりません。そして特にWebサービスにおいては非常に早いペースでサービスがリリースされ・絶えず変更されていきます。サービスの全ての内容・特徴・構造,またはログ周りに関するプログラム・データベースのテーブル構造を全てのサービスで把握して解析を行うことは実質不可能です。

既存の分析プラットフォームの導入というコストで,分析者の負担軽減を行う

上の分析レイヤー図で言えば,本来分析者に期待しているレイヤーは 4. 5. の分析・可視化の部分だと思います。そしてこの上 2 つのレイヤーは分析者の経験やナレッジが生きる,人間依存の部分です。

逆に,データ収集ツールや蓄積する器,分析クエリエンジンといったレイヤーは,既に多くのプラットフォームがクラウド上で提供してくれているものであります。逆にこれらプラットフォームを自社用に一から構築することはほとんどの場合,余計なコストとリソースを消費します。分析者が本来の役割・領域で能力をいかんなく発揮してもらうためには,下層分析レイヤーは既存のプラットフォームサービスの導入というコストをかける事で分析者の負担を減らしてあげることが重要です。

最も優秀な解析者になり得るのは実はサービスを作った人である

これも経験から感じている事ですが,いくら分析の専門技術を持っていたとしても

実際にサービスを作った人の持つ仮説検証能力やデータの読み取り能力には敵わない

ことが多々あります。分析者は素直にこの部分を認め,「サービスを作った人にも分析に協力してもらう」,「彼らにはないより科学的な見地で解析を行う」ことが負担を減らす意味でも,良い分析を遂行する意味でも非常に重要なことだと思います。

とにかくヒアリングやディスカッションを行いましょう。得られた分析データはすぐに彼らに提示して意見を聞きましょう。彼らに自分が役に立つ存在として認めてもらう努力をしましょう。分析者の存在価値はどれだけ意思決定者に認めてもらえているか,ということと同義です。

エンジニアにもっと協力してもらう

分析の元となるログを出してくれるのはインフラエンジニア、アプリケーションエンジニアの人たちです。ログのレコードの意味がわからない所が出てきたり,追加として取得して欲しい項目があったり,エンジニアの所へ相談にいくことが日常良くあります。また,データベースのどのテーブルに,どういう形でデータが記録されているのか,も独力で全て把握するのは困難です。また,これらを自分ひとりだけで頑張って追っていくのは時間の無駄です。そいういう部分はしつこいと思われても割り切って,どんどんエンジニアに聞く方がよいと思っています。

もちろん相手の手をわずらわせないために,どういうデータが見たいのか,あるいはどういう目的で新たな項目を記録して欲しいのか,といった目的・リクエストをわかりやすく伝える努力はとても重要です。

分析者がチームの橋渡し役となる

一般的な現場では意思決定者(=CxO,ディレクター,マネージャー)とエンジニア(ログの源泉)が密に意思疎通を行う事は少ないと思います。そして分析者だけが,彼らの橋渡し役となり,最強のデータドリブンチームを産み出すことができるのです。