トレジャーデータ(Treasure Data)公式ブログ

トレジャーデータ(Treasure Data)公式ブログです。

Login(アクセス)ログからわかる12の指標 その2

*トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。

「Login(アクセス)ログからわかる12の指標 シリーズ」

前回(その1)の続きです。

6. Frequency(リピート回数の分布)

特定期間におけるユーザー当たりの訪問回数の分布を見たものです。

SELECT uid, COUNT(1) AS cnt
FROM
(
  SELECT uid
  FROM login
  GROUP BY uid
) T
GROUP BY uid
ORDER BY cnt

 

f:id:treasure-data:20140507133618p:plain

7. 継続期間の分布(単位:週)

ユーザー当たりの最初のログインと最後のログインの差をとることで,ユーザーの継続期間の分布を見る事ができます。

SELECT
  CAST( play_term/7 AS BIGINT ) AS play_term_by_week,
  COUNT(1) AS uu
FROM
( SELECT uid, 
    CAST( (MAX(time) - MIN(time)) / 86400 AS BIGINT ) AS play_term
  FROM login
  GROUP BY uid
)t1
GROUP BY 
  CAST( play_term/7 AS BIGINT )
ORDER BY play_term_by_week ASC

f:id:treasure-data:20140507134344p:plain

8. 継続期間の分布(単位:日)

SELECT
  play_term,
  COUNT(1) AS uu
FROM
( SELECT uid as uid, 
    CAST( (MAX(time) - MIN(time)) / 86400 AS BIGINT ) AS play_term
  FROM login
  GROUP BY uid
)t1
GROUP BY play_term
ORDER BY play_term ASC

f:id:treasure-data:20140507134542p:plain

9. 直帰率

直帰率とは外部ページから流入したものの,内部ページへ進まなかった(離脱した)ユーザーの,アクティブユーザー数に対する割合をみるものです。

(注)ここでは少し意味を変えて,デイリーでの集計で全ログイン回数に対して1回しかログインしなかったユーザーの割合を直帰率と呼ぶことにします。

SELECT t2.d AS d,
  COUNT(1)/SUM(t2.cnt)*100 AS bounce_rate
FROM
(
  SELECT
    TD_TIME_FORMAT(time, 'yyyy-MM-dd', 'JST') AS d,
    uid,
    COUNT(1) AS cnt
  FROM login
  GROUP BY
    TD_TIME_FORMAT(time, 'yyyy-MM-dd', 'JST'),
    uid
) t1
RIGHT OUTER JOIN
(
  SELECT
    TD_TIME_FORMAT(time, 'yyyy-MM-dd', 'JST') AS d,
    COUNT(DISTINCT uid) AS cnt
  FROM login
  GROUP BY
    TD_TIME_FORMAT(time, 'yyyy-MM-dd', 'JST')
) t2
ON ( t1.d=t2.d )
WHERE t1.cnt < 2 AND 0 < t2.cnt
GROUP BY t2.d
ORDER BY d ASC

f:id:treasure-data:20140512095246p:plain

Metric Insights

トレジャーデータでは上記の指標を一覧するためのダッシュボード:Metric InsightsをOEM提供しています。

f:id:treasure-data:20140501161331p:plain

Treasure Data Platform で始めるデータ分析入門 〜7. Data Visualization 〜 Metric Insights - Treasure Data JP 公式ブログ 

トレジャーデータに関するお問い合わせは support@treasure-data.com まで。