GA4の「平均値」は幻だよ(初心者むけ記事)

GA4の「平均値」は幻だよ(初心者むけ記事)

先日、a2i主催のセミナー「参加無料!超初心者向け!GA4にログインはできた。その次に何をすればいいかわからない人のためのセミナー。サイト改善の知恵袋付きです。」を視聴しました。私は、まぁ、超初心者ではないのですが、このセミナーにすごく興味があったのです。というのは、「初心者むけ」のセミナーは、はっきり言って難しいんです。

あまり細かいところまで話すと、もちろんオーディエンスはついてこれないし、逆に、アバウトに話すと、「ふーん、で?」となりそうなんですね。なので、何をどこまで話すのかが難しいな、と。で、当日のセミナーは「王道」で話されているなと思いました。初心者むけだけど、押さえるところは押さえる。といった感じです。

講師の井水さん、コーディネーターの森野さんにはご苦労があったと思いますが、良いセミナーだったと思いました。井水さんの話し方が優しいのも良かったですし、森野さんの「合いの手」も良かったですね。若手とベテランのコラボ、、、的な。(^^) お疲れ様でした。

で、そのセミナーの中で「指標の意味合いをちゃんと捉えるのは、初心者であっても大事ですよ」というお話がありました。この記事は、それにインスパイヤされてのものです。ですので、この記事もGA4の初心者さん向けの記事です。

 

GA4の「平均値は幻」を検証する「アクティブユーザーあたりの平均エンゲージメント時間」とは?

ブロク記事タイトルの「GA4の平均値は幻」とはどういう意味でしょうか?具体例で説明したいと思います。

取り上げる指標はなんでも良いのですが、「アクティブユーザーあたりの平均エンゲージメント時間」にします。この指標は皆さんのGA4にも必ずあります。確かめたい方は、自社のGA4で以下の操作をしてください。

  • GA4にログイン
  • 左列の「レポート」をクリック
  • 左列の「エンゲージメント」の配下にある「ページとスクリーン」をクリック

もし、うまく見つからなかった場合は、デモアカウントを利用しましょう。GA4のデモアカウントで、上記の操作を行うと、以下の画面になります。赤枠で印を付けたところが「アクティブユーザーあたりの平均エンゲージメント時間」という指標です。

 

 

この指標は、「エンゲージメント時間」という、ユーザーがページを表示していた時間を、「アクティブユーザー数」で割って求めた平均の指標です。たとえば、全員が「アクティブユーザー」だとして、以下のAさんからEさんの5人が、Homeというページを、以下の秒数だけ見てくれたとします。

  • Aさんが10秒
  • Bさんが18秒
  • Cさんが15秒
  • Dさんが14秒
  • Eさんが8秒

すると、ページを見た時間(≒エンゲージメント時間)が合計で65秒、アクティブユーザーは5人なので、アクティブユーザーあたりの平均エンゲージメント時間は13秒(65秒÷5人)となります。ここまでは、いいですね。

初心者さん向けを想定しているので、かなりざっくり説明しています。もっと正確な定義を知りたいよ。という場合には以下のリンクで、一次情報(=Googleが発信する情報)をご確認ください。

ユーザーエンゲージメントの定義:https://support.google.com/analytics/answer/11109416?hl=ja
アクティブユーザーの定義: https://support.google.com/analytics/answer/12253918?hl=ja

 

GA4の「平均値は幻」とは

では、GA4の裏側にある詳細なデータが入手できるこのサイト(kazkida.com)の2024年10月の例で、何が幻なのかを説明します。

まずは、以下に貼り付けたGA4のレポートを見てください。注目してほしいのは赤枠のページです。ページタイトルが「Looker Studioのファネルチャートでスクロール率を可視化してみた」というページの「アクティブユーザー」は330人、そして「アクティブユーザーあたりの平均エンゲージメント時間」は36秒となっています。

これを見ると、普通は「330人全員じゃないにしても、多くの人が30秒以上はページを見てくれたんだね」と解釈します。

 

 

どうでしょう、30秒以上40秒未満このページを見てくれたユーザーは、330人のアクティブユーザーのうちの、何%くらいいると思いますか?半分くらいいるでしょうか?6割くらいでしょうか???

実際に検証してみると、「30秒以上40秒未満」このページを見てたのは、330人のアクティブユーザーのうち、わずか19人、率にして5.8%のユーザーだけでした。(赤枠)

そして、30秒未満しかこのページを見ていないユーザーがなんと、7割近くいたのです。(水色枠)

 

ですので、「アクティブユーザーあたりの平均エンゲージメント時間」が36秒だから、「このページが36秒見られた」とは、まったく言えないことが分かります。つまり、この「36秒」は幻なのです。

 

なぜ平均値が幻になるのか?

では、なぜ平均値が幻になってしまうのでしょうか?

それは、分布が歪んでいて、「右に長い(右に裾を引いた)」形になっているからです。「Looker Studioのファネルチャートでスクロール率を可視化してみた」というページの、個々のアクティブユーザーの「エンゲージメント時間」を平均せずに、ヒストグラムで表示したのがこちらです。X軸が10秒単位での「階級」です。Y軸がアクティブユーザー数です。

 

このヒストグラムからは、多数の「30秒未満しかページを見なかったユーザー」に混じって、小数ではあるが「660秒、760秒、870秒といったものすごく長い時間このページを見ていた(ように記録されている)ユーザーがいる。」ということが分かります。そして、それら小数のユーザーのために、平均値が時間の長い方に引きづられているのです。

 

ではどんな指標で判断するべきか?

平均値が幻だとすると、ユーザーがあるページを見た時間の長さを知るためにどのような指標を使えば良いでしょうか?その問いに対しては統計学的には答えが出ていまして「中央値」ということになります。中央値とは、値(この場合は、アクティブユーザー別のエンゲージメント時間)を小さい順に並べたときに真ん中に位置するユーザーが持つ値のことです。

中央値は、その性質上、外れ値(はずれち)と呼ばれる、非常に大きな値(あるいは小さな値)の影響を受けません。「アクティブユーザーあたりの平均エンゲージメント」の中央値を可視化してみると、22.1秒となりました。22.1秒より短く見たユーザー数と、長く見たユーザー数が同数という意味です。平均値よりはまだ納得がいく値だと思います。

 

まとめ

この記事でわたしが言いたかったことは、次の3点です。

  • GA4で簡単に確認できる「平均値」が代表値(現実を表すのに適切な値)でない場合がある
  • 「平均値」を盲信せず、背後にある「分布」について思いを馳せるとよい
  • 分布を直接確認したり、分布の形状を踏まえた適切な代表値を得るスキルは身につけると良いよね

3番目の「スキル」を身につけるための学習方法についてのリソースを「宣伝」欄に貼っておきますので、よろしければ見てください。

 

宣伝

(ここから宣伝です)というわけで、GA4は多くの場合「平均値」しか出してくれません。背後にある分布を確認する方法や、他の集計値が代表値である可能性を検証する方法は与えてくれないのです。そこで、もし、そうしたことをしようとすると、GA4のデータをBigQuery(Googleが提供するデータベースサービス)にエクスポートし、BigQuery上のデータに対してSQL文を記述して整形し、BIツール(本ブログ記事で利用したのはTableau)で分析することが必要になります。

なら、SQLを勉強したいよ。Tableauを勉強したいよ。

そう思った方に自信をもって紹介できる学習用の良い動画講座があります。1000件を超えるレビューを頂き、5点満点中4.6点と、お陰様で評判も良いようです。よろしければどうぞ。(画像をクリックするとUdemy.comにジャンプします。)

 

え?SQLは本で勉強したい?なるほど、では、こちらをどうぞ。クリックをするとアマゾンにジャンプします。

(本記事執筆時点で、レビューが39件、評点4.6/5 です)

 

Tableauを学べる講座はこちらです。「最高評価」とか、「ベストセラー」をいただいています。いずれも、クリックすると、Udemy.comにジャンプします。