シフォンケーキの失敗理由をデータで解明⁉ ビッグデータで簡単にユーザーの声を集める方法

シフォンケーキの失敗理由をデータで解明⁉ ビッグデータで簡単にユーザーの声を集める方法

こんにちは、Yahoo!ビッグデータレポートチームのいけみーです。
今回はビッグデータを使って、まるでアンケートやユーザーヒアリングをしたかのようにユーザーの声を簡単に抽出して可視化する方法をご紹介します。

皆さん、仕事をしているとこのような場面に直面することはありませんか?

「発売した新製品の評判や不満を知りたい!」
「リリースしたサービスに対する要望を把握したい」
「隙間ニーズを見つけたいが方法がわからない」

こういう状況ってよくありますよね? このような悩みを解決する手段はこれまでもいくつかありました。 アンケート、SNS分析、サポートセンターへの問い合わせ分析、ユーザーヒアリング、レビューサイト分析などなど。しかしもっと簡単で手間をかけず、リアルタイムに近くて、かつ多くの人の声を集める方法があれば…そんな夢のような課題を解決する手法を作ってみました。

ただし、そのお話をする前に、先にシフォンケーキについてのお話をします。
それはなぜか。シフォンケーキの謎を追求していくことが、最終的に上記の話につながるからです。 ということで、少しお付き合い下さい。

一番失敗しやすい料理ってなんだろう?

ところで、突然ですが一番失敗しやすい料理って何でしょうか? そんな疑問がふと湧いたので、「〇〇 失敗」で検索されている料理系の検索キーワードランキングを出してみたところ、以下のようなランキングとなりました。

(図1)「〇〇 失敗」と検索される料理名ランキング

画像
資料:Yahoo!検索データ(2018年年間)

検索数で2位に5倍以上の差をつけて圧倒的に失敗が検索されている料理、それがシフォンケーキでした。ということで、ここではデータに基づきシフォンケーキがもっとも失敗しやすい料理であると仮定をします。なお、いかにも失敗しやすそうなオムレツやだし巻き卵などはこのランキングに入りませんでした。

次に、いったいどのような失敗がシフォンケーキには多いのかを突き止めましょう。正攻法で行くならアンケートが思いつきますが、かなりの手間とコストがかかります。そこでデータを使ってこの課題を解決してみましょう。
まずは、オーソドックスにシフォンケーキとともに検索されているキーワードの上位を見てみてみるという分析アプローチをしてみましょう。いわゆる第二ワードランキングと呼ばれるものです。検索数が多い上位を見てみることで何か特徴がわかるかもしれません。

(図2)「シフォンケーキ」の検索第二ワードランキング

画像
資料:Yahoo!検索データ(2018年年間)

これにより「シフォンケーキ レシピ」を調べている人がもっとも多いことがわかりましたが、どのような失敗が多いのかをこのランキングから読み解くことはかなり難しそうです。この第二ワードランキングは一般的な関心度の高さや関心ワードを調べるのにはよい手法なのですが、検索数が多いということは言葉が想起しやすく単純なものであることが多いため、なかなか細かなニーズや細かな関心までを拾い上げるのは難しいという問題があります。
では、どうすればよいか? それを解決するためにデータの上層(検索数が多いところ)ではなく下層(検索数が少ないところ)に注目してみましょう。

(図3)検索キーワードと検索数の分布

画像

上記の分布において、一般的にロングテール部分と呼ばれる細かなデータが大量に集まった部分、ここがポイントです。
一つ一つの検索数は小さいうえに数も膨大にあるため、なかなか活用や分析が難しい部分でもありました。今回この下層部分から、「シフォンケーキの失敗」を表していると考えられる言葉、またはそれに類するキーワード群のみをうまく抽出する手法を考え、特徴キーワードを抜きだします。
その後「共起ネットワーク」と呼ばれる手法にて可視化を行います。すると次のように、シフォンケーキの失敗に関する言葉のネットワークが生成されるのです。

(図4)シフォンケーキの失敗関連の共起ネットワーク

画像
資料:Yahoo!検索データ
使用ツール:以下すべて「KH Coder」を利用

このネットワークを見ると、シフォンケーキの失敗ポイントがかなり存在することが見えてきました。特に膨らまない、しぼむ、へこむ、割れない、生焼け、固いなどなど焼き上がりに関する失敗の言葉がたくさん表れています。それ以外にも焼きあがった後の取り出しや、何かを混ぜたときに失敗しやすい傾向にありそうだということも見て取れますね。
なお、データを読み解く際のポイントして、例えば「紙型」-「外せる」といった言葉のネットワークがありますが、このような場合、もともとの言葉は「紙型を外せない」だったりします。言葉の処理の段階で「外せない」は「外せる」+「ない」と単語が分解されて集計されるため、一見肯定的なニュアンスに見える単語も元は否定形の場合があります。
そのような処理上の特性を踏まえた上でネットワークを見ると、さまざまな失敗パターンが浮かび上がっていることがよりわかります。

あらゆるユーザーの声を見つけられる万能なデータ

しかしこの手法、なにもシフォンケーキの失敗パターンを調べたいために考えたものではありません。本来の目的は違うところにあります。
例えばあなたが新しい製品を購入したとします。その製品が突然動かなくなりました。その場合、どのような行動をとりますか? 購入したお店に電話したり、サポートセンターにメールを出したり……その中には原因や対策を求めて検索で調べる人もいるのではないでしょうか? まさにそれがユーザーニーズの種となるのです。そのような検索キーワードをうまく抽出して取り出すことができれば冒頭に述べたようなユーザーの声のかわりとして活用することができるはず…というコンセプトで取り組んだのが今回の分析です。

この手法、ある程度検索されてるキーワードであればどんな言葉でも分析可能です。さらにはデータ処理をより精緻に実施することで細かなニーズの違いを分けて抽出できます。
実際にやってみましょう。今回は「洗濯機」に関するユーザーニーズを、洗濯機が壊れた時の検索キーワード傾向を調べる「故障・トラブル系」、洗濯機を使用していて面倒なことに遭遇してしまった「ハプニング系」、そして洗濯機(および洗濯方法)に対しての悩みである「疑問系」それぞれに分けて、可視化してみましょう。

(図5)洗濯機の「故障・トラブル系」抽出分析

画像
資料:Yahoo!検索データ

(図6)洗濯機の「ハプニング系」抽出分析

画像
資料:Yahoo!検索データ

(図7)洗濯機の「疑問系」抽出分析

画像
資料:Yahoo!検索データ

いかがでしょうか? 結果の傾向がそれぞれでかなり異なっていることがわかるかと思います。 「故障・トラブル系」では当然ですが物理的な故障を表すネットワークや、汚れが落ちないといった原因が不明なものまでがネットーワークに表れています。
「ハプニング系」はその種も千差万別。誰もがやってしまう洗剤と柔軟剤の入れ間違えや、ダウンを洗ったらシミになってしまったというものから、おう吐した服を洗ってしまったが大丈夫か? といったものまで洗濯時のハプニングがたくさん抽出されました。
最後に「疑問系」。洗濯機に関する疑問や悩みを調べたキーワード群から生成された結果のため、もっともユーザーニーズに近いものかもしれません。なお、ネットワークの生成ロジック上、頻度が高い(ニーズが多い)からといって必ずしもすべてを可視化できているわけではない点、また、つながった言葉だけが結果のすべてではない点を踏まえてみていただければと思います。

Yahoo! JAPANビッグデータレポートでは引き続きこのような楽しい分析をお届けしてまいります。 また、現在ヤフーではヤフーに蓄積された膨大なデータを社内で活用するだけでなく、企業や自治体に向けた事業活動を支援するための取り組み「データフォレスト構想」も進めていますので、ご興味を持たれた方はそちらもご覧ください。

引き続き、Yahoo! JAPANビッグデータレポートをよろしくお願いいたします。