linotice

linotice

2022.03.14

「Yahoo! JAPAN Advent Calendar 2021」のBest Authorが語る! CTOも驚く「スマホ操作のミスタップを防ぐ数式モデル」の意義とは?

画像
ヤフーの技術やデザイン、文化を発信する「Yahoo! JAPAN Tech Blog」では、毎年12月に毎日新しい記事を公開するアドベントカレンダー企画を実施。数多くの投稿のなかからCTO藤門がBest Authorを選出し、ランチ会で語り合います。

「Yahoo! JAPAN Advent Calendar 2021」のBest Authorに選ばれたのは、「スマホのタップ操作の成功率を算出するモデル ~ UIデザインにおけるユーザビリティの推定」を書いたYahoo! JAPAN研究所の山中祥太。HCI(ヒューマン・コンピュータ・インタラクション)研究からワークライフまで、さまざまな話題で盛り上がりました。

プロフィール

山中のプロフィール画像
山中 祥太
Yahoo! JAPAN研究所 上席研究員
2016年に明治大学大学院にて博士号を取得(工学)。2015年より日本学術振興会特別研究員DC2、2016年より日本学術振興会特別研究員PDおよび明治大学総合数理学部客員研究員を勤めたのち、2017年にヤフー株式会社に入社、Yahoo! JAPAN研究所に配属。ユーザーインターフェース研究、特に運動性能のモデル化に興味をもつ。情報処理学会、ACM各会員。
藤門のプロフィール画像
藤門 千明
取締役 常務執行役員CTO
筑波大学大学院を卒業後、2005年に新卒入社。
エンジニアとしてYahoo! JAPAN IDやYahoo!ショッピング、ヤフオク!の決済システム構築などに携わる。決済金融部門のテクニカルディレクターやYahoo! JAPANを支えるプラットフォームの責任者を経て、2015年にCTOに就任。2019年10月より現職。
干場のプロフィール画像
干場 未来子
PD統括本部 コーポレートPD本部
マーケティングソリューション事業で営業、エデュケーション、プロダクトマーケティング、マーケティングチームなどを経て、2016年に人事へ異動し、採用ブランディングを担当。

コンピュータ設計の前に、ユーザーの心理を探る

干場の顔画像

本日はまん延防止等重点措置が東京に適用されている状況なので、社内レストランBASEのオンライン懇親会セットをみんなで食べながら、Zoomでの取材とさせていただきました!よろしくお願いします!まずは、山中さんをBest Authorに選んだ理由を教えてください。

自宅に届けられる懇親会用の食べ物や飲み物の画像
▲今回の取材中にみんなで食した、社内レストランBASE11のオンライン懇親会セット「新春の旬菜 洋食」
藤門の顔画像

毎年アドベントカレンダーのBest Author審査では、各記事の閲覧数やSNSでの拡散具合などを数値でしっかり見ています。記事のなかでヤフーでの取り組みがどのように紹介されているか、その記事をどのくらいの人に見ていただけているか、そのインパクトがどのくらいあったのかを選考基準にしています。
今回のテーマは、「ヤフーのAIテックカンパニー化に向けた取り組み」だったのですが、全体で見るとAIに関連しない記事もある。その幅の広さが、実にヤフーらしいと思いました。
そのなかでも、山中さんの記事はエンジニアだけではなくデザイナーにも有益な内容になっていました。難しい数式も出てくるので、完全に理解するまで時間がかかったのですが(笑)、その難しさも含めて、ヤフーがこのレベルまでHCIを真剣に研究していることが伝わった。それがBest Authorに選んだ理由です。

藤門さんのZoomミーティング中の映像
▲取締役 常務執行役員CTO 藤門 千明
干場の顔画像

私もこの記事を読んでいて計算式が並び始めたところからよく理解できなくなりました(笑)。山中さんは明治大学の大学院でHCIを研究し、2017年のヤフー入社後はYahoo! JAPAN研究所で引き続きHCI関連の研究を続けています。HCIに関心をもったきっかけは何だったのでしょうか。

山中の顔画像

大学では、情報科学科でOSの設計やコンパイラ実装をしていたのですが、コンピュータに触れる人にとって使いやすいOSやソフトウェアとはどういうものなのかといった、インターフェース側にも興味がありました。そこで大学院では、インターフェースによって、人のコミュニケーションはどう変わるのかをテーマに研究を行いました。
例えばチャットツールには、投稿者が発言を削除・編集できないものとできるものがあります。削除機能や編集機能がないチャットツールでは発言が慎重になるため、コミュニケーション量が減ってしまう傾向があります。
チャットの発言数や発言内容を分析しているうちに、コンピュータの設計をどうすべきかよりも、人の心理にまで踏み込んで分析すべきだと考えるようになった。そして、研究テーマをHCIにシフトするようになりました。

干場の顔画像

HCIの実験では一定数のユーザーが必要になると思いますが、それはどうやって確保したのですか?

山中の顔画像

チャットツールはユーザー同士の関係性で、コミュニケーションの量や質が変わってきます。そこで、大学の研究室内の10人くらいでコミュニケーションする場合と、ほかの研究グループの人たちを巻き込んだ場合を比較することを考えていました。ところが、ちょうどそのとき東日本大震災が発生したため、ほかの研究室の人たちに頼むことができず、やむなく自分の研究室のメンバーのみで実験しました。

HCI研究は計算機のなかだけでは完結できない

藤門の顔画像

僕も高専時代にコンピュータグラフィックス、大学院ではバーチャルリアリティの位置制御などの研究をしていました。例えば、空間のなかをアバターが移動する際のインターフェースは何がいいのかといった研究をしていたんですね。特に大学院での研究はHCIに近いものでした。
だから山中さんの論文を読んで、あの頃は大変だったなと改めて思い出しました。HCI研究における最大の難しさは人が絡むところ。計算やコンピュータのなかだけではなかなか答えが出せない。どういう意図でこの操作をしたのかをユーザーに聞く必要もあるんですよね。
そうした苦労を山中さんは学生の頃から経験して、さらにヤフーに入社してからも継続している。感謝とともに、今後も続けてほしいというのが率直な願いです。

干場の顔画像

博士課程ではどんな研究をされていたのですか。

山中の顔画像

博士課程は、より理論寄りの研究をしていました。一般的に、スマホ画面のボタンは小さいボタンよりも大きいボタンのほうが操作時間が短いと言われています。では、ボタンの大きさを30ピクセルから35ピクセルに増やしたら操作時間はどれだけ短縮されるのか。ボタンの大きさと操作時間の関係式を作ったり、その改善をしたりといった研究をしていました。

ヤフー入社は、「多くの人の役に立ちたかったから」

干場の顔画像

卒業後は企業に就職するか、大学に残って研究を続けるか、二つの選択があったと思いますが、ヤフーへの入社を決めた理由を教えてください。

山中の顔画像

もちろん大学の研究室に残ることも選択肢にありましたし、他大学の特任助教授からお誘いもいただきました。しかし僕の目標は、UI/UXに関する新しい理論を構築して、世界中のコンピュータのUI/UXをより良くすること。
もちろん、大学にいながら企業と共同研究を行い、製品・サービスの実現まで結びつけている研究者もたくさんいます。でも僕は、多くの人が日常生活で使っているサービスを運営する会社に入って、裏方の一人として働いていく道を選びたいと思いました。
ヤフーは、天気予報や路線検索といった生活に密着したサービスを提供し、それが何百、何千万人のユーザーに使われている。そんな会社で「この理論が多くの人に実際に役立っている」と実感できる研究をすることにやりがいを感じたのです。

藤門の顔画像

それはCTOとしてとてもうれしいですね。ヤフーのサービスは年代・職種を問わず、あらゆるユーザーに使っていただいています。ユーザーの年齢や経験値によって、PCのマウスやスマホのタップも異なりますから、ユーザーのアクションによってUIを変えていかなければならないし、時代に合わせて進化させていく必要もある。
求められるUIは常に変化していくし、人によって求めるものは違うから、それが良いものであれば受け入れられるし、仮にあまり良くなかったとしても改善していけばいい。そうしたPDCAサイクルを自分たちのサービスのなかでどんどん回せることが、ヤフーでHCI研究を行う最大の強みだと思いますね。

山中の顔画像

最近は共同研究している大学での実験だけでなく、「Yahoo!クラウドソーシング」を使ってたくさんのクラウドワーカーに実験システムを配布し、そのデータを使った研究も行っています。クラウドワーカーの年齢層は幅広い。高齢の方もたくさんいらっしゃって、パソコン使用歴が40年という方もいて驚いたことがあります。
新しくリリースするアプリのデザインを決めるときに、そういった幅広い年齢層のユーザーのUIをどう考えればいいのか。年齢やITスキルに応じてUIを変えるべきなのか。これはHCI研究分野のなかでも、最近よく扱われるトピックの一つですね。
例えば、ユーザーの年齢に応じてボタンの大きさを設定できるアプリを作ったとしたら、それを使いやすく便利だと思う人もいるし、余計なお世話だとネガティブに捉える人もいる。ポジティブ、ネガティブ両方の反応がありうるUIについては、慎重に判断していく必要があります。

山中さんの仕事スペースの画像
▲山中さんの仕事スペース

スマホのタップ操作の成功率をモデルで算出

干場の顔画像

今回の記事は、まさにスマホのタップ操作の成功率をモデルで算出するという研究です。このテーマで記事を書こうと思ったのはなぜですか。

山中の顔画像

HCI研究では1990年代から2000年代にかけて、操作時間を推定するモデルがたくさん登場してきました。例えば、PCのマウスカーソルから離れたところにあるボタンの大きさに応じて、ユーザーがクリックするまでの操作時間を推定するモデルなど。ここ5~6年は、操作時間以外の要素も重視する流れも出てきました。どんなUIであれば、ユーザーが操作をミスなくできるのか。この論文もその流れの一つと言えます。
しかし、スマホのようなタッチデバイスでは、ユーザー自身も目的のボタンを選択できるか分からないまま画面をタップしなければなりません。そういう確率的な曖昧さも含めてモデルを拡大・修整したほうが、PCからスマホに主なデバイスが移行している現代にはふさわしいと思ったのです。
また、過去のアドベントカレンダーの記事を見ると、インターフェースデザインに関する記事が比較的少なかったため、僕自身の色を出せると思ったのも理由の一つです。社外にも公開されるので、より多くの人に役立つテーマとして選んだのです。
一方で、テクニカルな部分をしっかり説明したかったので、数式も入れています。この記事の元になった論文は英文で数式も多い、統計分析を中心にしたものですが、今回、記事を書くにあたっては、わかりやすさも重視してそういったものは必要最低限にしました。

科学的裏付けのあるガイドラインを生み出す

干場の顔画像

この記事で一番訴えたかったのはどのあたりですか。

山中の顔画像

これまでのUI設計は、デザイナーの経験や勘に頼る部分が多かったと思います。それを理論的に支える方法があるということを知ってほしかった。社内のデザイナーやプロダクトマネージャーにヒアリングを行ったところ、最終的に決まるデザイン案は、必要な機能、各種ボタンが搭載されているUIであることが多いという話を聞きました。
そうではなく、「全部のボタンのタップ成功率を90%以上確保できるようにしましょう」といった数値目標を設定することができるツールを使って、UIを設計してもらいたい。たとえモデルの数式は全部理解できなくても、デザインについての考え方、取り組み方が変わるのではないかと思ったのです。

藤門の顔画像

山中さんがスマホのタップ操作を数値化・モデル化したことは、この投稿のなかで一番大切なことだと思います。数式も難しかったけれど(笑)、UIを数値化・数式化したデザイナー向けのツールを提供したことも重要なポイントです。
デザインの感性やセンスは当然必要ですが、その部分を可能な限り数値化してモデル化すれば、より良いものを届けられるはず。ベテランのデザイナーがやっても新人がやっても同じように、ユーザーにとって良いUIが設計できる。結果的に「ヤフーのアプリって操作しやすいよね」と言ってもらえれば、それこそが真のネットカンパニーだと思います。

干場の顔画像

ツールについて社内ユーザーの反応はどうですか。

山中の顔画像

ダウンロード数は日々増えているので、わりと多くの人に試してもらえているのかなと。最初はEXEファイルで配布したのですが、デザイナーはMacを使っている人が多いから何とかしてほしいという要望があったため、HTML版も作ってブラウザーで動作できるようにしました。

藤門の顔画像

ヤフーのスマホアプリは、GoogleやAppleのプラットフォーム上で展開しているので、当然そのガイドラインやレギュレーションに沿う必要があります。だから僕もAppleのヒューマンインターフェース・デザインガイドラインはよく読むんですよ。
例えば「モジュールのサイズは44ポイント以上にせよ」とか書いてあるけど、なぜ44ポイントなのか。その根拠が山中さんの論文のモデルと合致していたらすごいな。

山中の顔画像

Androidのデザインガイドラインにも同様に、最低限のボタンサイズに関する指標があり、そこでは48dp(7.62mm)となってます。実は、僕の計算上、このボタンサイズなら成功確率は99%というモデルがあるんです。タップミスは完全には防げませんが、ほぼ成功すると思います。

藤門の顔画像

それはすごい! どこかで発表したいですね。

山中の顔画像

論文のなかではデザインガイドライン各社と比較した結果も示しています。AndroidやAppleのガイドラインに示されている数値は、僕の論文から見ても現実的で妥当なところだと考察しています。

コロナ禍での実証実験の難しさ

干場の顔画像

このモデルを作るにあたって一番苦労した点を教えてください。

山中の顔画像

モデルの数式自体は、ボタンのタップ座標の広がり方は正規分布に近づくという先行研究があります。それを数式に落とし込めるので、さほど苦労はなかったのですが、そのモデルを検証するにあたっては、たくさんの人にいろいろな大きさのボタンを押してもらって、理論通りの数字になっているかを検証しなくてはいけない。先ほど藤門さんもおっしゃっていたように、それが一番大変なところでした。
今回は大学生12名に、共同研究先で協力してもらって実験しました。ボタンのタップミスはしないでほしいものの、あくまで普段通りに操作してほしい。そして、なるべくボタンは早くタップできたほうがいいということを伝えたうえでの実験です。ボタンのサイズを変えながら、40回ぐらいタップしてもらって計測しました。
今回のテストユーザーは、スマホを毎日数時間以上使っている人しか見つけられなかったのですが、モデルをより精緻なものにするには、もっと幅広いユーザーを集めて実験をしたいですね。

藤門の顔画像

モデルが有効かどうかを証明するためには、どうやって人を集めてくるかが一番難しいし、面白いところだとも思います。今回の投稿でも実際に人に触ってもらっているシーンが一番生々しくて、まさにHCI研究を実践しているなと思いました。

山中の顔画像

いまはコロナ禍で人を集めることも大変ですし、共同研究先の大学に気軽に出かけることもできません。研究室に同時に〇人入室してはいけないなどの制約もあって、1週間でようやく10名分の実験をするのがやっとという状況です。一人で研究する場合、クラウドソーシングにシフトしているのはそういう事情もありますね。

研究者たちのピュアな視点を大切にする風土

藤門の顔画像

山中さんが所属する「Yahoo! JAPAN研究所」は大きく二つの分野の研究をしていて、一つはマルチビッグデータとAI系。もう一つはHCIの研究ですね。田島所長ともよく話すのですが、データ系の研究が難しい要因の一つには世界中でこの領域の研究が活発になっていて、競争が厳しくなっていることが挙げられます。
そんななかでも、山中さんたちがしっかり実験を行いながら論文を書いて、カンファレンスでも発表しているのはすごいことだと田島さんも話していましたよ。

山中の顔画像

僕はクラウドソーシングが使えるので、その点では恵まれていますね。Yahoo! JAPAN研究所では、テーマ設定は基本的に何でもやっていいと言われています。都度申請をする必要もありません。アカデミックな観点で価値がある、論文が優れたものとして評価されるのであれば、どんなテーマに取り組んでもいいというカルチャーには感謝しています。

藤門の顔画像

研究者たちがピュアな目で見ている、関心をもっているテーマは、組織としても価値のあるものとして信じているということですよね。「ヤフーのサービスはここがダメだと思う」といったことも、研究者の立場からどんどん提言してほしいと思います。

山中の顔画像

ほかにも研究所の強みだと思うのは、研究者のネットワークが幅広いことですね。以前、クラウドソーシングで実験したいと思って田島さんに相談したところ、その分野に強い研究者を紹介してくれたおかげで、あっという間にシステムを構築できたことがありました。
ハイレベルな技術をもつ人がたくさんいることで、僕の研究が前進しました。協力してもらえる研究者の存在があってこそ、新しい研究テーマの着想もできる。これは環境としてすごく恵まれていると思います。

今後の目標は、サービス部門との連携強化とサービスへの実装

干場の顔画像

山中さんの研究とヤフーの事業部門、サービス部門との関わりを教えてください。

山中の顔画像

この研究はサービスの改善につながりますよという話はするのですが、正直まだ具体的な成果は出ていないというのが現状です。これは大きく言えば、HCI系の研究全体の現状でもあります。
データ系の研究領域では、機械学習の成果をサービスの改善に使っていくサイクルができているのですが、HCIはいまのところそういったことができていない。HCI分野で会社がもっているデータを使って実用化したという論文を発表している企業もあまりありません。これをもしヤフーで実現できれば当社の強みにもなるので、ぜひやっていきたいと思っています。
例えば、ミスクリックを改善するアルゴリズムを開発する。それを実サービスに実装したら、年間何回のクリックミスを防ぐことができて、利用時間と売上金額に反映されたのかということが実証できたら、これは企業にとってもHCI研究にとっても有益なことです。会社の収益率も含む情報を論文として外部に公開することの難しさも理解しているので、何か代替案がないかを検討しているところです。

藤門の顔画像

それはぜひやってほしいですね。山中さん自身の研究成果にもつながるし、IT産業全体としても、ミスクリックやミスタッチは減らしたいでしょう。そのアルゴリズムで自分たちのサービスが良くなれば、それこそ“三方良し”になりますね。もちろんセンシティブな問題もあるけれど、ぜひ一緒にやっていきましょう。

干場の顔画像

今後も日本のHCI研究にとっても、ヤフーのサービス改善にとっても山中さんの研究が役立っていくと良いですね!

Yahoo! JAPAN研究所では、さまざまな領域の研究者を募集しています。本記事で興味を持ってくださった方はぜひご応募ください。

採用情報 公式SNSアカウント

このページの先頭へ