知的財産部より、ヤフーの「知的財産レポート」をお届けします。第1回目のテーマは「AI」です。
※知的財産レポートとは?
ヤフーはオープンイノベーションの考えが浸透しているインターネット業界のプラットフォーマーとして、お客様にサービスを長くご利用いただき、またビジネスパートナーの皆様にも安心して連携・協業いただくための「安全・安心の証」として活用すべく、多数の知的財産権を取得しております。知的財産レポートでは、ヤフーの提供するサービスや技術を守る知的財産について、不定期でご紹介してまいります。
ヤフーのAIと知的財産の取り組み
AIはさまざまな分野で実用化が進み、人々の生活に欠かせない存在になりました。
ヤフーはAIテックカンパニーとして、ビッグデータを用いたAI技術を日々研究・開発しております。その成果を安心・安全に利用するため多数の特許出願を行っており、いくつかの有用なAI技術は外部のサービス事業者様にもお使いいただけるよう無償提供しております。
ここでは、ヤフーのAIに関する取り組みのいくつかをご紹介します。
Yahoo!ショッピングで見た目が類似している商品を検索できる
「これと似ている商品を探したい」「名前がわからない商品を探したい」など、言葉では表現しづらい検索ニーズに対応した自社開発の独自AI技術を活用して、任意の画像に類似した見た目の商品をYahoo!ショッピング内で検索できる類似画像検索機能(※)を提供しています。
この機能では、深層学習を用いてYahoo! JAPANが独自に開発した画像認識技術(商品検出モデルと特徴抽出モデルを構築)と、ベクトル近傍検索技術「NGT」を利用しています。「NGT(Neighborhood Graph and Tree for Indexing)」は、テキストや画像、商品・ユーザーデータなどから抽出した特徴を表すデータ(高次元ベクトル)からなる大規模なデータベースから、高速に類似するデータを検索できるAI関連技術としてヤフーが開発し、複数件の特許が認められ登録されました。また本技術は、2016年11月よりオープンソースソフトウェアとして公開しています。
Yahoo!ニュースのコメントを健全化する
Yahoo!ニュースの記事に投稿されたコメントを「深層学習を用いた自然言語処理モデル(AI)」を利用して評価する取り組みを行っています。具体的には、AIによって「客観的で、必要であれば根拠を提示している」「新たな考え方や解決策、見識を提供する」などの条件を満たす建設的なコメントをスコアリングし、スコアが高いものを優先して上位表示させる独自技術「建設的コメント順位付けモデル」を実装しています。
本技術は複数の特許を出願しておりますが、外部のサービス事業者様にもご利用いただけるようAPIを無償で提供しております。
API提供につきましては以下をご覧ください。
深層学習を用いた自然言語処理モデル(AI)のAPIを無償提供 ー 導入をご検討の企業のみなさまへ
ヤフオク!で偽物出品の確率を即時判定する
出品物および出品者に関するあらゆる情報を活用した「偽物出品検知AI」は、出品完了後数秒以内に、その出品物が偽物である確率を判定します。偽物である確率が高いと判定した場合、優先的に人手による削除検討に移ります。
偽物出品検知AIはディープラーニングを用いた仕組みであり、1000万件を超える取引データをもとに、独自に開発したディープラーニング特化型スパコン「kukai」を活用して、検知精度が大幅に向上しました。
Yahoo!乗換案内で混雑状況予想を確認できる
ビッグデータを活用し、AI(機械学習)で電車内や駅の混雑を予測する機能を提供しています。
Yahoo!乗換案内では、現在時刻で検索したデータだけでなく、将来の出発時刻や到着時刻で検索したデータも膨大に集積しています。この集積したビッグデータを組み合わせ、AIを利用して「どの路線でいつ、いつもの混雑とは違う異常な混雑が起こるのか」の予測を行うことが可能になりました。
分散表現の学習時間を短縮化する
テキストデータからさまざまな単語の関係性を機械学習し単語同士の意味の相違をベクトルで表現する分散表現において、日々増加するインターネットサービス上のテキストデータを活用する場合には、分散表現の学習モデルを頻繁に更新する必要があります。その際に既に学習済みのデータを一から学習し直すのではなく、新しく追加されたデータのみを学習することで処理を効率化しつつ、同等の精度を維持することが可能な技術を開発し、yskipという名称でオープンソースソフトウェアとして公開しています。
特許侵害の発生リスクを抑えるため特許を取得しており、yskipを利用する場合には無償でご利用いただくことが可能です。
AIに関する特許出願状況
2019年までに121件の出願を行い、2021年4月時点で110件の出願に特許が認められ、登録されています。
出願件数の年推移
このうち、広く応用が可能な技術についてはオープン化を進めており、当技術を利用する場合は関連する特許も無償で利用可能となっています。現在利用可能となっている特許の一部をご紹介します。
ベクトル近傍検索技術(NGT) 高速な高次元ベクトル近傍探索ライブラリ
特許番号 | 概要 |
---|---|
特許第5014398号 | データ群から類似するデータを高速に検索すると共に、データ登録による検索速度の低下を防ぐ |
特許第5014399号 | 類似データの検索対象であるデータ群に、検索インデックスを煩雑にすることなく高速にデータを登録する |
特許第5208001号 | 新規な多次元ベクトルデータに類似するデータをデータベースから高速に検索する |
特許第5292384号 | 特定のノードへのリンクの集中を避けるために、リンクを効果的に削減し、かつ、ノードの孤立を避ける |
特許第5383776号 | グラフインデックスの更新において、過剰に長いリンクの生成を抑制する |
yskip 単語分散表現の学習ツール
特許番号 | 概要 |
---|---|
特許第6235082号 | 分散表現を用いた分類において、ストリーム入力されるデータを分散表現変換の学習データとして用いる |
ヤフーは、これからもAIを使ってサービスの質を向上し続けてまいります。