ジェグテック ヘッドライン|毎日、中小企業に関するニュースを中心に、約10名のライターが独自の視点でおまとめ中。次のビジネスのヒントがあるかも!要チェック!

AI技術の進化へ ヤフー「yskip」OSS公開

2019.04.23

分散表現による学習時間短縮

2019年4月19日、ヤフー株式会社は自社のホームページでAI(Artificial Intelligence)技術の一つである分散表現の学習時間を短縮するAI技術を公開したと発表した。

そのAI技術は、「yskip」と呼ばれ、4月18日にGitHub上にOSS(オープンソースソフト)として公開された。

分散表現とは、単語を高次元の実数ベクトルで表現する技術で
近い意味の単語を推定する際に使用されるAI技術だ。

具体的には、「日本」という単語と、「首都」という単語のベクトルがある場合、この2つのベクトルを加算しその結果に最も近い「東京」という言葉を導き出すものだ。

「yskip」による課題解決と今後の取り組み

従来の分散表現は、インターネット上のテキストデータを活用する場合、分散表現の学習モデルを多くの頻度で更新することが求められてきた。

その際、新しいデータだけでなく、既に学習しているデータも合わせて学習し直すことが必要であった。

今回の「yskip」技術を導入することで従来の全データを学習するときと比べ、新しいデータの学習のみ行い学習時間を短縮しつつ、従来と同等精度を維持することができる。

これは、分散表現学習法のSGNS(skip-gram model with negative sampling)を拡張した技術と呼ばれる。

実際に使用される場面は、ツイッター上のバックグラウンドで「yskip」が動き、膨大につぶやかれた投稿をリアルタイムに検索するなどで活用される。

今後も、ヤフーでは、データサイエンの分野において、エンジニアコミュニティに貢献しながら「ビックデータ」の先端研究、開発を通してユーザーのニーズに合ったサービスを提供していく考えだ。

(画像はヤフー株式会社プレスホームより)

外部リンク

分散表現の学習時間を短縮化するAI技術「yskip」をOSSとして公開

関連記事

ジェグテックを見る

ジェグテックヘッドライン

毎日、中小企業に関するニュースを中心に、約10名のライターが独自の視点でおまとめ中。次のビジネスのヒントがあるかも!要チェック!


ジェグテックとは

ジェグテックで商機をつかめ!

J-GoodTechプロモーション

アーカイブ