AI
マルチモーダルAIを使った画像検索
マルチモーダルAIを使った画像検索について紹介します。
マルチモーダルAIとは、テキスト、画像、音声など異なる種類を扱うAIのことです。 特にマルチモーダルAIの種類には様々なものが存在しますが、Representation (表現)と呼ばれる手法では、マルチモーダルのデータをどのように表現したり要約するタスクを解決することに着眼をしています。 本連載はマルチモーダルAIのRepresentation (表現)の手法の中でもテキストや音声、画像といった異なる種類のデータを同じ空間に表現する手法である埋め込み表現を使って、 画像検索に応用をしてみます。 これにより、与えられたキーワードにマッチする画像を検索したり、与えられた画像と似ている画像を検索することが可能になります。





