画像検索技術(image search)
当ブログの2004年12月2日の記事「ビデオ検索技術」の中で、私は、Google, Microsoft, Yahoo 各社が開発中のビデオ検索技術に言及しながら、これら各社の技術は「ビデオ検索」と呼ばれながらも本質的には「ビデオ検索」ではなく、キーワード検索の亜流に過ぎないという主旨のことを書いた。そして、真の意味での画像検索・映像検索の技術が望まれると述べた。
2005年2月23日夜のCNET Japanの記事「goo、類似画像の検索が可能なマルチメディア検索サービスを実験」によると、日本電信電話(NTT)とNTTレゾナント(旧・NTT-Xと旧・NTTブロードバンドイニシアティブが合併してできた会社)は、同日、画像の特徴など視覚的な情報から類似したコンテンツの絞り込みができる新しいマルチメディア検索サービス「MultiMedia Meister(マルチメディア・マイスター)」を開発したと発表したとのこと。
この技術の検証および評価が、本年2月23日から5月31日まで、「goo」上の実験サイト「gooラボ」で行なわれるらしい。
この種の研究成果を出せる企業・機関は現段階では世界でもそれほど多くない思われる。NTTグループは、基礎的にそのような潜在力を持った企業の一つであろう。
CNET Japanの記事はNTTサイバーソリューション研究所所長の小川克彦氏の言葉を引用し、「画像の周波数(鮮明さ)を16次元のベクトルで分類し、色を12次元のベクトルで分類している。合計28次元のベクトルにより、画像の類似性を判断する」と、その手法を説明している。その結果、「ユーザーが希望する画像に近い色や被写体の向き、形などを分類して表示」できるとしている。
そう説明されると、何となく、実用化も近そうな気がしてくる。ただし、特徴空間(つまり上記のベクトル空間)をどう取るか、その中でどのように「近さ」(つまり類似性の判断の基準となる距離)を取るか、といったところは今後も改善の余地があり、それによって実用化の度合いが増していくのだろう。いずれにしても、今後、ますます増え続ける膨大な量の画像・映像コンテンツを扱っていくためには、キーになる技術の一つである。
なお、NTTグループとは関係ないと思われるが、映像検索については、下記のような本も出ている。
MPEG‐7と映像検索 マルチメディア情報検索の新手法を詳述 著者: 国枝孝之, 高橋望, 脇田由喜 |
(c) 2005, zig zag road runner.
The comments to this entry are closed.
Comments