Webマーケティングblog - イーナチュラルオルグ
トップ > 検索エンジン > ウェブでの音声/映像検索技術はどこまで進んだか

2004年6月17日

ウェブでの音声/映像検索技術はどこまで進んだか

ウェブでの音声/映像検索技術はどこまで進んだか

インターネットで見たり聞いたりできる音声/映像ファイルは爆発的な伸びを見せている。しかし、現在のところ大手検索エンジンでは、こうしたコンテンツを直接検索できない。この隙間を埋めるための技術/ビジネスが動き始めた。

今後、マルチメディアコンテンツが増えるに伴い、これらが検索できないという問題が出てくると言うことで、これを検索できるようにするためのニッチなビジネスが始まっているそうです。

StreamSageが昨年暮れに発表した音声/映像検索技術が、現在注目を集めている。ワシントンDCを拠点とする同社は、およそ3年間研究を重ね、音声認識技術を使って音声や映像を文字に起こすソフトを開発した。同ソフトは、音声/映像を文字に起こした後に、文脈分析を行ない、言語の判別や、コンテンツのテーマの解析を行う。それにより、各ファイルで議論されているトピックの、一種の目次が作成できるというわけだ。

このようなチャレンジをしている企業もあるそうです。言語検出技術の精度は一般に80%しかないと言われているとはいえ、ある程度は分かるということですね。

StreamSageのCampaignSearch.comでは、

例えば民主党の大統領候補であるJohn Kerryの1時間の演説の中から、保険医療について語っている4分間程度の部分だけを抜粋して視聴することも可能だ。

ということで、これは凄い。まさに音声の中身を検索する技術です。National Public Radio(NPR)は、放送した音声番組がいち早く検索エンジンにリストアップされるよう、StreamSageの技術を使って文字に起こしているということです。これにより、検索エンジンからのアクセスが増加しているとのこと。

映像を「見て」解析するのは難しいかもしれませんが、音声を「聴く」ことはこんなにも進化しているんですね。

Posted by enatural at 2004年6月17日 15:38