2003年10月28日
Amazonの全文検索はスキャニングだった
Amazon.com、書籍全文検索サービスをどのように構築したか
USA Today 誌にAmazon.comの書籍情報のデジタル化の過程についての説明がありました。3,300万ものページを全部スキャンしてイメージ化して保存、その上で検索エンジンで参照・アクセス可能なテキストに変化したのですね。10年前には実現不可能だったそうで。
どんなもの凄い手を使ったのかと思ったら、なんとスキャンニングでした。話に聞くと、もの凄い高価なスキャナーではページを自分でめくってくれるものもあるんだとか。きっと、そういうのを使っているんでしょうね。利用者からするとありがたいですけど、気の遠くなる作業ですね。SEM Researchより。
Posted by enatural at 2003年10月28日 11:17