検索エンジン自作入門 - 山田浩之

Amazon
楽天ブックス
 Google、Yahoo!などが用いる全文検索についての入門書。筆者の開発した入門用検索エンジンwiserをベースに様々な方法を紹介する。基本となるアルゴリズムは“転置インデックス”。プログラムを作らなくてもアルゴリズムを理解すると、身の回りの整理整頓にも役立てられそうだ。転置インデックス = 参考書巻末のあいうえお順の目次、と捉えると理解しやすいだろう。
 本書はIBM、YahooなどITジャイアントで実務に携わってきた著者が著しており、実務に直結するコメントが多数掲載されている。「現代は検索社会」とまで言われる検索全盛の時代。通常検索の仕組みを学ぶことなく"ググる"ことで目的の情報へ辿り着こうとするが、アルゴリズムを理解することで様々に応用し、情報収集法をブラッシュアップすることができる。サンプルはC言語をベースとしているが、様々な言語にも応用ができるであろう。ITを目指すなら読むべき一冊に挙げられる。
 アルゴリズムを学ぶだけなら第1章で充分か。但しプログラムは自らの手を動かさなければ身につくことはないから、今回はプログラムを実際動かすこと無くさらりと読んでしまったが第2章以降はいずれソースコードの中身を読んでいきたいと考えている。

※wiserはオープンソースで技術評論社のHPよりいつでもダウンロードできる。

◆目次
第1章 検索エンジンはいかにして動くのか
第2章 全文検索エンジンのサンプルを準備する
第3章 転置インデックスを作ろう
第4章 検索しよう
第5章 転置インデックスを圧縮しよう
第6章 wiserの改良や
第7章 これからより深く学ぶために
付録

ブログ村, おすすめ本ランキング
リクナビ・社会人向け進学案内

0 件のコメント: