対象とするデータ
- 知らない Web サイト
→ e.x. goo
- 自分のサイト
→ e.x. Namazu
サーチエンジンの仕組み
INDEX について
- 全部のファイルに対して検索をすると時間がかかる
→ファイルが多ければ多いほど
- 索引に相当するものを作り、そのデータベースを検索する
ことにより検索時間の高速化を計る
goo でも Namazu でも基本的には同じ
- 最初に INDEX を作る必要がある
- 定期的に INDEX を更新する必要がある
Namazu による検索例
Namazu が扱えるデータ
Namazu では以下の文章を扱うことが出来ます。ただし、別途プログラムを
入手する必要がある場合もあります。
- compress,gzip,bzip2 で圧縮されたファイル
- Excel 文章
- ハイパー日記システム
- HTML 文章
- Mail/News
- man
- Word 文章
- PDF 文章
- RFC のファイル
- TeX のファイル
- PowerPoint 97,2000 の文章
- 一太郎9,10 のファイル
|