cachu's page

Last modified: Sat Jul 1 16:00:29 JST 2000

WWW 上での検索

[検索の必要性] [準備]

対象とするデータ

  • 知らない Web サイト
    → e.x.  goo
  • 自分のサイト
    → e.x.  Namazu

サーチエンジンの仕組み

gainen

INDEX について

  • 全部のファイルに対して検索をすると時間がかかる
    →ファイルが多ければ多いほど
  • 索引に相当するものを作り、そのデータベースを検索する ことにより検索時間の高速化を計る
    goo でも Namazu でも基本的には同じ
  • 最初に INDEX を作る必要がある
  • 定期的に INDEX を更新する必要がある

Namazu による検索例

Namazu が扱えるデータ

Namazu では以下の文章を扱うことが出来ます。ただし、別途プログラムを 入手する必要がある場合もあります。
  • compress,gzip,bzip2 で圧縮されたファイル
  • Excel 文章
  • ハイパー日記システム
  • HTML 文章
  • Mail/News
  • man
  • Word 文章
  • PDF 文章
  • RFC のファイル
  • TeX のファイル
  • PowerPoint 97,2000 の文章
  • 一太郎9,10 のファイル

Cachu's Page: このページの作者は cachu です。意見・要望は mkato@pastel.ocn.ne.jp までお願いします。