ストップ語/検索エンジン

ストップ語/検索エンジン

ストップ語

 英名は「stop word」で、検索エンジンの精度をあげるために、頻繁に使用される「その単語自体には固定の意味がないと思われる単語を検索対象から除外する」という考え方。

 例えば日本語なら助詞や助動詞などの頻繁に現れる単語がそれで、格助詞である「が」「は」とか、助詞の代表格なら「てにをは」だし、「です」「ます」などもですよね! いわゆる、文法的な役割を持つ「機能語」がそれに該当します。英語だと「a」「the」なんかの冠詞など。「IT(アイティ)」は「it(イット)」という文字列で扱われるので、ストップ語になります。
 そのほかにも「http」や「.com」のほか、数字または文字 1文字などもストップ語になっているそうです。ストップ語の検索

  • ストップ語だけが入力された場合は、その語句を検索します
    例)「The Sound and the Fury」は、「Sound」とFury」のみ検索
      「The Who」のようにストップ語だけだと、「The」「Who」も検索対象になります
  • 語句の直前にプラス記号 (+) を追加すると検索できます
    例)「 Star Wars Episode +I 」
  • 該当する語句を引用符で囲み、フレーズ検索でも可能
    例)「 “Star Wars Episode I” 」
タイトルとURLをコピーしました