ストップ語/検索エンジン

記事公開日 2013-08-14

ストップ語/検索エンジン

ストップ語

 英名は「stop word」で、検索エンジンの精度をあげるために、頻繁に使用される「その単語自体には固定の意味がないと思われる単語を検索対象から除外する」という考え方。

 例えば日本語なら助詞や助動詞などの頻繁に現れる単語がそれで、格助詞である「が」「は」とか、助詞の代表格なら「てにをは」だし、「です」「ます」などもですよね! いわゆる、文法的な役割を持つ「機能語」がそれに該当します。英語だと「a」「the」なんかの冠詞など。「IT(アイティ)」は「it(イット)」という文字列で扱われるので、ストップ語になります。
 そのほかにも「http」や「.com」のほか、数字または文字 1文字などもストップ語になっているそうです。ストップ語の検索



Copyright © 2000-2018 Makiko HOSOKAWA. All rights reserved.