SQL Server -- 从全文索引中去掉普通字符串

SQLServer2008引入了标识出那些对全文索引搜索无益的普通字符串的能力。这些无益的字符串被称为非索引字(SQLServer的早期版本中称为干扰词),并且包含在非索引字表中。非索引字表包含一个或多个非索引字,以及用来在全文索引中连接。SQLServer为所有支持的语言提供了包含普通非索引字的系统默认非索引字表。

使用CREATEFULLTEXTSTOPLIST命令来创建你自定义的非索引字表。语法如下:这个命令的参数在表6-6中有描述。

表6-6CREATEFULLTEXTSTOPLIST参数

在这个示例中,将创建新的、不是从既有的非索引字表复制而来的非索引字表(注意全文非索引字表语句必须以分号[;]来结束):为了确认新非索引字表的细节,可以查询sys.full_text_stoplists系统目录视图:这个查询返回:创建完非索引字表之后,现在可以使用ALTERFULLTEXTSTOPLIST命令来填充它。这个命令的语法如下:这个命令的参数在表6-7中有描述。

表6-7ALTERFULLTEXTSTOPLIST参数参数描述stoplist_name指定新用户定义的非索引字表的名称ADD'stopword'定义非索引字的字符串值。

最长可以添加64个字符LANGUAGElanguage_term定义与非索引字关联的语言

--可以是字符串(从sys.

syslan-guages中的别名)、

整数(LCID)或十六进制表示

(LCID的十六进制值)DROP'stopword'LANGUAGElanguage_term指定删除指定的语言下指定的非索引字DROPALLLANGUAGElanguage_term删除指定语言下的所有非索引字DROPALL指定从非索引字表中删除所有非索引字在这个示例中,假定我为包含引用了SQLServer文档参考书的表生成索引。在这个例子中,术语"SQL"和"Server"在搜索的上下文中不是非常有用(几乎所有条目都会包含它)。因此在这个示例中,我将增加两个新的非索引字到之前创建的非索引字表中:在增加两个新非索引字到非索引字表中之后,可以通过查询sys.fulltext_stopwords系统目录视图来验证这个列表:这个查询返回:在下一个查询中,我将演示将新非索引字表绑定到全文索引上:可以使用sys.fulltext_indexs系统目录视图来确认绑定的非索引字表:这个查询返回:可以通过使用sys.dm_fts_parser动态管理视图来测试我的新非索引字是否可以被全文引擎识别。这个DMV的语法如下:第一个参数query_string,是你可能会用在全文索引搜索中的查询字符串。lcid是地区标识符,stoplist_id是非索引字表的唯一ID(你可以从sys.fulltext_stoplists中检索)。accent_sensitivity参数的值可以是1或0,表示你的搜索是否区分重音。如下的查询使用前面创建的非索引字表测试搜索短语SQLServer2008Transact-SQLRecipes来演示这个DMV:结果返回了每个关键字的列表,以及它们被视为何种类型(干扰字/非索引字或精确匹配):正如你从结果中看到的,SQL和Server都被识别为干扰字(非索引字)。

在下一个查询中,演示从非索引字表中删除非索引字(就算非索引字表已经绑定到全文索引上也是可以的):使用DROPFULLTEXTSTOPLIST命令来删除非索引字表。但是要想删除它,必须先使用它从全文索引中对非索引字表解除绑定。这个技巧的最后一个查询演示了从全文索引中移除非索引字表的设置,然后删除非索引字表:解析这个技巧演示了如何通过创建用户定义且包含非索引字列表的非索引字表从全文索引中去掉普通字符串。使用CREATEFULLTEXTSTOPLIST命令来创建非索引字表。在创建索引字表之后,就可以使用ALTERFULLTEXTSTOPLIST来增加非索引字字符串到非索引字表中,或从非索引字表中移除非索引字字符串。使用sys.fulltext_stoplists和sys.fulltext_stopwords系统目录视图来确认设置。然后创建新表和全文目录,再通过指定WITHSTOPLIST=TSQLRecipes创建使用了新的非索引字的新全文索引。可以通过使用sys.dm_fts_parser来测试非索引字表中的非索引字是否被恰当地忽略。使用带有SETSTOPLIST的ALTERFULLTEXTINDEX从全文索引中移除非索引字表,随后是DROPFULLTEXTSTOPLIST命令。

相关推荐