测试数据:2亿行,被筛选出的数据,3KW多行。

众所周知 like %str%无法走索引,但是我们如果实在是有这种需求要达到like '%str%'的筛选目的,怎么优化好一些呢?

以下是我的一些思考:

(1)全文索引:原理是利用倒排索引,构建由谓词、短语、关键词等组成记录索引。但其实如果词用的不好会有问题,而且并不够精准,可能str相关的也出来了,且并不包含str这个字符串;

(2)构建计算列:

如果数据量少,直接基于要like的A列,再构造一个函数计算列B列取值为reverse(A),然后每次A列生成字符串,B列会自动产生反向字符串。
然后 比如A列为‘abcde’ 原本 我要like '%bc%',现在只需要A B列都加上索引,条件给 AND A like 'bc%' AND B like 'cb%'就好了。
(3)强行用其他办法试一波
【1】反向

【2】charindex

对比,直接like花费13分钟

使用charindex