
我们都知道where条件如果在字段上带了函数就不会去走索引,不好优化,无意间了解到mysql一个新特性--虚拟列,专门处理这块问题的,下面一起来了解下吧~
在MySQL 5.7中,支持两种Generated Column,即 Virtual Generated Column和Stored Generated Column ,前者只将Generated Column保存在数据字典中(表的元数据),并不会将这一列数据持久化到磁盘上;后者会将Generated Column持久化到磁盘上,而不是每次读取的时候计算所得。很明显,后者存放了可以通过已有数据计算而得的数据,需要更多的磁盘空间,与Virtual Column相比并没有优势,因此,MySQL 5.7中,不指定Generated Column的类型,默认是Virtual Column。
如果需要Stored Generated Golumn的话,可能在Virtual Generated Column上建立索引更加合适。综上,一般情况下,都使用Virtual Generated Column,这也是MySQL默认的方式
假设有一个表,其中包含一个 date 类型的列 `SimpleDate` date
SimpleDate 是一个常用的查询字段,并需要对其执行日期函数,例如
此时的问题是 即使对 SimpleDate 建立索引,这个查询语句也无法使用,因为日期函数阻止了索引。
为了提高查询效率,通常要进行额外的 *** 作,例如新建一个字段 SimpleDate_dayofweek,存放 dayofweek(SimpleDate) 的计算结果,然后对这列创建索引,SimpleDate_dayofweek 的值需要程序写入,例如使用触发器,在 SimpleDate 有变动时更新这样查询就可以改为
这么做的好处是提高了查询性能,可以使用 SimpleDate_dayofweek 列的索引了,但又带来了其他麻烦,例如
虚拟列 Generated Columns 就是用来解决这个问题的,可以增加一个可被索引的列,但实际上并不存在于数据表中,下面用一个实验来说明下:
需求:为了实现对json数据中部分数据的索引查询,考虑用MySQL5.7中的虚拟列功能
1、创建表
2、准备数据
3、构建姓名的虚拟列
4、构建索引
5、测试是否用到索引
可以看出用了索引了
6、插入新数据
此时的表的结构由于多出了user_name这一虚拟列,再插入别的数据要注意在表后指明插入列(不能给虚拟列插入数据)
做完发现这个实验好像不是那么好理解...应该对比一下加不加虚拟列有没走索引,可能会更容易让大家理解的...后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注一下~
可以这样写成只使用1个子查询:
select a.* ,b.d as day_num,b.m as month_num,b.y as year_num
from watersku a,(select sum(b.num) as y,
sum(case when date_format(b.add_time,'%Y-%m')=date_format(now(),'%Y-%m')
then b.num else 0 end) as m,
sum(case when date_format(b.add_time,'%Y-%m-%d')=date_format(now(),'%Y-%m-%d')
then b.num else 0 end) as d
from tra_order b , tra_trade b0
where a.sku_id = b.sku_id and b.tids = b0.tid and b0.status >2 and date_format(b.add_time,'%Y')=date_format(now(),'%Y'))b
另外上述按当前年、月、系统日期筛选比较表达式,也可以直接用year,month函数替代format函数进行比较,也许效率会高一些。
至于哪些写法的效率高一点,很多时候实际情况与我们想象有较大差距,有时我们认为效率低的写法执行效率并不会比我们认为高的写法低很多,甚至有可能掉反过来,对于这一点我在实际工作中深有体会。稳妥一些的做法是查看SQL执行计划,当然更为可靠的办法是使用大数据表进行实测比较。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)