ClickHouse VS SQLServer数据库 后续(2)
上文发了之后,有人说要和SSAS对比,还有人说要在SQLServer建一个列数据库来对比
SQL2012 之后开始有列存储, 但要在2016SP1之后才在Express版开放, 之前都是在Enterprise版才有, 我在win10安装了最新SQLServer 2019 Express版, 把订单日期字段加上列存储索引
--建立列索引用时42秒 create nonclustered columnstore index PK_tblSale_ColumnStore on [taobao].[dbo].[tblSale](date)
执行分组查询语句没有改善
SELECT Convert(varchar(8) , date, 112) as date,count(*) as dayCnt FROM [taobao].[dbo].[tblSale] group by Convert(varchar(8) , date, 112) order by Convert(varchar(8) , date, 112)
难道是因为datetime用convert转成字符,不能用索引??? 新建一列纯粹用字符的, 用时7分09秒更新2亿条数据
alter table tblSale add dateYMD varchar(10) update tblSale set dateYMD= (select Convert(varchar(8) , date, 112)) from tblSale
用新字段做groupby,用时44秒
SELECT dateYMD as date,count(*) as dayCnt FROM [taobao].[dbo].[tblSale] group by dateYMD order by dateYMD
重新建立列索引, 一个数据库只能有一个列存储索引
drop index PK_tblSale_ColumnStore on [taobao].[dbo].[tblSale] --建立列索引用时1分22秒 create nonclustered columnstore index PK_tblSale_dateYMD on [taobao].[dbo].[tblSale](dateYMD)
重新查询, 用时16秒, 还是很慢. 这个还是比不上ClickHouse, 有知道怎么样提高SQLServer的,请@我....