云组态需要做到按照时间段对采集到的指标(云组态称作变量,下文全部用变量替代)进行降采样展示变量的值曲线图。不同的云组态用户会有不同的变量需要监测,比如电力行业用户的场景中,C相、B相电压就是一个十分重要的变量。云组态要保证用户能够快速查询出任意时间段内的电压变化曲线,如下图所示:
数据库方案选型
方案一:Apache Imapla + Kudu
Kudu是一个分布式列式存储库,Impala负责通过sql的方式查询Kudu 的数据做汇总。Impala和kudu都是集群部署,至少需要4台服务器,这个方案的缺陷如下:
1.比较耗费服务器资源,Kudu数据落盘后也存在Compaction策略,导致cpu会比较高。
2. 写入速度比较慢(3节点2C8G配置目前每秒写入条目不到2万)。
3.数据要先从kudu读取到impala中再做计算,一旦数据过多,查询缓慢,用户无法忍受。
方案二:OpenTSDB + HBase
这个方案目前已经使用的人比较多。但此方案仍有缺陷:
1.HBase集群配置要求高,需要很好的调优.
2.OpenTSDB默认的compaction策略每到整点都会对上一小时的数据查询出来compact成一行,写入到HBase,删除原始数据,这个相当耗费cpu。即使关闭compaction,修改tsd.storage.enable_appends = true 启用append的方式低配机器 cpu也是相当高。
方案三:Cassandra
Cassandra是一套开源分布式NoSQL数据库系统。从其他团队使用的情况来看,cassandra比较适合查询小部分连续原始数据,不太适合做分析,没有降采样等功能,要出统计表只能是取一部分少量数据数据查询出来后再在内存处理出结果。这样用户只能看短时间内的数据曲线,实用性不高。
方案四:TDengine
TDengine是一个简单快捷高性能的时序数据库,提供高性能的同时大大降低了安装、部署、维护的成本,是当前繁易云组态底层采用的变量数据存储引擎。TDengine解决了我们几个之前较为头疼的问题
1. 安装简单。下载rpm包,一个命令安装完毕即可运行。
2. 性能强劲。测试场景:十万张点表,每个点表1s需要存储1条记录。在实际测试过程中,使用http接口,采用单机4C16G的配置,8线程每次写500条记录,10万条记录写入只需要300ms(如果使用java客户端更快);单变量降采样查询基本在2ms内完成。整个测试持续了48小时,测试期间cpu在20%-30%之间,内存维持在6G左右,写入相当稳定,没有出现超时。
综合考虑,使用TDengine硬件成本和开发维护成本大大降低,写入和查询速度还比opentsdb等高一个级别。
下图是TDengine***性能对比图,优势还是很明显的:
数据采集和查询方案设计
物联网设备采集的数据会经过好几道服务处理放入消息队列,之后经过过滤变量等业务逻辑处理后,数据写入TDengine。数据采集到存储的流程图如下。
遵循TDengine一个数据源一张表的设计思路,我们认为每个变量就是一个数据源,因此对每个变量会建立一张表。没有采用一个设备一张表的原因是由于工控行业中同一个采集设备内的变量采集周期不一定会一致,另外一个设备的变量也很多,超过100个是很普遍的现象,列过多,有些列又没有数据,会浪费空间。因此这里考虑使用一个变量一张表,会灵活得多。由于TDengine表名不能包含中文,需要在写入前的预处理环节中,将变量名称映射成TDengine表名。具体做法是使用雪花算法,每个设备id+变量名称(云组态中这样才能***确定变量)换一个雪花算法id,缓存在内存中,持久化存储到mongodb。这样做就确保了变量id***、TDengine表名***,映射关系简单。
我们使用TDengine时,需求暂时没有涉及到过多的标签查询,因此表的设计比较简单,1张超级表和多张子表即可满足。建立超级表的原因是方便后续多变量组合查询。具体建表思路是:
1.首选创建超级表:
CREATE TABLE IF NOT EXISTS {_tsdbSettings.DbName}.variables (ts timestamp, val float) TAGS (vkey binary(200));
2.创建子表:
CREATE TABLE IF NOT EXISTS {tableName} USING {_tsdbSettings.DbName}.variables TAGS ('{tag}');
一个变量一张表,这样做的优势是非常明显的。每张表里面只存一个变量的数据即使每秒写入一次,1个月也只有260万条,对其作指定时间范围的查询,不用考虑其他变量的数据,直接从时间戳索引得到想要时间范围的数据,效率很高。云组态的需求正是短时间内有很多变量按秒存储,保存半年左右,并且在此情况下,用户想查询任意一个变量的历史情况都能够快速得到响应。比如一开始截图中展示的电压变化曲线就是一个很好的例子,这在之前的解决方案中是没有实现的。由于有超级表,变量名映射出来的表名也无需特意维护,只需从超级表中查询时,通过标签列对所感兴趣的变量进行筛选过滤即可。
总结
繁易云组态采用了TDengine后,节省了其他方案搭建集群的费用,并且在写入速度和查询性能方面完全满足了业务的需求,运维也是相当简单,没有像HBase之类相当多的调优参数,cpu内存相当稳定。对比市面上其他开源方案,我们认为TDengine虽然开源不到一年,但是在同类产品中名列前茅。希望在今后还能看到RESTful接口写入速度进一步提高,文档进一步丰富
更多关于繁易云组态资料请咨询:http://flexem.gongboshi.com/