互联网一站式seo推广服务
深圳seo|seo优化|seo推广|seo技术|网站建设

免费咨询热线:4008-078-778

TSDB的数据如何利用Hadoop/spark集群做数据分析?

日期:2019-07-23 SEO优化

    物联网场景已经成为各行业巨头和各互联网企业的兵家必争之地,百度云天工TSDB对物联网场景下时序数据表现除了优秀的存储和查询才能,已经成为物联网应用的标配,支撑着智能制造、工业能源、智能车联网、智能家居、智慧城市等多个行业应用。TSDB正在助力企业拥抱物联网时代的到来。

seoimg.zcit/20190708/992e362033f0f3f451c9f5cbe55741fc.jpg" style="width: 565px; height: 377px;" />

    众所周知,百度云TSDB在读取、写入和查询数据上的性能一直表现优异。

支持每秒百万级数据点的写入,可线性扩展

查询1亿个数据点聚合值的响应时间小于1秒

提供优于传统数据库的压缩才能,大大节约存储空间

弹性、按需的海量数据存储才能,本钱更低。

 

我们都清楚,仅有提供海量的数据存储、极速的查询才能还缺乏以支撑不停开展的物联网行业应用。存储的海量数据如何产生价值为业主所用,是TSDB要解决的新问题。

 

物联网场景下,设备都是7*24小时工作以一定的频率上报数据的,数据量十分宏大。比方一辆无人车,以10Hz的频率上传数据,每次上传20个维度的数据点,每辆车每天就要存储1700万数据点;一个传感类监测设备比方温度传感器,通常每10秒钟上传一次数据,一个楼宇建筑中如果部署200个监测点,那一天下来需要170万个数据点。随着业务的开展,数据只会越来越多。这么多数据都是挖掘行业应用的金矿。

 

我们都不甘心数据只做存储躺在效劳器里,那怎么把TSDB中的数据发挥价值呢。不用担忧,TSDB目前已经可以作为Hadoop和spark集群的数据源,停止数据分析计算啦。

 

先来看最常使用的大数据分析工具Hadoop。Hadoop作为大数据分析的领军代表,提供可靠存储HDFS以及MapReduce编程范式以便大规模并行处理数据。TSDB作为存储海量数据的数据源,自然更需要Hadoop的帮助来做数据分析啦。我们都知道,Hadoop提供了基于廉价硬件实现大规模并行处理的才能,不过,简单的查询都要写MapReduce代码,对于商业用户实在不怎么友好。所以TSDB采用了更友好的方式,直接提供基于TSDB的Hive SQL。Hive是一个关系数据仓库,用户可以方便的利用类似SQL语言查询数据,而Hive会自动把SQL语言转换成MapReduce代码交给Hadoop处理。


转载请注明本文地址:互赢网络建站优化专注于深圳网站建设与网络推广自然排名网站seo优化技术 https://seo.zhangyongmi.cn/19224.html