面向时序数据库的时间序列数据有损压缩算法研究.pdf

面向时序数据库的时间序列数据有损压缩算法研究.pdf

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
重庆大学硕士学位论文 中文摘要 摘 要 随着大数据时代的来临,无数的设备需要采集不同指标的数据,其记录的数据 量非常之大。如果将采集到的数据直接存储到传统的关系型数据库中,不仅会消耗 大量的存储空间,同时也会降低数据的传输、查询、分析、处理效率。现有的传统 数据库系统对于时间序列数据的存储效率不高,因此需要针对时间序列数据的特 性,设计专门的时序数据库。目前的时序数据库允许用户创建、更新和销毁各种数 据并对其进行一定的图形化展示及分析,但并没有对海量历史数据进行过多操作 就直接将其存储到磁盘中。这极大制约了时序数据库的发展,容易引起存储空间消 耗过大、磁盘读写过多及系统性能降低等问题。因此,将高效的数据压缩技术引入 到时序数据库中,对时序数据库的发展有着尤其重要的意义。 基于以上问题,针对时间序列数据的特点,本文提出了一种新型高效的时间序 列数据有损压缩算法。该算法可以保证在一定的精度前提下,通过去除数据中的冗 余部分、缩短数据编码长度,节省了时间序列数据占用的存储空间,提高数据传输 速度。具体工作如下: 1)提出了基于差值法的时间戳压缩算法。本文基于差值法对传统的时间戳压 缩算法进行了优化。该算法对每个时间戳的差值计算了二次差值,根据设定好的压 缩规则对二次差值进行编码,以实现对时间戳的压缩。此外,针对时间序列数据采 集过程中普遍存在的时间点遗漏问题,本文提出的压缩算法也可以减少时间戳的 存储开销。 2 )提出了时间序列数据有损压缩算法。在数据存储过程中,浮点数采用的是 IEEE 规定的编码标准。这会出现两个浮点数值差异很小而编码转换得到的二进制 却相差甚远的情况。针对这一问题,本文结合浮点数的组成特性提出了有损压缩算 法。首先,对数据进行矢量量化预处理。然后,在可接受的精度损失范围内,将原 始数据转成结构相近的二进制编码字节。最后,进行异或操作并对结果中的冗余部 分进行编码压缩。该有损压缩算法可以实现时间序列中数据值的高效压缩。 最后,通过模拟仿真实验对本文提出的算法进行了验证。实验结果表明,在选 取适当的损失因子后,本文提出的有损压缩算法,能够在损失精度与压缩率之间取 得较好的平衡,同时数据值的压缩率高达5.274 倍,90% 以上的时间戳可以用1bit 进行存储,平均损失率趋近于0 。 关键词:时序数据库;时间序列数据;数据压缩;有损压缩 I 重庆大学硕士学位论文 英文摘要 Abstract With the advent of the era of big data, countless devices need to collect data from different indicators, and the amount of data recorded is very large. If the collected data is directly stored in a traditional relational database, not only will it consume a large amount of storage space, but it will also reduce the efficiency of data transmission, query, analysis, and processing. The existing traditional database system is not efficient for storing time series data, so it is necessary to design a special time series database for the characteristics of time series data. The current

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档