基于云计算的数据存储和挖掘研究.pptxVIP

基于云计算的数据存储和挖掘研究.pptx

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于云计算的数据存储和挖掘研究;;;01;;;;02;;;虚拟化技术:虚拟化技术是指计算元件在虚拟的基础上而不是真实的基础上运行,它可以扩大硬件的容量,简化软件的重新配置过程。CPU的虚拟化技术可以单CPU模拟多CPU并行,允许一个平台同时运行多个操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。

分布式存储技术:分布式存储技术是将数据分散存储在多台独立的设备上。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。

海量数据管理技术:云计算系统中的数据管理技术主要是Google的BigTable数据管理技术和Hadoop团队开发的开源数据管理模块HBase。Bigtable是Google开发的基于GFS、Chubby、MapReduce的大型分布式存储系统。它为Google的很多数据密集型应用提供了无缝数据服务能力。Google的很多数据密集型应用都构建在Bigtable之上(如GoogleEarth、GoogleFinance等),在这些应用中,Bigtable能够达到很高的性能水平。;03;;;性能比较:分布式文件系统和对象存储技术在性能上有所不同,分布式文件系统通常提供更高的吞吐量和更低的延迟,而对象存储技术则更适合于存储大量不变的数据。

可扩展性比较:分布式文件系统和对象存储技术都具有良好的可扩展性,但分布式文件系统通常需要更多的管理工作,而对象存储技术则更容易实现自动化管理。

成本比较:分布式文件系统和对象存储技术的成本也有所不同,分布式文件系统通常需要更高的硬件和运维成本,而对象存储技术则通常按需付费,更加灵活。

选择建议:在选择云存储技术时,应根据实际需求进行评估和选择。如果需要处理大规模的数据集和进行复杂的数据分析,可以选择分布式文件系统;如果需要存储大量的不变数据,并且希望实现自动化管理,可以选择对象存储技术。;04;;;;05;;;;;06;;金融机构可以利用???计算平台实现海量金融数据的集中存储,包括交易数据、客户数据、市场数据等。;;07;;;感谢观看

您可能关注的文档

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体 太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档