大数据背景下工程造价数据挖掘问题研究.pdfVIP

大数据背景下工程造价数据挖掘问题研究.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据背景下工程造价数据挖掘问题研究

作者:侯红孟辉

来源:《粘接》2021年第01期

摘要:随着网络信息技术的飞速发展,大数据时代已经到来,并渗透到各个领域中,针对

具体专业领域的大数据应用研究也越来越多。然而对于工程造价领域来说,在这个方面却一直

是个空白。文章从建筑企业在工程单价选取和估算的角度出发,梳理总结了面向工程造价数据

特点的数据挖掘过程,并提出了基于聚类算法对工程造价数据进行分析处理的方法,为海量工

程造价数据挖掘研究提供了有意义的探索。

关键词:工程造价;数据挖掘;聚类法

中图分类号:TU723.3文献标识码:A文章编号:1001—5922(2021)01—0151—05

近些年来,随着网络信息技术的飞速发展,大数据时代已经到来,并渗透到众多领域中,

针对具体专业领域的大数据应用研究也越来越多。然而对于工程造价领域来说,这个方面却一

直是个空白,每天,借助互联网以及各种工程造价系统产生着海量的工程造价数据,但是却没

有科学准确的处理方法对其进行处理,使其白白流失掉,工程造价信息的获取和传递仍然依靠

传统的方式进行,时效性和准确性都无法满足当今工程管理领域的需求。而要对这些庞大的工

程造价信息数据进行处理和挖掘,为工程管理过程的决策提供依据和参考,仅仅依靠人工的处

理技术是远远不够的,要创新应用数据挖掘技术来充分利用工程造价海量数据的价值,以促进

行业快速健康发展。

大数据1背景下工程造价数据分析

工程造价数据1.1

工程造价数据是指具体的工程项目在建设过程中用到的涉及人力、材料、机械等相关单价

数据。这类数据对进行科学准确的工程造价管理,尤其是成本控制,起着决定性的作用。一般

情况下,在实际的工程造价管理中,首先需要获取具体的工程造价数据信息,获取的方式有2

种:①借助一些权威的造价信息平台发布的数据,当前较为权威的平台有全国各地的工程造价

站、专业的工程造价信息网等;②实地调查,通过实地走访当地的市场完成数据的采集和获

取,在获取原始信息之后对其进行相应的整合和处理,在其中选取可信度较高的数据信息。对

于这两种方法来说,第一种的获取方式一般比较常用,因其成本低、且数据来源的可靠性相对

也在可以接受的范围之内,因此,为大多数企业和科研院所广泛采用。在本文研究的过程中也

主要采取此种方式为主要的数据获取方式,采取这样的方式获取工程造价数据,可能出现由于

数据提供机构的不同、采集方式和参考标准的不同而导致不同数据来源对于相同物料的单价不

尽相同,且通过这种方式采集到的数据变化频繁,更新周期呈现出越来越短的趋势,需要我们

通过数据挖掘算法对采集到的原始样本数据进行分析和处理,辅助我们找到获取最准确数据的

方法。

数据1.2本身的特征

工程造价数据因为其本身应用领域和使用方式的不同,也呈现出区别于通用大数据的特

点,具体说来,主要是:

)数据类1型多样。工程造价数据既包括动态变化的数据,比如工料和人力的价格,同时

也包括一些所谓的静态数据,主要有国家以及各地关于工程造价方面的政策文件、规章制度、

标准规范等,这些数据的变化相对来说具有一定的周期性,且一般变动周期较长,在本文中我

們主要研究动态数据,但是在实际的工程造价管理过程中,静态数据也是关注的重点。

)表现形式多样。来源于不同的数据平台和信息系统,工程造价的数据表现形式也不尽2

相同,这里的表现形式多样体现为2个不同的方面:①呈现形式包含文字、图表、数据等,②

同一种形式也因为呈现平台和提供方的不同而具有不同的格式,比如大多数的工程造价信息平

台虽然提供了数字形式的工程造价信息导出功能,但是输出的表格形式也不尽相同,在使用过

程中还是需要先进行相应的变换和整合。

)动态变化性。工程造价数据因为受到市场复杂因素的影3响,其数据一直处于不断的变

化中,不同平台和系统也因为不同的采样和更新周期将其离散化,但是数据本身变化的动态性

是一直存在的。

)多4维复杂性。工程造价数据来源不同,形式多样,表现形式也呈现出不同的样式,加

之变化频繁,构成的过程也呈现出一定的复杂性,以上因素都直接导致了工程造价数据的多维

复杂性。

工程造价数据1.3挖掘的流程

基于数据挖掘的基本流程,笔者提出了工程造价数据挖掘的基本流程及框架,如图1所

示。

工程造价数据的处理和挖掘主要经历4个过程:数据获取和记录、数据抽取和清洗、

文档评论(0)

150****5835 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档