- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
矿床统计预测2017-4-地质变量
4.1 地质变量的概念和种类;地质变量按取值方法可分为2类:
1)观测变量,其值为直接测量的数据。如地层厚度。
2)综合变量,其值为原始观测值的某种有意义的计算结果,如比值、乘积等)。如化探研究中有时可定义如下逻辑变量:;它是综合变量,表示一个单元内岩性的变异度或不确定性,也间接表示局部地质作用的复杂程度。其中 pi 表示单元中观测得到的某种岩性所占的比例,作为该岩性出现概率的估计; n为单元中岩性种类数。;地质变量按其取值的数据类型,可分为
定量变量:值为定量数据。
逻辑变量:值为逻辑数据。又称布尔(boolean)变量。
文本变量:值为文本数据。
定量变量根据数据类型可分为
连续变量:取实数值。
离散变量:取整数值。
逻辑变量和文本变量是离散变量。;在矿床统计预测中,地质变量构置(或称提取)是指指定所拟使用的变量,初步确定矿产预测中所使用的变量集合,并获取其数据,为预测建模作准备。
在矿床统计预测中,地质变量可包括以下各类因素或标志:
(1)各种控矿因素、找矿标志。
(2)各种对矿化有破坏或排斥作用(与矿化强度负相关)的因素或标志。
(3)对矿床形成分布的影响虽尚未明确,但统计分析证明与成矿有关系的各种因素或标志。
(4)以上三类标志的综合;提取变量时应注意:
(1)地质概念模型及勘查、研究成果是重要依据,同时还要利用有关专业知识,提取尽可能多的变量。
(2)变量所代表的地质现象或概念在空间尺度上与单元尺度要有可比性,从而一个变量在一个单元中可以取一个值,在研究范围内不同位置上可能得到不同的值。
(3)尽量提取定量变量。这是因为通过某些变换,定量变量可以变为定性变量,但反过来却不易。
(4)已证明与矿化无关的因素或标志,不应提取。(实际工作中往往难以确认某种地质因素与矿化之间无任何关系。经常需要借助统计分析方法判断是否有关。);4.3 地质变量的变换;(2)离散化。是指将连续变量变为离散变量。
方法:在连续变量的值域中取一个或多个阀值,从而将该值域划分为多个区间,使每个区间对应一个整数值,或文本值,或逻辑值,从???得到一个新的离散变量。
布尔转换是一种离散化。
又如,化学元素丰度,值域为0-100%。选择2个适当的阀值可将它变为一个取三个可能值的离散变量,如取值为“高”、“中”、“低”。;(3)网格化。是指将二维(或三维)空间上不规则分布的定量数据变为按规则网格分布的数据,以便于分析和作图。方法:
1)在原始数据分布的空间范围划分规则网格;
2)计算各网格中原始数据的平均数,作为对应于该网格的新数据。
3)如果一个网格中没有原始数据,可用该网格周围一定范围内相邻网格的数据平均值作为该网格对应的估计值。这种估值的过程称为插值。计算算术平均值是最简单的一种插值方法。除此外还有多种加权平均的内插方法,如距离倒数加权、克立格估值等。
网格化能引起数据平滑的副作用。;网格化例子;(4)标准化。是将随机变量的平均值变为0,标准差变为1的一种线性变换。设原始数据为:;(5)规格化。就是线性改变变量的值域,目的是使不同变量统一量纲、便于分析。一般公式为:;式中 C 是适当的常数,用以避免分母为0等情况。;式中 C是适当的常数,用于避免对数不存在的情况。;(10)划分 是将一个集合分为不重叠且无缝隙的多个子集。通过对值域的划分,将1个变量变成多个不同的其它变量,以便深入研究。比如,;4.4 地质变量的选择;选择变量的具体统计分析方法有许多种。
(1)散点图法 将样品点(比如单元)投绘于变量坐标系中,根据点的分布情况直观考察变量的重要性。例如设y为矿床值,x为任一地质变量,下列散点图可用于变量选择。;(2)相关系数法。根据一个变量与矿床值的相关系数大小来判断变量的重要性;或根据两个变量的相关系数大小来判断其是否相互线性相关。相关系数计算公式为;(3)秩相关系数法。根据变量与矿床值的秩相关系数大小来判断变量的重要性。秩是指数据按大小排序后的序号。秩相关系数计算方法如下。;秩相关系数计算的例子(n=6);与一般线性相关系数相比,秩相关系数在衡量两个随机变量线性相关程度方面较粗糙。但某些情况下能反映两变量的非线性相关。比如下图。;(4)秩和检验法。用于判断某一变量在两个不同总体(比如“有矿单元”和“无矿单元”)中取值是否有显著差异。秩和检验法根据数据情况有许多种具体方法,其中较简单的一种如下。
设变量为 x ,两总体的样品数分别为 n1 和n2,并设 n1≤n2 。两总体样品混合起来,样品总数为n1+n2 。
1) 将全部样品混合后按 x从大到小顺序排列。各样品的序号称“秩”。
2) 将第一总体的 n1个样品的秩求和,得T 。
3) 给定信度(如?=0.05),查“秩和检验表”,得秩和的上下限 (T1, T2)。
4)判断:若 T 落在区间
文档评论(0)