期刊共被引矩阵对角线问题实证研究.docVIP

下载本文档

5
0
约5.39千字
约 12页
2018-05-16 发布于福建
举报
版权申诉

期刊共被引矩阵对角线问题实证研究.doc

1、本文档共12页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

期刊共被引矩阵对角线问题实证研究

期刊共被引矩阵对角线问题的实证研究　　[摘要]在共被引分析中，至关重要的一步是生成共被引矩阵。对共被引矩阵对角线的处理，学术界仍然存在争议。在总结前人几种对角线取值方法的基础上，从社会网络、共被引分析的原理和期刊动态变化的特点三个角度出发，认为期刊共被引矩阵对角线的取值应为该期刊与自身的实际共被引次数，并通过实证数据进行验证。　　[关键词]期刊共被引　对角线取值　聚类分析　核心-边缘结构分析　　[分类号]G350 　　　　1　引　言　　　　共被引分析方法是引文分析方法的一种，自从1973年分别由Small和I．V．Marshakova提出后，就备受研究者们关注。根据分析对象的不同，共被引分析方法主要分为文献共被引、作者共被引、期刊共被引和专利共被引等几种。　　期刊共被引是以期刊为基本单元而建立的共被引关系。期刊共被引分析方法于1991年McCain首先引入并运用于期刊及学科领域的研究以来，理论与方法逐渐发展，运用领域也不断扩大。随着科学知识图谱、可视化技术、社会网络分析等逐渐成为科学计量学研究的热门，期刊共被引分析越来越成为人们关注的热点。　　期刊共被引分析的步骤，学术界普遍采用1990年McCain对作者共被引技术总结的模式，其归纳为选择作者、检索共被引频次、生成共被引矩阵、转化为Pear.SOil相关系数矩阵、多元分析和解释结果等几个步骤。这几个步骤中，生成共被引矩阵是基础和关键的一步，后面的分析均基于该矩阵。　　共被引矩阵是个对称矩阵，非对角线上元素表示两两之间共被引的次数(也称共被引强度)，共被引强度越高，则说明关系越密切；然而，对共被引矩阵对角线取值的处理，学术界提出过多种观点，但至今没有统一的定论。由于不同的对角线取值，会造成期刊共被引分析结果的差异，因此有必要对期刊共被引矩阵对角线取值问题进行探究。　　　　2　共被引矩阵对角线取值的几种方法　　　　2.1　总被引次数　　对角线上的数值采用文献总被引次数或作者总被引次数(包括了作者自引的次数)，这是学者们对共被引分析对角线取值的最初思考。国内学术界一些早期的研究L2-3]即采用这种观点。这种做法，数据易取，容易操作。但其取值依据明显与共被引理论不一致，造成分析的结果失真严重。因而，用总被引次数填充共被引矩阵对角线的做法，逐渐被其他做法代替。　　　　2.2排序前三的共被引频次之和的一半　　White和Grififth最初是将对角线值定为：排序前三的共被引频次之和的一半。因为，一方面对角线上取作者总被引次数远远高出其他作者间的共被引次数，另一方面是作者同名造成的影响很大。　　　　　　对角线取排序前三的共被引频次之和的一半，部分解决了失真和作者同名的问题，又可突出共被引分析中对角线上数值的相对重要性。这样做能解决对角线取总被引次数的一些问题，但此做法的合理性缺乏有效的证明。并且，现代检索技术的发展，同名的问题已基本得到解决。　　　　2.3　缺失值　　对角线上的取值直接采用默认的缺失值，是Mc.Cain提出的，这也是影响最广泛、目前最普遍的一种对角线确定方法。MeCain提出这种做法，也是为了解决对角线上采用总被引次数造成失真严重的问题，并通过作者共被引的实例证实缺失值的聚类、多维尺度、主成分分析的结果与White和Griffith采用排序前三的一半的做法，结果相差不大。　　在聚类分析、多维尺度分析中，对角线值缺失的共被引矩阵需要将对角线默认为0，再转化成相关系数矩阵，这样相似矩阵对角线就自动变为1，这种取值方法解决了进一步多元分析中程序的限制问题。从表面看来，在处理数据方面非常方便，但忽略了研究对象的背景与含义。共被引矩阵是考察各对象之间亲疏关系的相似矩阵，撇开对象与自己的关系，孤立地分析对象与对象之间的亲疏关系，存在一定的不合理性。　　　　2.4　最大值和最大值+1 　　White在文献[6]中，建议使用期刊被引频次的最大值作为对角线取值。他从Person相关系数矩阵测度相似性的角度出发，并通过实例，说明采用默认值的做法会使分析结果存在一定的人为特定目的。取最大值的做法，比起排序前三的一半的做法，更加凸显对角线的重要性，也方便操作。　　我国学者邱均平从临近矩阵的角度出发，认为：按照共被引的假设――具有相同的共被引强度意味着具有相同的相似程度，期刊与自身的关系应为最亲近(相似)，建议用最大值+1来凸显期刊与自身的亲密关系，并以编辑出版类期刊群和图书馆学情报学期刊群做了实证分析。　　采用最大值或最大值+1的做法，从相似性的角度看，存在一定的合理性，而且数据易取，操作简单。但难于解释的一个问题是：为何取最大值或最大值+1，而不是最大值+2、最大值+N?理论依据