R语言对BRFSS数据探索回归数据分析报告 附代码数据.docxVIP

R语言对BRFSS数据探索回归数据分析报告 附代码数据.docx

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

R语言对BRFSS数据的探索

摘要

该项目包括探索真实世界的数据集-疾病预防控制中心2013年的行为风险因素监测系统-并创建了三个学生选择的研究问题的报告。

所选择的研究问题及其各自的结果如下:

?被访者对其身体质量指数(BMI)的健康状况有何看法?性别是否有区别?

是的,健康知觉与BMI之间有明显的关系,也有性别差异。

?作为一名幼儿的父母,如何影响报告的睡眠时间?这在性别上有什么不同的报道?

?作为一个年幼的父母,导致报告的睡眠减少,包括男女之间的差异。

?是否对与一年中调查时间有关的一般健康认知做出反应?各州之间有什么分歧?

冬季和非冬季的反应在国家层面上没有显着差异,但是在各州的反应方面存在差异。

建立

初始阶段包括加载所需的软件包和数据。

加载包

library(ggplot2)

library(dplyr)

加载数据

数据从本地文件加载

load(brfss2013.RData)

dim(brfss2013)

##[1]491775330

从上面可以看出,数据集由近500,000个观察值和330个可能的变量组成。?并不是所有的观测数据都包含了所有的变量,因此数据质量在下面的每个问题上分别进

第1部分:数据

BRFSS的背景

根据CDC网站,“行为风险因素监测系统(BRFSS)是美国首屈一指的与健康有关的电话调查系统,收集美国居民的健康相关风险行为,慢性健康状况和使用预防性服务。?BRFSS成立于1984年,拥有15个州,现在收集所有50个州,哥伦比亚特区和三个美国领土的数据。?BRFSS每年完成40多万次成人访谈,成为世界上最大的连续进行的健康调查系统。“

方法

根据疾病预防控制中心的数据,“BRFSS是一项跨部门的电话调查,国家卫生部门每月通过固定电话和移动电话进行一次标准化问卷调查,并获得CDC的技术和方法支持。在进行BRFSS座机电话调查时,调查员从一个随机选择的家庭成人中收集数据。在进行BRFSS调查问卷的移动电话版本时,调查员从通过使用移动电话参与并居住在私人住宅或学院住房的成年人那里收集数据。

关于概化,因果关系和偏见的观察

虽然课程材料简要地提到了更高级的统计内容(因果推断),但考虑到作者对于因果关系的现有知识,可以做出以下陈述:

?关于泛化能力的话题:由于调查的广度-在美国所有50个州和其他美国领土上,由CDC与各州卫生机构协调,-它似乎捕获了足够的随机样本,使其可归纳为广泛的美国人口。

?因果关系:考虑到BRFSS是一种观察性练习-没有明确的随机分配治疗-所有指出的关系可能表明联系,但不是因果关系。

另外,考虑到BRFSS的方法,对于偏见有一些担忧:

?通过电话调查,有可能低报几种类型的个人:

?那些无法使用固定电话或手机的人。

?原则上不接受电话调查的人。

?调查时没有调查的地方。

?由于面试问题的答案没有得到确认,受访者可能会以各种方式改变他们的回答:

报告不需要的行为和特征,而低报不受欢迎的行为和特征。

系统地夸大身高或收入等特征。

自从被要求将细节记忆到30天或更长时间之前,请不要忘记关键信息。

?最后,参与国家机构之间的访谈实践和问题集可能存在不一致之处。详情请见CDC网站。

为了将来的参考,如果数据集包括关于每次采访的细节以及采集的时间,这将是有用的。这将进一步了解那些可能或不可能参与调查的人。

第2部分:研究问题

研究问题1:

被访者对其身体质量指数(BMI)的健康状况有何看法?性别之间有什么区别?

这是一个很有意思的问题,因为它寻求将自己的健康状况与客观的整体健康状况联系起来。?BMI不是没有争议(例如见这里),但它被广泛认可。性别之间的差异也很有趣,因为人们可以梳理出社会内部不同的看法和压力。

分析使用以下变量完成:

genhlth-对应于一般健康

?X_bmi5cat-将BMI分为4类的计算变量。?BMI来源于报道的身高和体重。

?性别-报告的性别

研究问题2:

作为一个年幼的孩子的父母如何影响报告的睡眠时间?这在性别上有什么不同的报道?

这是一个很有意思的问题,可以估计作为幼儿的家长对受访者的影响。了解这一点有助于帮助他人更好地理解父母,并可能同情父母。了解这种影响在男性和女性之间是否明显不同也是有用的。

分析使用以下变量完成:

?sleptim1-报告每晚睡眠时间

?rcsrltn2-被访者与同一家庭随机孩子的关系

?X_impcage-将儿童年龄分为4个可能类别的推算变量。

?性别-报告的性别

研究问题3:

是否对与一年中调查时间有关的一般健康认知做出了回应?各州之间有什么分歧?

这个问题看季节方面可能如何影响反应。在这种情况下,感兴趣的是冬季月份对整体健康反应的潜在影响。作为后续研究,它考虑了美国

文档评论(0)

zhangwe1688 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档