- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
知乎23届校招数据分析试题
1.现在想筛选出一些优质的内容,筛选的标准是:内容作者的评级大于5级、或者尽管内容作者评级小于5级,但内容本身的评级大于5级或者内容获得的喜欢数大于1000,同时,所筛选出来的内容类型要求为1,下列SQL中,where条件可行的是()
A.whereauthor_level5or(author_level=5and(content_level5orlike1000))andtype=1
B.where(author_level5orauthor_level=5)and(content_level5orlike1000)andtype=1
C.where(author_level5or(author_level=5andcontent_level5orlike1000))andtype=1
D.where(author_level5orauthor_level=5and(content_level5orlike1000))andtype=1
正确答案:D
解析:这道题考查SQL语句中筛选条件的逻辑。优质内容的筛选有明确规则,D选项准确涵盖了所有条件:作者评级大于5级,或作者评级小于等于5级但内容本身评级大于5级或喜欢数大于1000,同时内容类型为1。A、B、C选项在条件组合或表述上存在偏差,不符合题目要求。
2.如果想监控一段时间内,不同活跃频次的用户贡献的APP时长的比例变化,下列哪中展现形式更好()
A.堆积面积图
B.饼图
C.条形图
D.直方图
正确答案:A
解析:这道题考察的是对数据可视化图表的理解和应用。要监控不同活跃频次用户贡献的APP时长比例变化,需要一种能清晰展示各部分占比及其随时间变化的图表。堆积面积图能很好地展示不同类别数据随时间的变化趋势和占比,适合本题需求。饼图主要用于展示静态的比例关系,条形图用于比较不同类别的数据大小,直方图则用于展示数据的分布情况,均不适合本题需求。因此,A选项堆积面积图是最合适的展现形式。
3.有下列两张表,表1记录着每个作者的id和这个作者的等级,表2记录着每个等级对应等阶划分,现想在表1中添加C列,记录该作者的对应的等阶,在EXCEL中,可以在C列输入哪个函数()
A.=vlookup(B:B,D:E,2,1)
B.=IF(B1=1,初级,B1=2,初级,B1=3,中级,B1=4,中级,B1=5,高级)
C.=vlookup(A:B,D:E,2,1)
D.=IF(B:B=D:D,E:E,0)
正确答案:A
解析:暂无解析
4.A、B、C三个人在五一假期外出旅行的概率分别为1/2、1/3、1/4,假设三个人的行动相互之间没有有影响,那这三人中至少有一个在五一假期外出旅游的概率是()
A.1/24
B.11/24
C.2/3
D.3/4
正确答案:D
解析:这道题考查概率的计算。三人都不外出旅行的概率为:(1-1/2)×(1-1/3)×(1-1/4)=1/4。至少有一人外出旅行的概率用1减去都不外出的概率,即1-1/4=3/4。选项A明显过小,B也不符合计算结果,C也不正确,所以答案是D。
5.假设有一种病毒,它的携带率为1/2000。有一种化验方法可以精准地检测到这种病毒,也就是说,如果一个人携带这种病毒,一定可以被检测出来。但是该项化验的假阳性率为1%,即健康人接受该项化验,会有1%的可能性被误诊为病毒携带者。假设从人群中随机选择一人进行检测,化验结果为阳性(阳性意味着受检者可能是该病毒携带者)。那么,在不考虑其它变量的情况下,此人携带该病毒的概率最接近下列哪个数据?()
A.99%
B.5%
C.2%
D.1%
正确答案:B
解析:这道题考察的是对概率论中贝叶斯定理的应用。首先,我们知道病毒的携带率为1/2000,即0.0005,假阳性率为1%,即0.01。根据贝叶斯定理,我们可以计算出在化验结果为阳性的情况下,此人真正携带病毒的概率。这个概率等于(携带率*检测准确率)/(携带率*检测准确率+健康率*假阳性率),即(0.0005*1)/(0.0005*1+0.9995*0.01),计算后得到的结果最接近5%。
6.从随机数字表抽得50个(各取两位数字)随机数作为两个样本,求得则理论上()
A.
B.作两方差齐性的F检验,必然方差齐
C.做两样本均数的t检验,检验必得出无差别的结论
D.分别从两样本求出的总体均数的95%的置信区间,很可能有重叠
正确答案:D
解析:暂无解析
7.某个工程开
文档评论(0)