有学者认为,大数据的长项是对资料进行相关分析,而不用进行详尽的因果分析。但对此,学界尚有争议。因果关系需要两个变量在统计上有相关性,在时间上有先后顺序,即自变量在前,因变量在后;在逻辑上自变量的发生导致因变量的发生,即如果自变量没出现则因变量也不会出现。在

admin2021-11-08  31

问题 有学者认为,大数据的长项是对资料进行相关分析,而不用进行详尽的因果分析。但对此,学界尚有争议。因果关系需要两个变量在统计上有相关性,在时间上有先后顺序,即自变量在前,因变量在后;在逻辑上自变量的发生导致因变量的发生,即如果自变量没出现则因变量也不会出现。在传统的回归分析中,统计学注重对假设的检验和模型的显著性,但是在大数据时代,机器学习采用交叉验证的方法,根据结果的准确程度来判断模型好坏,不会深入分析各变量问的关系。因此,在大数据应用中,即使研究人员不知道变量间的因果关系,也可以根据数据间的相关关系得到想要的模型。
    由上文可以推知:

选项 A、相关分析和因果分析都能够建立模型
B、在大数据时代,对数据进行因果分析已不重要
C、统计意义上的相关不能代替因果关系,这一规则将在大数据时代被改写
D、机器学习的方法显著优于传统回归分析

答案C

解析 A项“都能”表述过于绝对,题干未明确指出是否能建立模型,排除。B项因果分析的重要性题干没有讨论。由尾句“在大数据应用中,即使研究人员不知道变量间的因果关系,也可以根据数据问的相关关系得到想要的模型”可知,C项正确。D项“优于”在文段中没有提到。故本题选C。
转载请注明原文地址:https://kaotiyun.com/show/RdBi777K
本试题收录于: 行测题库国家公务员分类
0

最新回复(0)