老师
大家好,欢迎大家来到江苏省名师空中课堂,我是昆山经济技术开发区高级中学丁辉老师。今天我们跟大家共同学习的主题,数据的来源收集和分析。同学们好,我们首先一起来回顾一下上节课讲到的核心概念,老师给大家准备了一个表格,我们一起来看一下。当我们出现男字了以后,我们并不知道这个人是谁。随着内容的越来越多,我们对相关的人物越来越清晰,通过两条信息的这个推导,我们得出他们是老乡通俗的理解。表格当中的内容,我们把它称为叫数据,表达出一条完整的语义题,我们把它称为叫信息。两条信息推导出来的内容,我们把它称为叫知识。
老师
这节课我们一起跟大家来探讨数据的来源收集与分析,粗识数据科学。首先我们从社会热点问题来看一个案例,随着生活水平的提高,越来越多的学生成为了小胖子,小胖子也有很多的烦恼,比如爱打瞌睡、易饿,体育跑不动,过重的身体影响的日常生活。想调查饮食与肥胖之间存在的相关性。现在请你拿出一套方案,即思考三个问题,怎么样调查,什么内容,如何来分析两者这样的关系。
老师
我们首先暂且搁置问题,我们先来看数据的来源,按照数据的获取的直接性,我们可以把它分为叫直接数据和间接数据。顾名思义,直接数据就是从调查者直接获取的数据,相对而言,它的样本空间受到调查的成本、环境等等其他因素的影响,样本量可能不一定很大,相对而言成本也相对比较高。间接数据我们可以借助于中间人或者指或者在线调查的方式来间接地获取数据,我们可以获得大样本的数据,相对而言调查的成本也比较低,实施起来比较方便。
老师
除了这种分类的方式以外,随着互联网的发展,人工智能的发展,我们现在手机的 APP 当中制了很多的传感器,比如说老师手上戴着手环,我们获取的数据也可以把它分为意识干预下的数据的获取和非意识干预下的数据获取。比如说我们纸质的调查,当我们知道要去调查你的相对的比较隐私的数据时,我们人为的有时候会优化数据,这样我们得到的数据的样本就不一定真实。
老师
非意识干预调查,比如说我们手机的APP,类似手机的类似于我的手环,我们得到的数据是由我的行为所分析直接得出来,相对而言数据比较真实。在现实生活当中,我们可以根据实际情况来选择不同的数据来源,那数据如何获取?具体的方法如下,我们有反弹法,我们有文本汇总、观察记录以及调查问卷,我们甚至可以通过在线调查的方式。请问如果现在收集我们班学生有关于饮食和肥胖之间的关系的调查看隐藏内容