《教师生活365》网[师慧园]论坛

 找回密码
 必须实名注册
查看: 73|回复: 0
打印 上一主题 下一主题

信息时代的骗局:背离现实世界 大数据毫无价值

[复制链接]

1万

主题

2万

帖子

20万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
204692
跳转到指定楼层
楼主
发表于 2014-7-4 17:17:18 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
信息时代的骗局:背离现实世界 大数据毫无价值
2014年07月04日
来源:译言网 作者:Emily Dreyfuss












如果说大数据擅长测量人们的行为,那么它在认识人们日常事物的隐性知识方面则是失败的。一种内隐的认识在控制着我们的行为。跟身边的事物一样,这些不可见的隐性知识只有主动去看,我们才能发现。


(图片作者:Gary Waters 来自:盖蒂图片社)
经过一代人的时间,“技术天才”与社会的关系发生了改变,他们从宅男变成了救世主,从反社会群体变成了社会的最大希望。许多人似乎确信,当下理解我们世界的最佳方式便是坐在屏幕前,分析海量信息——我们称其为“大数据”。
来看看“谷歌流感趋势”吧。2008年,当它面世时,硅谷的许多人员鼓吹其将成为大数据的另一个里程碑,并且会很快淘汰掉传统分析。
不过,他们错了。
如果硅谷的大数据传教士们真想“了解世界”,那么他们不仅需要掌握数据的量,也要掌握数据的质。
“谷歌流感趋势”不仅没有提供流感传播的精确图表,它也无法实现大数据作为传道者的美梦。没有“厚数据”,大数据就什么也不是。你必须离开电脑,深入到现实世界当中来获取这些丰富且带有情境化的信息。电脑极客们一度因不擅社交而被嘲笑,他们被告知应该“多出去走走”。事实上,如果大数据最主要的拥趸者希望理解这个他们也参与塑造的世界,他们真的需要出去走走。
与修改算法无关
“谷歌流感趋势”试图通过识别人们在流感季可能搜索的词汇来发挥作用。当它追踪的词汇搜索达到高峰时,谷歌会向大家预警新流感的爆发,这大约要比官方数据早两周时间。
对很多人来说,“谷歌流感趋势”成为了大数据之力的代表。在畅销书《大数据:一场改变我们生活、工作和思考的革命》中,作者维克托-迈尔-舍恩柏格和肯尼斯-库克耶称,与政府滞后的数据报告相比,“谷歌流感趋势”是更有用、更及时的流感指示器。为什么即便费心查看数据,人们还是会得病,我们何时才能知道究竟什么与疾病相关?“因果关系”他们写道,“不会被丢弃,不过其立意的根本正受到考验。”
然而,本月发表在《科学》上的一篇文章表明,自2011年八月起,“谷歌流感趋势”几乎每周都会高估流感的流行性。
回溯到2009年,在发布后不久,“谷歌流感趋势”完全没预警到猪流感。这证明人们在流感季搜索的许多词都与流感无关,而与每年这一季相关的词通常都有:冬天。
如今,很容易说(像许多人做过的那样)“谷歌流感趋势”的失败源于大数据的不成熟。不过,这样便错过了问题的关键。当然,调整算法、提高数据收集技术将会让下一代大数据工具变得更有效。然而,大数据真正的狂妄之处不在于我们对一套不成熟的算法和方法过于自信,问题是我们盲目地相信坐在电脑屏幕前,捣鼓一些数字就足以让自己对周围广阔的世界有个了解。
为什么大数据需要“厚数据”
大数据仅仅是在收集人文学科中所谓的”薄数据“,它们由我们的动作和行为路径产生。我们每天最常走的路线,在网上搜索的东西,睡了多久,人与人之间的多种联系,我们所听的音乐类型等等。这些数据来自于你浏览器中的cookies,你腕上的fitbit或是你手机里的GPS。人们的这些行为内容无疑是重要的,但它们并不是全部。
为了真正地了解人,我们也必须了解经验的那部分,即人类学家所指的“厚数据”。它不仅仅捕捉事实。比如说,美国有86%的家庭主妇每周会喝掉6夸脱以上的牛奶,但是她们为什么喝牛奶呢?而且这像什么呢?一块带有星星和条纹的三色布是薄数据,而一面在风中高高飘扬的美国国旗便是厚数据。
在探寻“我们做了什么”的基础上,大数据简单地认识我们;厚数据尝试通过我们如何与所在的不同世界相联系来了解我们。只有了解我们的世界,人们才能从整体上真正认识它,这恰恰也是谷歌、facebook这类的公司想要做的。
用0和1认识世界
想想当下硅谷的那些宏伟宣言,谷歌有名的宗旨是“组织全球信息,使人人皆可访问并从中获益。”最近,马克-扎克伯格跟他的投资人说,在全球性连接变得日趋重要、知识经济不断受到强调的背景下,Facebook带来了一个全新的视角,即”认识世界”。他描述了未来“认识”的样子:“人们每天向graph(Facebook的算法搜索机制)发布数十亿条内容和链接,由此建立各种有待了解事物的最明晰模本。”在这个追求认识的过程中,即便是一些小公司也可以分享信息。去年,捷波朗软件的副总裁耶利米-罗宾逊说道,他们的健康跟踪设备JawboneUP试图“认识行为变化的科学。”
与收集的数据一样,这些目标也非常“大”。毋庸置疑,商业渴望更好地认识社会。毕竟,与客户行为及文化相关的信息不仅是经营的关键;在知识经济时代,它们也逐渐成为一种货币,用来交换点击数、浏览量、广告费,或是更简单直接的——权力。在此过程中,倘若谷歌、facebook这类公司能帮助我们不断地增进对自己的认识,它们便将获得更大的权力。问题是声称电脑终将组织所有数据,或是向我们提供对流感、健康、社交联系或任何其他事情的全面认识,这彻底拉低了数据和认识的意义。
如果硅谷的大数据传教士们真想“了解世界”,那么他们不仅需要掌握数据的量,也要掌握数据的质。不幸的是,要实现后者,人们要将电脑放下,不仅“从谷歌眼镜中看世界”(或是从facebook中、从虚拟现实中),还要去体验真实的世界。这样做有两个重要原因。
要了解人,你就要了解他们所处的情境
如果你对一个领域高度熟悉,薄数据则是最有用的。你有能力填补信息的不足,设想到人们为什么这样做或为什么有这样的反应——当你能想象并重建行为发生的情境时,薄数据便是有意义的。如果不知道情境,想推断出任何因果关系或是了解人们的行为动机则是很难实现的。
这也是为什么在科学实验中,研究人员需要竭尽全力掌控实验室环境的方方面面,以求打造一个人为场所,使各种影响因素都在可计量范围内。不过,真实世界并不是一个实验室。能确保你对陌生情境有所了解的唯一途径即是置身其中地去观察、去内化并阐述正在发生的每一件事。
世上大部分是我们所不知道的隐性知识

如果说大数据擅长测量人们的行为,那么它在认识人们日常事物的隐性知识方面则是失败的。我怎么知道刷牙时该挤多少牙膏?什么时候该并入行车道?眨眼是表示“这东西真有趣”还是“我的眼睛进了东西”?这些都是内化的能力、无意识的行为,一种内隐的认识在控制着我们的行为。跟身边的事物一样,这些不可见的隐性知识只有主动去看,我们才能发现。不过,它们却对每个人的行为方式有着重要影响。它能够解释事物是怎样、以哪种意义与我们联系起来的。
人类及社会科学中有一系列俘获和解释人的方法,他们所处的情境,他们的隐性知识,而且这些都拥有一个特质:它们要求研究者进入杂乱而真实的生活。
没有哪一个工具可以成为认识人类的快捷方式。尽管硅谷有许多出色的发明,不过我们对数字技术的期望还是要有个限度。“谷歌流感趋势”真正教给我们的是:不能仅仅问这个数据有多“大”,还要问问这个数据有多“厚”。
有时,走进真实的生活将会得到更好的效果。有时,我们必须要离开电脑一会儿。




让教育在大数据时代寻找大机遇
——对话美国卡内基梅隆大学高级访问学者魏忠
《今日教育》特约记者 凌馨翁
曾有人如此解读大数据应用:美国的Target百货公司上线了一套客户分析工具,可以对顾客的购买记录进行分析,并向顾客进行产品推荐。一次他们根据一个女孩在Target连锁店中的购物记录,推断出这个女孩怀孕了,然后开始通过购物手册的形式向女孩推荐了一系列孕妇产品。
从一个人杂乱无章的购买清单中,经过对比发现了其中的规律和不符合常规的数据,并就此得出一些真实的结论,这就是大数据应用的一个典型案例。
那么,大数据到底是什么?它将为教育带来怎样的机遇与挑战?教育工作者如何在大数据时代确定自身定位?
今天,大数据研究领域内的专家——美国卡内基梅隆大学高级访问学者、上海海事大学经济管理学院副教授魏忠,将为我们展现一幅大数据在教育领域的应用图景,解读如何让教育在大数据时代寻找大机遇。
从平常的教育中看大数据
记者:最近几年,随着信息技术的高速发展,大数据、慕课、翻转课堂、微课等引发了全国教育界的高度关注,部分地区、学校也已开始试点应用。那么,大数据最大的特点是什么?教育领域的大数据又体现在哪些方面?
魏忠:大数据最大的特点在于它记录、提供了海量的过程性、个性化的数据。
这些数据在什么情况下产生,背景是什么,是非常容易理解而且是非常真实的,是没有经过衰减的信号。为什么过去也提数据,但近几年大数据突然“热”起来了?这就是因为现代信息技术的发展和成熟,为大数据的记录、生成提供了基础。这种进步非常不简单,有了现代信息技术才可能达到。
具体到教育领域,在学生的学习成长过程中,会积累大量的结构性、非结构性数据。例如每一次考试的成绩、学习的速度、在哪方面有特长、曾经获得过哪些奖励、参加过哪些社会活动等,在电子档案中将一目了然,包括学生的微博、微信、QQ等网络社交活动中也会留下大量的信息,成长轨迹非常清晰。这些东西构成了完整的证据链,你是什么样的人,应该是能准确知道的。高校招生就可以通过这些过程化的数据,来判断、选择适合自己学校的学生。学生的过程数据还可以显示这个学生是更适合做医生还是工程师,更应该从哪个方向努力、从事什么工作,这对学生更为重要。
记者:在教育领域,也有很多的数据,比如平均分、升学率等等,您认为大数据与传统数据如何区分?
魏忠:你说的这些准确地说不是数据,而是数字。数字与数据最简单的区别在于,数字只是表面现象,仅仅是一个结果,几乎没有意义,很容易造成事情简单化;而数据蕴涵着更深层的信息,是过程性和综合性的考虑,更能够考量真实世界背后的逻辑关系。
比如说一个学生考试得了80分,好还是不好?放在一线城市的热点小学他是差生,放在农村小学里他就是优生。80分,只有和它的环境背景信息一起被考量的时候,才有意义。环境背景信息通常叫元数据。把80分背后的元数据考虑进去,例如这个学生的家庭背景、学习态度、智力水平等,再把这些元数据和80分放在一起,和学生过去的70分,未来的90分进行对比分析,才能说这80分是数据。80本身是个数字,80背后是数据,而且是庞大的数据。
传统数据诠释的是宏观的教育状况、整体的学生水平,且其采集方法、内容归类、分析构成等已被摸索出一套成熟的标准,数据更多是在阶段性的评估中获得。而大数据更关注微观、个体层面,要求时时处处采集信息,全面客观记录信息,大量采用可视化展现方法等等,帮助信息收集方获取精准材料。大数据与传统数据相比,有非结构化、分布式、数据量巨大、数据分析由专家层变化为用户层等特点,这些特点正好适应了个性化和人性化的学习变化。
最近还有一个非常热的问题,就是有人提出了小数据的概念,讨论大数据和小数据到底哪一个更有效。我曾去过一些省份,发现一些老师热衷于统计班里学生的答题情况,哪道题答对了,哪道题答错了。而上海有一个课题,拿个摄像头对着讲课老师,通过观察,分析他的教学应该从哪些方面改进。他们认为这些是大数据。其实这都是小数据,只观察了某一部分。大数据一般具有数据体量巨大、数据类型繁多、数据来源完整真实、处理速度快、价值密度低但价值高的特征,是完整全面的。大数据和小数据哪个更管用?如果你能证明你的教学方法、教学目的是准确的,那小数据是有用的。
大数据时代,教育向实证科学贴近
记者:您曾谈到有些结论看似是真理但其实是谬误,是不是可以这样理解,许多情况下的所谓真理它其实只是一个表面化的东西,而大数据让它更加深入和准确了?
魏忠:对于某一结论,它背后的背景更有意义,失去这个背景,变化很快的环境就会造成无效的结论。从教育的角度上说,如果仅靠抽样获取的数据来证明这种教学模式好,那种授课方法不好,是不准确的。我们今天觉得很多有用的数据,是怀着某种目标得来的,这个目标对还是不对,从不同的角度上看是不一样的。
大数据给了我们一种可能性,使我们可以用不同的视角去看同一件事情。通过大量的实验、研究等获得实证数据,以完整真实的数据为依据,分析学生,分析老师,这样得出的课程教学模式、师生评估方法等就更具针对性、可行性,得出的结论才能更科学、更精确。
在我看来,未来,当数据量积累到了一定的程度,教育将从人文社会学科变成实证科学,大数据应用的前景也会越来越光明,但道路也会越来越曲折。 
信息技术时代,未来学校得益于互联网教育而获得新生
记者:随着网络信息技术的发展,教育信息无处不在。现在的问题不是信息太少,而是信息过载?信息化将给教育带来怎样的冲击?
魏忠:可以理解为信息过载。我们现在有个误解是认为有电脑之后才有信息化,并且信息化能使教育成功。事实上,电脑只是一种信息的载体,竹简、书本等也都能传递信息,只不过信号强度不同。我相信没有任何一所学校能把所有的东西堆在一起,信息过载,反而容易致使某些学校不知如何准确选择适合自身发展的内容,同样,也容易致使某些老师在面对庞杂的教育资源时,不知怎样筛选可供有针对性指导学生发展的内容。
信息技术从外围给教师增加了新的竞争对手。信息技术的应用又导致学生在心理预期、学习习惯等方面的变化,这就从核心和内部促进着教学过程的转变。学生变了,不如以前“好带”。这也许并不是坏事,在这当中,不知潜藏了多少机遇和可能性等待着有心之人去发现。
记者:那您认为未来教育的图景是什么样的?
魏忠:我的判断是,大数据时代,互联网教育与学校教育将逐渐分离,正如电影院和电视机在初期竞争的时候水火不相容,而成熟以后会各得其所。翻转课堂提供了一种互联网教育与学校教育共存的新模式。事实上,学校里更多的实验室与更少的课堂,更多的交往与更少的讲授,更多的互动与更少的灌输,更个性化的服务和更灵活的学制,将是未来学校得益于互联网教育得到新生的机会。
解放了的知识本身被学校扔掉,学校不再是知识的独家代理商,人的本身才是教育的重点。我在讲授《网络工程课》时,大学三年级的60个学生在一个学期内对这门课程的点击量达到70000次,所花时间占他们该学期开设所有10门课程学习时间的60%,这一门课程的资源总合达到75G。是什么原因提高了学生的学习积极性,形成庞大的数据量呢?是通过任务教学、可视化诱导、日志排名、学习效果反馈、社交网络等MOODLE 和SAKAI 常用的或者定制的插件。大数据研究可以帮助老师重新审视学生需求,通过现代信息技术寻找吸引学生参与教学活动的方法。信息技术解放了一些具有创新精神的老师,使他们抛弃了大量重复的劳动而将精力集中在了教师的核心功能。
在学校,传统的每个班级40个学生以及每个老师讲45分钟,无异于让程度不同的学生排着队接受教师的“专家门诊”,与此同时,大量的学校实验室和美丽校园,却在排着队浪费,它们等学生下课去体验。而随着教育信息化的进展,更好的排队系统和行为分析系统,会将老师一对多的讲授,变成互动的沟通,这些都是技术的解放力量。
信息化革新教育模式,教育数据更易获得和整合。处于信息化的时代,学生获取知识的途径不再主要是课堂学习。线上学习越来越成为学习知识的主要途径,而课堂成为交流学习成果,答疑解惑的场所。比尔·盖茨声称:“五年以后,你将可以在网上免费获取世界上最好的课程,而且这些课程比任何一个单独的大学提供的课程都要好。”如此一来,学习行为的数据将自动留存,更易于后期的学习行为评价和评估,教师不再基于自己的教学经验来分析学生的共同点,在学习中的偏好,遇到的难题等,只要通过分析整合学习的行为记录,就能轻而易举得到学习过程中的规律,这对教师的下一步工作重点有指导意义。并且线上学习能做到个性化教学,根据个人的学习数据制定相应的学习计划和辅导。利用数据挖掘的关联分析和演变分析等功能,在学生管理数据库中挖掘有价值的数据,分析学生的日常行为,可得知各种行为活动之间的内在联系,并做出相应的对策。
技术重新定义教育,教师要贴上“个性化”标签
记者:慕课和翻转课堂进入中国后,有专家断言未来的中小学教师会失业,您怎么看这个问题?
魏忠:我并不认为教育技术可以取代老师,而是技术重新定义了教育。翻转课堂、信息技术下的教育可以不要老师吗?恰恰相反,你看视频,越来越标准化。但学生是个性化的,这就需要我们老师学会高效利用高新技术、利用教育信息资源,有针对性、更个性地指导学生成长、进步。
很难讲今天的老师比学生懂得多,更权威、准确。但是老师是不是更重要呢?当然更重要。为什么?教师的功能发生转变了,教师不再是知识的垄断者了,随着知识从学校教育中逐步剥离,传授知识不再是老师最重要的职能,教师培养什么样的人,对学生进行个性化辅导、指导的职能越发重要。翻转课堂不是不需要老师了,技术不能代替人的智慧,这些基本原则是不变的。掌握基本原则的人可以一直走下去,只掌握方法的人将会有灾难性的后果。随着信息技术的发展,老师的功能如果不变革的话,是会失业的。
记者:教师在大数据时代如何站稳脚跟?
魏忠:仔细回想教育这么多年走过的路,我们给学生带了很多不好的示范,比如老师自己不读书,不看原著,却要教育学生好好读书。大数据时代,各类教育信息接二连三地被推到师生面前,老师如果还在错误方向上“勤奋地工作”,学生便难以从老师的“指导”中获得有助于自身成长的养分。教育本质是对学习者的支持和服务,而不是对他们的规训和教化。人本身就有逻辑推断和自组织的能力,发掘它,才是正道。正在发生的教育变革并不是要把传统的课堂搬到网上,而是让新技术解放人们原有的天分,使原本千百年来被耽误的学生,成倍地生长出来。这就要求老师转变观念,更专业化地发展,更个性化地开展教学。一方面是让教学目的目标更加个性化,每个老师可以选择自己擅长的、喜欢的方法教学;另一方面是随着信息泛滥,个性化教育和人性化的面对面教育应该越来越受到重视。
记者:教育行政部门如何帮助帮助学校、教师应对信息化发展给教育带来的挑战和机遇?
魏忠:教育信息化,要求学校课程模式、课堂形态要有所革新,老师的思想意识要与时俱进,因为有太多别的资源在诱惑学生,占有他们的时间和精力,比如小说、电视节目、游戏。
在大数据时代,需要学校整合优化教育资源,增强自身的竞争力、吸引力,更好地发挥“育人”职能;需要解放老师,少用标准束缚老师。怎么解放?过去没有PPT的帮助,而现在有了,弥补了很多不足,许多普通老师的课甚至可以跟特级教师的一样精彩。信息化的本质是解放人,在于弥补人的不足,但观念不改变,学习不跟上,就没有根本性的帮助。教育部门理解了这个本质,明白了技术是为人服务的,就会清楚要做的是什么,是为了帮助教师的专业发展。对教育信息化而言,我们的投入其实并不少,但是使用率不高。我们往往重视硬件的投入不重视软件的投入,不重视对人的素质和看不见东西的投入。因此,教育主管部门工作的重点在于公平,不是推广某种信息技术教学模式,而且应该推广某种趋势,更多考虑那些弱势群体,给他们更多的帮助,让他们在大数据时代寻找到缩小差距、提升自我的机遇。



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 必须实名注册

本版积分规则

QQ|Archiver|手机版|小黑屋|《教师生活365》网[师慧园]论坛  admin.php?action=setting&operation=basic

GMT+8, 2024-9-11 04:49 , Processed in 0.119822 second(s), 27 queries .

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表