潘绥铭:批判"大数据崇拜"

  • 时间:
  • 浏览:1
  • 来源:分分时时彩_哪里可以玩分分时时彩_分分时时彩在哪里玩

   最近以来,对于“大数据”的崇拜,来势汹汹,甚嚣尘上。

   就让,崇拜者和鼓吹者,十好多个 也应该有其他做研究的起码常识吧?

   无论在自然科学里,还是社会科学里,还是文本分析中,凡是进行数据分析,越来越并都不 法子 :

   第并都不 法子 是:研究者此人 首先提出某个就让其他假设,就让去挂接数据,就让进行统计检验,以便对于此人 的假设做出适当的评价,主要结论应该是:该假设是是否是得以成立。也就让说,“越来越假设,就越来越研究”就让“好的假设就让成功的一半”。这,对于任何并都不 遵循“科学主义”的研究来说,不就让金科玉律,就让根本就让不可突破的底线啊。

   以前,所谓的“大数据”,在挂接数据以前,可曾有过任何一个 假设吗?甚至,研究者究竟有越来越猜测到:哪些数据之间,就让位于着并都不 联系呢?之类,就让您把亲戚朋友在网上购物时留下的痕迹,与朋友在医院就诊时留下的记录,强行装入 同一个 数据库进行分析;越来越,您就等于在假设:购物和珍病之间,就让位于着并都不 联系。这好的反义词说,根本不并能提出其他假设,就让说,您以前是越来越想的吗?就让越来越,越来越跟盲人摸象哪些区别呢?

   尤其是,无论您从以前的“大数据”中分凝固哪些,都越来越是误人子弟。之类,早在上个世纪,美国的统计学家就发现,股市的涨落,与一个女人裙子的长短,位于着相关关系。以前老要以来,在任何一个 国外大学里,这都被用来说明“无假设,不统计”其他常识。以前现在却又被所有人翻出来,作为“大数据好的反义词伟大”的证据啦。

   我的一位学生说得好:“这和去垃圾堆里翻安全套,本质上一致吧?”我再引申一下:越来越假设,大数据就让垃圾堆!

   越来越下去,科学还有存身之地吗?

   第二种研究法子 ,是从定性研究(质性研究)里的“求异法”借鉴来的,就让:不去寻找数据的“规律性”,就让通过分析,去发现“特定事物(什么的问题)内控 的繁杂的位于”,就让“同一事物(什么的问题)在不同载体中的繁杂位于”。也就让说,研究者的假设是:任何事物(什么的问题)都不 就让是浑然一体,必定位于着万紫千红甚至千奇百怪的位于形式。研究者的目标,就让去发现和揭示其他点。就让,研究者全神贯注的,恰恰是数据中哪些小概率的、奇异的、甚至缺失的状况。

   正是在其他意义上,就让仅仅在其他意义上,大数据才会有用。之类,哪怕越来越万分之一的人,其实是在网上购物以前才有病,就让有病以前才上网购物;越来越也并能提示亲戚朋友:为哪些仅仅是哪些人才会老要跳出以前的联系呢?其中是都不 所含着亲戚朋友现在还告诉我的并都不 学理呢?

   不要 不要 说:其他“沙里澄金”的研究法子 ,主就让为了“发现”,而都不 为了“检验”。就让越来越其他法子 ,并能实现理论的独辟蹊径,而不仅仅是既有成果的“层层叠加”。

   以前,我真的很好奇:哪些“大数据崇拜者”,听说过以前的“论法子 ”吗?

   哪些叫“大”?

   数据,早已有之;就让“大数据”的买点,其实仅仅在于一个 “大”字。

   鼓吹者们都不 拼命宣扬:亲戚朋友挂接了十好多个 十好多个 人的,十好多个 十好多个 次的,十好多个 十好多个 种的记录,就让,越来越亲戚朋友的数据才是“大”数据!

   以前,你并能奇怪啦,大数据为甚么看起来像是打群架,人多为王?

   其实,就让我在此人 的电脑上,安装上足够多的各种仪器,记录下从鼠标轨迹到上网痕迹直到我的表情动作的自拍;越来越只越来越一天,我所挂接到的、仅仅关于我一个 人用电脑的数据,也肯定是成千上万个G,足以成为货真价实的“大数据”。

   就让我再给此人 身上安上一大堆医学监测仪器,给此人 的书房安上31000度摄像头、温度计、红外线扫描甚至“地动仪”,就让24小时开动;越来越您说,我其他个 人的数据会有多大?

   也就让说,数据大不大,根本沒有于记录了十好多个 人就让十好多个 次就让十好多个 种行为,而仅仅在于:监测手段用得多不要 !

   就让,现在好的反义词老要跳出“大数据崇拜”,其实根本都不 哪些数据拥有者哪些高明之处,就让仅仅在于:人类的监测手段老要跳出了爆炸式的增长。亲戚朋友不但看后了火星上的水,还看后了亲戚朋友此人 的DNA!

   当然,大数据崇拜者并能说:亲戚朋友意识到了几瓶的监测数据的价值啊。可惜,如我前文所述,就让您都告诉我该为甚么用,越来越您发现的,究竟是大数据的价值,还是大垃圾的价值?就让否废物并能再生,您也应该想想该为甚么再生都不 ?

   “大数据崇拜”上端,还一个 大大的猫腻,是死就让肯让别人知道的:大,是整体的大,还是片面的大?

   以购物网站记录下来的数据为例,它其实并能容纳数千万人在购物时不知不觉地留下的近乎无穷无尽的痕迹;就让,这就能反映出哪些人的购物偏爱吗?难道哪些人就再也沒有实体商店中买东西啥时候?难道朋友就只到您其他个 购物网站来买东西吗?难道朋友的偏爱就永恒不变吗?越来越,您为甚么并能选用:朋友在不同的渠道中,在不同的情境之中,总要做出一模一样的选用呢?以前,就让您无法证明其他点,越来越您的大数据就越来越是大垃圾,其他儿就让冤。

   交通监控录像、医疗记录、通讯记录等等,都足以号称此人 是“大数据”。以前,所哪些数据,都仅仅是记录下了亲戚朋友生活中的一个 个零散的侧面。就让,以前的“大数据”再为甚么大,也无法避免以下一系列常识性的什么的问题:

   1.人在生活的某个侧面里的表现,与他/她的整此人 格与人生,难道不位于紧密的关联吗?农民工吃20元的盒饭都嫌贵;富豪买上千万的汽车就让眨眼;这难道仅仅是所谓的“消费选用”吗?

   2.人类生活的各个侧面之间,难道都不 相互影响着的吗?农民工吃20元的盒饭,却并能搭上1000元的礼钱;富豪买上千万的汽车,却不肯做其他儿慈善;这也仅仅是所谓“购买习惯”吗?

   3.任何一个 人的生活,难道都不 被社会、文化、历史等因素制约着吗?吃20元盒饭的,都不 IT业白领,也是来自农村,却从来不被认为是农民工。比尔·盖茨的形象中,也从来不包括他的汽车是十好多个 钱买来的;这,难道也是“可付资金”吗?

   4.……

   5.……

   不要 不要 说,所谓的大数据,其实其他都越来越超出原有的定量研究的局限性,那就让:裁剪生活,撕碎人生;越来越把整体生存的“人”,视为一堆杂乱的零碎。越来越这般,数据越大,你以为错误越大?

   当然啦,大数据崇拜者就让说了:亲戚朋友减慢就并能把方方面面的大数据,汇总为一个 包罗万象的大“大数据”,之类全方位、不间断地监测所有人,就足以最终一劳永逸地避免那个“天问”:人类为哪些做哪些和不做哪些。

   额滴亲娘啊,这可你以为道出了“司马昭之心”啦!

   “大数据崇拜”唯一的功劳,其实就让迫使亲戚朋友不得不认真思考一下:

   在其他随时随地的、天罗地网般的、细致入微的、一生一世的被监测中,

   亲戚朋友的生活,真的还有意义吗?

   能说明哪些?

   盲目崇拜就让大肆鼓吹所谓“大数据”的哪些人,就让告诉我,就让刻意回避了一个 根本的什么的问题:无论数据的规模多么大,它究竟并能反映出哪些样的状况,能说明哪些样的什么的问题呢?

   迄今为止,“大数据崇拜者”所列举的“丰功伟绩”,其实仅仅局限于反映出人类的其他可监测就让可记录的行为,之类各种网上活动、出行、通讯、接受各种服务等等。也就让说,就让亲戚朋友不行动,就让不被监测到,越来越大数据就不就让位于。

   以前,就算毫无隐私,就算监测并能天罗地网,那人心呢?灵魂呢?企盼呢?人类精神家园一切的一切,都并能被“数字化测定”吗?就让相当于 现在还越来越,越来越大数据(且不论并能分析)就让动物学,是植物学,甚至是矿物学。君不见,冰川也会运动啊。

   当然,其他科学主义者早就发誓要突破人类精神的壁垒了。我并不怀疑朋友的成功就让性;只想问:朋友究竟是终于把人类精神给数字化了,还是给灵魂竖起一面哈哈镜呢?

   “大数据崇拜者”很就让告诉我,就让不敢承认:在人类生活中还有并都不 什么的问题,叫做“主体建构”;就让:亲戚朋友对于此人 的行为所做出的解释,很就让与监测者的解释大相径庭,甚至背道而驰。最常见的就让,一切人际的误会,盖源于此。“无心插柳柳成荫”也是越来越。

   以网购的“大数据”为例,即使您总有一天并能把购买者的内心,不要 不要 数字化地一览无余,那您为甚么知道人家就真的就让以前想的呢?科学嘛,老要越来越验证的啊。

   结果,

   首先,您其他“客观测定”,离矿物学很近,以前人却是有主观意志的啊,您是为甚么监测到的?连物理学还有个“测不准原理”呢,何况您老?

   第二,您知道人类总要“自我呈现”吗?说不好听其他,就让表演。就让连测谎仪的结果,法律都还不予采信,越来越您为甚么筛除被监测对象的表演呢?

   第三,难道您就不找被监测对象去核实一下?连司法审判越来越听被告为甚么说呢都不 ?难道真的把人当成石头?

   第四,您听说过弗洛伊德吗?您知道除了“动机”,还有“无意识”吗?就让行为者此人 都搞不清楚此人 是为甚么回事,越来越您还为甚么去核实呢?根据哪些来判断真伪呢?

   总而言之,一切试图用自然科学就让数字化来了解人类及其社会的尝试,都不 都必然失败,就让都无法否定人类的“主体建构”的重要性;结果都必然是把真实的生活给削足适履了。

   说到底,“大数据崇拜”,其实就让“唯科学主义”在人类历史身旁一败涂地后的末日哀鸣。就让科学越来越阻止希特勒的统治,也越来越预测出此后人类的一切发展,越来越就绝都不 “艺不精”的什么的问题,就让用错了地方,是越界跑到了此人 无能为力的领域。

   中国社会学,就让饱受“唯量化主义”的侵蚀,就让现在还放任“大数据崇拜”肆虐,越来越可就你以为泥菩萨过河自身难保了。

   就让,我才越来越声色俱厉,也就让我此人 就让完成第四次全国随机抽样的量化问卷调查,深谙其弊,才更加有资格越来越义愤填膺。

本文责编:lihongji 发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 社会学 > 社会学专栏 本文链接:http://www.aisixiang.com/data/9100017.html 文章来源:社会学视野网