您当前的位置:首页 > 媒介杂志 > 升民视点
魔幻化的“大数据”
时间:2014-08-04 16:45:28  来源:2014年8月主刊  作者:黄升民

 

大约就在2012年,程序员出身的涂子沛出版了名为《大数据:正在到来的数据革命》一书,以科普方式介绍了大数据的由来与变革趋势,成为社会各界关注大数据的重要启蒙。也正是在那一年,《媒介》编辑部推出了主打文章《大数据,新天地》,详尽介绍了大数据的由来,作用与未来趋势,成为媒体专业期刊中探讨大数据的第一刊。

其实,从创刊以来,编辑部从没忽略数据收集数据分析对于媒介经营的价值与功效。早年间,我们关注的是收视率调查,受众调查,后来是有线数字电视中的海量数据监测和专业数据公司的产业链,两年前则是所谓的大数据。本期重提大数据主题一方面是因为注意到业界对于大数据的热情分毫未减,另一方面也是在热潮之中冷静地看到了这股潮流的方向出现了一定 “魔幻化”的偏颇。在此,笔者向诸位看官提供几点参考:

第一,数据量的由小到大是一个渐进过程,而非突然爆发。涂子沛在接受《生活周刊》时表示,在美国,上个世纪80年代就有人提出“大数据”的概念了,到2000年,由于信息系统的累积作用,人类的数据开始大量增多,有不少企业的数据级进入到“太”(terabyte)的级别,学术界就开始尝试给多少为“大”进行定义。起初流行的定义是“200太就是大数据”,只是没想到,随后数据量更以一种更加迅猛的几何级速度递增,这才有了我们今天所认知的“大数据”。事实上,人类文明的构建一直都与数据息息相关。人类从数据到信息再到知识、智慧并以此解决问题的操作方式自古有之;数据处理也随着数据量、数据处理要求的改变,经历了从数据仓库、联机分析、数据挖掘、数据可视化到大数据的自然过程;数据运用于各行各业同样并不新鲜,在自然科学、金融、医疗、农业等诸多领域的运用历史、成熟程度都远超人文科学领域。只是,到了今天,我们可以用更加方便、低廉、容易的方式去获取数据、处理数据,并将之运用于更多人文科学、社会科学的领域,让大数据与普通人们的生活有了更加紧密的联系。这当然是一种极大的进步,但是这种进步是一种积累和渐进的过程,而不是忽如其来的风暴。由此,也奠定了我们对待大数据的基本态度——盲目追捧、过度神化都不必要。

第二,大数据是有效的但不是万能的。谁也不能否认大数据技术的有效性,但是正如人类数据处理历史的演进过程那样,数据处理的技术和理念永远赶不上数据自身的变化速度。到了今天,自然界与人类社会的数据量增长程度超越了任何一个年代,摩尔定律的作用之下我们甚至很难去想象未来数据量的成长规模需要用怎样的新单位去计量。与此同时,数据成长的速度,数据的类型也都对数据处理技术提出了极大的挑战。从目前的技术发展来看,我们能够掌握、存储、管理、分析和运用的数据还只是沧海一粟,甚至分析能力虽然有了极大的提升却仍然无法匹配数据的量级和种类,技术的滞后是一种必然结果,也是一个客观事实。事实上,在很多领域中,数据分析技术的滞后性让我们得到了大量的数据垃圾和数据冗余,盲目地追捧所谓的大数据技术,或者偏执地信任大数据技术的处理结果,反而会在一定程度上妨碍我们对数据信息的掌握,影响我们做出准确的判断与明智的决策。数据从来都只是我们做决策的参考,虽然这种参考很重要,但绝不应当是人类决策的全部。

第三,平台和数据体现的是科学精神而不是花哨的魔幻效果。在今年早几期的杂志中,我们讨论过互联网本初精神,也谈论过互联网思维,当时就曾经指出,互联网的核心是强调开放和互动,而数据和平台是大部分互联网机构的运行核心。这个说法其实互联网自身也是承认的。马云说互联网打破了信息的不对称性格局,竭尽所能透明一切信息;对产生的大数据进行整合利用,使得资源利用最大化;互联网的群蜂意志拥有自我调节机制。这些都与我们所说的数据+平台的互联网核心相契合,只是,当这些要素被“金融”二字所控制,当一切的标准是为了更快、更大的“盈利”,那么平台和数据就难免沦为了路演中的魔幻剂,穿上了商业化的投机性外衣。当互联网的开放与互动被打破,走向了封闭和垄断,异化就不可避免;当数据和平台所成就的海量、迅速、可寻址不再是科学主义的抓手,而是资本路上的点金术与魔术棒,互联网的扭曲发展就再难否认。我们可以先不讨论国外的情况,至少在国内,互联网机构正集体利用大数据技术为广大受众编织一场华丽的幻梦,以掩盖幻梦之下追求真金白银利润至上的商业逻辑。

第四,互联网的数据帝国是不是真如宣传中那样光辉雄伟壁垒坚实?BAT为首,越来越多的以互联网为代表的传媒机构号称自身掌握了海量数据,以数据指导业务、设计产品、决策内容、重构商业模式,甚至开创了新的技术壁垒,可以与所有竞争者相区隔。然而从笔者的角度来看,一来这些数据的“海量性”与“准确性”存疑——国外有政府部门统一管理公共数据,并做了大数据的开源与保护处理,国内本就不具备这样的现实;数据量级最大的BAT三者之间的数据也从未共享与开源。那么,单凭亿级用户的网络行为构筑成大数据基础,其实是有违大数据本身“数据库之间可以实现自由流动与关联”的准则的。因此,在我们承认互联网上数据海量,并可以尽量还原用户真实需求的前提之下,这种数据库与数据库之间的隔离、竖井的现实存在也是不可抹杀的。再者,平台化、数据化都不是寡头帝国独有的核心科技,至于所谓的壁垒与区隔,如果没有真正的核心技术,其实也不过是一座空中楼阁。

第五,互联网的大数据泡沫已经逐步显现。从最近几年传媒业的发展轨迹来看,当一个事物被追捧到极致,其出现泡沫的可能性也就不可避免地被提升了。比如早年间的互联网金融泡沫,比如影视业的投资泡沫,再比如目前已经初显雏形的大数据泡沫。想必大家都还记得央视315曾经曝光的内幕,以百度为典型代表的互联网Cookie运用会极大地威胁用户的数据安全与隐私信息保护。百度在普通消费者手机中的预装软件高达6款之多,几乎涵盖了百度手机端的全部产品线,包括:百度搜索、百度手机助手、百度浏览器、百度优化大师、百度好123、百度地图等等。尽管工信部宣布从2013111日起,就要求生产厂商公示手机中的预装软件等基本配置信息。但是对于百度这样通过第三方来预装软件还缺乏有效的法律法规监管。而这也只是互联网寡头大数据运用与用户数据安全保护悖论的冰山一角。

与国外政府、机构在数据技术开发上所奉行的“挖掘越多,保护越多”的准则相比,中国目前的大数据运用在一定程度上是踩着监管的红线,钻了法律的漏洞行进着的。当然,这种行为并不仅限于互联网、媒体产业,在金融、医疗、通信等几个重点行业,此类问题层出不穷,互联网圈也只是其中之一。然而,正如国家管理层终究将鞭责伸向了盗版、盗播、海外视频内容引进、OTT TV竞争乱象一样,迟早有一天,互联网寡头赖以为生存根基的大数据也会成为管控的核心区。到了那个时候,如何在不侵犯用户隐私信息的前提下保住现有的垄断性地位,维持住高楼广厦不倒,笔者以为,这是一个很难也很重要的问题。互联网很美好,互联网也很危险,到底是热情拥抱还是警觉远离,还需冷静思考。

 

斯诺登扯开了一个关于数据安全的口子,直指互联网数据安全背后的政府黑幕。而最近苹果的后洞门则让无数粉迷如同五雷轰顶。如果偶有信息的点滴泄露,人们还能将其视为无意的“漏洞”,睁一只眼闭一只眼的予以原谅。然而,当个人消费者的所有信息在无告知的前提下赤裸裸地被企业盗取、截获、掌握,就无人能够淡定的坐视不理。

人在做天在看,这个“天”正是大数据,它可能是上帝,也可能是撒旦。

 

==============================

更多内容,敬请关注媒介杂志8月刊《阴阳两面大数据》 

【本期重磅封面】

激辩大数据

大数据无处不在,大数据无所不能,大数据无往不利。似乎祭出大数据,一切问题迎刃而解。大数据果真这么美好?即使它真的如此神奇,我们对它的把握又处于何种阶段?笔者以为,我们对大数据的理解和认知存在很多误区,不妨一辩。

媒体大数据运营的四维空间

实际上,媒体机构要在以PB计的数据分析上完成价值转换,指导内容优化,提升广告和营销活动的实效性,核心则是破解数据背后更为深刻的逻辑关系,而破解之道,在于构建一个闭环的四维空间。

百度:具有大数据基因的搜索大鳄

当百度以大数据的方式深入我们生活的方方面面;当我们开始依赖百度提供的数据,并以此为基础成为我们决策、行动的根据;当我们做出的决策早已经被百度获悉和熟知的时候,我们可以毫不夸张的说,百度就成为了《1984》里的“老大哥”,一刻不停的紧盯着我们。

腾讯角力大数据

说共舞大数据,不如说角力。大数据不是一只温驯的绵羊,其应用并非想象中那么浪漫简单,而是要对自身从顶层设计和底部架构两个方向同时摸索前进。而且,作为聚拢无限资源、源源不断汲取数据的大公司,还应该承担更多责任。

阿里巴巴的野心:从电商到数据平台

数据有价值,但依靠数据不断地攻城略地,能走多远?将数据真正落地到电商平台卖家的需求,去做更多纵深层面的挖掘和探索,让一批商家从阿里的电商平台成长为全国乃至国际的品牌,或许这是比快速扩张更紧迫、更该做的事情。

大数据格局下的视频网站之“变”

无论是更加多元的数据信息来源渠道,还是通过数据分析实现更为精准的视频推荐和广告投放以改善用户体验,在视频网站运营的每一个环节都或多或少的刻上了大数据的烙印。

电信运营商:“掘金”大数据

近年来,全球电信市场正在发生深刻变革,电信运营商过去在整个ICT产业中的主导权正逐步被分化,转型移动互联网已成为行业共识。运营商如何去电信化、避免沦为管道商,引发了业界的热烈讨论。在一片大数据热的背景下,电信运营商也顺应趋势开启了大数据时代的探索。

彭博社:数据支撑下的金融信息服务商

彭博社22年的发展历程,完全奠基于对金融数据的理解和把握。它将行业需求与相关数据整合,不断的根据传播格局调整自己的服务,最终成为了国际一流的金融信息服务商。这对国内各大行业媒体而言,堪为借鉴。

IMDb:数据铸就电影专家

作为“250部佳片”榜单发布者的IMDb,也是目前互联网上最为系统的有关电影、电视、明星的在线数据库,它几乎包括了所有的电影,以及1982 年以后的电视剧。那么,IMDb所特有的电影评分系统为何深受影迷欢迎?它又是如何获得今天的地位的呢?

 

【专题】2014,华数传媒新征程

华数传媒的战略论——专访华数数字电视传媒集团高级副总裁赵志峰

近日,本刊记者赶赴杭州,专访了华数数字电视传媒集团高级副总裁赵志峰,从“新网络、新媒体、新产业以及华数的发展思路”这四个维度,了解华数今后一段时间内的战略规划与发展思路。

华数:新媒体、新网络——对话华数传媒网络有限公司副总裁乔小燕

华数传媒作为兼有新媒体业务和自有有线电视网络的新传媒企业,在为多网、多屏服务的过程中,致力于将电视屏打造成家庭信息化的终端和城市信息化的综合平台,形成了显著的竞争优势。

新时代电视媒体运营商的进阶论——专访华数传媒媒控股股份有限公司副总裁李学东

当各家网络视频、电视盒子、数字电视运营商共同搅动OTT TV市场,以电视大屏争夺家庭用户,力争成为家庭信息娱乐中心时,华数也面临着一个极为复杂和多元的竞争格局。在这样的环境中,华数如何应对竞争,如何给自身定位,如何实现进阶?李学东以“电视秘书”的概念和由来向笔者解答了这一疑问。

版权平台的差异化打法——专访华数传媒媒控股股份有限公司副总裁刘宁子

华数如何在丰富性与差异化找到平衡呢?在与刘宁子的交谈中,笔者得出了答案:一方面是在版权采购上建立了科学、健康的内部机制,另一方面,是在外部通过各种灵活多样的方式建立与供应商的持久的、良性的合作关系。

 QQ图片20140319212733_编辑_编辑.jpg

如欲获取本期杂志,敬请联系本刊发行部:010-6545023865450353,或微信留言

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐内容
 第六届中国传媒趋势论坛盛大开启
第六届中国传媒
专题解读第二十四期:维旺迪——数字时代转型之路
专题解读第二十四
推荐阅读:新富阶层的消费与媒介观
推荐阅读:新富阶层
推荐阅读:TV活着,生猛且坚强
推荐阅读:TV活着,生
相关文章
    无相关信息
栏目更新
栏目热门