
大数据带来的大变迁.doc
4页大数据带来的大变迁大数据带来的大变迁大数据带来的大变迁 何宝宏 2012-10-16 来源:泰尔网 因为数字化、PC、互联网、移动终端和物联网等引发的“大数据(Big Data)” ,人类正在迈入信息化的又一个全新时代一般认为现在的“大数据”具备以下几个典型特征:1)数量巨大,相对之前可能 10 倍以上的信息量,从 TB 到 PB甚至 ZB 级2)类型繁多,承载信息的载体从文本、图片、音频到视频、3D等;3)单位价值下降,比如连续不间断的视频监控中,可能有用的就 1 秒;4)及时性,处理和传播速度也要倍数级提高(比如 1 秒内),否则就没价值了现在所说的大数据,都是指“数字化”的信息如果把“数据巨大” 、 “类型繁多” 、 “单位价值下降”和“处理及时”的非数字化的信息也认为是大数据,就会发现人类历史上,已经多次经历过多次 “大数据”时代,而且每一次“大数据” ,都带来了人类社会的巨大变革第一次是语言的发明8 万年前,人类通过呼吸系统、声带和口腔器官的巧妙配合,可以发出不同的声音这些不同的独立声音单元,以特定的时间顺序排列,便组合成表达思想的信息;如果同时控制音量和音调的变化,信息内容就会更加丰富。
语言可以让思想交流融合,让分工合作成为可能语言成为新型的信息载体,信息的传递不再依靠简单的肢体语言和喊叫声,创新得以孵化,人类第一次遇到了快速增长的“大数据”的挑战第一,语言不仅让可承载的信息量倍增,而且让信息类型延伸到帮助智人传递育儿和狩猎等领域;第二,信息量和信息类型的快速增长,导致生产力的大幅提高,人类寿命猛增,社会分工开始出现;第三,生产力的提高导致人类闲暇越来越多,思考和创造也就越来越多,文明开始孕育,审美观、传说故事和宗教观开始出现了但随着“语言大数据”的发展和应用,语言作为唯一载体的缺点开始显现第一,地理范围有限,经常仅在部落内传递;2)对象范围有限;3)信息容易失真;4)信息容易失传于是,弥补“语言大数据”缺陷又一信息技术——“文字大数据”时代开始出现和繁荣相对语言,无论是图形文字、声音文字还是数学符号,可以承载的信息量和信息类型更多,传播范围可以更广,更加准确和更加便于传承有了文字,无法长久保存和必须同步传播的口头信息,变成了“永久性” 、可异步存储的符号记录如果说语言将人类和动物区别开,那么文字就是将人类从野蛮时代推进到了文明时代文字(包括数学符号)的产生和传播,生产力又一次得到了飞跃,并且催生了历法、兵法、法律和礼仪等,加速了贸易等的发展,人类又一次淹没在了“大数据”的洪流中。
文字让大数据得以渗透到日程生活的方方面面,比如书籍、学校和教师诞生了文字是“大数据”的载体,而文字的载体是乌龟壳、羊皮和竹简,以及后来发明的纸张等,相对仍然比较昂贵另外,这些类型的书籍需要靠人工抄写或雕刻,费时费力而且常会出现错误,因此书籍仍然难以平民化, “文字大数据”传播的范围仍然很有限于是让信息可以用“工业化”的方式存储和传播的印刷术出现了印刷术结束了手稿时代,让文化广为传播,再次扩充了信息的数量和组织, “大数据”时代又一次来临印刷术让各种书籍无处不在,四书五经、宗教经卷、律法、图书馆和字典等兴起, “印刷大数据”的类型和数量再次急剧上升,印刷术(尤其是活字印刷,也广义的也包括造纸术)导致书籍和知识“泛滥” ,直接引发了人类社会的巨大变革比如在中国,掌握“大数据”的读书人的数量急剧上升,迫切需要一种知识型人才的选拔制度了,科举制度应运而生再比如,在西方依靠古登堡发明的活字印刷术,可以直接接触到《圣经》的人数快速增加了,垄断这一资源的教会和神职人员的地位发生了动摇,欧洲的宗教改革开始了;大量在欧洲已经失传的古希腊文明和知识,再次回到了欧洲,成为文艺复兴进一步发展的温床在活字印刷术前每部书都是经典,但现在“信息过载”出现,大量垃圾书籍充斥了人们的生活,信息的“单位价值”快速下降。
“印刷大数据”在欧洲的进一步发展和传承,最终引发了后来的工业革命随着工业革命的推进,产生了更大量和更多类型的数据处理需求,导致了信息采集、保存和处理作为独立的一个行业——“信息产业”出现和繁荣电力革命后,整个社会经济活动的重点,从材料的使用转移到了对“大数据”的使用,企业也在纷纷取消内部动力生产部门的同时增加了信息处理部门而近年来随着智能、平板电脑、个人电脑、数码相机、数字摄像机、POS 机以及各种各样的传感器等终端逐步接入互联网,气候、天文、地质、生物、基因、军事、商业和医疗等行业数据的普遍数字化和网络化,以及博客、播客、微博、社会化网络等的爆发式增长,数据越来越“大” ,人类又一次遭遇了“大数据”时代一次同时,移动互联网和社交网络不但在吞噬着人们的注意力,而且我们已经失去了以前的大脑,单位信息的价值快速下降,人类淹没在了“信息垃圾”之中这次的大数据,信息的产生、传递和保存不仅“工业化”了,而且“数字化”和“自动化”了,人类社会发展的核心驱动力,也从之前的“动力驱动”转变为“数据驱动” 垃圾是放错地方的宝物,因此必须诞生革命性的技术手段,将这个时代的“信息垃圾”换一个地方,换一直方式提供给我们。
但这次 “大数据”革命存储介质的“短寿” ,可能会给后人带来巨大的麻烦目前使用的磁盘、磁带、CD 和 U 盘的寿命,短则3-5 年,长则 100-200 年(理论上,尚未验证),而现存最早的甲骨文是公元前 14-11 世纪的,羊皮书是 4 世纪的,木板书是两晋的试想一下,接下来的 1000 年,我们如何保存、打开、检索和甄别,这些保存在 CD/软盘/硬盘甚至云计算等上的、PDF/DOC/MP3 等各种格式的大数据呢?历史上的每次“大数据” ,都对人类社会的影响都是革命性的,这次也必将会是颠覆性的2012 年 3 月,奥巴马政府宣布投资 2 亿美元启动“大数据研究和发展计划” ,并且定义为“未来的新石油” ,希望增强政府收集、分析和萃取海量数据的能力这是白宫第三次在“国家战略层面”推动信息通信业的发展,前面两次分别是 1993年克林顿政府的“信息高速公路计划” ,以及 2010 年奥巴马政府的 “国家宽带战略” 让我们迎接人类历史上,第四次“大数据”时代的到来。
