第七百六十九章 大数据(2 / 2)
除此之外,杨星还认为大数据在政府工作和公共服务领域一样大有可为。比如每年多个联合国经发会都要对世界经济形势统计并加以预测。而其中甄别各国经济数据真实性相当重要。因为有不少国家出于各种原因,会漏报虚报甚至瞒报数据。让政策制定者因为基础数据不实而做出错误的预测和规划。有些经济学家想到一个简单易行的办法,就是通过搜集各国电力部门用电情况判断经济真实情况,因为企业和地方政府可以用在报表上做手脚,但大多数国家的电力部门一般处于垄断地位,作假可能性不大。
其用电量数据可以直接反映企业开工情况,电力数据的汇总分析处理就需要大数据出马,同时对用电大数据的分析和挖掘还能建立建筑节能指标,为交通、银行系统提供有用的信息,很符合中星提出的“智慧城市”的含义。
此外大数据在公共安全领域也前途光明,杨星以中星刚和世界卫生组织达成的合作为例,现在双方正筹备建立一个 “网络卫生实验室”,尝试利用对互联网上各类信息实行大数据处理,以此筛选出合适的情报来预估传染性疾病的分布,扩散速度等趋势,如果成功,会极大提升当局应对类似“**”这样急性传染病的发现和处置速度,让药品准备和提高医院床位等更加高效和更有的放矢,有极大助益。
最有说服力的例子还是来自中星和美国国土安全部签订的一份重要合同,由于“维基解密”等网对美国“梯队”全球监听系统的不懈追踪和大量曝光,这个神秘系统终于在“911”的大背景下通过《爱国者法案》堂而皇之的走向了前台,现在由美国国土安全部直接管辖。
和杨星前世一样这个机构依然承担着监听全球通信的责任,但现实情况是由于信息技术高速发展,传统的电话监听已落后于时代,必须承担起对电邮、短信、视频分享等信息的监控,由此产生了天文数字般的数据,美国国土安全部信息主管就在媒体上直截了当的抱怨,为了追捕本?拉登的行踪,仅对全美每6个小时全面监听,生成的数据量就相当于美国国会图书馆所有印刷书籍的信息总量。
这样大的数据量,造成信息大量过剩,如果单靠传统人力分析,只能徒费光阴,眼睁睁看着本?拉登之流因为前线得不到及时情报而大摇大摆溜走。为此国土安全部也想了许多办法,美国在研的好几部超级计算机都被它预定,可是依然赶不上洪水一样滔滔不绝涌来的数据流。而大数据处理不但能应对大量数据,还包括有复杂计算的意思在内。即使数据量不多,但系统需要复杂计算和用户配对,类似婚恋交友网站要核实客户信息真实那样,就要进行交叉比对,以判断信息真实性样。
经过一番考察后,美国国土安全部终于相中了能同时提供大数据处理和分析的星云电子,“大数据”概念很合他们的心意,同意将国土安全部的全国信息联网分析处理等后勤保障任务交给中星集团,成为继五角大楼之后,中星争取到的又一重量级美国政府强力部门。以美国如今的声势来说,全球都知道什么是世界头等大事,那就是“反恐战争”,而中星搞定了“反恐”和“战争”两大部门,就算都是搞后勤,也是不得了的本事,有国土安全部的广告效应,还没等杨星讲演结束,就有人迫不及待的发问想杨星帮忙解决问题了。
其中最踊跃的无疑是许多国家的超市运营商,在西方国家,由于人力成本高昂,仓储式门类齐全的大型超市成为商业零售主流形式,过去他们自己搞的信息系统中有大量的原始数据在录入时就丢弃,因为超市传统上只保留和销售直接相关的数据,比如卖了多少产品,哪一类商品最畅销和库存情况,其他信息量太大,无法一一统计,只能放弃。
但现在有了大数据情况就不一样,从顾客在超市结账那一刻起,所有原始数据都可以被超市挖掘出宝贵用途,如某位顾客大量采购蛋奶和婴儿纸尿裤,那就意味着他成家不久,刚有了小孩,向他促销时就能提供对应消息。有了大数据,超市就能从以前保留的众多原始数据里提取更多有用的信息将来使用。杨星这样形容大数据来为演讲作总结,“数据是资产,是财富,更是生产要素,非常活跃,可重复利用,并且环保无污染,前景极为广阔!”