“白云依山尽”的云时代

2015-10-14 03:15
国防科技工业 2015年8期
关键词:云端白云检索

□ 于 希

“白云依山尽”的云时代

□ 于希

下一次雾霾是大数据,下一个战场是云平台。

我们已经跨入了大数据的时代并飞向云端。

我们的下一次灾难将是什么?

置身于大数据时代,我们从查字典翻书转向通过网络获取信息,年龄越小的群体越是有网络和数据的依赖,但哪些数据是真实的?哪些数据是准确的?哪些数据是有用的?哪些数据是最新的?谁来帮我们甄别?

可能我们脑中少了一块芯片。这块芯片,可以迅速过滤掉那些虚假、错误、无用、过时的信息,并迅速挑选出真实、准确、有用、最新的信息。

事实上,我们采集到的数据,既没人帮助甄别,也无法在脑中植入芯片进行智能分析,我们只能想当然地认为哪个网站权威,它提供的信息就是权威的。

问题从这里开始产生。

过去,我们使用公式、引用数据,会去查辞典、找出处,而现在,手工劳动效率远远低于电脑,人工查找会非常浪费时间并降低工作效率,于是我们习惯性地到百度、维基百科去检索数据,这些检索工具不知不觉中替代了我们的工具书。

用过这些检索工具的人都知道,这里的数据库是“众筹”的,所有信息都没有经过权威机构验证,我们在使用着,同时也在担心着。

随着全民化的“拷贝”、“粘贴”和上传,这些检索资料库变得越来越庞大,检索一个关键词,会搜出几十万甚至上百万条信息,你根本没时间一一浏览、对比并核实,只能根据主观判断,使用自认为最准确、最靠谱的数据。当你由此生产出新的数据并上传后,又给下一位检索者带来了新的不确定性。

随着人类网络依赖性的日渐增强,同时也随着网上云数据的建立,这些上传数据在量上会呈现几何级数增长。起先,天上只有一两朵小云,后来云越来越多,越来越大,慢慢地,整个天空被云的阵列彻底遮盖,再也看不到蓝天。并且,随着每块云朵里因数据的不准确而产生的黑色素(BUG)越来越多,这些云慢慢变成为乌云甚至黑云——此时,互联网的天空中已布满了信息的雾霾。

如果你不敢呼吸夹杂着雾霾的空气,那你必将对使用这种充满雾霾的云数据而忧心忡忡。

所以,在云的雾霾到来之前,我们与其天天在制造新的云,上传不确定的数据,还不如做一件比制造新云更有意义的事:对云上数据的准确性进行认证。

我们有理由相信,谁此刻意识到未来云数据的准确性直接决定着云平台和云天空的生死,谁此刻着手建立云数据认证标准,在全球部署云数据认证中心,对上传数据者建立诚信等级,对已上传数据进行及时认证,他一定会成为未来最富有的企业家。因为谁都清楚,信息化时代之前,知识先学后用;信息化时代到来后,知识需要学习还需要快查、查对才足够应用。在检索和引用阶段就带着错误,随后带入产品的设计、研发、生产和服务,那种破坏性将是致命的,正如一位患者,他的病不是后天的,而是先天的,其治愈的难度可想而知。

不妨举例,为纪念唐代诗人王之焕,需要铸一尊金鼎并引用《登鹳雀楼》一诗,结果在检索时,“白日依山尽”写成了“白云依山尽”,但设计人员并不知道这一错误,于是开始设计:转换书法字体,设计样稿,制作模具,浇铸作品,打磨镀金,剪彩展示,这时,前来瞻仰的观众们发现“白日”写成了“白云”

如果这样的错误不是发生在金鼎上,而是发生在一种新型火箭的研制甚至是国家导弹防御体系建设之中,它又会导致什么样的后果呢?

今天,我们处在生产信息和生产错误信息、垃圾信息并存的阶段,如果这些信息不经过过滤和净化就直接上传至网络及云端,这不等于在给云端生活的人们提供没有经过过滤和净化的空气吗?谁能保证吸入这样的空气对我们的机体不会带来疾病和影响呢?

可惜,我现在无法从网上找到对数据进行检索、过滤、分析、认证、加工、提出使用建议的智能化工具,只能想当然地认为它正确,最多在时间允许时“货比三家”一下,而当只有一条检索结果时,你只能认为它正确,要不,你自己手工去进行大海捞针。

我相信,这都是未来的云服务平台应该具备的功能,考虑更加全面,技术更为先进,但有一点存疑,就是及时性数据准确性的认证。大数据的集成及智慧处理和服务只会催生新发明、新创造、新公式、新成果等新数据的加速形成,如果不及时进行认证并上传,将会延误科技的发展,及时上传而不进行认证,又会导致云端的再次污染。

为此,在云平台数据阵列的设计上,要有“原始数据库”,“认证数据库”,“待认证新数据”,“数据应用进展”等等模块,并且要对“原始数据库”和“认证数据库”进行安全保护、严格管理,确保不被污染。尤其是“原始数据”(源数据)库,必须保证绝对安全,确保“认证数据”受到破坏时,还能通过“原始数据”进行推导。

如果对“源数据”不进行最严密的保护,“白日依山尽”被黑客篡改为“白云依山尽”,最初的影印原件都被篡改,谁还能证明或推导出“白日依山尽”呢?即使你有这首诗的真实原件,在许多人引用了“白云依山尽”之后,又有谁不认为你手里持有的是赝品呢?

这就引发了另一个话题,在互联网时代落后于美国的其他国家,在“互联网+”时代,是否可以超越而成为强者呢?美国在互联网时代抢先建设了高速路,其他国家能否在“互联网+”时代生产出质量最过硬的汽车并提供品质最过硬的汽油,让我们在高速路上跑得既快且十分安全呢?

这其实是一次绝好的机遇。我们能否抢先一步,从标准制订到数据认证再到数据服务,在云上建起4S店或是5S店,提前占据主动并引领时代之先呢?

再深入一步说,要从国家安全的战略高度审视这一问题。

如果我们跑的路、用的车都是别人修建和生产的,对路的缺陷和车的隐患一无所知,甚至对一些恶意国家故意搞的设计缺陷和质量隐患毫无察觉,两国冲突之时,我方的车毁人亡不就是一瞬间的事吗?战争的胜败不也成了倾刻间的事了吗?

由此可以推断,未来,在云端上,尤其是在云根部的“源数据”及“认证数据库”这一区域,将是大国云上部队(天兵天将)厮杀得昏天黑地的战场。

其实,想想也是非常可耻的,大国对人类几千年积累下来并共用的原始数据进行争夺,并各自通过做手脚的方法让对方引用错误数据而导致连锁反应,实在是非常卑劣无耻的行为。

退一步讲,即使未来人类相互间的争夺不是云平台云数据而是在此平台进行云端的军备竞赛,这也必将导致人类的欲望进一步膨胀,世界大战或星际大战将瞬间被触发。

说实话,根据本文的思想,剧作家们完全可以创作出一部好的电影剧本,揭露未来云端科技竞争的残酷。

重回现实,我不得不说:“大数据”和“云平台”看上去很美,有人建立“大数据”公司,不知有没有人建立“真数据”公司和“准数据”公司。没有真实性的“大数据”是“虚胖”的数据,脚踩棉花的“云平台”是不踏实的平台。

霍金说,未来,机器人将战胜人类。我倒认为,人类将退化于对信息化、数据的盲目崇拜和过度依赖,同时也必将毁灭于对人类共有“源数据”的争夺与篡改。

人类的“源数据”一旦被篡改,数千年的文明将瞬间归零。知识将被植入病毒,人类文明将整体携带先天性疾病,再也无法根治。

如果现在着手建立的云端是一个未来的战场,那就让云时代永远不要到来,同时让已经飘在天空的白云早一点“白云依山尽”吧。

(作者单位:中国航天科工集团公司培训中心)

猜你喜欢
云端白云检索
四海心连·云端汇聚
在云端永生
云端之城
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
白云(外三首)
在云端
我喜欢白云