■杨光
美国政府大数据计划出炉
■杨光
日前,奥巴马政府宣布“大数据的研究和发展计划”。通过提高美国从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究。
这个计划里,六个联邦政府的部门和机构宣布新的2亿美元的投资,提高从大量数字数据中访问、组织、收集发现信息的工具和技术水平。了解更多正在进行的联邦政府的计划,解决所大数据所带来的机遇和挑战,可通过大数据表来了解大数据革命。
美国还计划与工业界、大学研究界、非营利性机构与管理者一起利用大数据所创造的机会。显然,不能单单依靠政府,需要奥巴马总统所呼吁的“众人拾柴火焰高”这样的努力。
一些相关的公司已经赞助大数据相关的比赛,并给大学提供这方面的研究资助。大学里也开始开设一门全新的研究型课程,培养下一代的“数据科学家”。一些无国界的组织帮助非营利性机构对公益性服务的数据进行采取、分析和可视化处理。白宫科技政策办公室将会非常有兴趣支持建立一个跟大数据相关论坛,包括最新的公私组织之间的合作。
美国政府的大数据计划
亮点:为应对大数据革命带来的机遇,联邦政府制定计划,推进相关研究机构进一步进行科学发现和创新研究。
国防部(DOD)
国防部高级研究计划局(DARPA)
多尺度异常检测(ADAMS)项目解决大规模数据集的异常检测和特征化。项目中对异常数据的检测指对现实世界环境中各种可操作的信息数据及线索的收集。最初的ADAMS应用程序进行内部威胁检测,在日常网络活动环境中,检测单独的异常行动。
网络内部威胁(CINDER)计划,旨在开发新的方法来检测军事计算机网络与网络间谍活动。作为一种揭露隐藏操作的手段,CINDER将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。
Insight计划主要解决目前情报,监视和侦察系统的不足,进行自动化和人机集成推理,使得能够提前对时间敏感的更大潜在威胁进行分析。该计划旨在开发出资源管理系统,通过分析图像和非图像的传感器信息和其他来源的信息,进行网络威胁的自动识别和非常规的战争行为。
Machine Reading项目,旨在实现人工智能的应用和发展学习系统的过程中对自然文本进行知识插入,而不是依靠昂贵和费时的知识表示目前的进程,并需要专家和相关知识工程师所给出的语义表示信息。
Mind's Eye项目,旨在为机器建立视觉的智能。传统的机器视觉研究的对象选取广泛的物体来描述一个场景的属性名词,而Mind's Eye旨在增加在这些场景的动作认识和推理需要的知觉认知基础。总之,这些技术可以建立一个更完整的视觉智能效果。
Mission-oriented Resilient Clouds项目通过技术进行检测,诊断并对攻击作出响应,有效地建立了“社区卫生服务系统”的云,以解决云计算固有的安全挑战。该方案还旨在开发新技术,使云应用和基础设施受到攻击时能够继续运行。只要整体能够有效的运行和保存,可以允许个别主机和任务损失。
对加密数据的编程计算(PROCEED)的研究工作旨在开发实用的方法,相关现代化计算编程语言,使数据加密时仍然能使用云计算环境,以克服信息安全的重大挑战。使用户能够不需首次解密的情况下能够操纵加密的数据,它将使得对手拦截信息更加困难。
在视频和图像的检索和分析工具(VIRAT)计划旨在开发一个系统能够利用军事图像分析员收集的数据进行大规模的军事图像分析。VIRAT如果成功,将使分析师能够在相关活动发生时建立警报。VIRAT还计划开发工具,能够以更加准确率和召回率的去从大量视频库里进行视频内容的检索。
XDATA项目计划旨在开发用于分析大量的半结构化和非结构化数据的计算技术和软件工具。最核心的挑战是,可伸缩的算法在分布式数据存储应用、如何使人机交互工具能够有效的迅速定制不同的任务,以方便对不同数据进行视觉化处理。对开源软件工具包的灵活使用,使得能够处理大量国防应用中的数据。