近日,谷歌发布了一个帮助研究者查找在线数据的免费搜索引擎:数据集搜索(Dataset Search)。谷歌表示,该引擎面向科学家、数据记者、数据极客等人群。
据悉,数据集搜索与谷歌的其他专用搜索引擎一样可以免费使用,它基于拥有者对文件和数据库的分类方式来查找文件和数据集。該引擎读取文件内容的方式与搜索引擎搜索网页的方式不同。有专家表示,该引擎填补了这一领域的空白,可以极大地促进开放数据运动的发展,这一运动旨在实现数据的开放利用和重复利用。
目前谷歌已经正式对外测试开源数据集搜索引擎,用户在键入数据集名称或关键信息后,该搜索引擎会给出一系列数据源列表,每一个数据源都会有简要的介绍,例如更新日期、作者、版权和内容说明等。随着数据集搜索的不断改进,未来它也许会跟谷歌学术整合,将特定研究领域的搜索结果关联到相关数据集。(陈曲)