当前位置:首页 > 新闻资讯 > 正文

谷歌强力推出数据集搜索!Dataset Search神器重磅来袭2018-09-06 10:32:28 | 编辑:hely | 查看: | 评论:0

还记得曾经的你,在做科研的时候,为了得到一份儿数据集,绞尽脑汁各种百度、各种google,但结果往往一无所获。从今儿起,再也不用担心这个问题了!继Google学术搜索之后,谷歌又一神作——Dataset Search重磅来袭!

 

继Google学术搜索之后,谷歌又一神作——Dataset Search重磅来袭!

千呼万唤始出来!Google Dataset Search腾空出世了!

还记得曾经的你,在做科研的时候,为了得到一份儿数据集,绞尽脑汁各种百度、各种google,但结果往往一无所获。从今儿起,再也不用担心这个问题了!

谷歌超级重磅神器来也:

 

 

Dataset Search——数据集搜索领跑者

数据,可以说是当今世界众多科学家与工作人员赖以生存的一片沃土。而在网络中存在成千上万个数据存储库,科研人员亦可以访问及使用这些数据集。

为了方便科学家和数据相关研究、工作人员能够轻松访问这些数据,谷歌启动了“数据集搜索(Dataset Search)”。

与谷歌Scholar工作方式类似,不论数据集是托管、发布在哪个网站、数字图书馆或个人网站,都可以轻松的查找与访问。

为了创建数据集搜索,谷歌为数据集提供了一套指南,以便谷歌(和其他搜索引擎)能够更好地理解其页面的内容。

这套指南主要突出了数据集以下方面的信息:

• 数据集的创建者

• 数据集发布时间

• 数据集搜集方法

• 数据集使用条款

• ......

然后,谷歌收集并且链接这一信息,对不同版本的同一数据集做分析,并找到描述或讨论数据集的出版物。

谷歌的方法基于一个开放标准(schema.org),任何发布数据的人都可以采用上述方式对他们的数据集做描述。

在这个新版本中,用户可以找到有关环境和社会科学的大多数数据集的引用,以及来自其他学科的数据(包括政府数据和新闻机构提供的数据)。随着越来越多的数据存储库使用schema.org标准来描述它们的数据集,用户在数据集搜索中发现的数据集的多样性和覆盖范围将继续增加。

Dataset Search——抢先体验!

数据集搜索支持多种语言,当然也包括中文。只需输入你要查找的内容,这款神器便将帮助你在存储库提供者的站点上找到已发布的数据集。

例如,如果你想分析每天的天气记录,你可以在数据集搜索中尝试输入daily weather:

 

 

正如搜索结果所示,你可以看到来自NASA、NOAA的数据集,同时也是可以看到来自学术存储库的数据,例如哈佛的Dataverse和ICPSR。

正如NOAA的首席数据官Ed Kearns所说:“这种类型的搜索长期以来一直是科学界许多研究人员的梦想!”

但是谷歌方面也表示,像这样的搜索工具只有在数据发布者愿意提供的元数据的基础上才能发挥作用。并呼吁广大数据提供者能够采用schema.org标准来描述数据。

心动不如行动,大家赶快动手去试试吧:https://toolbox.google.com/datasetsearch

上一篇:机器学习技术&市场最强评估宝典 AI研发者福利!谷歌推出数据集搜索专用引擎Dataset Search下一篇:

公众平台

搜索"raincent"或扫描下面的二维码