2012老版栏目

谷歌学术走过风雨十年

时间:2015-01-13浏览:116设置

发布时间: 2014-11-24 08:53:50 | 来源: 光明网 | 作者: 闫洁
11月18日,针对学术文献的免费搜索引擎——谷歌学术迎来了它的十周岁生日。通过利用网页爬虫抓取数以百万计的学术论文文本,谷歌学术改变了研究人员在网上查阅文献的方式。

  在今年《自然》杂志开展的一项调查中,60%的科学家表示自己经常使用该项服务。日前,《自然》杂志对话谷歌学术共同创始人anuragacharya,畅谈谷歌学术的过去和未来。

  问:你如何知道哪些文献需要检索?

  答:我们通过爬虫抓取所有网页。以一篇新发表的博客为例,我们会判断它和其他学术文章存在何种联系。如果很多人引用它,或者它引用了很多人的文章,那么它可能具有学术价值。这里面并没有神奇的公式可以套用,只能从很多特性中寻找证据。

  问:创建谷歌学术的想法从何而来?

  答:我在2000年来到谷歌,之前则在加州大学圣芭芭拉分校从事学术工作。很明显,假如继续从事学术研究,我不可能产生比呆在谷歌还大的影响,使世界各地的人们都可以找到信息。因此,我放弃了学术道路,花了4年时间管理谷歌网页检索团队。那是一段异常忙碌的日子,整个人可以说是心力交瘁。

  alexverstak(注:acharya在网页检索团队的同事)和我决定休假半年,并试图利用这段时间让学术文章的搜索变得更加方便快捷。当时的想法并不是创建谷歌学术,而是想提高谷歌在用户利用网页搜索学术文章时的排名。不过,随之而来的问题是如何判定搜索用户的意图:他们需要学术性的结果或者只是个门外汉?我们据此建立了一个内部原型,谷歌学术变成了一种非常有用和重要的服务。

  问:这个想法很快就取得了成功吗?

  答:很快就广受欢迎。谷歌学术启用后,使用量呈指数级增长。一个重要的差别在于我们按照与用户请求的相关性排列搜索结果,这是此前的学术性搜索服务无法做到的。它们采用的是倒序方式,即首先提供最新的结果。我们还通过爬虫抓取到研究论文的全部文本,尽管在一开始并未将所有出版商的全部文本包括进来。

  问:2012年,谷歌学术从谷歌主页搜索选项的下拉式菜单中消失。你是否担心谷歌学术的地位可能下降或者被砍掉?

  答:不会担心。我们的团队在不断成长中,从成立之初的两个人发展到现在的9人。很多人或许会将谷歌学术从首页菜单中的撤销看成是一种降级,但事实并非如此。这些菜单链接是为了帮助用户从主页转到其他服务,因此会突出那些使用最多的转换链接。如果用户已经知道如何启动谷歌学术,他们就不需要那种转换链接。就是这样而已。

  问:谷歌学术如何盈利?

  答:谷歌学术到目前还未盈利。其实,谷歌提供的很多服务都不赚钱。谷歌学术的首要定位是回归学术界。我们之所以成功坚持到现在,就是因为在谷歌看来,这项服务的花费并不高。就访问量来说,谷歌学术同很多谷歌服务相比很小,因此利用广告盈利的机会相对较少。不过,到目前为止我们还没有盈利上的压力。

  问:未来谷歌学术会有什么样的改变?

  答:我们非常擅长帮助用户找到他们要搜索的文章。不过,下一步我们打算做的一件大事是帮助用户找到他们需要但又不知如何搜索的文章。我们能否让意外发现变得更加容易?如何帮助每个人在无须翻阅上百篇论文导致一整天任何其他事都干不了的情况下,轻松掌握学术前沿?

  我不知道我们将如何实现这个目标。尽管在这方面我们已经做了一些初步努力如推出建议搜索引擎,但离想要的东西还相去甚远。在向用户推送不是其主动搜索的信息时,存在一个本质性问题:内容必须具有相关性,确保我们没有浪费用户时间,但又不能太相关,因为用户已经知道这些文章。

  问:使用谷歌学术的用户是否有必要担心数据隐私问题?

  答:我们采用标准的谷歌数据收集政策,谷歌学术也不例外。我在谷歌的角色主要是负责谷歌学术,所以不会谈太多更宽泛的问题。(闫洁)

返回原图
/