Wolfram Alpha知识引擎开创搜索引擎3.0时代

2009-05-26 14:03:11

“以光速从地球飞到土星需要多长时间?用计算机化知识引擎Wolfram Alpha查找的话,不到一秒钟就能得到答案:75分钟。网络用户可以向该服务器提交个性化的问题,Wolfram Alpha将努力找出答案。一位35岁的健康女性接下来十年间患上心脏病的几率?1/167。美国建国200周年纪念日1976年7月4日华盛顿特区的气温?74华氏度。”《洛杉矶时报》的报道说,Wolfram Alpha甚至能救你的命,键入“冻伤2度风速2公里/小时”,它会告诉你,如果你在气温2度、风速每小时25公里的情况下站在室外,22分钟后你会冻伤。

  对于这样的问题,谷歌和维基百科也许要搜索大量可能匹配的已有网页。5月18日启用的Wolfram Alpha可不是这样,“我们不是用人们已经写在网上的东西,我们努力使用真实的人类知识的材料提供特定的答案。”它是以发明人、英国物理学家斯蒂芬·沃尔弗拉姆的名字命名的,斯蒂芬20岁时就获得了物理学博士学位,后来因为开发了一种计算和图形软件包而发了大财。

  Wolfram Alpha不是一个搜索引擎,而是被叫做计算化知识引擎。这么叫不只是为了避免跟谷歌正面相对,而且表明它回答问题的不同方式。搜索引擎告诉用户在网上的什么地方找自己需要的东西。Wolfram Alpha则努力直接给出答案,而不是给出其他网站的链接,它是一个有点封闭的系统,努力把一个问题分解成其组成部分,然后进行计算,用它自己的资料得出答案。答案以表格或图片形式显示。它就像一个配有最先进的计算器和一排排图书与百科全书的图书馆馆员。

  为了做到这一点,Wolfram Alpha和他的人工资料管理员团队为系统装备了一系列数学公式、10兆字节的各种来源的数据:科学杂志、百科全书、政府文件(CIA的世界手册、美国人口普查报告)和其他他们认为可信的来源。10兆字节有多大?可以用它搜索一下:它会告诉你那大约是国会图书馆收藏的文本的一半。

  这些特定的知识能不能转化成广告收入还有待观察。一些分析人士怀疑这一网站像谷歌那样风行的潜力。一家投资公司的分析师说,大部分搜索收入将来自那些跟商业有关的搜索。“你不会希望它搜索最好的数码相机是哪一款,因为对这样的问题,没有一个算法能够提供答案。”

  人们难免要比较Wolfram Alpha和谷歌,但它们对各自任务的陈述表明,这两种服务是不同的。谷歌希望“对世界上的信息加以组织,使人人都能够获取并使用它们”。Wolfram Alpha的目标则是“使跟任何东西有关的可以计算的变得可以计算”。二者的目标都很高,但都还没有实现。Wolfram Alpha可以演示物质的分子结构,可以列举美国大部分城市周围最近发生的地震,可以告诉你坦桑尼亚的通货膨胀率,但它却回答不了“现在几点”这样简单的问题。像文学和流行文化之类的问题,不纯粹是以公式或数字为基础,是无法计算的。因而《经济学家》说:“一个免费的、几乎立刻就能计算出一些复杂问题的网站确实很新奇,有助于专业知识的民主化。”

  如Wolfram自己所说,使搜索引擎变得更聪明不只是一个爬梳更多数据的问题。即使答案已经在数据库里,软件可能就是无法理解用户提的问题。一半的工作是要教会程序分析人类的语言,以便搞懂用户要它做什么。

  Wolfram Alpha努力神奇地从互联网上浩瀚的信息海洋中提取出有用、精确的信息。这是互联网的发明人蒂姆·伯纳斯·李也为之神迷的任务,他用了十多年时间借助一个他称为“句法网络”的系统做基本类似的事情。目前,Wolfram Alpha在提供人们不关心的信息方面遥遥领先,类似明天地球和太阳之间相距多远?40岁男性的平均体重指数是多少?埃菲尔铁塔是不是比西雅图的太空针塔高?迈阿密现在的海浪大不大?五线谱上如何标记D小调?问一个稍微复杂一点的问题,比如“凯文·罗斯正在跟谁约会?”它就会回答说无法确定该如何处理你输入的问题。谷歌也许回答错了,但至少它试了。

  Wolfram Alpha显然会不断进步,但很难想象它能进步到真的有用的地步,人类的语言缺少使它能够试着解答的精确性。现实生活中人们的语言表达必须考虑真实世界的模糊性,在生活中,人们对什么是有趣的或感人的则有不同的看法。
 

[打印] [关闭] [返回顶部]