主持人与嘉宾李开复在现场
李开复做主题演讲
那么这是今天的网页搜索,所以我们对中文的网页搜索我们相当自豪。在过去一年半中做了这么多工作,我们认为是今天最好的中文搜索。做到这样的地步是不是就结束了,很显然没有。第一个中文的网页搜索,如果我们不继续的把这每一个0.1%都争取的话,这个网页搜索它的精准度就会下降,因为每天网页越来越多,然后有各种的作弊方式会发生,还有各种不同的新的网站、新的内容等等问题会出现,所以我们一定要继续努力,我们几十个人、上百人的团队会不停的、永远的专注在看搜索的质量,这是今天的搜索。
现在我想谈一下在未来搜索会走向什么样的一条路?未来方面我认为最重要的一点就是整合搜索,我们说未来其实不太精确,其实今天已经有不少整合搜索的功能已经上线了。待会儿会有一些想法,是怎么测试的。整合搜索的概念大概是这样,网页搜索能够把很多的文字做一个排序,它靠很多不同的排名方式,一个排名就是看一个网页多有权威性。另外就是我搜索的词和网页的词有没有出现,做一个匹配,这些都是传统的网页搜索非常重视的一些特征。但是,后来有不少的网站发现了一件事情,用这些特征来做,排名网页和文字相当好,但是很多特殊的信息用它来排名就不太对了。比如说书本的排名,如果你要搜索的是图片,那图片本身我们没有办法理解它,但是你可能找附近的词,还有图的下面有没有图注的存在,把这些东西加全来处理。比如你要排的是学术论文,一个学术论文它排高还是排低,可能更多的要看这篇论文和作者还有期刊,它本身权威性高不高,那怎么决定一篇文章的权威性高不高呢?就要看其他的文章有没有来引用它。这是一个不同的方式。
新闻搜索当然很重要是新,就是你做一个新闻搜索,一个十天前的匹配更好的文章,也许不应该排再一个5分钟之前匹配较低的文章上,因为新闻搜索新很重要。比如说视频、比如说博客搜索,比如说论坛搜索,比如说公交路线、地图、比如说餐饮的搜索,比如说我们的二手货的搜索等等,今天可能有一百个不同的搜索,他们用传统的网络搜索排名就是排的不好。为什么不好呢?因为网络排名所用的特征,他们所用的信号不适合这一种文本,这一种类别,不适合。所以就有很多的垂直网站,他们就产生了,有些是做比如说二手货的搜索、餐饮的搜索、或者是书名的搜索,非常多的垂直网站就出现了,有一些是Google做的,有一些是我们的竞争对手做的,有一些是一个小公司做的,他们每一个都能在这个领域里比网页搜索做的更好,这个是毫无疑问的。因为他们挑选的那个类别就是你网络搜索搜不好,亿我又来做一个垂直搜索,比你做的更好,这个对用户来说是一个好消息。
但是今天我们看是上百个、甚至上千个不同的垂直搜索,但是这个就违背了当时搜索的理念,搜索的理念就是所有天下事,你在我这一个框里打一个词都可以帮你搜到,但是慢慢搜论坛到那去,搜公交到这儿去,搜地图到这儿去,找餐饮到哪去,找视频到这个网站。慢慢的我们的脑袋就爆炸了,而且一般的用户,在座都是互联网的元老,用了很多互联网的,还有很多初级的用户,他们不可能会记得每一个垂直搜索到什么地方去,这是一个很大的问题。还有很多的就是说,有些东西到底要去哪里找?比如说有关周杰伦的信息,我应该到视频找、新闻找、音乐找?还是博客找?粉丝俱乐部找?还是论坛找?因为周杰伦到处都出现。你要找李开复的话,你要到他的学术论文还是他的书本,还是演讲的内容,还是视频?还是公司?还是个人博客等等,很多不同的结果,到底去哪找?就算你知道各种不同的垂直搜索,可能你也不知道要去多少个地方?所以我们认为这个又是开始了对用户的一个不方便。所以我们整合搜索的概念,就是又回到了一个搜索框,我们去处理一个很困难的技术问题,就是当你搜索周杰伦的时候,他的一个图片和他的博客、还有粉丝俱乐部,我们要把它做一个排序,怎么去做排序,当然是我们公司的机密,在这里不能够分享。而且你可以想想,比如你只搜周杰伦的时候,我们可能就会想说大部分的人,想到周杰伦是想到音乐呢?还是演员呢?还是粉丝俱乐部、还是新闻呢?还是其他的?但是如果一个人搜索周杰伦唱歌,这个时候哪些排的高一些?如果周杰伦专辑、周杰伦绯闻等等的,你可以想象所有匹配周杰伦的搜索词这个排序又不一样,所以我们要做一套技术能够处理单个或者多个的搜索词,而针对这些搜索词,我们要把多元的不同信息,他们用不同的方式排名,能够做一个动态的排序,你可以想象这是相当困难的一件事情。我们所有的搜索都不号称能够做到完美,因为不可能的,我们尽力把它做好,对于用户来说,我们认为如果你要找的某一个信息,如果找的是周杰伦的视频,但是你只打了周杰伦进去,我们如果只要能把它放在第一位,我们就相当满足,并不强求他一定要排在第一位。整个搜索的概念就是这样,排第一位还是比较困难,排到第一页大部分用户比较满意了。
那整合搜索就是我们要把多元的信息整合起来,然后做一个动态的排序,这样的情况之下,用户就不需要知道这些垂直搜索。这不表示垂直搜索就要灭亡了,垂直搜索还是存在的。那些明明知道自己要到哪找的人,还是可以去垂直搜索,只是那些不确定的人,或者要开始做一个搜索的人,我们欢迎他来我们的整合搜索,然后我们会给他不同的路线,让他发现一个比如我打周杰伦,看到了周杰伦的视频,点击看更多周杰伦视频,去看更多的内容,这个是整合搜索的概念,是要把各种垂直搜索做好,然后做一个动态的整合,真正用户搜索的任何东西,我们都可以做一个很好的排序。这样就降低了用户的负担,他不需要去认识一千个不同的垂直的搜索。这个是我们明年最重要的一个方向。
最后我还想讲几点我们也认为很重要的发展。先讲一下,整合搜索今天在我们的网站上已经开始推出了,所以你可以试试不同的词,当你做一个搜索,图片出来了、地图出来了、视频出来了,这个时候你就会看到了有一个、两个或三个的搜索,而且不一定排在第一个,可能第二、第五、第十,都有可能,欢迎你们去试一试,你会发现每一个月我们的整合搜索里会有越多的非网页搜索。三个月以前你去搜几乎都是网页,今天的话我想至少有10%到15%有这种多元的结果,未来越来越多,30%、40%等等,越来越多。这是一个我们发展的方向。
另外我想再谈几个,我们认为很重要的方向,第一个方向我想谈的就是智能化。怎么样让搜索变的很聪明,刚才谈的搜索的排序,然后把整合搜索的信号整合起来,里面还有很多很有趣的东西,只是用户不见得能够看得出来,因为我们并不没有把这里面的机制暴露出来,我可以举个例子,让你们知道网页搜索是相当困难的事情。
原文链接