近日,今日头条上线了自己的搜索服务 “头条搜索”,网页版目前已经开始投入使用。一直以来,中国的互联网搜索业务都是由一家名叫百度的公司把持着,在移动互联网红利已经逐步走向萎缩的今天,“搜索”究竟是不是一门好生意,今日头条现在入局搜索业务还能有怎样的发展呢?
百度在搜索上的优势在哪?
互联网上所有的网页都存在无数个服务器,搜索引擎想要实现搜索就要将这些网页存到自己的服务器上,这就要依靠“爬虫(网页蜘蛛)”来实现: 这些爬虫会一直向想被发现的网站发送请求,并将得到的网页存在自己的服务器上。
接下来要对归类好的文件建立索引,这就需要对爬好的网页进行关键词分析并建立索引列表。 用户进行搜索时就可以通过索引列表来在服务器中搜索相关页面,并通过不同的加权方式将搜索结果按照先后进行排序,最终呈现给用户。
听起来虽然简单,但是实际上搜索引擎要面对数以亿计的网页时,每一次搜索都是一次对算力的考验。大家如果对搜索引擎的工作原理感兴趣可以查看Google 官方出品的“How Google Works”视频。只需三分钟就能让你大概明白搜索引擎。
而百度和谷歌,差不多垄断了当代互联网有关搜索引擎的所有技术专利。
前段时间“李彦宏当院士”的事情闹得沸沸扬扬,虽然最后因为群众反对意见比较大草草收场,但也印证了李彦宏在专业领域出色的能力:作为中国互联网领域少有的技术型 CEO,李彦宏曾经在搜索引擎领域创建超精准搜索(ESP)技术和图像搜索引擎技术。 而他所持有的“超链分析”技术专利,是现代搜索引擎领域的重要基础发明之一,这项技术专利,在一定程度上奠定了整个现代搜索引擎的发展趋势和方向。
而搜索作为百度最重要的业务,尽管这几年百度确实是丢人,但从搜索技术这个角度来讲,百度确实是中国最好的。不过百度的市场占有量已经从巅峰时期的85%下降到了70%左右,而且还有进一步下降的趋势。