第七十三章:搜索引擎
推荐阅读:深空彼岸、明克街13号、夜的命名术、最强战神、全职艺术家、龙王殿、重生之都市仙尊、财运天降、花娇、好想住你隔壁
一秒记住【谷粒小说网 www.gulixi.com】,精彩小说无弹窗免费阅读!
第二天,苏炎直接来到了教学楼,今天是他和陆渊亭约好的日子。
来到陆渊亭的办公室,此刻里面正有三名男子正在办公室里和陆渊亭有说有笑。
看到苏炎的到来,陆渊亭也是起身做了介绍,这三人是计算机院系那边的负责人,这次过来主要就是看看苏炎到底有什么东西,敢夸下海口去和国外的搜索引擎进行竞争。
苏炎简单的打了个招呼后,一行人便在陆渊亭的带领下来到了一处会议室坐着,接下来就是苏炎展示他搜索引擎核心技术的时候了。
搜索引擎这个东西,需要用到网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,在零一年的这个时候,还用不上自然语言处理技术,大数据处理也更后世的概念不太一样。
但是说白了,所有的搜索引擎核心点其实就是一个东西,算法。
因为每一个东西都是围绕着算法进行的。
“各位都是计算机方面的专家了,对于搜索引擎可能都有自己的看法,所以在一会的讲解中我希望可以按照我的节奏来,要是有异议的话可以提出来,我会进行详细的解答。”
说完苏炎便开始准备进入正题。
“在展示我的算法核心之前,我们先来看看当下的三大主流算法,百度的超链分析,谷歌的pagerank算法以及ibm的hits算法。
而在着三种算法里几乎所有人都觉得百度的超链分析是三个算法中最落后的,但有些事情我们还是要多角度的看一看,百度的超链分析在某种程度上可以算得上是奠定了搜索引擎的发展基础。
通过抓去网页信息,然后用算法机制对这些网页进行排序当用户输入关键词进行搜索时,根据关键词匹配出按照机制进行排列的网页。
当前三大主流算法,其实不管是哪一家的算法,算法基础其实都是一样的。都是按照上面的步骤来进行的。
甚至有一种说法,谷歌的算法其实是剽窃了百度的超链算法,对此我们不去做过多的研究。那么同样是搜索引擎为什么百度在国外市场竞争不过谷歌呢?
关键在于百度当前的过于简单的基于在某次搜索的所有结果中被其他网页用超链接指向的越多的网页就价值越高这种基础排序方式。
这种基础排序方式导致有些正确的网页反而被一些劣质网页所覆盖,最终劣币驱逐良币,使用户很难找到自己需要的东西。
而谷歌的pagerank就多了两件很重要的事情,第一件事情是,把a页面到b页面的链接解释为a给b的投票行为,谷歌在这里会同时考评a和b的等级从而形成新的等级。
也就是每一个页面都有pr值,同时你的pr值会成为其他页面pr值的参考。
然后不断的重复计算每个页面的pr。假设给每个页面一个随机pr值,那么经过不断的重复计算,这些页面的pr值会趋向于稳定,也就是收敛的状态。
这样也就意味着用户用谷歌的搜索引擎可以比百度更为有效的获取到自己所需要的信息。至于我说为什么不将百度放在眼里,完全是因为百度在前不久推出了竞价业务。”
当说到百度的竞价业务的时候,苏炎明显顿了顿。
而计院来的同志也是适时的捧哏道,“竞价业务据我所知是百度新推出的盈利模式。”
“那么各位对这种盈利模式怎么看?”
苏炎平静的看着众人。
“确实是一个很好的盈利手段,对商家来说可以算的上是一个相对精准的推广。如果是想要登上搜索首页得到话,那么支付给百度的费用将是一笔巨资。如果没有太大的变故的话,这将是百度除了传统广告之外的又一大重要盈利手段。”
“确实竞价排名系统推出后,肯定会有很多企业乐于支付这笔钱的,不过这里面有一个问题,竞价的审核问题怎么解决,毕竟竞价嘛,价高者得,到时候一些虚假广告钱给够了都能上首页,怎么办?要知道网站审核方面总不可能挨个去查看人家的产品吧,而一旦出现问题的话,网站遭受的损失可不是一般的大,毕竟搜索引擎更多的是信誉。”
苏炎看着陷入思索的几人,不由的松了一口气,他可是知道百度在后世靠着竞价排名这个东西可是没少赚钱的,但同样也是饱受诟病,后世的各种莆田系医院就是借此发家,正所谓百度看病,癌症起步。
要是计院的几位对于这种竞价排名也起了兴趣,那么苏炎宁愿将搜索引擎的项目推后,等到神秀科技缓过来之后自行研发。
“苏总,听你的意思似乎是不看好百度的竞价排名啊?”
计院那边的一个中年男人推了推自己鼻梁上的金丝眼镜看着苏炎说道。
随着他的话音落下,包括陆渊亭在内的其他三人也是看向了苏炎,想要听听他的回答。
“对于竞价排名,我确实很抵触。因为如果玩竞价,我们就是在辜负用户的信任,用户为什么会使用搜素引擎?就是因为他想了解一个东西但他自己又不知道,所以他其实是来咨询搜索引擎的。
这个时候搜索引擎扮演的是一个答疑解惑的作用,而一个好的搜索引擎是一个能让更多用户得到自己想要答案的东西,慢慢的,当用户习惯使用某个搜索引擎的时候,其实这个事情的内核就是他相信这个搜索引擎,他认为搜索引擎会给到他想要的答案。
而这个时候我们如果使用搜索结果置顶排行的竞价模式,用户其实是会出现信任习惯的,他们会更相信我们放在那边的推荐,这种信任源于他们对搜索引擎的信任,也源于他们对这个竞价模式的不了解,对互联网的不了解。
比如用户感冒了来搜索感冒怎么办,我们置顶了一个感冒药的商户,用户很可能就去买了,确实,商户可以得到相对精准的多的广告效果,可是我们的用户呢?
他们可能是相信我们的推荐,相信各位也清楚,我国互联网还没有完全普及开来,很多人甚至对于互联网的认知只停留在较浅的层次上,对于竞价排名这种东西他们压根就不了解,也许他们在自己搜索后,出现的第一个结果还以为这个就是搜索出来的结果呢。而这个结果很可能就是竞价广告而已。
我们的互联网是不健全的,监管方面也是存在着很大的漏洞,我可不希望多年以后,当民众得知真相后会戳着我的脊梁骨骂,毕竟有些钱可以赚,但有些钱赚了确实昧良心。
至于如何盈利,我的想法是互联网广告业务,同时我们也搞竞价排名,不过我们是采用竞价排名的方式进行广告拍卖。
之后一方面通过旗下高用户、以及后续开发的高流量产品出售广告位,另一方面是通过做广告联盟匹配广告主和流量主(中小网站、中小App、媒体网站等),占据广告长尾市场,从中赚取佣金。”
神秀不会只做一个搜索引擎,我们用搜索引擎消耗用户的信任,其实是会直接影响到未来的产品。”
苏炎坚定的说道。
第二天,苏炎直接来到了教学楼,今天是他和陆渊亭约好的日子。
来到陆渊亭的办公室,此刻里面正有三名男子正在办公室里和陆渊亭有说有笑。
看到苏炎的到来,陆渊亭也是起身做了介绍,这三人是计算机院系那边的负责人,这次过来主要就是看看苏炎到底有什么东西,敢夸下海口去和国外的搜索引擎进行竞争。
苏炎简单的打了个招呼后,一行人便在陆渊亭的带领下来到了一处会议室坐着,接下来就是苏炎展示他搜索引擎核心技术的时候了。
搜索引擎这个东西,需要用到网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,在零一年的这个时候,还用不上自然语言处理技术,大数据处理也更后世的概念不太一样。
但是说白了,所有的搜索引擎核心点其实就是一个东西,算法。
因为每一个东西都是围绕着算法进行的。
“各位都是计算机方面的专家了,对于搜索引擎可能都有自己的看法,所以在一会的讲解中我希望可以按照我的节奏来,要是有异议的话可以提出来,我会进行详细的解答。”
说完苏炎便开始准备进入正题。
“在展示我的算法核心之前,我们先来看看当下的三大主流算法,百度的超链分析,谷歌的pagerank算法以及ibm的hits算法。
而在着三种算法里几乎所有人都觉得百度的超链分析是三个算法中最落后的,但有些事情我们还是要多角度的看一看,百度的超链分析在某种程度上可以算得上是奠定了搜索引擎的发展基础。
通过抓去网页信息,然后用算法机制对这些网页进行排序当用户输入关键词进行搜索时,根据关键词匹配出按照机制进行排列的网页。
当前三大主流算法,其实不管是哪一家的算法,算法基础其实都是一样的。都是按照上面的步骤来进行的。
甚至有一种说法,谷歌的算法其实是剽窃了百度的超链算法,对此我们不去做过多的研究。那么同样是搜索引擎为什么百度在国外市场竞争不过谷歌呢?
关键在于百度当前的过于简单的基于在某次搜索的所有结果中被其他网页用超链接指向的越多的网页就价值越高这种基础排序方式。
这种基础排序方式导致有些正确的网页反而被一些劣质网页所覆盖,最终劣币驱逐良币,使用户很难找到自己需要的东西。
而谷歌的pagerank就多了两件很重要的事情,第一件事情是,把a页面到b页面的链接解释为a给b的投票行为,谷歌在这里会同时考评a和b的等级从而形成新的等级。
也就是每一个页面都有pr值,同时你的pr值会成为其他页面pr值的参考。
然后不断的重复计算每个页面的pr。假设给每个页面一个随机pr值,那么经过不断的重复计算,这些页面的pr值会趋向于稳定,也就是收敛的状态。
这样也就意味着用户用谷歌的搜索引擎可以比百度更为有效的获取到自己所需要的信息。至于我说为什么不将百度放在眼里,完全是因为百度在前不久推出了竞价业务。”
当说到百度的竞价业务的时候,苏炎明显顿了顿。
而计院来的同志也是适时的捧哏道,“竞价业务据我所知是百度新推出的盈利模式。”
“那么各位对这种盈利模式怎么看?”
苏炎平静的看着众人。
“确实是一个很好的盈利手段,对商家来说可以算的上是一个相对精准的推广。如果是想要登上搜索首页得到话,那么支付给百度的费用将是一笔巨资。如果没有太大的变故的话,这将是百度除了传统广告之外的又一大重要盈利手段。”
“确实竞价排名系统推出后,肯定会有很多企业乐于支付这笔钱的,不过这里面有一个问题,竞价的审核问题怎么解决,毕竟竞价嘛,价高者得,到时候一些虚假广告钱给够了都能上首页,怎么办?要知道网站审核方面总不可能挨个去查看人家的产品吧,而一旦出现问题的话,网站遭受的损失可不是一般的大,毕竟搜索引擎更多的是信誉。”
苏炎看着陷入思索的几人,不由的松了一口气,他可是知道百度在后世靠着竞价排名这个东西可是没少赚钱的,但同样也是饱受诟病,后世的各种莆田系医院就是借此发家,正所谓百度看病,癌症起步。
要是计院的几位对于这种竞价排名也起了兴趣,那么苏炎宁愿将搜索引擎的项目推后,等到神秀科技缓过来之后自行研发。
“苏总,听你的意思似乎是不看好百度的竞价排名啊?”
计院那边的一个中年男人推了推自己鼻梁上的金丝眼镜看着苏炎说道。
随着他的话音落下,包括陆渊亭在内的其他三人也是看向了苏炎,想要听听他的回答。
“对于竞价排名,我确实很抵触。因为如果玩竞价,我们就是在辜负用户的信任,用户为什么会使用搜素引擎?就是因为他想了解一个东西但他自己又不知道,所以他其实是来咨询搜索引擎的。
这个时候搜索引擎扮演的是一个答疑解惑的作用,而一个好的搜索引擎是一个能让更多用户得到自己想要答案的东西,慢慢的,当用户习惯使用某个搜索引擎的时候,其实这个事情的内核就是他相信这个搜索引擎,他认为搜索引擎会给到他想要的答案。
而这个时候我们如果使用搜索结果置顶排行的竞价模式,用户其实是会出现信任习惯的,他们会更相信我们放在那边的推荐,这种信任源于他们对搜索引擎的信任,也源于他们对这个竞价模式的不了解,对互联网的不了解。
比如用户感冒了来搜索感冒怎么办,我们置顶了一个感冒药的商户,用户很可能就去买了,确实,商户可以得到相对精准的多的广告效果,可是我们的用户呢?
他们可能是相信我们的推荐,相信各位也清楚,我国互联网还没有完全普及开来,很多人甚至对于互联网的认知只停留在较浅的层次上,对于竞价排名这种东西他们压根就不了解,也许他们在自己搜索后,出现的第一个结果还以为这个就是搜索出来的结果呢。而这个结果很可能就是竞价广告而已。
我们的互联网是不健全的,监管方面也是存在着很大的漏洞,我可不希望多年以后,当民众得知真相后会戳着我的脊梁骨骂,毕竟有些钱可以赚,但有些钱赚了确实昧良心。
至于如何盈利,我的想法是互联网广告业务,同时我们也搞竞价排名,不过我们是采用竞价排名的方式进行广告拍卖。
之后一方面通过旗下高用户、以及后续开发的高流量产品出售广告位,另一方面是通过做广告联盟匹配广告主和流量主(中小网站、中小App、媒体网站等),占据广告长尾市场,从中赚取佣金。”
神秀不会只做一个搜索引擎,我们用搜索引擎消耗用户的信任,其实是会直接影响到未来的产品。”
苏炎坚定的说道。