关灯
护眼
字体:

第七十三章 搜索引擎(第1页)

请退出浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。🎁美女直播

第二天,苏炎直接来到了教学楼,今天是他和6渊亭约好的日子。

来到6渊亭的办公室,此刻里面正有三名男子正在办公室里和6渊亭有说有笑。

看到苏炎的到来,6渊亭也是起身做了介绍,这三人是计算机院系那边的负责人,这次过来主要就是看看苏炎到底有什么东西,敢夸下海口去和国外的搜索引擎进行竞争。

苏炎简单的打了个招呼后,一行人便在6渊亭的带领下来到了一处会议室坐着,接下来就是苏炎展示他搜索引擎核心技术的时候了。

搜索引擎这个东西,需要用到网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,在零一年的这个时候,还用不上自然语言处理技术,大数据处理也更后世的概念不太一样。

但是说白了,所有的搜索引擎核心点其实就是一个东西,算法。

因为每一个东西都是围绕着算法进行的。

“各位都是计算机方面的专家了,对于搜索引擎可能都有自己的看法,所以在一会的讲解中我希望可以按照我的节奏来,要是有异议的话可以提出来,我会进行详细的解答。”

说完苏炎便开始准备进入正题。

“在展示我的算法核心之前,我们先来看看当下的三大主流算法,百度的链分析,谷歌的pagerank算法以及ibm的hits算法。

而在着三种算法里几乎所有人都觉得百度的链分析是三个算法中最落后的,但有些事情我们还是要多角度的看一看,百度的链分析在某种程度上可以算得上是奠定了搜索引擎的展基础。

通过抓去网页信息,然后用算法机制对这些网页进行排序当用户输入关键词进行搜索时,根据关键词匹配出按照机制进行排列的网页。

当前三大主流算法,其实不管是哪一家的算法,算法基础其实都是一样的。都是按照上面的步骤来进行的。

甚至有一种说法,谷歌的算法其实是剽窃了百度的链算法,对此我们不去做过多的研究。那么同样是搜索引擎为什么百度在国外市场竞争不过谷歌呢?

关键在于百度当前的过于简单的基于在某次搜索的所有结果中被其他网页用链接指向的越多的网页就价值越高这种基础排序方式。

这种基础排序方式导致有些正确的网页反而被一些劣质网页所覆盖,最终劣币驱逐良币,使用户很难找到自己需要的东西。

而谷歌的pagerank就多了两件很重要的事情,第一件事情是,把a页面到b页面的链接解释为a给b的投票行为,谷歌在这里会同时考评a和b的等级从而形成新的等级。

也就是每一个页面都有pr值,同时你的pr值会成为其他页面pr值的参考。

然后不断的重复计算每个页面的pr。假设给每个页面一个随机pr值,那么经过不断的重复计算,这些页面的pr值会趋向于稳定,也就是收敛的状态。

这样也就意味着用户用谷歌的搜索引擎可以比百度更为有效的获取到自己所需要的信息。至于我说为什么不将百度放在眼里,完全是因为百度在前不久推出了竞价业务。”

当说到百度的竞价业务的时候,苏炎明显顿了顿。

🎁美女直播请退出浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。

www.qbzww.com 全本免费小说
畅快阅读 永久免费
请注意适当休息 保护好您的眼睛

全球最大的跨国集团海豚会赶走鲨鱼吗小可怜怀了豪门老男人的崽袁周率天龙奇缘记攻略大全恋爱游戏百科王者平行时空曝光众英雄麻了赶海遇到河豚魂穿到古代梦醒之后浑身酸疼匪我愆期子无良媒句式小可怜怀了豪门老男人的崽袁舟侓海豚赶鱼攻略失败后女主火葬场了在线海豚可以赶走鲨鱼吗有钱的当老大没钱的难过活是什么歌快穿满级大佬穿成新手我绑定了男主万人迷系统免费阅读总裁的蛇精病妻 第20章野火by夏布多昂TXT逍遥六界御剑仙是什么歌校草室友总在撩我山青禾免费阅读惊艳修真界男主快穿我绑定了恋爱攻略系统缇霏惊艳修真界怎么样中国第一家跨国公司穿书后所有讨厌我的人都来为我洗白类似古代末世空间在手打造世外桃源免费惊艳修真界在哪里看快穿我绑定了恋爱攻略系统百度梦醒之后的失落伤感诗句钟府表妹的悠哉生活泡书吧恋爱游戏角色惊艳修真界作者其他遇见你真好的文案恋爱游戏神作大唐小纨绔最新章节更新信息木石奇缘记是哪本书别称2024年全球天灾驱赶海豚萤祸霹雳布袋戏女主别推了我真没想当黄毛反派TXT天龙奇缘记攻略大全图文软萌王妃战神王爷太能宠资源匪我愆期子无良媒翻译及句式失去你的那一天在线阅读免费都市绝世邪医林凡叶惜最新本如寄百度资源本如寄番外在哪里看真千金她超凶年薪百万穿搭