H5响应式建站系统

自动适应所有的浏览设备,手机、微信、平板、PC

浅谈相关性的搜索引擎工作原理

2018-08-163831微加建站
相关性,是搜索引擎优化中的重点。但是对于相关性的搜索引擎工作原理,相信大部分的SEOER对于都缺乏了解。致力于搜索引擎技.......

 


    相关性,是搜索引擎优化中的重点。关键词优化也叫SEO,是长期总结出的搜索引擎收录和排名规则,对网站进行程序、内容、版块、布局等的调整,使网站更容易被搜索引擎收录,在搜索引擎中相关关键词的排名中占据有利的位置。深圳响应式网站SEO网站结构符合搜索引擎的爬虫喜好则有利于SEO优化。网站架构分析包括:剔除网站架构不良设计、实现树状目录结构、网站导航与链接优化。但是对于相关性的搜索引擎工作原理,相信大部分的SEOER对于都缺乏了解。致力于搜索引擎技术中的相关性排名技术研究,以有多年的时间。作为职业SEO对于搜索引擎算法的研究是必须的,虽然说,我们不可能知道搜索引擎算法的全部。但是只需要我们主流搜索引擎技术的方向,你就可以知道搜索引擎时代的脉搏。
    相关度排序技术的产生主要是由搜索引擎的特点决定的。首先,现代搜索引擎能够访问的Web网页数量已经达到上十亿的规模,哪怕用户只是搜索其中很少的一部分内容,基于全文搜索技术的搜索引擎也能返回成千上万的页面。即便这些结果网页都是用户所需要的,用户也没有可能对所有的网页浏览一遍,所以能够将用户最感兴趣的结果网页放于前面,势必可以增强搜索引擎用户的满意度。其次,搜索引擎用户自身的检索专业能力通常很有限,在最为普遍的关键词检索行为中,用户一般只是键人几个词语。例如,Spink等曾对Excite等搜索引擎的近300位用户做过实验调查,发现人均输入的检索词为3.34个。国内部分学者也有相似的结论,发现90%左右的用户输入的中文检索单字为2~6个,而且2字词居多,约占58%,其次为4字词和3字词。过少的检索词事实上无法真正表达用户的检索需求,而且用户通常也不去进行复杂的逻辑构造,只有相当少的用户进行布尔逻辑检索、限制性检索和高级检索等方法,仅有5.24%的检索式中包含有布尔逻辑算符。国内的部分学者的研究结果也表明,约40%的用户不能正确运用字段检索或二次检索,80%左右的用户不能正确运用高级检索功能,甚至还发现用户缺乏动力去学习复杂的检索技能,多数用户都寄希望于搜索引擎能够自动地为他们构造有效的检索式。由于缺乏过去联机检索中常常具备的检索人员,因此,用户实际的检索行为与用户理想的检索行为存在事实上的差距,检索结果的不满意也是不奇怪的。正是由于这个特点,搜索引擎就必须设法将用户最想要的网页结果尽可能地放到网页结果的前面,这就是网页相关度排序算法在搜索引擎中为什么非常重要的原因。
    现阶段的相关度排序技术主要有以下几种:一是基于传统信息检索技术的方式,它主要利用关键词本身在文档中的重要程度来对文档与用户查询要求的相关度做出测量,如利用网页中关键词出现的频率和位置。一般而言,检索出的网页文档中含有的查询关键词个数越多,相关性越大,并且此关键词的区分度越高;同时,查询关键词如果出现在诸如标题字段等重要位置上,则比出现在正文的相关度要大。二是超链分析技术,使用此技术的代表性搜索引擎有Google和Baidu等。和前者相比,它以网页被认可的重要程度作为检索结果的相关度排序依据。从设计思想上看,它更注重第三方对该网页的认可,如具有较大链入网页数的网页才是得到广泛认可的重要网页,而根据关键词位置和频率的传统方法只是一种网页自我认可的形式,缺乏客观性。最后还有一些其他方式,如由用户自由定义排序规则的自定义方式。北京大学的天网FTP搜索引擎就采用这种排序方式,它可以让用户选择诸如时间、大小、稳定性和距离等具体排序指标来对结果网页进行相关度排序。再如收费排名模式,它作为搜索引擎的一种主要赢利手段,在具有网络门户特点的大型搜索引擎中广为使用,但于担心影响搜索结果的客观性,这种方式不是它们的主流排序方式,而仅仅作为一个补充显示在付费搜索栏目中。
    相关度排序技术主要依赖于超链分析技术实现。超链分析技术可以提供多种功能,其中的主要功能就是解决结果网页的相关度排序问题。它主要是利用网页间存在的各种超链指向,对网页之间的引用关系进行分析,依据网页链人数的多少计算该网页的重要度权值。一般认为,如果A网页有超链指向B网页,相当于A网页投了B网页一票,即A认可了B网页的重要性。深入理解超链分析算法,可以根据链接结构把整个Web网页文档集看成一个有向的拓扑图,其中每个网页都构成图中的一个结点,网页之间的链接就构成了结点间的有向边,按照这个思想,可以根据每个结点的出度和入度来评价网页的重要性。
    对于超链分析技术,有代表性的算法主要是Page等设计的PageRank算法和Kleinberg创造的HITS算法。其中,PageRank算法在实际使用中的效果要好于HITS算法,这主要是由于以下原因:首先,PageRank算法可以一次性、脱机且独立于查询的对网页进行预计算以得到网页重要度的估计值,然后在具体的用户查询中,结合其他查询指标值,一起对查询结果进行相关性排序,从而节省了系统查询时的运算开销;其次,PageRank算法是利用整个网页集合进行计算的,不像HITS算法易受到局部链接陷阱的影响而产生“主题漂移”现象,所以现在这种技术广泛地应用在许多搜索引擎系统中,Google搜索引擎的广获成功也表明了以超链分析为特征的网页相关度排序算法日益成熟。
    PageRank技术基于一种假设,即对于Web中的一个网页A,如果存在指向网页A的链接,则可以将A看成是一个重要的网页。深圳响应式网站推广就是由产品为核心内容,建立网站和域名注册查询,再把这个网站通过各种免费,收费渠道展示给消费者的一种操作方法。常见的免费网站推广包括:优化网站内容或构架提升网站在搜索引擎的排名,在论坛、微博等平台发布信息,在其他热门平台发布网站外部链接等,付费推广主要是:易推传媒推广,百度推广,搜搜推广,买广告之类等等方式。PageRank认为网页的链入链接数可以反映网页的重要程度,但是由于现实中的人们在设计网页的各种超链时往往并不严格,有很多网页的超链纯粹是为了诸如网站导航、商业广告等目的而制作,显然这类网页对于它所指向网页的重要程度贡献程度并不高。但是,由于算法的复杂性,PageRank没有过多考虑网页超链内容对网页重要度的影响,只是使用了两个相对简单的方法:其一,如果一个网页的链出网页数太多,则它对每个链出网页重要度的认可能力降低;其二,如果一个网页由于本身链入网页数很低造成它的重要程度降低,则它对链出网页重要度的影响也相应降低。所以,在实际计算中,网页A的重要性权值正比于链入网页A的重要性权值,并且和链入网页A的链出网页数量呈反比。由于无法知道网页A自身的重要性权值,所以决定每个网页的重要权值需要反复迭代地进行运算才能得到。也就是说,一个网页的重要性决定着同时也依赖于其他网页的重要性。

 

热门新闻

新手建站:应看重网页设计公司这几点
网站若想足够吸引人,一个吸睛美观的网页是不可或缺的。不过大多数企业和想要建站的个人都不懂设计知识,这种情况下,你就需要用到网页设计公司了。网页设计公司有哪些呢?国内外比较知名的有WordPress, Strikingly, Wix,上线了,
外贸建站怎么做
外贸建站并不是找给建站公司,就可以当甩手掌柜了,想要后期能够为营销推广做服务,还需要注意很多事情,下面微加就带大家一起来了解下。1. 为什么要做外贸独立站首先,企业做外贸独立站成本更低。相较于每年动辄两三万的b2b平台费用,独立站只需要一次
深圳网站建设:中小企业应该如何自行去做营销网站的seo优化工作
导读:那最近朋友圈里面最为火热的就是百度竞价推广的广告位从20位减少至4位的事情了,这让很多做网络营销的企业很少苦恼,尤其是之前只做付费推广不做SEO是企业来说是一个很大的打击,这也让很多的企业明白了免费的SEO优化的重要性,那这时候去做SEO优化推广费用就比较高了,同时也说明了中小企业推广成本又高了,这时候很多的企业都是不愿意出钱去做的,那企业如何自行去做营销型网站seo优化的工作呢?中小企业应该如何自行去做营销网站的seo优化工作
网站要如何防范木马程序入侵
入侵者是怎么样上传木马的呢?一般有几种方法,通过sql注射手段,获取管理员权限,通过备份数据库的功能将木马写入服务器。或者进入后台通过程序的上传功能的漏洞,上传木马等等,当然正常情况下,这些可以上传文件的程序都是有权限限制的,大多也限制了相关格式文件的上传。
深圳网站建设:2017网络营销的七大诀窍
眼下,网营销已经成为业界的热门之一。越来越多的企业与个人认识到了开展网络营销的必要性,同时大量的络营销服务企业也应运而生。无论是对于企业或个人,还是网络营销服务机构,在开展网络营销之前,进行针对性的网络营销分析是很有必要的。通过网络营销分析,用数据和现实来指导自己开展网络营销的步骤,能有效提高网络营销效率。向大家简单介绍七种网络营销分析的方向,各种方向结合起来,就能够做出一个相对客观准确的网络营销分析。

推荐新闻

新闻资讯

微加建站

联系微加

客服电话:400-0755-992

客服邮箱:vip@wapadd.cn

服务时间:周一至周五 9:00-18:00

扫一扫  关注微加

Copyright © 2021 WapAdd.cn 深圳微加互联科技有限公司 粤ICP备14021220号-1 建站加盟首选,微加建站! 粤公网安备 44030402001656号

图片与文章来源于网络,版权归原作者所有,如有侵权,请与我联系删除。

微信分享
咨询热线
400-0755-992
关注微加
关注微加
提交需求
管理平台