首页 > seo学习 > seo基础 > SEO学习免费教程第七课:浅析搜索引擎的三个工作过程
2014
10-19

SEO学习免费教程第七课:浅析搜索引擎的三个工作过程

seo学堂今天给大家带来第七课,浅析搜索引擎的三个工作过程,下面就展开来阐释:

一、爬行和抓取网页

主流搜索引擎都有自己的网页抓取程序spider。Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页,蜘蛛抓取网页,获得网页html代码存在数据库。

二、预处理网页

搜索引擎抓取网页后,还要进行大量的预处理工作,才能提供给用户较为精准的检索服务。其中,最重要的就是进行文字提取、关键词提取,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。以备排名程序随时调用。

三、提供检索排名服务

当用户输入关键词进行检索的时候,搜索引擎会自动从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的标题、摘要以及其他信息。

学习SEO不仅要知其然,还要知其所以然,只要这样,您才能把握SEO的精髓。搜索引擎作为用户日常检索的主流应用,它的目的就是致力于为用户提高更加精准智能化的搜索体验,因此它必然从用户的角度,来进行网页抓取、处理以及排名展示,对用户越有用,用户评价越好,文章质量越高的内容,当然搜索引擎排名也就越好。

学完了该课程的SEOER,还阅读了琪琪seo基础知识培训免费教程系列。

最后编辑:
作者:SEO学堂
专注于SEO营销、SEO优化、SEO实战培训、SEO实战经验的分享、交流、互利共赢。
捐 赠如果您觉得这篇文章有用处,请支持作者!鼓励作者写出更好更多的文章!

SEO学习免费教程第七课:浅析搜索引擎的三个工作过程》有 10 条评论

  1. xingbuxing 说:

    现在新站半个月才开始正常收录,新站上线时间只有3个月,时间越来越紧迫,最近都不知道该怎么安排工作了

    • SEO学堂 说:

      现在百度算法对新站的收录,比2015年是提前了,但是对新站的审核力度也加大了,意味着SEO做的好的,内容质量高的,更新勤快一些,一般相对来说收录就快些,排名也快些,没有计划垃圾采集的,低质量的内容,就有可能很长时间不收录或者甚至不更新首页快照。

  2. hyoung 说:

    要想网页有排名,首先要被搜索引擎收录。

    • SEO学堂 说:

      嗯,收录是获得搜索引擎排名的第一步,也是最重要的一步。很多人总是感觉收录很容易,其实就目前来看,百度现在对于网站内容收录的难度再加大,有的甚至出现了,收录了又掉下来的情况,所以说提高网站收录可以有效提高网站关键词排名。[工作]

  3. 残风如故 说:

    Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页
    那Spider的抓取间隔大概是多久呢?

    • SEO学堂 说:

      由于百度的数据量是以几十亿计量的,可想而知,百度完成一次收录更新,需要多长时间,就是借助云计算和大数据,估计完成一次蜘蛛爬取和收录更新,也需要至少一周,或者几周的时间。[围脖]

  4. 佛山阿曦 说:

    如何做质量高的文章内容呢?

    • SEO学堂 说:

      高质量的内容就是做符合搜索引擎需求的,用户喜闻乐见的,能够真正留住用户的文章内容,同时注意关键词的布局,以及文章内容的编辑还有良好的用户体验。[让红包飞]

  5. 乐乐 说:

    虽然不太明白,但是觉得挺好的。

留下一个回复

你的email不会被公开。

浏览器必须开启Javascipt