聊城万拓网络科技-专业聊城网站建设、聊城网站制作、聊城网站优化、聊城做网站的品牌网站建设专家!

    您当前的位置是:首页 - 新闻动态 - 业界动态 » SEO优化原理和搜索引擎算法初探

    SEO优化原理和搜索引擎算法初探
     发布时间:2013-05-15  点击次数: 次   作者:万拓网络  来源:lcbaituo.com  Tags:

    一、SEO优化原理和搜索引擎算法初探
     
     
    首先我说一下SEO优化的原理是根据SE的原理进行优化的,所谓SE指的就是搜索引擎,在座的大家我想基本上都是学计算机相关专业出身的,所以大家都明白任何一个程序的编制都是根据一定的算法或者规律来编写的,那么搜索引擎也一样,搜索引擎是帮助用户查找存储在个人电脑、计算机网络如互联网上的信息的软件程序。用户输入搜索项目,通常是通过录入一个关键词或短语,搜索引擎通过扫描被搜索的计算机和计算机网络,或者分解(分析)它们数据的索引,返回给用户
     
    那么搜索引擎是如何收录我们页面的呢
    一、抓取
    搜索引擎首先会派出一种被称作“蜘蛛”或者是“机器人”的软件,根据一定规则扫描存在于互联网上的网站,并沿着网页上的链接从一个网页到另一个网页,从一个网站到另一个网站。为保证采集的资料最新,它还会回访已抓取过的网页。
    二、索引
    由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
    三、排序
    当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。
    最后,由检索器将搜索结果的链接地址和页面内容摘要等内容组织起来,返回给用户。
     
     
    以上为SEO优化的基本的原理
     
     
    二、重点讲解一下索引算法
    现代搜索引擎普遍使用全文索引技术,即网页文档中所有词都参与索引。理想的索引词应该是表达文档内容的语义单位,即语言学里的词语,是那些专指义,而实际意义无法由组合成分相加得到的最小语言单位。但实际系统中中文文本必须通过自动分词程序的处理,分割成为独立的分词单位,再从分词结果中选择索引词。自动分词算法有两大类,普遍采用的方式是基于词典的分词方法,这一方法效率高,但分词精度受词典规模制约;另一种是基于统计语言模型的方法,可以发现一些新词。实际应用是两种方法的不同程度的组合。
    在建立索引的时候 (关键词的提出)在网页源文件中提取出能够代表它的内容的一些特征
     
    对于中文来说,就是要根据一个词典Σ,用一个所谓“切词软件”,从网页文字中切出Σ所含的词语来。一篇网页主要就由一组词来近似代表了,p = {t1, t2, …, tn}。
    在进行分词的时候将去掉一些无意义的词 例如 的 吧 吗 等助词 形容词 连词等 重点分析的是名词 专有名词!



    分享到:
    下一篇:不用害怕搜索引擎算法的改变
     

    本站业务:聊城网站建设-聊城网站制作-聊城做网站