武汉SEO > SEO优化 > 正文

武汉SEO剖析搜索引擎分词的算法逻辑和语法思路

作者:武汉SEO 来源:武汉SEO推广 2019-08-10 12:05

分词在我们这个圈子里是很容易被提及的一个词汇和概念,笔者通过对搜索引擎分词原理的研究,去进一步优化标题和关键词撰写的手法和标准。做外贸也是如此,注重搜索引擎对英文长句的拆分,词组的分词和理解,也是很有必要的。

分词在我们这个圈子里是很容易被提及的一个词汇和概念,笔者通过对搜索引擎分词原理的研究,去进一步优化标题和关键词撰写的手法和标准。做外贸也是如此,注重搜索引擎对英文长句的拆分,词组的分词和理解,也是很有必要的。

武汉SEO剖析搜索引擎分词的算法逻辑和语法思路

这篇文章为主的笔者先以中文分词的搜索引擎算法逻辑讲解一下我学习后理解中的分词逻辑,英文分词后续会继续更新,可以多多关注!

1.紧密性

词组的紧密性:紧密性原则是写标题的优先考虑原则,配合生意参谋的数据分析工具,获取这些买家自身输入的搜索行为词,保证原则上不做分割,维护其紧密性

2.通顺性

语句的通顺性:堆砌词组,堆砌关键词,堆砌标题是很多年前的手法了,这里不用细说,是一定要规避堆砌的。因此写标题的时候要考虑的一点是语句的通顺性(虽然买家看首焦图来决定点击的行为轨迹更大,而不是看标题,相信很多人买一些并不要求很高的技术性或产品匹配度的产品,都是直接看图就买,不会仔细看标题)但是,现在是2019年了,AI算法和词意的判断准确度已经有了很大的提高,因此标题不仅仅是给访客看,也是要给搜索引擎看的。保证语句的通顺性,可理解性,能辅助加大搜索算法对产品的理解和二次判断,是很必要的

3.逻辑性

分词的逻辑性:分词常规算法上基础原理分为最大正向匹配,逆向最大匹配法,双向最大匹配法

最大匹配

什么是最大匹配模型?

首先什么是最大匹配?最大匹配是指以当前已有词典为数据库,捕获词典数据库中最长的单词为第一次取字数量的扫描串数据,执行扫描

例如数据库中最长的单个词为“现在最流行的歌”,统计共有7个汉字字符,最大匹配的计算算法则是按照起始字数为7个汉字。然后逐字递减,每次减少1个词,进行扫描和分析,同理进行第三次,第四次的匹配,在对应的词典中进行查找。

注:切分结果中非词典词越少越好,单字字典词数越少越好,这里的“非词典词”就是不包含在词典中的单字,而“单字字典词”指的是可以独立运用的单字,如“的”、“了”、“和”、“你”、“我”、“他”。例如:“技术和服务”,可以分为“技术和服务”以及“技术和服务”,但“务”字无法独立成词(即词典中没有),但“和”字可以单独成词(词典中要包含),因此“技术和服务”有1个非词典词,而“技术和服务”有0个非词典词,因此选用后者。

武汉SEO剖析搜索引擎分词的算法逻辑和语法思路

而正向,逆向,双向就是基于上面这个扫描和分词逻辑进行的,下面我以”我们在天文博物馆玩“一词举例子:

最大正向匹配:从左往右,或者说从前往后,从开始往结束进行扫描

那么,我们..........

开始吧

扫描1:从左往右取7个字-我们在天文博物,扫描7字的词典数据,不存在此类词语,执行下一次扫描

扫描2:我们在天文博,扫描6字的词典数据,不存在此类词语,执行下一次扫描

扫描3:我们在天文,扫描到5字的词典数据,不存在此类词语,执行下一次扫描

......依次同理

当执行到扫描6的时候,扫描到我们,存在这个词语,因此分词:我们,我们这个词搜索算法分析和理解出来了,存储:我们

那么下一次要执行的就是去掉已经识别和分词的“我们”,开始执行对”在天文博物馆玩“的扫描和分词,按照上面的程序运行,依次类推扫描1:在天文博物馆玩,扫描7字的词典数据,不存在此类词语,执行下一次扫描

扫描2:在天文博物馆,扫描6字的词典数据,不存在此类词语,执行下一次扫描

扫描3:在天文博物,扫描5字的词典数据,不存在此类词语,执行下一次扫描

以此同理,一直这样扫描和分词,最后分出:我们/在/天文/博物馆/玩”,其中,单字字典词为2,非词典词为0。

而逆向最大匹配法的思路是即从后往前取词,其他逻辑和正向匹配的相同。

不过正向匹配和逆向匹配都有其缺陷,因此搜索引擎也会运用双向最大匹配法和双向最大匹配法。分别计算正向最大匹配和逆向最大匹配的结果

计算逻辑:非字典词(越少越好)+单字字典词(越少越好),最后统计出正向和逆向的这个结果和的数值

假设:

正向:非词典词=2,单字词典词=3,共5

逆向:非词典词=1,单字词典词=2,共3

取决其中数值更低的作为结果,那么选择逆向作为输出,输出逆向最大匹配时候的分词的逻辑结果

文本总结

零售春风吹满地,运营喵们真牛逼。在这个懵逼树上懵逼果,懵逼树下你和我的年代,风雨飘摇,电商平台,搜索算法变幻莫测。辛苦的运营喵还是得烧脑的学习一些搜索引擎的底层逻辑SEO运营的思维。


本文地址:SEO优化频道 http://seo.hkm168.com/seojishu/3087.html,武汉易企推SEO公司提供一站式SEO优化服务:武汉SEO优化、网站优化,关键词排名优化、SEO顾问诊断、SEO培训、网站建设、武汉竞价托管、全网营销推广(全网品牌推广)、百科词条创建修改、新媒体引流、公司负面公关处理等;另外本站原创文章,转载本文请保留本站地址,谢谢!

上一篇:武汉电商网站建设的价格和基本设施费用,需要考虑哪些因素

下一篇:武汉SEO数据分析怎样做才能真正具有价值?

相关文章相关文章
  • 武汉SEO数据分析怎样做才能真正具有价值?

    武汉SEO数据分析怎样做才能真正具有价值?

    与很多朋友或者客户的沟通中发现,对于数据价值的使用,有一种很不合情理的现象:高开低走是普遍的规律,各种主流峰会上,数据被捧上圣坛,数据也是各种创投故事的主角,但实际运营中却是高不成低不就,落地难、形成业务驱动力更难,比较纯粹的数据分析主要散...

    2019-08-12 11:16
  • 武汉电商网站建设的价格和基本设施费用,需要考虑哪些因素

    武汉电商网站建设的价格和基本设施费用,需要考虑哪些

    为什么有些网络公司的制作费用高,有些更便宜?之前也有小伙伴在后台咨询例如:模板网站多少钱?模板网站多久完成?这样的问题,其实看过下面的文章内容,你们就能理解了。 下面,笔者将详细介绍网站建设的价格和基本设施费用。 网站域名 什么是网站域名呢?...

    2019-08-09 11:14
  • 武汉SEO影响页面排名因素是什么?又该如何解决这些问题呢?

    武汉SEO影响页面排名因素是什么?又该如何解决这些问题

    页面优化的方式会对其排名能力产生巨大影响。大家一定要记住,是页面排序,而不是网站排序。...

    2019-08-08 10:26
  • 武汉SEO新网站优化如何引流拓客,看看这个方法怎么样!

    武汉SEO新网站优化如何引流拓客,看看这个方法怎么样

    之前咱们说过新网站优化方面的问题,很多的企业主们在新网站优化的初期,都会面临各种同样的困难:没流量没点击没咨询,因而业务拓展很难做起来。如何在这样的初期困境中寻找到合适的优化方法,从而使得你的网站走上正轨,是一个比较重要的点!...

    2019-08-07 12:14
  • 如何做SEO语音搜索?语音搜索SEO查询词特点

    如何做SEO语音搜索?语音搜索SEO查询词特点

    看了《SEO实战密码》的作者最近推送的一篇文章,感触颇深,遂想说上一两句。随着互联网的崛起,潮流在一步步推进,看过Sara之前的推送的应该知道现在的SEO,已经从最初的有网站,有图片就OK,转向了寻求高清大图,现在已经进军到小视频SEO了。今日一看大咖对...

    2019-08-06 11:38
  • 武汉SEO告诉你为什么企业需要优化语音搜索?

    武汉SEO告诉你为什么企业需要优化语音搜索?

    当涉及搜索优化(SEO)策略时,一般需要做两件重要的事情:对你的关键词进行有效的研究,并为未来调整你的SEO策略。第一事是根据你的受众群体所需的内容来进行识别。第二个源于操作中不可预知的一些变量。...

    2019-08-05 11:54
  • 武汉SEO搜索优化,链接构建的指标决定排名是真的吗?

    武汉SEO搜索优化,链接构建的指标决定排名是真的吗?

    您应该了解与链接相关的各种指标。这些指标可以帮助您判断潜在链接的seo优化价值,帮助您评估是否值得追求,以及应该投入多少资源才能获得它。当您进行链接配置文件分析(网站上链接数量和类型的seo整体报告)时,无论是在竞争对手的网站上还是您自己的网站上...

    2019-08-03 13:31
  • 移动互联时代如何做好移动优先索引?对SEO有什么影响?

    移动互联时代如何做好移动优先索引?对SEO有什么影响?

    移动互联时代,谷歌改变策略自智能手机爆发以来,人们越来越依赖于手中的这一块小小的屏幕。如今大多数人从移动设备而不是电脑上使用谷歌。但Google Search的网页搜索结果排名系统最初是为PC时代设计的。“爬虫”们还在查看页面内容的桌面版本,以确定其与用...

    2019-08-02 13:36
产品图片2
服务器图片