<noframes id="9zd7v">

        <form id="9zd7v"></form>

        <address id="9zd7v"><address id="9zd7v"><nobr id="9zd7v"></nobr></address></address>
          <address id="9zd7v"><menuitem id="9zd7v"><meter id="9zd7v"></meter></menuitem></address>

          武漢SEO剖析搜索引擎分詞的算法邏輯和語法思路

          作者:武漢網絡公司 來源:華凱夢科技 2019-08-27 22:00

          分詞在我們這個圈子里是很容易被提及的一個詞匯和概念,筆者通過對搜索引擎分詞原理的研究,去進一步優化標題和關鍵詞撰寫的手法和標準。做外貿也是如此,注重搜索引擎對英文長句的拆分,詞組的分詞和理解,也是很有必要的。

          武漢SEO剖析搜索引擎分詞的算法邏輯和語法思路

          這篇文章為主的筆者先以中文分詞的搜索引擎算法邏輯講解一下我學習后理解中的分詞邏輯,英文分詞后續會繼續更新,可以多多關注!

          1.緊密性

          詞組的緊密性:緊密性原則是寫標題的優先考慮原則,配合生意參謀的數據分析工具,獲取這些買家自身輸入的搜索行為詞,保證原則上不做分割,維護其緊密性

          2.通順性

          語句的通順性:堆砌詞組,堆砌關鍵詞,堆砌標題是很多年前的手法了,這里不用細說,是一定要規避堆砌的。因此寫標題的時候要考慮的一點是語句的通順性(雖然買家看首焦圖來決定點擊的行為軌跡更大,而不是看標題,相信很多人買一些并不要求很高的技術性或產品匹配度的產品,都是直接看圖就買,不會仔細看標題)但是,現在是2019年了,AI算法和詞意的判斷準確度已經有了很大的提高,因此標題不僅僅是給訪客看,也是要給搜索引擎看的。保證語句的通順性,可理解性,能輔助加大搜索算法對產品的理解和二次判斷,是很必要的

          3.邏輯性

          分詞的邏輯性:分詞常規算法上基礎原理分為最大正向匹配,逆向最大匹配法,雙向最大匹配法

          最大匹配

          什么是最大匹配模型?

          首先什么是最大匹配?最大匹配是指以當前已有詞典為數據庫,捕獲詞典數據庫中最長的單詞為第一次取字數量的掃描串數據,執行掃描

          例如數據庫中最長的單個詞為“現在最流行的歌”,統計共有7個漢字字符,最大匹配的計算算法則是按照起始字數為7個漢字。然后逐字遞減,每次減少1個詞,進行掃描和分析,同理進行第三次,第四次的匹配,在對應的詞典中進行查找。

          注:切分結果中非詞典詞越少越好,單字字典詞數越少越好,這里的“非詞典詞”就是不包含在詞典中的單字,而“單字字典詞”指的是可以獨立運用的單字,如“的”、“了”、“和”、“你”、“我”、“他”。例如:“技術和服務”,可以分為“技術和服務”以及“技術和服務”,但“務”字無法獨立成詞(即詞典中沒有),但“和”字可以單獨成詞(詞典中要包含),因此“技術和服務”有1個非詞典詞,而“技術和服務”有0個非詞典詞,因此選用后者。

          武漢SEO剖析搜索引擎分詞的算法邏輯和語法思路

          而正向,逆向,雙向就是基于上面這個掃描和分詞邏輯進行的,下面我以”我們在天文博物館玩“一詞舉例子:

          最大正向匹配:從左往右,或者說從前往后,從開始往結束進行掃描

          那么,我們..........

          開始吧

          掃描1:從左往右取7個字-我們在天文博物,掃描7字的詞典數據,不存在此類詞語,執行下一次掃描

          掃描2:我們在天文博,掃描6字的詞典數據,不存在此類詞語,執行下一次掃描

          掃描3:我們在天文,掃描到5字的詞典數據,不存在此類詞語,執行下一次掃描

          ......依次同理

          當執行到掃描6的時候,掃描到我們,存在這個詞語,因此分詞:我們,我們這個詞搜索算法分析和理解出來了,存儲:我們

          那么下一次要執行的就是去掉已經識別和分詞的“我們”,開始執行對”在天文博物館玩“的掃描和分詞,按照上面的程序運行,依次類推掃描1:在天文博物館玩,掃描7字的詞典數據,不存在此類詞語,執行下一次掃描

          掃描2:在天文博物館,掃描6字的詞典數據,不存在此類詞語,執行下一次掃描

          掃描3:在天文博物,掃描5字的詞典數據,不存在此類詞語,執行下一次掃描

          以此同理,一直這樣掃描和分詞,最后分出:我們/在/天文/博物館/玩”,其中,單字字典詞為2,非詞典詞為0。

          而逆向最大匹配法的思路是即從后往前取詞,其他邏輯和正向匹配的相同。

          不過正向匹配和逆向匹配都有其缺陷,因此搜索引擎也會運用雙向最大匹配法和雙向最大匹配法。分別計算正向最大匹配和逆向最大匹配的結果

          計算邏輯:非字典詞(越少越好)+單字字典詞(越少越好),最后統計出正向和逆向的這個結果和的數值

          假設:

          正向:非詞典詞=2,單字詞典詞=3,共5

          逆向:非詞典詞=1,單字詞典詞=2,共3

          取決其中數值更低的作為結果,那么選擇逆向作為輸出,輸出逆向最大匹配時候的分詞的邏輯結果

          文本總結

          零售春風吹滿地,運營喵們真牛逼。在這個懵逼樹上懵逼果,懵逼樹下你和我的年代,風雨飄搖,電商平臺,搜索算法變幻莫測。辛苦的運營喵還是得燒腦的學習一些搜索引擎的底層邏輯SEO運營的思維。


          本文地址:武漢SEO優化頻道 http://www.piojosa.com/seojishu/1190.html,武漢易企推網絡公司,是一家專業的武漢網絡推廣,網絡營銷,品牌營銷策劃推廣公司,提供一站式全網營銷推廣服務:小程序開發,網站建設,SEO百度排名,SEM競價托管,品牌營銷推廣、360搜狗百度競價開戶、百度地圖標注、百科詞條創建修改、新媒體引流加粉、企業負面公關處理等;另外,禁止轉載本站文章,謝謝!


          相關文章相關文章
          湖北網絡營銷導航
          黃石網絡推廣十堰seo優化恩施seo優化隨州網絡推廣荊州seo優化荊門網絡推廣黃岡seo優化咸寧網絡推廣襄陽seo優化孝感seo優化潛江網絡推廣鄂州網絡推廣天門網絡推廣宜昌seo優化 武漢SEO優化 武漢SEO培訓 百度推廣開戶 今日頭條開戶 危機公關處理 百度百科創建
          本地企業
              可提供上門服務

          便捷

          本地企業可提供上門服務

          提供適合、專業可行方案

          周到

          提供適合、專業可行方案

          5-10分鐘售后響應機制<

          貼心

          5-10分鐘售后響應機制

          按效果收費,無效果不收費

          放心

          按效果收費,無效果不收費

          行業高標準,效果穩定可靠

          穩定

          行業高標準,效果穩定可靠

          1-3個月排名上百度首頁

          快速

          1-3個月排名上百度首頁

          武漢易企推網絡公司;公司地址:武漢市武昌區靜安路6號5.5創意產業園4樓;公司官網:http://www.piojosa.com XML地圖

          服務熱線:18120550335 / 027-88866235 歡迎來電咨詢; 聯系QQ:1193073039

          Copyrigh?2017-2030 版權所有:武漢易企推網絡科技有限公司 備案號:鄂ICP備17012199號 網站地圖 手機站

          黑人欧美日韩专区在线视频-在线播放中文乳大-人人模人人爽人人喊你-春色校园小说综合网-手机看片 福利盒子234|2018亚洲动漫图片区|欧美综合自拍亚洲图久青草

            <noframes id="9zd7v">

                <form id="9zd7v"></form>

                <address id="9zd7v"><address id="9zd7v"><nobr id="9zd7v"></nobr></address></address>
                  <address id="9zd7v"><menuitem id="9zd7v"><meter id="9zd7v"></meter></menuitem></address>