顯示具有 分詞 標籤的文章。 顯示所有文章
顯示具有 分詞 標籤的文章。 顯示所有文章

2014年1月6日 星期一

[中文分詞]百度算法中怎麼進行中文切詞分詞

導讀:百度作為中文搜索引擎的先驅,它的核心地位可以說在短時期是沒有任何搜索引擎可以超越的,百度的卓越成就在於它對博大精深的中國文化的領悟和對中文分詞的的超強功底百度受歡迎的主要原因除了用戶習慣的原因,在較大程度上得益於百度算法的精准率,搜索結果值更貼近用戶的想獲得的資訊。用一句廣告詞“正是我想要的”來形容百度最恰當不過了。

2013年8月20日 星期二

MMSEG中文分詞程式

MMSEG是一種基於最大匹配演算法的程式,詳細的資料MMSEG官網已經有詳細資料與範例,這邊不再贅述,只是把一些重點跟摘要列出供快速了解與複習使用:

這個程式包含了以下三個部分:
1. 一個詞庫
2. 兩種匹配演算法
3. 四種歧意消解規則
以及以chunk為中心思想的做法

其中,兩種演算法分別是:

Google Analytics初學者入門簡介