统计和规范中的误区

本文档由 Andrew 分享于2009-06-13 03:15

切分单位(分词单位)是一种为规范而作的规范,即仅仅是一种规定,并无什么道理. 词频统计概念不清楚. 用传统的分词技术做词频自动统计,统计结果不仅依赖于被统计的文本,而且依赖于词 表的收词范围和动态识别未登录词的策略.脱离词表和分词...
文档格式:
.pdf
文档大小:
204.26K
文档页数:
6
顶 /踩数:
0 0
收藏人数:
1
评论次数:
0
文档热度:
文档分类:
文学/艺术/军事/历史  —  经管励志
添加到豆单
文档标签:
规范 语料库 词频 词类 ArgMax 区别词 状语 副词 切分 公式
系统标签:
统计 词频 误区 单字词 分词 语料库
下载文档
收藏
打印

扫扫二维码,随身浏览文档

手机或平板扫扫即可继续访问

推荐豆丁书房APP  

获取二维码

分享文档

将文档分享至:
分享完整地址
文档地址: 复制
粘贴到BBS或博客
flash地址: 复制

支持嵌入FLASH地址的网站使用

html代码: 复制

默认尺寸450px*300px480px*400px650px*490px

支持嵌入HTML代码的网站使用

分享到