海量中文短信文本密度聚类研究

本文档由 荣海生 分享于2010-11-22 23:40

根据短信文本的特性,给出一种基于密度的中文短信聚类的方法,该方法将文本数据中具有高密度的区域划分为簇,构造一个可达相似度的升序排列的种子队列存储待扩张的短信文本,选择大阈值相似度可达的对象,即快速定位稠密空间的文本对象使较高密度的簇优先完成。实验结果表明,该聚类方法比K-means提高10倍左右的效率。 关键词: 密度 簇 邻域 短信文本 聚类
文档格式:
.pdf
文档大小:
196.19K
文档页数:
2
顶 /踩数:
0 0
收藏人数:
0
评论次数:
0
文档热度:
文档分类:
IT计算机  —  开发文档
添加到豆单
文档标签:
密度 邻域 短信文本 海量中文 聚类 聚类研究
系统标签:
聚类 文本 密度 海量 ascque 存储待
下载文档
收藏
打印

扫扫二维码,随身浏览文档

手机或平板扫扫即可继续访问

推荐豆丁书房APP  

获取二维码

分享文档

将文档分享至:
分享完整地址
文档地址: 复制
粘贴到BBS或博客
flash地址: 复制

支持嵌入FLASH地址的网站使用

html代码: 复制

默认尺寸450px*300px480px*400px650px*490px

支持嵌入HTML代码的网站使用





82