海量中文短信文本密度聚类研究
本文档由 荣海生 分享于2010-11-22 23:40
根据短信文本的特性,给出一种基于密度的中文短信聚类的方法,该方法将文本数据中具有高密度的区域划分为簇,构造一个可达相似度的升序排列的种子队列存储待扩张的短信文本,选择大阈值相似度可达的对象,即快速定位稠密空间的文本对象使较高密度的簇优先完成。实验结果表明,该聚类方法比K-means提高10倍左右的效率。 关键词: 密度 簇 邻域 短信文本 聚类
分享:
君,已阅读到文档的结尾了呢~~