西安邮电大学学报

2019, v.24;No.141(06) 53-56

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于差异度量和互信息的文本特征选择算法
Text feature selection algorithm based on difference measure and mutual information

潘晓英;陈柳;王昊;赵逸喆;孙俊;

摘要(Abstract):

针对基于文档频率的特征选择算法易于忽略词频和类别关系的问题,提出一种基于差异度量和互信息的文本特征选择算法。融合归一化差异度量和互信息概念,引入词频信息和特征分布系数,弥补归一化差异度量算法在特征选择过程中忽略词频和特征词与类别之间关系的不足,并增加特征分布系数对其进一步优化。实验结果表明,在不同特征维度下,该算法能够有效提高文本分类准确率。

关键词(KeyWords): 归一化差异度量;互信息;特征选择;词频信息;特征分布

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金资助项目(61702414)

作者(Author): 潘晓英;陈柳;王昊;赵逸喆;孙俊;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享