符号 | 解释 | 贡献度 |
TT_CT_Sim | 新闻正文文本和标题文本之间的相似度 | 1.9211 |
Have_S_Word | 新闻标题中是否包含高频词汇,高频词汇是指有具有吸引眼球效果的词汇 | 1.4416 |
CT_CI_Sim | 图片文本相关度 | 1.1455 |
Have_Pron | 新闻标题中是否含有“她”,“他”这类指代词 | 1.0762 |
Have_Symbol | 新闻标题中是否具有情感倾向性的标点符号 | 1.0263 |
CT_Length | 新闻正文长度 | 0.9376 |
Have_Num | 新闻标题中是否包含数量词汇 | 0.8824 |
Is_Origin | 新闻是否是原创新闻 | 0.7698 |
TT_Length | 新闻标题的长度 | 0.6936 |
Have_Names | 新闻标题中是否使用名人姓名 | 0.6182 |
News_Tag | 新闻标签 | 0.5928 |
Nums_Image | 新闻中图片的数量 | 0.5496 |
Nums_Review | 新闻评论数 | 0.4096 |
Avg_Sen_Length | 正文中平均句子的长度 | 0.2651 |