Sentiment-Analysis-Python 从携程网上采集整理客户对酒店的评论,形成正面评论和负面评论语料库,利用python机器学习方法搭建情感分析模型。 主要步骤涉及: 数据准备,读取文件,数据预处理包括:整合数据生成样本空间、生成词袋、统计词频生成模型 1 合并txt文本,形成正负评价语料 2 结巴分词 3 去掉停用词 4 生成词袋 5 统计词频 6 划分训练集和测试集 7 引入朴素贝叶斯分类器(其他分类器也可) 8 模型预测评估