上述介绍的是我们通用的情感分类系统,面对的是通用的主观评论语料。但在一些领域中,某些非极性词也充分表达了用户的情感倾向,比如下载使用APP时,“卡死了”、“下载太慢了”就表达了用户的负面情感倾向;股票领域中,“看涨”、“牛市”表达的就是用户的正面情感倾向。所以我们要在垂直领域中,挖掘出一些特殊的表达,作为极性词给情感分类系统使用:
垂直极性词 = 通用极性词 + 领域特有极性词
该系统即为垂直领域的情感分类系统。
3.3 系统优化情感分类的工作,在现在和未来还可以做更多的工作来对系统进行优化:
挖掘更多的极性词(多领域)
尝试不同的分类器,调优现有的模型
句式识别:否定句,转折句,排比句等……
语料清洗:识别水军评论和用户评论