主页
topics
情感分析
情感分析(或观点挖掘)是指分析大量文本以确定是否表达正面情感、负面情感或中立情感的过程。
公司现在可以获得比以往更多的客户数据,这既是机遇也是挑战:分析大量可用的文本数据并提取有意义的洞察,以指导他们进行业务决策。
从电子邮件和推文再到在线调查回答、与客户服务代表聊天和评论,可用于衡量客户情感的来源似乎无穷无尽。情感分析系统可帮助公司更好地了解客户、提供更强大的客户体验并提高品牌声誉。
了解如何充分利用会话式 AI 聊天机器人的强大功能。
与以往相比,人们在线表达感受的方式越来越多,因此组织需要强大的工具来近乎实时地监控有关他们及其产品和服务的言论。根据技术和服务行业协会最近的一份报告,随着公司采用情感分析并开始使用它来分析更多会话和交互,识别客户旅程每个阶段的客户摩擦点将变得更加容易。1
通过客户评论获得更客观的结果
最新的人工智能 (AI) 情感分析工具可帮助公司筛选评论和净推荐值 (NPS) 中的个人偏见,并获得有关该公司品牌、产品和服务的更客观的观点。例如,如果客户在评论中表达负面观点和正面观点,则评估该评论的人员可能会在看到正面评价之前将其标记为负面评价。AI 增强的情感分类有助于以客观的方式对文本进行排序和分类,因此这种情况不会发生,并且两种情感都会得到体现。
提高商业智能计划的可扩展性
借助情感分析,拥有大量非结构化数据的公司能够快速有效地分析数据并从中提取有意义的洞察。由于客户通过数字渠道生成大量文本,人工团队很容易被信息淹没。强大、基于云、AI 增强型客户情感分析工具可帮助组织从客户数据中大规模提供商业智能,而无需花费不必要的资源。
实时监控品牌声誉
现代企业面对危机需要迅速做出反应。在社交媒体上表达的观点,无论真实与否,都可能会摧毁花费数年时间建立的品牌声誉。强大的 AI 增强型情感分析工具可帮助高管监控品牌相关的整体情感,以便他们能够发现潜在问题并迅速解决。
情感分析使用自然语言处理 (NLP) 和机器学习 (ML) 技术来训练计算机软件,使其以与人工相似的方式分析和解读文本。该软件使用两种方法之一:基于规则的方法或基于 ML 的方法,或者两种方法的组合(称为混合方法)。每种方法都有各自的优点和缺点;基于规则的方法可以近乎实时地提供结果,而基于 ML 的方法适应性更强,通常可以处理更复杂的场景。
基于规则的情感分析
在基于规则的方法中,软件经过训练,可以根据描述作者意图的单词组合或词汇组合对文本块中的某些关键字进行分类。例如,表示正面含义的词汇组合中的单词可能包括“affordable”、“fast”和“well-made”,而表示负面含义的词汇组合中的单词可能包括“expensive”、“slow”和“poorly made”。然后,该软件会扫描分类器以查找正面或负面词汇组合中的单词,并根据使用的单词量和每个类别的情感得分来计算总情感分数。
机器学习情感分析
通过机器学习 (ML) 方法,算法可用于训练软件,以使用文本中出现的单词及其出现顺序来衡量文本块中的情感。开发人员使用情感分析算法训练软件如何像人工一样识别文本中的情感。ML 模型继续从输入的数据中“学习”,因此被称为“机器学习”。以下是几种最常用的分类算法:
线性回归:一种基于一组特征 (X) 描述值 (Y) 的统计算法。
Naive Bayes:一种使用 Bayes 定理对文本块中的单词进行分类的算法。
支持向量机:一种快速高效的分类算法,用于解决两组式分类问题。
深度学习 (DL):深度学习也称为人工神经网络,是一种先进的机器学习技术,它将多种算法连接在一起以模仿人脑功能。
混合方法
文本分析的混合方法结合基于 ML 和基于规则的功能,以优化准确性和速度。虽然高度准确,但与其他两种方法相比,这种方法需要更多的资源,例如时间和技术能力。
除了用于构建情感分析工具的不同方法之外,组织还可以根据自己的需求采用不同类型的情感分析。三种最流行的类型(基于情绪的情感分析、细粒度情感分析和基于方面的情感分析 (ABSA))都依赖底层软件的能力来衡量所谓极性,即一段文本传达的整体感觉。
一般而言,文本的极性可以描述为正面、负面或中立,但是通过进一步将文本分类,例如分为“极其正面”或“极其负面”等子组,一些情感分析模型可以识别出更微妙和更复杂的情绪。文本的极性是衡量文本情感最常用的指标,由软件表示为 1 到 100 范围内的数字评级。0 代表中立情感,100 代表最极端的情感。
以下是三种最广泛使用的情感分析类型:
细粒度(分级)
细粒度或分级情感分析是情感分析的一种,它将文本分为不同的情绪和表达的情感级别。然后,情绪按照 0 到 100 的等级进行评级,类似于消费者网站通过部署星级评定来衡量客户满意度的方式。
基于方面 (ABSA)
基于方面的情感分析 (ABSA) 将文本正文中检查的范围缩小到企业希望分析的产品、服务或客户体验的单一方面。例如,预算旅行应用程序可能会使用 ABSA 来了解新用户界面的直观程度或衡量客服聊天机器人的有效性。ABSA 可以帮助组织更好地了解其产品的成功因素或未达到客户期望的成因。
情绪检测
情绪检测情感分析旨在了解文本正文背后的个人心理状态,包括他们编写评论时的心态和意图。它比细粒度或 ABSA 更复杂,通常用于更深入地了解一个人的动机或情绪状态。情绪检测可以识别文本正文中的特定情绪,例如失望、冷漠、不安和震惊,而不是使用正面、负面或中立等极性评价。
组织出于各种原因进行情感分析。以下是一些最常见的用例。
支持团队使用情感分析向客户提供更加个性化的响应,准确反映交互的情绪。基于 AI 的聊天机器人使用情感分析可以发现需要快速上报的问题,并优先处理需要紧急关注的客户。在客户支持论坛上部署的 ML 算法有助于根据紧急程度对主题进行排序,甚至可以识别出表明对特定产品或功能感到失望的客户反馈。这些功能有助于客户支持团队更快、更高效地处理请求,并改善客户体验。
通过使用情感分析进行社交媒体监控,品牌可以更好地了解网上关于他们的评价以及原因。例如,新产品发布是否顺利?监控销售是了解情况的一种方法,但只能向利益相关者展示部分情况。使用客户评论网站和社交媒体上的情感分析来识别用户关于产品所表达的情绪,将有助于更深入地了解产品如何吸引客户。
通过将情感分析工具应用于整个市场而不仅仅是他们自己的产品,组织可以发现趋势并发现新的增长机遇。也许竞争对手的新营销活动没有按照他们预期的方式与受众建立联系,或者也许某个名人在社交媒体上使用了某种产品以增加需求。情感分析工具可以帮助发现新闻文章、在线评论和社交媒体平台上的趋势,并实时提醒决策者,使他们能够采取行动。
尽管情感分析及其支持技术正在迅速发展,但它仍然是一个相对较新的领域。根据刘冰(2020 年)的《情感分析》,该术语自 2003 年以来才被广泛使用。2还有很多东西需要学习和完善,以下是一些最常见的缺点和挑战。
缺乏上下文
上下文是理解文本块中表达的情绪的关键组成部分,也是经常导致情感分析工具出错的一个组成部分。例如,在客户调查中,客户可能会就以下问题给出两个答案:“What did you like about our app?”第一个答案可能是“functionality”,第二个答案是“UX”。如果以另一种方式提问,例如,“What didn’t you like about our app?”,客户答案的意义就变了,但单词本身并没有改变。为了纠正这个问题,需要为算法提供客户所回答问题的原始上下文,这种耗时的策略称为预处理或后处理。
使用反讽和讽刺
无论训练水平或程度如何,软件都很难正确识别文本中的反讽和讽刺。这是因为,当某人表达反讽和讽刺时,通常是通过语气或面部表情来传达的,而他们所使用的词语没有明显的区别。例如,在分析短语“Awesome, another thousand-dollar parking ticket – just what I need”时,情感分析工具可能会因为使用“awesome”一词而错误地表达情绪的本质,并将其标记为正面评价。
否定
否定是指在句子中使用否定词来表达相反的意思。例如,这句话:“I wouldn’t say the shoes were cheap.”,它所表达的是,这双鞋可能很昂贵,或者至少价格适中,但情感分析工具可能会忽略这一微妙之处。
习惯用语
习惯用语(例如使用常见的英语短语,如“Let’s not beat around the bush”或“Break a leg”)经常会让情感分析工具及其所基于的 ML 算法混淆。当在社交媒体渠道或产品评论中使用上述人类语言短语时,情感分析工具会识别错误:例如,“break a leg”可能会被错误地识别为让人痛苦或者悲伤的事情,或者完全忽略这些词。
决定要部署情感分析以更好地了解客户的组织有两种选择:要么购买现有工具,要么构建自己的工具。
选择构建自己的工具的企业通常会使用采用通用编码语言(例如 Python 或 Java)的开源库。这些开源库之所以有用,是因为它们的社区专注于数据科学。尽管如此,希望采用这种方法的组织仍需要进行大量投资,聘请工程师和数据科学家团队。
获取现有的软件即服务 (SaaS) 情感分析工具需要较少初始投资,并且允许企业部署预训练的机器学习模型,而不是从头开始创建模型。只需几个简单的步骤即可启动并运行 SaaS 情感分析工具,对于尚未准备好进行必要投资来构建自己的工具的企业来说,这是一个不错的选择。
1 “情感分析的当前和未来状态”(ibm.com 外部链接),Ragsdale、John and Bose、Ashimendu,技术与服务行业协会,2022 年 10 月 4 日
2 《情感分析》(第 2 版)(ibm.com 外部链接),刘冰,剑桥大学出版社,2020 年 9 月 23 日