内容


向 Watson 询问 Twitter 提供的信息,第 4 部分

提取图像文本并分析情绪

Comments

系列内容:

此内容是该系列 4 部分中的第 # 部分: 向 Watson 询问 Twitter 提供的信息,第 4 部分

敬请期待该系列的后续内容。

此内容是该系列的一部分:向 Watson 询问 Twitter 提供的信息,第 4 部分

敬请期待该系列的后续内容。

在本系列的 第 1 部分 中,您在 Bluemix 上创建了一个 Python Web 应用程序并从 Twitter 采集了实时推文。您已将推文文本保存到一个 JSON 文件和一个文本文件中。在 第 2 部分 中,您向应用程序添加了 Watson Tone Analyzer 服务,并将该服务应用于您保存的文本文件,以便评估您收集的推文中的情感。在 第 3 部分 中,您从推文提取图像并进行了分类。现在,在本系列的最后一篇教程中,将读取这些图像中的文本,将此文本与推文文本相结合,分析合成文本中的情绪和洞察。

构建您的应用程序需要做的准备工作

本教程系列第 1-3 部分的代码和输出文件

  • 您运行的应用程序的 URL
  • 在 DevOps Services 中获取您的代码的 URL

运行应用程序获取代码

1

提取图像文本

在本教程系列的 第 3 部分 中,您以编程方式使用了 Watson Visual Recognition 服务,并将它应用到了第 1 和 2 部分中构建的数据集,获得了各种类别的 JSON 对象。在本教程中,将使用同一个 Visual Recognition 服务,但会将它用于不同的用途:读取嵌入在图像中的文本。

可以回想一下,Visual Recognition 服务对于在一天内可对它执行的免费 API 调用次数是有限制的。为了在熟悉该服务的文本分析功能的过程中不会用完此配额,我们首先会使用该服务处理单个图片。然后,根据您的理解,以编程方式对更大的数据集执行文本分析。为了深入了解各个图片的信息,我们将使用 Watson 服务的演示站点。

  1. 转到 Visual Recognition 服务的演示。
  2. 将一个图片上传到显示 Or paste an image URL 的输入框中。如果您手头没有合适的图片,可考虑使用可下载资源部分的 tutorial_Watson_sentiment_part4_images.zip 文件中提供的两个示例图像。
  3. 等待分析完成。然后您会看到两种结果:图像的分类(已在第 3 部分中讨论)和提取的嵌入式文本。 问得最多的 UK 问题的屏幕截图
    问得最多的 UK 问题的屏幕截图
2

分析图像文本中暗含的情绪

  1. 单击该链接获取检测的单词的 JSON 对象。可以看到每个单词是单独报告的。
  2. 要执行任何有意义的分析,需要单词具有句子格式。因此,运行以下代码段来创建一个字符串。
    	...
    	detected_text = [...the JSON object goes here...]
    	i = 0
    	concatenated_string = ''
    	
    	while i < len(detected_text):
    	    word = detected_text[i]['word']
    	    concatenated_string = concatenated_string + detected_text[i]['word'] + ' '
    	    i = i + 1
    	
    	print concatenated_string
  3. 将此代码的输出(concatenated_string 变量中的文本)提供给 Watson Tone Analyzer。为此,请转到它的 演示 站点,单击 Your own text,粘贴该文本,然后单击 Analyze。输出类似于下图。
文档级别
文档级别
3

对推文和图像文本重复该情绪分析

您在上一步中看到的分析仅适用于图像中的文本。它不包含推文的文本。您可以回想一下本系列第 2 部分中对推文文本的分析。现在获取该文本,将它添加到您在第 2.2 步获取的文本中,然后再次运行第 2.3 步。结果相同吗?或者它们不同吗?无论结果是什么,与仅分析推文的文本相比,您现在都能拥有对推文的更全面的理解。

您从一个图像中提取了单词,分析了这些单词所带的情绪,然后将这些单词与图像的推文相结合,并再次分析了情绪。您现在已准备好以编程方式大规模地重复这些步骤。为此,可以扩展本系列中使用的代码。

您现在已完成本教程的学习!

结束语

在本教程中,您分析了推文中的图像文本,以了解它们传达的情绪。与本系列前面的教程相结合,您创建一个推文数据集,提取了这些推文的文本,然后分析了文本中传达的情绪。您还从这些推文中提取了图像并对其进行了分类。

现在,您不仅能够读取推文文本,还能读取推文中的图像,以了解它们所表达的情绪,了解这些图像所属的类别,并使用该知识获取业务洞察。因此,您已准备好处理大量推文,对围绕它们的情绪进行整体分析。


相关主题


评论

添加或订阅评论,请先登录注册

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=认知计算
ArticleID=1043479
ArticleTitle=向 Watson 询问 Twitter 提供的信息,第 4 部分: 提取图像文本并分析情绪
publish-date=03012016