Использование пакетов анализа текста (Text Analysis Package)

Пакет анализа текста (text analysis package, TAP) служит шаблоном для категоризации текстовых ответов. Использование пакета анализа текста (TAP) - легкий способ категоризировать текстовые данные с минимальным вмешательством, поскольку он содержит предварительно построенные наборы категорий и лингвистические ресурсы, которые необходимы, чтобы быстро и автоматически закодировать очень большое число записей. Для извлечения ключевых понятий текстовые данные анализируются и исследуются при помощи лингвистических ресурсов. На основе ключевых понятий и паттернов, обнаруживаемых в тексте, записи можно упорядочить по категориям выбранного в PAT набора категорий. Можно создать свой пакет TAP или изменить существующий пакет.

TAP состоит из следующих элементов:

  • Наборы категорий. По существу, в набор набор категорий входят предопределенные категории, коды категорий, дескрипторы для каждой категории и, наконец, имя для всего набора категорий. Дескрипторы - это лингвистические элементы (понятия, типы, паттерны и правила), например, термин дешево или паттерн хорошая цена. Дескрипторы служат для определения категории, чтобы помещать в нее документ или запись, когда текст соответствует любому из дескрипторов категории.
  • Лингвистические ресурсы. Лингвистические ресурсы - это набор библиотек и расширенных ресурсов, которые настраиваются для извлечения ключевых понятий и паттернов. Извлеченные понятия и паттерны, в свою очередь, служат дескрипторами, по которым записи можно поместить в категорию из набора категорий.

Следующие задачи можно выполнять для пакетов анализа текста.

После выбора вами пакета анализа текста и набора категорий SPSS Modeler Text Analytics может извлечь и категоризовать ваши записи.

Прим.: Пакеты анализа текста можно создать и использовать как взаимозаменяемые между SPSS Text Analytics for Surveys и SPSS Modeler Text Analytics . Однако имейте в виду, что скоринг по правилам может в SPSS Modeler Text Analytics отличаться в зависимости от того, загружается ли пакет анализа текста непосредственно из SPSS Modeler Text Analytics или же из IBM® SPSS Text Analytics for Surveys . Мы рекомендуем использовать пакеты анализа текста, составляемые в SPSS Modeler Text Analytics , поскольку пакеты анализа текста, составляемые в IBM SPSS Text Analytics for Surveys , могут быть созданы при помощи лингвистических ресурсов другой версии.