Использование пакетов анализа текста (Text Analysis Package)
Пакет анализа текста (text analysis package, TAP) служит шаблоном для категоризации текстовых ответов. Использование пакета анализа текста (TAP) - легкий способ категоризировать текстовые данные с минимальным вмешательством, поскольку он содержит предварительно построенные наборы категорий и лингвистические ресурсы, которые необходимы, чтобы быстро и автоматически закодировать очень большое число записей. Для извлечения ключевых понятий текстовые данные анализируются и исследуются при помощи лингвистических ресурсов. На основе ключевых понятий и паттернов, обнаруживаемых в тексте, записи можно упорядочить по категориям выбранного в PAT набора категорий. Можно создать свой пакет TAP или изменить существующий пакет.
TAP состоит из следующих элементов:
- Наборы категорий. По существу, в набор набор категорий входят предопределенные категории, коды категорий, дескрипторы для каждой категории и, наконец, имя для всего набора категорий. Дескрипторы - это лингвистические элементы (понятия, типы, паттерны и правила), например, термин дешево или паттерн хорошая цена. Дескрипторы служат для определения категории, чтобы помещать в нее документ или запись, когда текст соответствует любому из дескрипторов категории.
- Лингвистические ресурсы. Лингвистические ресурсы - это набор библиотек и расширенных ресурсов, которые настраиваются для извлечения ключевых понятий и паттернов. Извлеченные понятия и паттерны, в свою очередь, служат дескрипторами, по которым записи можно поместить в категорию из набора категорий.
Следующие задачи можно выполнять для пакетов анализа текста.
- Создавать пакеты анализа текста. Дополнительную информацию смотрите в разделе Создание пакетов анализа текста.
- Загрузите пакеты анализа текста. Или же можно загрузить проект SPSS Text Analytics for Surveys (.tas), который будет преобразован в пакет текстового анализа. Дополнительную информацию смотрите в разделе Загрузка пакетов анализа текста.
- Измените пакеты анализа текста. Дополнительную информацию смотрите в разделе Изменение пакетов анализа текста.
После выбора вами пакета анализа текста и набора категорий SPSS Modeler Text Analytics может извлечь и категоризовать ваши записи.