Изучаем анализ текстовых связей (Text Link Analysis, TLA)

В представлении TLA (Text Link Analysis, анализ текстовых связей) можно изучить результаты извлечения паттернов TLA. TLA - это метод сопоставления паттернов, при помощи которого можно задать правила паттернов и сравнить их с фактически извлеченными понятиями и взаимосвязями, найденными в вашем тексте.

Например, иногда недостаточно извлекать идеи о той или иной организации. При помощи TLA можно также узнать о связях этой организацией с другими организациями или о людях, входящих в эту организацию. Кроме того, при помощи TLA можно извлекать мнения о товарах или, для некоторых языков, взаимосвязи между генами.

Получив некоторые результаты извлечения паттернов TLA, можно просмотреть их на панелях паттернов типа и понятия в представлении TLA. Дополнительную информацию смотрите в разделе Паттерны типа и понятия. Можно дополнительно изучить их на панелях данных или визуализации в этом представлении. И самое, возможно, существенное то, что их можно добавить в категории.

Если вы еще не сделали этого, можете выбрать Извлечь и Включить извлечение паттернов TLA в диалоговом окне Параметры извлечения. Дополнительную информацию смотрите в разделе Извлечение результатов паттернов TLA.

Чтобы получить результаты извлечения паттернов TLA, нужно, чтобы какие-то правила паттернов TLA были определены в шаблоне ресурсов или в используемых библиотеках. Можно использовать паттерны TLA в некоторых шаблонах ресурсов, поставляемых вместе с IBM® SPSS Modeler Text Analytics. Какого рода взаимосвязи можно извлечь, целиком зависит от правил TLA, определенных в ваших ресурсах. Можно задать собственные правила TLA.. Паттерны содержат макросы, списки слов и промежутки между словами; паттерн представляет собой логический запрос, или правило, которое сравнивается со входным текстом. Дополнительную информацию смотрите в разделе О правилах текстовых связей.

Когда правило паттерна TLA соответствует тексту, этот текст можно извлечь как паттерн и реструктурировать как выходные данные. Затем результаты появляются на панелях представления TLA. Панели можно по отдельности скрывать и выводить, выбирая имя панели в меню Вид:

  • Панели паттернов типа и понятия. Вы можете строить и изучать свои паттерны на этих двух панелях. Дополнительную информацию смотрите в разделе Паттерны типа и понятия.
  • Панель Визуализация. На этой панели можно в наглядном виде изучать взаимодействие между понятиями и типами в ваших паттернах. Дополнительную информацию смотрите в разделе Диаграммы TLA (Text Link Analysis, анализ ссылок в тексте).
  • Панель Данные. Можно изучать и просматривать текст, содержащийся в документах и записях, который соответствует выбранному на другой панели. Дополнительную информацию смотрите в разделе Панель Данные.
Рис. 1. Представление Text Link Analysis
Представление Text Link Analysis