Поддерживаемые элементы для правил и макросов

Следующие аргументы принимаются как параметры в правилах анализа текстовых связей и макросах:

Макрокоманды

Макрос можно использовать непосредственно в правиле TLA или в другом макросе. Если вы вводите имя макроса вручную или из представления источника (а не выбираете имя макроса в контекстном меню), не забудьте префикс - символ доллара ($); пример - $mTopic. Имя макроса зависит от регистра. При выборе макросов в контекстном меню доступны все макросы, определенные на текущей вкладке Правила текстовых связей.

Типы

Тип можно использовать непосредственно в правиле TLA или в макросе. Если вы вводите имя типа вручную или из представления источника (а не выбираете имя типа в контекстном меню), не забудьте префикс - символ доллара ($); пример - $Person. Имя типа зависит от регистра. Если вы используете контекстные меню, то можете выбрать любой тип из текущего используемого набора ресурсов.

Если сослаться на неизвестный тип, будет выведено предупреждение, а в дереве правил и макросов у такого правила появится предупреждающий значок, пока вы не исправите ошибку.

Литеральные строки

Чтобы включить информацию помимо извлеченного, можно определить литеральную строку, которую должен найти механизм извлечения. Для всех извлеченных слов и словосочетаний задан тот или иной тип; поэтому они не могут использоваться в литеральных строках. Если использовать слово, которое было извлечено, оно будет проигнорировано, даже если его тип - <Неизвестный>.

Литеральная строка может быть одним или несколькими словами. Следующие правила применяются при определении списка литеральных строк:

  • Заключите список строк в скобки, например, (его). Если нужен выбор из литеральных строк, разделите их операцией ИЛИ, например, (данный|этот|некоторый) или (его|ее|их).
  • Используйте одиночные слова или словосочетания.
  • Разделяйте слова в списке символом |, означающим логическую операцию ИЛИ.
  • Если нужно соответствие формам единственного и множественного числа, введите обе формы. Автоматически разные формы слова не генерируются.
  • Используйте только нижний регистр.
  • Чтобы повторно использовать литеральные строки, определите их как макрос и затем используйте этот макрос в других макросах и в правилах TLA.
  • Если искомая строка содержит точки или дефисы, их нужно включить. Например, чтобы найти в тексте соответствие ч.д.а., введите как литеральную строку и буквы, и точки, ч.д.а.

Операция исключения

Восклицательный знак ! служит операцией исключения, которая не допускает выражение отрицания занять конкретный слот. Операцию исключения можно добавить только вручную, редактируя ячейку (после двойного щелчка по ячейке в таблице значений правила или в таблице значений макроса) или в представлении источника. Например, если добавить $mTopic @{0,2} !($Положительный) $Бюджет в правило TLA, вы будете искать текст, который содержит (1) термин, для которого задан любой из типов в макросе mTopic, (2) промежуток между словами длиной от нуля до двух слов, (3) ни одного вхождения термина с типом <Положительный> и (4) термин с типом <Бюджетный>. Тогда возможен захват фразы "автомобилям назначены неадекватные цены", но будет проигнорирована фраза "салон предлагает невероятные скидки".

Для использования этой операции нужно ввести восклицательный знак и скобки вручную в ячейке элемента, дважды щелкнув по ячейке.

Промежутки между словами (<Any Token>)

Промежуток между словами, также называемый <Any Token>, задает диапазон для допустимого числа маркеров между двумя элементами. Промежутки между словами полезны при поиске соответствий с близкими словосочетаниями, различающимися дополнительными детерминативами, предложными группами, прилагательными и тому подобными словами.

Табл. 1. Примеры элементов в таблице значений правила без промежутка между словами
# Элемент
1
Нет данных
2
mBeHave
3
Положительные

Примечание: В представлении источника это значение определяется так: $Неизвестный $mBeHave $Положительный

Этому значению соответствуют такие предложения, как "персонал отеля был вежлив”, где персонал отеля принадлежит типу <Неизвестный>, был входит в макрос mBeHave, а вежлив имеет тип <Положительный>. Но не будет соответствия предложению “персонал отеля был очень вежлив”.

Табл. 2. Пример элементов в таблице значений правила c промежутком между словами <Any Token>
# Элемент
1
Нет данных
2
mBeHave
3
4
Положительные

Примечание: В представлении источника это значение определяется так: $Неизвестный $mBeHave @{0,1} $Положительный

Если добавить в значение правила промежуток между словами, соответствие будет найдено и с предложением “персонал отеля был вежлив”, и с предложением “персонал отеля был очень вежлив”.

В представлении источника и при редактировании строки синтаксис для промежутка между словами имеет формат @{#,#}, где @ означает промежуток между словами, а {#,#} определяет минимально и максимально допустимое число слов между предшествующим и последующим элементами. Например, @{1,3} значит, что соответствие для двух заданных элементов будет признано, если между ними есть хотя бы одно и не больше трех слов. @{0,3} значит, что соответствие для двух заданных элементов будет признано, если число слов между ними 0, 1, 2 или 3, то есть не больше 3 слов.