Искатель Web может находить некоторые ссылки (адреса URL),
входящие в разделы JavaScript документов Web. Если вам известно, что многие из адресов URL, приведенных в тексте,
имеют низкую значимость, то, настроив дополнительные свойства искателя Web, вы можете отключить анализ ссылок.
Искатель Web может находить как относительные, так и абсолютные ссылки. Если документ HTML содержит элемент BASE, искатель использует этот элемент для получения из относительных ссылок абсолютных. В противном случае искатель использует для этого URL самого документа.
Поддержка JavaScript ограничена извлечением ссылок.
Искатель не выполняет синтаксический анализ JavaScript,
не строит объектную модель документа (Document Object Model - DOM), не интерпретирует и не выполняет операторы JavaScript. Искатель ищет в содержимом документа (в том числе в разделах JavaScript, но не только в них) строки,
которые похожи на адреса URL в операторах JavaScript. Это означает две вещи:
- Будут найдены некоторые URL, которые были бы проигнорированы более строгим синтаксическим анализатором HTML. Искатель отвергнет все строки, не являющиеся синтаксически правильными адресами URL,
но некоторые из допустимых URL, возвращенных шагом просмотра, могут не представлять интереса для поиска.
- Содержимое документа, генерируемое в JavaScript (например, когда пользователь просматривает страницу и браузер выполняет JavaScript),
будет недоступно искателю Web и, следовательно, не будет индексироваться.
Поскольку искатель Web не анализирует JavaScript в файлах HTML, URL в JavaScript им не обрабатываются. Чтобы включить поддержку просмотра искателем Web этих URL в JavaScript, можно выполнить одно из следующих действий:
- Отредактировать на консоли администратора искатель Web, а на странице Пространство для искателя Web
добавить эти URL в список URL, который искатель будет использовать в качестве отправной точки для добавления
нужных URL в собрание (Начальные URL). Чтобы изменения вступили в силу, следует перезапустить искатель Web (запускать полный просмотр не требуется).
- С помощью тега привязки (<a href="..">) задать нужные URL
в файле HTML в качестве гипертекстовых ссылок.