Написание утилиты массовой загрузки

Узел экспорта баз данных содержит опции для массовой загрузки в диалоговом окне Дополнительные опции. Программы массовой загрузки могут использоваться для загрузки данных из текстового файла в базу данных.

Опция Использовать массовую загрузку - через внешний загрузчик конфигурирует для IBM® SPSS Modeler три действия:

  • Создание всех необходимых таблиц базы данных.
  • Экспорт данных в текстовый файл.
  • Вызов программы массовой загрузки для загрузки данных из этого файла в таблицу базы данных.

Как правило, программа массовой загрузки - это не сама утилита загрузки баз данных (такая как утилита sqlldr Oracle), а небольшой сценарий или программа, составляющая правильные аргументы, создающая вспомогательные файлы для конкретных баз данных (например, файлы управления), а затем вызывающая утилиту загрузки базы данных. Информация в следующих разделах поможет отредактировать существующую утилиту массовой загрузки.

Вы можете также написать свою собственную программу массовой загрузки. Дополнительную информацию смотрите в разделе Разработка программ массовой загрузки. Обратите внимание на то, что эта возможность не входит в стандартное соглашение о технической поддержке, и вам нужно обратиться за помощью к представителю группы обслуживания IBM.

Сценарии для массовой загрузки

IBM SPSS Modeler поставляется с рядом программ массовой загрузки для различных баз данных, реализуемых при помощи сценариев Python. Если выполняется поток, содержащий узел экспорта баз данных с включенной опцией Через внешний загрузчик, IBM SPSS Modeler создает таблицу базы данных (если она требуется) через ODBC, экспортирует данные во временный файл временный файл на хосте, использующем IBM SPSS Modeler Server,после чего вызывает сценарий массовой загрузки. Этот сценарий, в свою очередь, выполняет утилиты, предоставляемые поставщиком СУБД, для выгрузки данных из временных файлов в базу данных.

Примечание: В установку IBM SPSS Modeler интерпретатор времени выполнения Python не входит, поэтому требуется отдельная установка Python. Дополнительную информацию смотрите в разделе Дополнительные опции экспорта базы данных.

Сценарии (в папке \scripts каталога установки IBM SPSS Modeler) предоставляются для базы данных, перечисленных в следующей таблице.

Табл. 1. Предоставляемые сценарии массовой загрузки
База данных Имя сценария Дополнительная информация
IBM Db2 db2_loader.py Дополнительную информацию смотрите в разделе Массовая загрузка данных в базы данных IBM Db2.
IBM Netezza netezza_loader.py Дополнительную информацию смотрите в разделе Массовая загрузка данных в базы данных IBM Netezza.
Oracle oracle_loader.py Дополнительную информацию смотрите в разделе Массовая загрузка данных в базы данных Oracle.
SQL Server mssql_loader.py Дополнительную информацию смотрите в разделе Массовая загрузка данных в базы данных SQL Server.
Teradata teradata_loader.py Дополнительную информацию смотрите в разделе Массовая загрузка данных в базы данных Teradata.