Содержание


Обзор DB2 LUW

Часть 1. Основные понятия и архитектура DB2 LUW

Обзор основных понятий и общее описание архитектуры СУБД IBM DB2 для платформ Linux, Unix и Windows

Comments

Серия контента:

Этот контент является частью # из серии # статей: Обзор DB2 LUW

Следите за выходом новых статей этой серии.

Этот контент является частью серии:Обзор DB2 LUW

Следите за выходом новых статей этой серии.

Цель подготовки данной серии статей

Основной целью написания серии обзорных статей по IBM DB2 является восполнение нехватки материалов по данной тематике на русском языке. Действительно, несмотря на наличие перевода немалой части документации на русский язык и доступные книги по DB2, по-прежнему ощущается нехватка в доступной обзорной информации, которая позволила бы заинтересованным читателям составить представление о возможностях DB2, встроенном функционале и специфике администрирования.

При этом автором не ставится задача подготовки обзорного описания всех продуктов семейства DB2 (см. врезку «Семейство продуктов DB2»), вместо этого планируется сосредоточить усилия на варианте DB2 для операционных систем Linux, Unix и Windows - т.е. на продукте DB2 LUW.

Читателям, заинтересованным в практическом руководстве по началу работы с DB2, рекомендую обратиться к свободно распространяемой книге «Начало работы с DB2 Express-C», переведённой на русский язык. В этой книге приведено множество примеров типовых операций с программным обеспечением DB2, что позволяет с лёгкостью приступить к работе как с описанной в книге версией DB2 9.7, так и с более новыми версиями DB2 (10.5 и 11.1). При работе с актуальными версиями программного обеспечения DB2 необходимо учитывать, что часть функционала версии 9.7 объявлена устаревшей и не поддерживается в новых версиях продукта (см. врезку «Устаревшие функции DB2 LUW»).

Функциональные возможности DB2 LUW

IBM DB2 использует общепринятую на текущий момент клиент-серверную архитектуру реляционной СУБД, с обеспечением хранения информации на сервере и подключением приложений-клиентов к базам данных локально либо через сеть.

Для обеспечения конкурентного доступа к данным со стороны параллельно исполняемых приложений в DB2 используется транзакционный механизм, основанный на применении блокировок и ведения журнала транзакций, и обеспечивающий предоставление стандартных гарантий ACID (Атомарность, Согласованность, Изолированность, Долговечность). Данный механизм прошёл долгий путь эволюции для обеспечения максимальной производительности, надежности и минимизации задержек исполнения приложений.

В DB2 реализована поддержка всех распространенных промышленных стандартов доступа приложений к данным, включая стандартный язык запросов SQL, интерфейсы ODBC и JDBC, работу с типовыми текстовыми табличными форматами и т.п. Кроме того, DB2 включает в себя развитые возможности по хранению и работе с полуструктурированными данными в форматах XML, JSON/BSON. Для разработки хранимых процедур в DB2 реализована поддержка множества процедурных языков, включая:

  • стандартный для DB2 язык SQL PL,
  • используемый в СУБД корпорации Oracle язык SQL/PL,
  • возможность разработки «внешних» хранимых процедур на языках Java, C, C++ и COBOL.

Отличительными особенностями DB2 является:

  • масштабируемость, ограниченная только доступными вычислительными ресурсами, и максимально экономичное использование вычислительных ресурсов;
  • мощные встроенные средства разграничения и контроля доступа, предоставляющая возможности гранулярного ограничения доступа к информации в разрезе объектов (таблиц, представлений), а также реализующая модель мандатного разграничения доступа;
  • развитая интегрированная система резервного копирования и восстановления данных;
  • наличие полного набора технологий для построения «классических» аналитических хранилищ данных (деление таблиц на разделы, материализованные представления, оптимизации кэширования данных и сканирования таблиц и индексов, «внутренний» параллелизм исполнения сложных запросов и т.п.);
  • поддержка построения конфигураций массивно-параллельной аналитической обработки данных (MPP) из множества серверов, соединенных через коммуникационную сеть, на базе DB2 Database Partitioning Feature (DB2 DPF);
  • максимальная устойчивость к отказам и практически линейное масштабирование кластерных конфигураций DB2 pureScale, с хранением данных на общих дисках;
  • технология DB2 BLU, реализующая поддержку современной in-memory «поколоночной» аналитики без использования ручной оптимизации структуры баз данных.

Для облегчения миграции приложений с других типов СУБД (в первую очередь, Oracle Database) в DB2 предусмотрены развитые средства обеспечения совместимости, включая поддержку необходимых типов данных, хранимых процедур, и стандартных системных представлений.

Существует несколько редакций продукта DB2 LUW, объединяемых единым набором базовых функций и отличающихся друг от друга наличием ограничений по используемым вычислительным ресурсам и поддержке расширенного функционала. Для ознакомления с продуктом, изучения и даже развертывания небольших производственных конфигураций может использоваться редакция DB2 Express-C, доступная бесплатно. Функциональные возможности и ресурсные ограничения различных редакций DB2 LUW детально изложены в статье «Сравнение распределенных серверов баз данных DB2 10.5».

Структура сервера баз данных

Под сервером баз данных DB2 понимается компьютер, на котором установлено программное обеспечение сервера DB2 (DB2 engine) и который обеспечивает предоставление сервисов по управлению структурированной информацией.

Доступ к сервисам DB2 со стороны приложений обеспечивается клиентским программным обеспечением DB2 (IBM Data Server Driver Package), обеспечивающее взаимодействие с сервером DB2 в соответствии с поддерживаемыми методами подключения приложений (включая ODBC, JDBC, OLE DB, ADO, CLI и другие методы). В большинстве случаев вместе с сервером DB2 устанавливается и необходимое клиентское программное обеспечение, что обеспечивает возможность подключения к серверу DB2 приложений, непосредственно размещаемых на сервере баз данных.

На сервере баз данных DB2 может размещаться несколько копий программного обеспечения DB2, отличающихся друг от друга версиями программного обеспечения и каталогами установки. Несколько копий программного обеспечения DB2 могут размещаться на одном сервере независимо друг от друга при условии отсутствия конфликтов ресурсов между ними (включая достаточность вычислительных ресурсов сервера и отсутствие конфликтов за логические ресурсы операционной системы: сетевые имена, номера портов, каталоги файловой системы и т.п.).

Непосредственное предоставление сервисов СУБД обеспечивается компонентом менеджера баз данных DB2 (DB2 database manager, DB2 DBM). В каждой копии может быть создано несколько экземпляров менеджера баз данных DB2, или, более кратко – экземпляров DB2 (DB2 instances). Экземпляр – это независимая среда, в которой могут создаваться базы данных и работают приложения. Каждый экземпляр DB2 обладает собственной конфигурацией и предоставляет доступ к определенному набору баз данных. Экземпляры DB2 являются независимыми в том смысле, что выполнение операций на одном экземпляре не влияет на другие – за исключением ресурсных ограничений, вызываемых функционированием нескольких экземпляров на одном и том же физическом либо виртуальном сервере.

Запуск и остановка сервисов DB2 выполняется на уровне экземпляра, т.е. каждый экземпляр DB2 может находиться в запущенном либо остановленном состоянии. Параметры экземпляра DB2 могут определять его ресурсные ограничения (например, в части использования оперативной памяти). Ресурсы экземпляра DB2 используются для обслуживания существующих в рамках экземпляра баз данных.

База данных – это совокупность объектов, составляющих единый информационный массив (таблиц, представлений, индексов и т.д.). Базы данных являются независимыми единицами и, соответственно, обычно не используют объекты совместно с другими базами данных (исключением могут быть распределенные конфигурации баз данных, использующие механизмы федерализации доступа к данным).

Схематически пример структуры сервера баз данных представлен на рисунке.

Пример структуры сервера баз данных DB2 LUW
Пример структуры сервера баз данных DB2 LUW
Пример структуры сервера баз данных DB2 LUW

Во многих случаях сервер баз данных DB2 содержит единственную установленную копию DB2 с единственным созданным экземпляром, обслуживающим единственную базу данных. При такой конфигурации все ресурсы сервера баз данных используются для обеспечения функционирования одной базы данных DB2.

Обслуживание запросов подключенных приложений на стороне сервера баз данных выполняется так называемыми агентами DB2. Для каждого подключенного приложения в рамках экземпляра DB2 запускается координирующий (основной) агент, который при необходимости может запускать несколько дополнительных (вспомогательных) агентов. Технически каждый агент представляет собой отдельный поток выполнения либо (для старых версий DB2) отдельный процесс операционной системы, с ассоциированными ресурсами, необходимыми для его работы.

Параметры конфигурации DB2

Конфигурация сервера DB2 может быть задана на четырех различных уровнях:

  • переменные среды;
  • реестр профиля DB2;
  • файл конфигурации менеджера баз данных (DBM CFG);
  • файл конфигурации базы данных (DB CFG).

Переменные среды задаются на уровне операционной системы сервера и средствами операционной системы. Для ОС Windows эти переменные фактически являются глобальными для сервера, для ОС семейств Unix и Linux для каждого экземпляра могут быть установлены свои специфические настройки переменных среды.

Параметры реестра профиля DB2 могут быть заданы на уровне операционной системы (глобально) либо на уровне экземпляра, при этом настройки на уровне экземпляра переопределяют значения, определённые на уровне операционной системы. Просмотр и установка значений параметров реестра профиля DB2 выполняется с помощью команды db2set.

Параметры файла конфигурации менеджера баз данных определяются на уровне экземпляра, а параметры конфигурации базы данных – на уровне базы данных.

Многие параметры являются динамическими, т. е. внесенные изменения сразу же вступают в силу; однако есть параметры, для изменения которых необходимо остановить и снова запустить экземпляр. Это можно сделать в командной строке с помощью команд db2stop и db2start. Перед остановкой экземпляра все приложения должны отключиться. Для принудительной остановки экземпляра можно воспользоваться командой db2stop force.

Файл конфигурации менеджера баз данных включает параметры, влияющие на экземпляр и все базы данных, содержащихся в нем. Файл конфигурации менеджера базы данных можно просмотреть или изменить с помощью командной строки (командами GET DBM CFG и UPDATE DBM CFG), а также средствами IBM Data Studio.

Файл конфигурации базы данных включает параметры, влияющие на определенную базу данных. Файл конфигурации базы данных можно просмотреть или изменить с помощью командной строки (командами GET DB CFG и UPDATE DB CFG), а также средствами IBM Data Studio.

Детальное описание поддерживаемых переменных среды и реестра профиля DB2, а также параметров конфигурации менеджера баз данных и баз данных приведено в официальной документации DB2.

Организация хранения данных

Наименьшей единицей хранения данных в DB2 на физическом уровне является страница. Допустимые размеры страниц: 4 Кбайт, 8 Кбайт, 16 Кбайт и 32 Кбайт. Информация объектов базы данных (например, записи таблиц и элементы индексов) размещаются на страницах.

Выделение дополнительного пространства для хранения данных выделяется группами страниц, которые называются экстентами. Выполнение операций выделения дополнительного пространства на уровне экстентов увеличивает производительность операций вставки и обновления записей.

Хранение информации в базах данных DB2 организовано в рамках объектов, называемых табличными пространствами. Табличное пространство представляет собой именованный набор контейнеров для хранения информации, размещаемых в файловой системе сервера баз данных.

Для каждого табличного пространства создается один либо несколько контейнеров (файлов либо каталогов в файловой системе) для хранения информации, а также устанавливается размер страницы и область для кэширования данных (буферный пул, см. ниже), а также ряд других параметров.

Существуют следующие виды табличных пространств:

  • обычные: используются для размещения пользовательских таблиц и индексов;
  • большие: используются для размещения пользовательских таблиц и индексов, а также данных больших объектов (LOB) и данных XML. В современных версиях DB2 большие табличные пространства используются по умолчанию вместо обычных;
  • временные: используются для размещения временной информации при исполнении запросов (системные временные табличные пространства) и временных таблиц, определенных приложениями (пользовательские временные табличные пространства).

Вид табличного пространства указывается при его создании и не может быть изменён иначе, как удалением и повторным созданием табличного пространства.

Табличные пространства можно также классифицировать по типу управления, устанавливаемому при создании табличного пространства:

  • табличные пространства под управлением системы (SMS, System Managed Storage) – в качестве контейнеров табличного пространства используются каталоги, для размещения объектов хранения в каталогах осуществляется создание файлов с данными. Пространство не распределяется предварительно, файлы увеличиваются динамически. При определении контейнеры фиксируются на момент создания;
  • табличные пространства под управлением базы данных (DMS, Database Managed Storage) – в качестве контейнеров табличного пространства используются предварительно распределённые файлы, контейнеры можно добавлять, удалять или менять;
  • автоматически управляемые табличные пространства (automatic storage) – автоматическое определение типа и размещения контейнера в зависимости от вида табличного пространства (DMS для обычных и больших табличных пространств, SMS для временных табличных пространств). Конкретные определения контейнеров при создании табличного пространства не задаются, нужные контейнеры создаются автоматически. Увеличением существующих и добавлением новых контейнеров полностью управляет DB2.

Чтобы разрешить применение автоматического управления табличными пространствами, для начала нужно создать базу данных с включенным автоматическим хранилищем (используется по умолчанию) и привязать к ней набор путей хранения данных.

По умолчанию DB2 выполняет последовательную запись в экстенты с «расслоением» между контейнерами. К примеру, если имеется табличное пространство с размером страницы 4 КБ и размером экстента 8 страниц, и используется 3 непосредственных контейнера в табличном пространстве типа DMS, это означает, что 32 КБ данных (4 КБ x 8 страниц в экстенте = 32 КБ) будет записано на один диск прежде, чем начнется запись на следующий.

Начиная с DB2 версии 10.1, с целью упрощения управления хранением данных введено новое понятие – группа хранения данных (storage group). Группой хранения данных называется именованная совокупность путей в файловой системе сервера СУБД, которые могут использоваться для размещения данных. Состав групп хранения в базе данных обычно определяет набор видов устройств хранения, доступных для размещения информации. При создании базы данных в ней всегда автоматически создается группа хранения по умолчанию.

Каждое автоматически управляемое табличное пространство ассоциируются с одной из созданных групп хранения данных, что и определяется физическое размещение данных, хранящихся в соответствующих табличных пространствах. Существует возможность переместить табличное пространство из одной группы хранения в другую с помощью команды ALTER TABLESPACE … USING STOGROUP ….

Ведение журнала транзакций

IBM DB2 LUW, как и большинство других современных реляционных СУБД, обеспечивающих предоставление гарантий ACID, используют транзакционный журнал как один из основных механизмов реализации соответствующих требований.

Выполняемые DB2 операции изменения данных фиксируются в транзакционном журнале в виде последовательности записей журнала. Для каждой базы данных ведется собственный транзакционный журнал, представляющий собой последовательность файлов на диске. Размер единичного файла определяется параметром LOGFILSIZ, количество первоначально создаваемых файлов определяется параметром LOGPRIMARY. При необходимости DB2 может создать дополнительные файлы журнала, максимальное количество создаваемых файлов регулируется параметром LOGSECOND.

Запись информации в транзакционный журнал ведется с использованием специального буфера в оперативной памяти. Сброс содержимого буфера на диск (в файлы транзакционного журнала) осуществляется по мере заполнения буфера, а также при подтверждении и отмене транзакций (по команде приложения либо по факту нештатного закрытия соединения с приложением).

Файл транзакционного журнала, который необходим для восстановления данных после сбоя, называется активным. Активные файлы транзакционных журналов должны быть постоянно доступны менеджеру баз данных DB2 . Поскольку доступность файлов транзакционного журнала является критической для обеспечения работоспособности СУБД, предусмотрен механизм зеркального хранения транзакционных журналов в двух файловых системах (настраивается параметром LOGMIRROR).

В случае неправильного выбора размера и количества файлов транзакционного журнала, не соответствующего уровню текущей нагрузки, возможны ситуации переполнения транзакционного журнала из-за недостаточного количества разрешенных к созданию файлов журнала либо недостатка в доступном дисковом пространстве. В зависимости от настроек базы данных (см. параметр BLK_LOG_DSK_FUL), приложениям может возвращаться сообщение о соответствующей ошибке, либо обработка может быть приостановлена до разрешения ситуации администратором.

Также ситуации переполнения транзакционного журнала могут возникать при наличии длительных транзакций, осуществляющих операции изменения данных. Даже если такая длительная транзакция выполняет единичное небольшое изменение базы данных, которое затем долгое время остается не подтвержденным, соответствующий файл транзакционного журнала остается активным и не может быть повторно использован.

Существует два основных режима работы с транзакционным журналом DB2: циклическое журналирование и архивное журналирование. В режиме циклического журналирования DB2 циклически использует созданный набор файлов транзакционного журнала. В режиме архивного журналирования DB2 дополнительно копирует файлы транзакционного журнала в архив с помощью методов, определенных параметрами LOGARCHMETH1 и LOGARCHMETH2.

Режим циклического журналирования обеспечивает восстановление целостности базы данных при крахе сервера СУБД. Резервное копирование такой базы данных возможно только после отключения всех приложений (т.е. с приостановкой доступа пользователей). Восстановление данных из резервной копии возможно только с приведением базы данных в состояние на момент снятия резервной копии.

Режим архивного журналирования также обеспечивает восстановление целостности базы данных при крахе сервера СУБД. Дополнительно обеспечивается резервное копирование базы данных без приостановки доступа пользователей и включение активных файлов журнала (необходимых для восстановления целостности данных) в резервную копию. Восстановление данных из резервной копии может быть дополнено применением изменений, выполненных над базой данных после снятия резервной копии, и приведения базы данных в состояние на выбранный момент времени в прошлом (но не ранее момента снятия резервной копии).

Режим архивного журналирования требует дополнительных затрат ресурсов на выполнение операций архивирования, включая увеличенный объем операций ввода-вывода и дополнительное дисковое пространство для хранения архивных файлов транзакционного журнала.

Организация кэширования данных

В целях сокращения количества выполняемых операций ввода-вывода, DB2, как и другие современные реляционные СУБД, осуществляет кэширование операций чтения и записи, выполняемых над табличными пространствами. Кэширование осуществляется с использованием областей оперативной памяти, называемых буферными пулами. В DB2 может быть определено несколько различных буферных пулов (создаваемых командой CREATE BUFFERPOOL) с указанием размера страницы, размера и признака возможности автоматического управления размером. Каждое табличное пространство сопоставляется с определенным буферным пулом, при этом один буферный пул может использоваться совместно несколькими табличными пространствами.

При выполнении операции чтения сперва производится поиск нужной страницы с данными в буферном пуле. При обнаружении необходимой страницы чтение данных выполняется из буферного пула, в противном случае производится загрузка страницы с диска в буферный пул. Предусмотрен механизм асинхронной предвыборки страниц в буферный пул при обнаружении линейного (предсказуемого) характера обращений к страницам. Механизм предвыборки во многих случаях позволяет снизить время ожидания операций чтения нужных данных с диска за счет выполнения чтения в асинхронном режиме.

При выполнении операции записи корректировка страницы выполняется непосредственно в буферном пуле. Запись страницы на диск в синхронном режиме при этом не выполняется, а сохранность данных обеспечивается механизмом ведения транзакционного журнала. Запись измененных страниц табличных пространств на диск ведется асинхронно, в фоновом режиме, и обеспечивает разумную минимизацию объема работы, которая может потребоваться для восстановления состояния базы данных при её аварийном (некорректном) закрытии. Корректное закрытие базы данных (например, при штатной остановке сервера СУБД) обеспечивает запись на диск всех измененных страниц всех буферных пулов.

Использование оперативной памяти

Модель памяти DB2 состоит из различных областей памяти на уровне экземпляра DB2, базы данных, приложения и агента.

Детальное описание областей памяти DB2 приведено в документации, ниже представлено краткое описание назначения различных областей.

Перечень основных областей памяти DB2 приведен на рисунке ниже (изначально взятом из официальной документации DB2).

Основные области памяти DB2
Основные области памяти DB2
Основные области памяти DB2

Общая память, используемая экземпляром СУБД, включает в себя:

  • Monitor Heap – область памяти для ведения мониторинга операций и состояния, размер регулируется параметром MON_HEAP_SZ;
  • FCM Buffers – область памяти для взаимодействия между координирующим агентом и его субагентами, а также для обеспечения внутренних взаимодействий в многораздельных базах данных ;
  • Audit Buffer – область памяти, в которую помещаются записи аудита перед сбросом в журнал аудита.

На уровне базы данных принято различать:

  • глобальную область базы данных, часто называемую «Областью производительности» («Performance memory»), включающую различные области кэширования и область ведения блокировок ;
  • область данных приложений, часто называемую «Функциональной областью» («Functional memory») и включающую различные рабочие области памяти агентов, обслуживающих подключения к базе данных.

Глобальная область базы данных состоит из следующих основных компонентов:

  • Buffer pools – буферные пулы, т.е. области для кэширования данных табличных пространств;
  • Lock list – область для хранения информации о блокировках, размер которой регулируется параметром LOCKLIST;
  • Package cache – область для кэширования планов выполнения запросов, размер регулируется параметром PCKCACHESZ;
  • Catalog cache – область для кэширования системного каталога, включающего в себя описания всех объектов базы данных, размер регулируется параметром CATALOGCACHE_SZ;
  • Utility heap – оперативная память для выполнения операций обслуживания базы данных (включая операции резервного копирования и восстановления), размер регулируется параметром UTIL_HEAP_SZ;
  • Database heap – оперативная память для обслуживания операций базы данных (включая буфер транзакционного журнала и кэш для ускорения доступа к системному каталогу, а также буфер аудита на уровне базы данных), размер регулируется параметром DBHEAP.

Суммарный объем глобальной области базы данных ограничен параметром DATABASE_MEMORY.

Область данных приложений включает в себя:

  • Application Global Memory – общие области памяти, совместно используемые при обработке запросов приложений, максимальный объем регулируется параметром APPL_MEMORY;
  • Agent Private Memory – частные области памяти, используемые для функционирования отдельных агентов, обслуживающих подключенные приложения.

Дополнительно можно выделить области памяти, выделяемые для работы драйвера DB2 на стороне приложения. Для локальных приложений (использующих протокол межпроцессного взаимодействия, а не сетевой доступ для подключении к менеджеру баз данных) установленные параметры DB2 регулируют объем выделяемой оперативной памяти (преимущественно параметр ASLHEAPSZ).

Управление оперативной памятью при выполнении операций сортировки

При выполнении многих видов операций СУБД требуется осуществить сортировку данных, поэтому управлению оперативной памятью, используемой для сортировки, уделяется особое внимание.

В случае невозможности размещения области сортировки целиком в оперативной памяти, данные для сортировки размещаются в системном временном табличном пространстве. Производительность запросов, требующих таких объемных операций сортировки, может быть значительно снижена.

Параметры, управляющие выделением оперативной памяти для сортировки:

  • SORTHEAP – предельный размер памяти для операции сортировки;
  • SHEAPTHRES – предельный размер частной области памяти агента, выделенной для операции сортировки;
  • SHEAPTHRES_SHR – предельный объем общей оперативной памяти, которая может быть использована для выполнения операций сортировки (суммарно всеми потребителями) в каждый момент времени.

В DB2 поддерживается три основных модели управления памятью сортировки:

  • Модель общей области сортировки (shared sort) – используется по умолчанию, подразумевает установку параметра SHEAPTHRES в значение 0. Выделение оперативной памяти для сортировки осуществляется из глобальной области базы данных.
  • Модель частной области сортировки (private sort) – используется при ненулевом значении параметра SHEAPTHRES и отсутствии настроенной общей памяти сортировки. Выделение оперативной памяти для сортировки осуществляется из области данных приложений (точнее, из частных областей, принадлежащих агентам).
  • Гибридная модель сортировки (hybrid sort) – используется при ненулевом значении параметра SHEAPTHRES и наличии настроенной общей памяти сортировки. Операции, требующие использования общей памяти сортировки, выполняются с выделением памяти в глобальной области базы данных, остальные операции сортировки выполняются с выделением памяти в частных областях агентов.

Использование общей (глобальной) памяти для выполнения операций сортировки предоставляет ряд важных преимуществ:

  • более гибкое управление оперативной памятью при выполнении запросов, позволяющее увеличить эффективность использования оперативной памяти;
  • возможность использования параллельного варианта алгоритма сортировки за счет наличия одновременного доступа к области памяти сортировки у координирующего агента и подчиненных ему суб-агентов DB2.

Для включения возможности использования общей памяти при выполнении операций сортировки может использоваться одна из следующих настроек :

  • активирована модель общей области сортировки путем установки параметра SHEAPTHRES в значение 0;
  • активирован параллелизм выполнения операций путем установки параметра INTRA_PARALLEL в значение YES;
  • переменная DB2_WORKLOAD установлена в значение ANALYTICS;
  • активирована функция DB2 Connection Concentrator (обычно используется при организации доступа к базам данных DB2 for z/OS и DB2 for i, см. описание данной функции в документации DB2).

Автоматическое управление распределением памяти

Наличие большого количества различных областей оперативной памяти и параметров, регулирующих их объем, может требовать значительных усилий для ручной настройки сервера DB2. Поэтому, начиная с версии 9, IBM DB2 поддерживает автоматическое управление распределением оперативной памяти между различными областями с использованием самонастраивающегося менеджера памяти (STMM, Self-Tuning Memory Manager).

Если функция самонастройки включена, STMM динамически распределяет доступные ресурсы памяти между потребителями оперативной памяти в базе данных. STMM реагирует на изменения характеристик рабочей нагрузки, регулируя значения параметров конфигурирования памяти и размер буферных пулов для оптимизации производительности. Чтобы включить STMM, необходимо установить для параметра конфигурации базы данных SELF_TUNING_MEM значение ON.

Автоматическое управление распределением памяти ведётся для тех областей памяти, для которых оно было явно разрешено. При установке значения параметра конфигурации командами UPDATE DBM CFG и UPDATE DB CFG, для использования STMM после значения параметра указывается ключевое слово AUTOMATIC. Указанное при этом числовое значение параметра используется как начальное, далее STMM осуществляет периодическую корректировку значений с учетом текущей нагрузки, перераспределяя оперативную память между различными потребителями.

Автоматическое управление средствами STMM поддерживается для следующих параметров:

  • INSTANCE_MEMORY – суммарный объем оперативной памяти экземпляра DB2;
  • DATABASE_MEMORY – глобальные области базы данных;
  • DBHEAP – область для обслуживания операций базы данных;
  • LOCKLIST – область ведения данных о блокировках;
  • MAXLOCKS – процент занятия памяти блокировками одного приложения для перехода к эскалации блокировок;
  • PCKCACHESZ – область кэширования планов выполнения запросов;
  • SHEAPTHRES_SHR – общая область сортировки;
  • SORTHEAP – размер области сортировки для одной операции;
  • APPL_MEMORY – область функциональной памяти;
  • APPLHEAPSZ – предельный объем частной памяти, используемый одним агентом;
  • STMTHEAP – ограничение на размер области, используемой компилятором SQL и XQuery запросов (на один запрос);
  • STAT_HEAP_SZ – максимальный объем оперативной памяти, выделяемый для построения статистик утилитой RUNSTATS и выделяемый из функциональной области памяти.

Виды объектов баз данных

Настоящий раздел содержит обзор видов объектов баз данных DB2. Полный перечень видов объектов баз данных DB2 и детальная информация по каждому виду объектов приведена в документации DB2:

Схемы

Схемы – это пространства имён для сбора объектов базы данных. Схемы преимущественно используются для:

  • обеспечения индикации монопольного использования объектов или связей с приложением;
  • логической группировки связанных объектов.

Все объекты базы данных DB2 (за исключением общих синонимов) имеют полностью классифицированные имена, состоящие из двух частей; схема является первой частью такого имени: <имя_схемы>.<имя_объекта>

Полностью классифицированное имя объекта должно быть уникальным. Если подключиться к базе данных и создать или обратиться к объекту, не указав схему, DB2 будет использовать идентификатор пользователя, с помощью которого установлено подключение к базе данных, в качестве имени схемы. Чтобы задать схему для текущего сеанса работы, можно также воспользоваться оператором SET SCHEMA.

Создание схемы может быть выполнено явно, путем вызова оператора CREATE SCHEMA, либо неявно, при первой попытке создания объекта без указания имени схемы. В последнем случае для успешного создания схемы пользователю должна быть предоставлено полномочие IMPLICIT_SCHEMA.

Для большинства видов объектов базы данных могут быть созданы синонимы, позволяющие обращаться к исходным объектам через другое имя (возможно, размещённое в другой схеме). Создание синонимов осуществляется оператором CREATE SYNONYM / CREATE ALIAS. Также поддерживается работа с публичными синонимами, которые не привязаны к конкретной схеме. Обращение к публичным синонимам осуществляется без указания схемы вне зависимости от установленной текущей схемы сеанса работы. Создание публичных синонимов осуществляется командой CREATE PUBLIC SYNONYM / CREATE PUBLIC ALIAS.

Таблицы

Таблица – это собрание связанных данных, логически упорядоченных в столбцах и строках.

Каждая строка таблицы состоит из одинакового набора именованных колонок. Каждой колонке при создании таблицы присваивается тип данных, ограничивающий допустимые значения колонки в строках таблицы (записях базы данных) и определяющий семантику возможных операций над соответствующими значениями (включая сравнение, сортировку, вычислительные операции).

Создание таблицы осуществляется командой CREATE TABLE, удаление – командой DROP TABLE. Поддерживается изменение описания таблицы командой ALTER TABLE, включая добавление и удаление колонок, изменение типов данных колонок. После выполнения некоторых операций изменения описания таблицы требуется выполнить её реорганизацию (реструктурировать физическое хранение таблицы для оптимального доступа к ней) с помощью команды REORG.

Классификация встроенных типов данных DB2, которые могут быть использованы при определении колонок таблицы, приведена на рисунке ниже.

Встроенные типы данных DB2
Встроенные типы данных DB2
Встроенные типы данных DB2

В дополнение к одному из допустимых значений поддерживаемого типа данных, значения колонок могут принимать незаполненное, т.е. пустое (NULL) значение. Возможность для колонки хранить пустые значения определяется при создании таблицы.

Большинство перечисленных на приведенном рисунке типов данных имеют непосредственный аналог в других современных реляционных СУБД и детально описаны в документации DB2. Ниже представлено краткое описание особенностей типов данных, характерных именно для DB2, либо могущих вызвать затруднения при использовании.

При работе со строковыми данными, в отличие от некоторых других типов СУБД, DB2 различает пустую строку (строку нулевой длины) и NULL-значение строкового типа. Данная особенность влияет на порядок поиска (использование предиката равенства вместо выражения IS NULL) и состав допустимых значений колонок (при запрете хранения NULL-значений в колонке может быть сохранена пустая строка).

Строковые значения типов GRAPHIC, VARGRAPHIC и DBCLOB отличаются от других строковых типов тем, что всегда хранятся в кодировке UTF-16. При обращении к соответствующим колонкам со стороны клиентского приложения, СУБД обеспечивает преобразование данных к кодировке, используемой клиентским приложением.

Колонки типа DATE (дата) по умолчанию не содержат метки времени. В режиме совместимости с СУБД Oracle Database, в DB2 дополнительно поддерживается хранение атрибутов времени (часы, минуты, секунды) в колонках DATE.

При необходимости обеспечить эффективную работу с точными десятичными числами, включающими дробную часть (например, в финансовых приложениях), целесообразно использование типа данных DECFLOAT, который комбинирует точное представление значений типа DECIMAL и возможности эффективных вычислений над значениями типа FLOAT.

Тип данных BLOB обеспечивает возможность сохранения в базе данных неструктурированной двоичной информации (например, изображений или документов офисных форматов). Значения типа BLOB могут сохраняться вместе с другими полями записи (если их размер позволяет разместить их достаточно компактно), либо отдельно, в специальном объекте хранения. В последнем случае запись содержит ссылку на хранимое BLOB-значение вместо самого значения. Аналогичным образом организовано хранение значений типов CLOB и DBCLOB.

Тип данных XML обеспечивает хранение в полях таблицы структурированных иерархических документов формата XML. Для хранимых XML-документов поддерживаются операции доступа к атрибутам (без необходимости разбора XML-документа при обращении), индексация отдельных атрибутов и другие возможности.

В дополнение к встроенным типам данных, DB2 поддерживает работу с пользовательскими типами данных, определяемыми на основе встроенных типов. Работа с пользовательскими типами данных описана в документации DB2.

При создании таблицы существует возможность указать для колонок правила автоматического заполнения их значений. Особым случаем колонок с автоматическим заполнением являются столбцы идентификации – числовые столбцы, автоматически генерирующие уникальное числовое значение для каждой вставляемой строки. Автоматическое заполнение может осуществляться в одном из двух режимов:

  • GENERATED ALWAYS – значение всегда устанавливается сервером DB2 и не может быть явно установлено приложением;
  • GENERATED BY DEFAULT – значение устанавливается сервером DB2 в том случае, если приложение не указало явно присваиваемое значение при вставке записи.

Также на уровне таблицы могут быть определены ограничения, задающие ограничения на состав значений атрибутов. Поддерживаются следующие виды ограничений:

  • первичный ключ (PRIMARY KEY) – ограничение уникальности на набор колонок, преимущественно используемых для поиска единичной записи, в таблице может быть только один первичный ключ;
  • ограничение уникальности (UNIQUE) – дополнительное ограничение уникальности на набор колонок;
  • внешний ключ (FOREIGN KEY) – ссылка в виде набора значений колонок, указывающая на комбинацию колонок другой таблицы, для которой определён внешний ключ или ограничение уникальности;
  • проверка (CHECK) – логическое условие, ограничивающее возможные значения одной или сразу нескольких колонок в записи.

Механизм ограничений реализует средства автоматического контроля и обеспечения целостности базы данных, включая ссылочную целостность данных (контроль наличия в «родительской» таблице записей, на которые ссылаются через внешние ключи записи «дочерних» таблиц). Грамотное использование ограничений позволяет гарантировать формальную корректность заполнения базы данных и в определённой степени защититься от ошибок приложений и пользователей при корректировке данных.

Поскольку механизм ограничений создает дополнительную вычислительную нагрузку при вводе и корректировке данных, в некоторых случаях от его использования сознательно отказываются, возлагая ответственность за правильное ведение базы данных на приложение. В то же самое время, DB2 использует описания ограничений целостности для определения взаимосвязей между таблицами и подбора наиболее эффективного плана выполнения запросов.

Временные таблицы

Для хранения временных данных приложений в DB2 предусмотрен механизм временных таблиц, предоставляющий полный набор функций работы с табличными данными, но в контексте текущей пользовательской сессии.

Доступ к временным таблицам значительно повышает производительность, поскольку минимизируются либо вовсе не возникают конфликты доступа к системному каталогу, а также не используется блокировка строк, ведение журнала (не обязательно, зависит от режима создания таблицы) и проверка полномочий.

Временные таблицы также поддерживают индексы, т. е. ко временной таблице можно создать любой стандартный индекс. Для таких таблиц можно также выполнить сбор статистик (командой RUNSTATS) для получения информации, необходимой оптимизатору запросов.

Временные таблицы располагаются в пользовательском временном табличном пространстве, которое должно определяться до их создания.

В DB2 существует две основные разновидности временных таблиц:

  • объявленные временные таблицы (DGTT – Declared Global Temporary Tables);
  • созданные глобальные временные таблицы (CGTT – Created Global Temporary Tables).

Объявленные временные таблицы — это созданные в памяти таблицы, используемые приложением и автоматически отбрасываемые при завершении его работы. Доступ к таким таблицам может получить только то приложение, которое их создало, и они не хранятся ни в одной из таблиц системного каталога DB2.

Каждая объявленная временная таблица имеет схему SESSION; эту схему необходимо указывать, ссылаясь на неё. Используемый для объявления временных таблиц идентификатор пользователя будет иметь в этих таблицах все привилегии. Каждое приложение, объявившее временную таблицу, будет иметь собственную копию такой таблицы.

Хотя DGTT дают возможность объявить временную таблицу, определение такой таблицы нельзя совместно использовать в разных подключениях или сеансах. При запуске каждого сеанса необходимо выполнять оператор DECLARE GLOBAL TEMPORARY TABLE.

При использовании созданных глобальных временных таблиц (CGTT) определение временной таблицы нужно создать всего один раз, поскольку оно сохраняется в системном каталоге DB2. Это означает, что другие подключения могут воспользоваться определением такой таблицы, а не создавать его снова.

Хотя структуру таблицы CGTT можно использовать сразу, данные разных подключений не зависят друг от друга и пропадают после закрытия подключения.

Индексы

Индекс — это упорядоченный набор ключей, каждый из которых указывает на строку таблицы. Индексы обеспечивают уникальность строк (т.е. реализуют ограничения уникальности, рассмотренные в предыдущем разделе) и повышают производительность. Ниже описаны некоторые характеристики, которые можно определить для индексов:

  • индексы могут строиться по возрастанию или по убыванию значений колонок;
  • ключи индексов могут быть уникальными или неуникальными;
  • индексы могут строиться по нескольким столбцам (такие индексы называют комбинированными);
  • если индексные и табличные данные сгруппированы в одинаковой последовательности индекса, такой индекс называется сгруппированным (CLUSTERED INDEX).

Создание индексов обеспечивается оператором CREATE INDEX, удаление – оператором DROP INDEX. При создании индекса указывается его тип (уникальный / неуникальный) и состав колонок для построения индекса.

В DB2 предусмотрены инструменты, обеспечивающие автоматизрованный подбор индексов для оптимизации выполнения запросов. Наиболее удобно работа с данными инструментами организована в IBM Data Studio.

Последовательности

Хотя объекты последовательностей не зависят от таблиц, они функционируют аналогично столбцам идентификации и обеспечивают генерацию уникальных числовых последовательностей. Разница между последовательностями и столбцами идентификации заключается в том, что столбцы идентификации генерируют уникальные числа строго в указанной колонке таблицы, тогда как объекты последовательностей могут использоваться для генерации последовательных числовых значений, логика использования которых определяется приложением.

Создание последовательностей обеспечивается командой CREATE SEQUENCE, обращение к очередному и текущему полученному значениям осуществляется с помощью операторов NEXT VALUE FOR и PREVIOUS VALUE FOR. Для совместимости с СУБД Oracle Database также поддерживается синтаксис обращения к значениям последовательности через псевдо-колонки «NEXTVAL» и «CURRVAL».

Представления

Представление – это отображение данных в таблицах. Данные для представлений не хранятся отдельно, они отбираются при запуске представления. Поддерживаются вложенные представления, т. е. представления, созданные на основе других представлений.

Создание представлений осуществляется командой CREATE VIEW, удаление – командой DROP VIEW. Для облегчения обновления (замены) представлений предусмотрен синтаксис CREATE OR REPLACE VIEW, который обеспечивает создание нового представления (если его еще не существует) либо замену существующего представления на новое определение (если представление с указанным именем уже было ранее создано).

Триггеры

Триггер — это объект, который автоматически выполняет операцию с таблицей или представлением. Определенное действие с объектом, для которого определен триггер, вызывает запуск триггера. Обычно триггер не считается объектом приложения; соответственно, обычно триггеры создаются не разработчиками, а администраторами баз данных.

Хранимые процедуры и функции

Хранимые процедуры – это объекты базы данных, содержащие операторы SQL и бизнес-логику. Хранение части логики приложения в базе данных повышает производительность, поскольку сокращается объем трафика между приложением и базой данных. Кроме того, хранимые процедуры предоставляют централизованное местоположение для хранения программного кода, и, соответственно, другие приложения могут воспользоваться теми же хранимыми процедурами. Для вызова хранимой процедуры используется оператор CALL.

Пользовательские функции (UDF, User Defined Functions) – это объекты базы данных, позволяющий пользователям расширить язык SQL собственной логикой. Функция всегда возвращает значение или значения, обычно как результат включенной в функцию бизнес-логики. Чтобы вызвать функцию, используйте её в составе оператора SQL или с оператором VALUES.

В DB2 хранимые процедуры и пользовательские функции можно разрабатывать на нескольких языках программирования, среди которых PL/SQL, SQL PL, Java, C, C++, COBOL.

Системный каталог

Одним из базовых информационных ресурсов СУБД является системный каталог, хранящий и предоставляющий доступ к информации о структуре базы данных, включая:

  • описание таблиц, колонок и индексов;
  • описание и текст представлений, триггеров и хранимых процедур;
  • сведения о табличных пространствах и контейнерах для хранения данных;
  • установленные полномочия по доступу к объектам базы данных;
  • другую метаинформацию базы данных.

Обращение к системному каталогу требуется при решении многих задач, включая автоматизацию задач администрирования и обслуживания баз данных, разработку приложений и многое другое.

Наиболее часто используются следующие таблицы (в действительности, представления), входящие в состав системного каталога:

  • SYSCAT.SCHEMAS – описание схем базы данных;
  • SYSCAT.TABLES – описание таблиц базы данных;
  • SYSCAT.COLUMNS – описание колонок таблиц;
  • SYSCAT.INDEXES – описание индексов.

Детальное описание и состав колонок для перечисленных выше и других таблиц системного каталога приведено в документации DB2.

Организация параллельной транзакционной обработки

Транзакции

Транзакция (или единица работы) состоит из одного или нескольких операторов SQL, которые при выполнении рассматриваются как отдельная единица; иными словами, сбой одного оператора транзакции приводит к сбою целой транзакции, при этом все операторы, выполненные до момента сбоя, откатываются.

Транзакция заканчивается оператором COMMIT. Транзакция также может закончиться оператором ROLLBACK либо аварийным (нештатным) отключением приложения, после которого все внесённые приложением изменения в базу данных будут отменены. Началом транзакции является первый выполненный оператор после открытия соединения приложения с базой данных либо после завершения предыдущей транзакции. Каждое соединение приложения с базой данных может иметь не более одной активной транзакции.

Как уже было указано ранее, изменения в базе данных фиксируются в транзакционном журнале. Для обеспечения возможности «отката» изменений, внесенных отменяемой транзакцией, в транзакционном журнале также фиксируются границы транзакций. При этом для транзакций, выполняющих только операции чтения данных, запись в транзакционный журнал не ведется. Информация о начале транзакции помещается в транзакционный журнал перед началом выполнения первого (для данной транзакции) оператора записи данных.

В случае ошибки выполнения единичного оператора, осуществляющего запись данных, все изменения, внесенные данным оператором, отменяются с использованием данных транзакционного журнала. Приложение, получив диагностическое сообщение об отказе в выполнении оператора, может отменить всю транзакцию (оператором ROLLBACK) либо выполнить какие-то другие действия с базой данных и, в итоге, подтвердить внесённые изменения (оператором COMMIT).

Приложение может определять дополнительные точки отката в рамках транзакции (с помощью оператора SAVEPOINT) и отменять изменения, выполненные после созданной точки отката (с помощью оператора ROLLBACK TO). Использование точек отката позволяет приложению выборочно отменять выполненные в рамках транзакции действия, что может быть полезно при обработке ошибок контроля целостности данных и в других сценариях.

Блокировки

Параллельное использование подразумевает, что несколько пользователей могут одновременно работать над одними и теми же объектами базы данных. Доступ к данным необходимо должным образом координировать для обеспечения целостности и согласованности данных.

Для получения согласованных результатов параллельно выполняемых транзакций требуется контроль параллельного использования общих ресурсов. Такой контроль основан на применении блокировок.

Концепции блокировки и параллельного использования тесно взаимосвязаны. Блокировка временно запрещает приложениям выполнять другие операции до завершения текущей операции. Чем активнее в системе применяется блокировка, тем меньше остается возможностей параллельного использования. С другой стороны, чем реже блокировка применяется в системе, тем больше появляется возможностей параллельного использования.

Блокировка срабатывает автоматически по мере необходимости для поддержки транзакции и отключается после прерывания такой транзакции (с помощью команды COMMIT или ROLLBACK). Блокировка может устанавливаться на таблицы или строки.

Существует два основных типа блокировки:

  • Общая блокировка (S) — устанавливается, когда приложение считывает данные и не допускает внесения изменений в ту же строку другими приложениями.
  • Эксклюзивная блокировка (X) — устанавливается, когда приложение обновляет, вставляет или удаляет строку.

Если двум и больше приложениям необходимо выполнить операцию с одним и тем же объектом, одному из них придется подождать, чтобы установить требуемую блокировку. По умолчанию, приложение будет ждать бесконечно долго. Временем ожидания блокировки приложением управляет параметр конфигурации базы данных LOCKTIMEOUT. По умолчанию этот параметр имеет значение -1 (бесконечное ожидание).

Для установки времени ожидания блокировки в определенном подключении можно использовать сессионную переменную CURRENT LOCK TIMEOUT. По умолчанию для этой переменной задано значение LOCKTIMEOUT. Чтобы изменить это значение, можно воспользоваться оператором SET LOCK TIMEOUT.

В случае, когда два приложения (или более), подключенных к одной базе данных, бесконечно долго ожидают ресурсов вследствие неправильной последовательности обращения к этим ресурсам, возникает ситуация взаимоблокировки. Период ожидания не может закончиться, поскольку каждое из приложений удерживает ресурс, необходимый другому приложению. Во всех случаях проблема взаимоблокировки связана с неправильной структурой или логикой приложений.

DB2 обеспечивает автоматическое обнаружение ситуаций взаимоблокировки, выполняя соответствующие проверки с периодичностью, заданной параметром DLCHKTIME. Обнаружив действительно возникшую взаимоблокировку, DB2 воспользуется внутренним алгоритмом, чтобы определить, какую из двух транзакций необходимо откатить, а какую продолжить.

Уровни изоляции

Детальный анализ проблем, которые могут проявиться при отсутствии контроля параллельного использования ресурсов, приведён в документации DB2, а также в литературе по теории функционирования реляционных СУБД. Возможные виды проблем включают в себя:

  • потерянное обновление (при одновременном изменении одного блока данных разными транзакциями, одно из изменений теряется);
  • недостоверное чтение (чтение данных, добавленных или изменённых транзакцией, которая впоследствии не подтвердится);
  • неповторяющееся чтение (при повторном чтении в рамках одной транзакции, ранее прочитанные данные оказываются изменёнными);
  • фантомное чтение (одни и те же выборки в одной транзакции дают разные множества строк из-за добавления, удаления либо изменения строк другими транзакциями).

Управление со стороны приложений встроенными в DB2 механизмами защиты от перечисленных выше проблем осуществляется с помощью установки используемого уровня изоляции. Уровни изоляции можно рассматривать как политики блокировки, в которых, в зависимости от выбранного уровня изоляции, можно достичь различных вариантов блокировки базы данных приложением. Требуемый приложением уровень изоляции может быть установлен на уровне сеанса и на уровне отдельного выполняемого запроса либо подзапроса.

DB2 предоставляет следующие уровни защиты для изоляции данных:

  • недостоверное чтение (Uncommitted Read, UR);
  • стабильность курсора (Cursor Stability, CS);
  • стабильность чтения (Read Stability, RS);
  • повторяемое чтение (Repeatable Read, RR).

Недостоверное чтение также называют «грязным». Это самый низкий уровень изоляции, который допускает наивысшую степень параллельного использования. При операциях чтения строки не блокируются, за исключением случаев, когда другое приложение пытается удалить или изменить таблицу; операции обновления выполняются так же, как при использовании следующего уровня изоляции — уровня «Стабильность курсора».

При использовании уровня изоляции «Недостоверное чтение» предотвращаются следующие проблемы:

  • потерянное обновление.

Стабильность курсора — это уровень изоляции по умолчанию. Он обеспечивает минимальную степень блокировки. При этом уровне изоляции блокируется «текущая» строка курсора. Если строка только считывается, блокировка сохраняется до перехода на новую строку или завершения операции. Если строка обновляется, блокировка сохраняется до завершения операции.

При использовании уровня изоляции «Стабильность курсора» предотвращаются следующие проблемы:

  • потерянное обновление;
  • недостоверное чтение.

До выхода DB2 9.7, при использовании уровня изоляции «Стабильность курсора» выполнение записи (операция UPDATE) закрывало для чтения (операция SELECT) доступ к той же строке. Логической основой служило то, что поскольку операция записи вносит в строку изменения, для чтения следует дождаться завершения обновлений, чтобы получить окончательное зафиксированное значение.

В DB2 9.7 по умолчанию используется другой подход к уровню изоляции «Стабильность курсора» для новых баз данных. Этот новый подход реализован с помощью «принятой на текущий момент» ( currently committed, CC ) семантики. При использовании CC-семантики, операция записи не закрывает доступ к той же строке для операции чтения. Ранее, такой подход был возможен при использовании уровня изоляции UR; разница с текущим подходом заключается в том, что при UR операция чтения получает недостоверные значения, а при CC-семантике — значения, принятые на текущий момент. Принятые на текущий момент значения — это значения, зафиксированные до начала операции записи.

Стабильность чтения обеспечивает блокировку всех строк, получаемых приложением. Для заданного запроса блокируются все строки, соответствующие набору результатов. Таким образом, использование данного режима изоляции может привести к захвату приложением большого количества блокировок, и, в случае достижения установленных ограничений, к эскалации блокировок с уровня строк на уровень таблиц. Тем не менее, на уровне изоляции «Стабильность чтения» оптимизатор запросов DB2 не включает в план выполнения выполняемых запросов операций по явному захвату блокировок на уровне таблиц, даже если в набор результатов попадает большая часть записей таблицы.

При использовании уровня изоляции «Стабильность чтения» предотвращаются следующие проблемы:

  • потерянное обновление;
  • недостоверное чтение;
  • неповторяющееся чтение.

Повторяющееся чтение — это наивысший уровень изоляции. Он предоставляет наивысшую степень блокировки и меньше всего возможностей параллельного использования. Блокировка устанавливается на строки, которые обрабатываются для построения набора результатов; иными словами, могут блокироваться даже те строки, которые не попадут в конечный пакет результатов. Другие приложения не могут обновлять, удалять или вставлять строки, которые повлияют на набор результатов, пока выполняемая операция не будет завершена. Повторяющееся чтение гарантирует, что один и тот же запрос, созданный приложением несколько раз за одну операцию, каждый раз будет выводить одинаковые результаты.

Оптимизатор запросов DB2 при использовании уровня изоляции «Повторяющееся чтение» может включать в план выполнения запросов явные операции установки блокировок на уровне таблиц в случае, когда соответствующие запросы предполагают сканирование всех строк таблицы (что означает необходимость заблокировать каждую строку таблицы в ходе выполнения запроса).

При использовании уровня изоляции «Стабильность чтения» предотвращаются все возможные проблемы конкурентного доступа, но одновременно максимально ограничивается возможный параллелизм выполнения операций.

Заключение

В данной статье были рассмотрены основные функциональные возможности СУБД IBM DB2 LUW, структура сервера баз данных, настройка конфигурации и организация хранения данных. Кроме того, рассмотрены основные принципы функционирования сервера DB2, поддерживаемые виды объектов баз данных и организация параллельной транзакционной обработки DB2.


Ресурсы для скачивания


Похожие темы


Комментарии

Войдите или зарегистрируйтесь для того чтобы оставлять комментарии или подписаться на них.

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=40
Zone=Information Management, Большие данные и аналитика
ArticleID=1017997
ArticleTitle=Обзор DB2 LUW: Часть 1. Основные понятия и архитектура DB2 LUW
publish-date=10202015