Ahorre energía con el dispositivo de compresión de datos de DB2 10.1 para Linux, UNIX y Windows

Reduzca el mantenimiento y haga que su base de datos sea más verde

El dispositivo de compresión de IBM® DB2® para Linux®, UNIX®y Windows® le permite almacenar sus datos de una forma compacta. Existen dos beneficios conocidos en este abordaje: primero, la reducción de espacio de almacenamiento, y segundo, la mejora de rendimiento. En este artículo describimos un estudio de caso que muestra el tercer beneficio: reducción del consumo de energía por unidad de trabajo. Como resultado, su compresión de datos reduce el costo de mantenimiento de base de datos y hace que su base de datos sea más "verde".

Andriy Miranskyy, DB2 Quality Assurance Developer, IBM

Photo of author Andriy MiranskyyEl Dr. Andriy Miranskyy es ingeniero de software de la división de IBM Information Management en el IBM Toronto Software Laboratory. Sus intereses de trabajo e investigación están en el área de mitigar riesgos en ingeniería de software, enfoque en aseguramiento de calidad de software, comprensión de programas, requerimientos de software, arquitectura de software, gestión de riesgos de proyecto, y TI Verde. Andriy recibió su doctorado en Matemáticas Aplicadas en la Universidad de Western Ontario. Cuenta con una experiencia de 15 años de ingeniería de software en gestión de información y en industrias farmacéuticas. Andriy tiene diversas publicaciones y patentes en el campo de ingeniería de software.



Sedef Akinli Kocak, PhD student, Ryerson University

Sedef Kocak photoSedef Akinli Kocak es estudiante de doctorado en el Programa de Ciencias Ambientales Aplicadas y Gestión en la Universidad de Ryerson. Sus intereses de investigación incluyen tecnologías de información y sostenibilidad ambiental, software sostenible, TI verde y desarrollo de software verde. Akinli Kocak posee una maestría en ciencias por la Universidad de Maine y maestría en administración de empresas por la Universidad de Ankara. Póngase en contacto con ella en sedef.akinlikocak@ryerson.ca



Enzo Cialini, Manager, DB2 UDB System Testing, IBM

Enzo Cialini photoEnzo Cialini es Miembro Sénior del Staff Técnico de la división de IBM Information Management Software en el IBM Toronto Laboratory. Actualmente es el Arquitecto en Jefe de Aseguramiento de Calidad responsable por la gestión y la estrategia de pruebas técnicas para DB2 LUW Engine (Warehouse y OLTP) y Customer Operational Profiling. Enzo se unió a IBM en 1991 y ha estado trabajando en el equipo de desarrollo de DB2 desde 1992. Tiene más de 20 años de experiencia en desarrollo de software, pruebas y soporte. Enzo está activamente comprometido con los clientes en el campo en implementaciones OLTP y Warehouse, es autor de la Guía de Alta disponibilidad para DB2 y tiene diversas patentes y publicaciones acerca de DB2 e Integración.



Dr. Ayse Basar Bener, Professor of Engineering, Ryerson University

Ayse                 Bener photoLa Dra. Ayse Basar Bener es profesora del Departamento de Ingeniería Mecánica e Industrial de la Universidad de Ryerson. Sus intereses de investigación son la construcción de modelos inteligentes para obtener tomas de decisiones sostenibles bajo la incertidumbre. Ella ha publicado más de 100 artículos en publicaciones y conferencias. La Dra. Bener tiene una maestría en Sistemas de Información de la Escuela de Economía de Londres. Ella es miembro de AAAI, IEEE, y AIS.



13-05-2013

Introducción

Los sistemas de almacenamiento de disco pueden ser comúnmente los componentes más caros de una solución de base de datos. Para grandes depósitos o bases de datos con inmensos volúmenes de datos, el costo de subsistema de almacenamiento puede fácilmente exceder el costo combinado de servidor de hardware y del software de servidor de datos. Por lo tanto, incluso una pequeña reducción en el subsistema de almacenamiento puede generar ahorros sustanciales para la totalidad de la solución de base de datos. La compresión de datos reduce los requerimientos de almacenamiento, mejora la eficiencia E/S y proporciona un acceso más rápido a los datos desde el disco.

El último release de DB2, versión 10.1, introdujo un nuevo tipo de compresión de datos: compresión de datos adaptativa. Este dispositivo utiliza diversas técnicas de compresión, incluyendo compresión de ancho de tabla y de ancho de página. (Vea la sección Recursos para obtener un enlace hacia la sección de compresión de la documentación de DB2). Estas técnicas de compresión generan una reducción significativa de espacio de almacenamiento. Sin embargo el uso de este dispositivo puede generar sobrecarga de CPU asociada con compresión y descompresión de datos.

Otro efecto secundario positivo de esta tecnología es la aceleración de cargas de trabajo intensivas de E/S (pese a la sobrecarga de CPU). La lectura de datos de disco hacia la memoria para procesamiento es una de las operaciones más lentas de base de datos. El almacenamiento de datos comprimidos en disco lleva a menos operaciones necesitadas de E/S para recuperar o almacenar la misma cantidad de datos (en comparación con el conjunto de datos sin compresión). Por lo tanto, para cargas de trabajo de disco ligadas a E/S (por ejemplo, cuando el sistema está inactivo o esperando por datos a ser accedidos desde el disco), el tiempo de procesamiento de consulta puede ser mejorado notablemente. Además, DB2 procesa los datos en almacenamiento intermedio en la memoria bajo su forma comprimida, por lo que reduce la cantidad de memoria consumida en comparación a los datos no comprimidos. Esto tiene el efecto de inmediatamente incrementar la cantidad de memoria disponible para la base de datos sin tener que incrementar la capacidad de memoria física. Esto puede mejorar más el rendimiento de la base de datos para consultas y otras operaciones.

La compresión puede ser deshabilitada cuando las tablas son creadas usando la opción COMPRESS YES. De manera alternativa, el administrador puede habilitar la compresión de una tabla T existente al ejecutar el SQL ALTER TABLE T COMPRESS YES. Usted puede encontrar detalles adicionales acerca del uso del dispositivo de compresión de datos en el artículo de developerWorks Optimice el almacenamiento con compresión profunda en DB2 10.

¿Cómo afecta el dispositivo de compresión al consumo de energía para una carga de trabajo dada? Con el fin de responder esta pregunta hemos analizado el consumo total de energía del software cuando procesa una carga de trabajo específica en dos diferentes escenarios:

  • Sin el dispositivo de compresión de datos
  • Con el dispositivo adaptativo de compresión de datos

Hemos descubierto que el dispositivo de compresión incrementa el consumo promedio de energía por unidad de tiempo, pero disminuye el consumo promedio por estado de cuenta debido a una reducción significativa del tempo de ejecución. Para nuestra carga de trabajo bajo estudio, esto generó una reducción del 34% de consumo de energía por unidad de trabajo. Los detalles del estudio se dan abajo.

Establecimiento de descripción de carga de trabajo y estudio de caso

Para nuestro estudio de caso medimos los efectos de dos acciones en la cantidad de recursos (tiempo y electricidad) que se necesitan para completar una determinada carga de trabajo:

  • Sin usar ninguna compresión de datos
  • Usando compresión adaptativa de datos

Nuestra carga de trabajo de referencia es el estándar TPC-H. Este es creado por el Consejo de Desempeño de Procesamiento de Transacciones y se usa como el estándar de la industria para medir el rendimiento de las bases de datos. La carga de trabajo consiste de un conjunto de consultas ad-hoc orientadas hacia negocios. La base de datos ha sido diseñada para tener una relevancia amplia en toda la industria. Vea el documento de especificaciones TPC-H para obtener más detalles.

Al usar las herramientas proporcionadas con la carga de trabajo, hemos poblado la base de datos con 1GB de datos en crudo y generamos 240 consultas distintas asociadas con este conjunto de datos. Las consultas fueron ejecutadas secuencialmente por aproximadamente dos horas de una manera circular en una laptop Lenovo ThinkPad T60 con 3GB de RAM. Fue seleccionado un intervalo de dos horas para reducir los errores de medición asociados con una baja precisión (0.01kWh) del medidor de energía (UPM EM100). Nota: Algunas de las declaraciones consumen una cantidad significativa de tiempo. Por ejemplo, una consulta que inició a las 1:59 puede tomar 5 minutos, terminando a las 2:04.

Contamos el número de declaraciones ejecutadas en un intervalo de tiempo dado y medimos la cantidad de energía consumida por DB2 ejecutándose en las dos configuraciones: sin compresión y con compresión adaptativa.

La carga de trabajo fue ejecutada contra cada configuración tres veces para estimar el error de medición (expresado usando un error estándar relativo). Nota: El error estándar relativo se calcula como el estimado de la muestra de la desviación estándar de la población (en este caso 3 ejecuciones de carga de trabajo) dividido por la raíz cuadrada del tamaño de la muestra y por la media de la población.


Resultados de referencia

La Tabla 1 muestra los resultados de medición. Primero, veamos el tiempo de ejecución promedio por declaración. La configuración más lenta de la base de datos es, como se esperaba, la que tiene el dispositivo de compresión deshabilitado. Tratamos esta configuración como el origen. La compresión de datos reduce el tamaño de las tablas en un 61% y lleva a una mejora de rendimiento del 97% en comparación con la configuración de referencia.

El dispositivo de compresión incrementa el consumo general de energía en un 29% (en comparación con la configuración de referencia). Sin embargo, el consumo de energía por unidad de trabajo se reduce en 34%, debido al incremento en rendimiento de consulta.

Con base en estos datos, concluimos que al habilitar la compresión adaptativa de datos se obtiene un efecto mezclado de consumo de energía: el consumo por unidad de tiempo se eleva, pero el consumo por unidad de trabajo disminuye. Teóricamente, si el tamaño de la carga de trabajo es fijo, el hardware es dedicado solo a esta carga de trabajo, el rendimiento de esta carga de trabajo no es crítico, y los ahorros de espacio son irrelevantes, puede ser benéfico el ejecutar consultas contra la versión no comprimida de la base de datos. Estos requerimientos raramente se cumplen en la práctica: las cargas de trabajo se escalan hacia arriba, el hardware es compartido entre múltiples tareas (especialmente en los entornos virtualizados o de cómputo de nube) y el ahorro de espacio es crítico.

Tabla 1. Características de la carga de trabajo y de la base de datos con y sin compresión adaptativa (± denota error estándar relativo)
Dispositivo de base de datosConteo promedio de estado por horaConsumo promedio de electricidad (kWh)Consumo de espacio (MB)Encabezado 2Relación de compresión (ver nota 1 abajo)Watts por estado por segundo (ver nota 2 abajo)
Sin compresión415 ± 1,8%0,035 ± 0,5%1168,2100%302
Compresión adaptativa814 ± 4,0%0,045 ± 0,0%455,661%199

Nota 1: La relación de compresión se define como 1 – tamaño comprimido / tamaño no comprimido.

Nota 2: Esta métrica es equivalente a la métrica TPC “rendimiento de desempeño por energía” medida en Watts por transacción por segundo (W/tps) y se calcula como “Consumo de energía” / “Trabajo completado”. Vea Especificación de Energía TPC para obtener más detalles.


Amenazas a la validez

Este estudio de caso muestra que el método puede ser aplicado exitosamente a un conjunto de datos particular. Después del paradigma del caso ‘‘representativo’’ o ‘‘típico’’, esto sugiere que el mismo abordaje puede ser extrapolado hacia otros productos.

Nuestro sistema de prueba no está diseñado para su uso en entorno de producción. Es una laptop (ajustada para minimizar el consumo de electricidad, sacrificando eficacia) con un sistema operativo del tipo para consumidor. Sin embargo, creemos que los resultados pueden ser extrapolados hacia un sistema de producción, ya que la compresión de datos es agnóstica con relación al sistema.

La cantidad de ahorros para el sistema de producción variará con la configuración del sistema y con la carga de trabajo asociada. Los ahorros pueden ser más acentuados para un sistema grande. Por ejemplo, si un sistema no comprimido requiere 100 discos duros para almacenar los datos y uno comprimido requiere 50, entonces usted puede inmediatamente ahorrar 50% de la energía consumida por su sistema de almacenamiento, apagando los discos duros sin usar.


Resumen

Nuestro estudio de caso muestra que, en adición a ahorro en espacio y mejora en rendimiento, el dispositivo de compresión adaptativa de DB2 puede reducir el consumo de energía por unidad de trabajo. Esto lleva a la reducción de costo de mantenimiento y hace que su base de datos sea "más verde".

Recursos

Aprender

Obtener los productos y tecnologías

Comentar

Comentarios

developerWorks: Ingrese

Los campos obligatorios están marcados con un asterisco (*).


¿Necesita un IBM ID?
¿Olvidó su IBM ID?


¿Olvidó su Password?
Cambie su Password

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


La primera vez que inicie sesión en developerWorks, se creará un perfil para usted. La información en su propio perfil (nombre, país/región y nombre de la empresa) se muestra al público y acompañará a cualquier contenido que publique, a menos que opte por la opción de ocultar el nombre de su empresa. Puede actualizar su cuenta de IBM en cualquier momento.

Toda la información enviada es segura.

Elija su nombre para mostrar



La primera vez que inicia sesión en developerWorks se crea un perfil para usted, teniendo que elegir un nombre para mostrar en el mismo. Este nombre acompañará el contenido que usted publique en developerWorks.

Por favor elija un nombre de 3 - 31 caracteres. Su nombre de usuario debe ser único en la comunidad developerWorks y debe ser distinto a su dirección de email por motivos de privacidad.

Los campos obligatorios están marcados con un asterisco (*).

(Por favor elija un nombre de 3 - 31 caracteres.)

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


Toda la información enviada es segura.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=90
Zone=Information mgmt
ArticleID=929555
ArticleTitle=Ahorre energía con el dispositivo de compresión de datos de DB2 10.1 para Linux, UNIX y Windows
publish-date=05132013