Publicado: 30 mayo 2024
Colaborador: Michael Goodwin
Un acuerdo de nivel de servicio (SLA) es un contrato entre un proveedor de servicios y un cliente que define el servicio que se proporcionará y el nivel de rendimiento que se esperará. Un SLA también describe cómo se medirá y aprobará el rendimiento, y qué sucede si no se cumplen los niveles de rendimiento.
Los SLA generalmente se forman entre un proveedor y un cliente externo, pero las empresas también los emplean internamente para formalizar acuerdos entre departamentos o equipos.
Los SLA son una parte importante de los contratos de subcontratación y proveedores de tecnología de la información (TI), ya que brindan una visión de extremo a extremo de la relación laboral. Ayudan a garantizar que todos los stakeholders tengan una comprensión precisa del acuerdo de servicio.
Los SLA establecen las expectativas del cliente, responsabilizan a los proveedores y, en última instancia, ayudan a optimizar la experiencia del usuario final. Los SLA sientan las bases para una relación de trabajo más fluida, resolviendo la incertidumbre y los puntos de controversia desde el principio, y ayudan a proteger los intereses de todas las partes involucradas.
Con la IA generativa en el punto de mira, llegó el momento de que las TI, impulsadas por la IA, ocupen el lugar estelar. Esta guía está diseñada para ayudar a las empresas a adaptar, actualizar o incluso replantear su enfoque de la estrategia de TI e IA.
Hay 3 tipos principales de acuerdos de nivel de servicio: a nivel de cliente (a veces, llamados SLA basados en el cliente), a nivel de servicio y SLA multinivel.
Un SLA basado en el cliente es un acuerdo entre un proveedor de servicios y un cliente, ya sea externo o interno. Este acuerdo describe uno o más servicios diferentes que se proporcionarán al cliente. Por ejemplo, este acuerdo podría ser entre un proveedor de servicios en la nube de terceros y una empresa de tecnología que describe las expectativas de rendimiento de las aplicaciones alojadas en la nube.
Un SLA interno es un acuerdo entre dos departamentos, equipos o sitios diferentes dentro de la misma organización. Este acuerdo puede ser entre los equipos de desarrollo y de negocios que describen la cadencia de despliegue y las expectativas generales para una determinada aplicación o producto.
Un SLA de nivel de servicio es un contrato que detalla un servicio definido que se proporciona a varios clientes. Si un proveedor ofrece un producto con el mismo nivel de servicio y soporte independientemente del cliente, puede utilizar un SLA de nivel de servicio.
Por ejemplo, los equipos de gestión de servicios de TI (ITSM) pueden emplear un SLA común para todos los clientes que describa el nivel de servicio que los clientes pueden esperar de su service desk cuando se comuniquen con la empresa para obtener soporte o informar un incidente.
Un SLA multinivel es un acuerdo dividido en distintos niveles para incorporar a más de dos partes, o diferentes niveles de servicio, en el mismo acuerdo. Se podría emplear un SLA multinivel entre una organización y varios proveedores externos, como en un modelo multinube con numerosos proveedores de nube pública. El acuerdo también se puede establecer entre más de dos equipos o departamentos internos.
Una organización que ofrece un producto con diferentes planes de precios o niveles de servicio, como un producto SaaS, por ejemplo, también puede usar un SLA multinivel que describa el nivel de servicio y las expectativas para cada nivel de producto.
Regístrese para obtener la guía sobre observabilidad
Los SLA varían según la empresa, el producto y las necesidades comerciales específicas de cada organización, pero la mayoría de los SLA contienen características similares. Los componentes clave incluyen:
La sección de descripción general presenta el acuerdo y sus características más básicas, como las partes involucradas, un esquema general de los servicios que se prestarán y la fecha de inicio y duración del acuerdo.
Esta sección delinea los servicios específicos que se prestarán y todos los detalles relacionados. Incluirá información sobre la prestación del servicio, los plazos de entrega de los productos, los cronogramas de mantenimiento, las dependencias pertinentes y cualquier otra información relevante. Esta sección debe proporcionar una descripción exhaustiva de todos los factores y circunstancias.
Una sección de stakeholders enumera todas las partes involucradas en el acuerdo, cuáles son sus funciones y responsabilidades y cómo comunicarse con ellas. Un contacto principal a menudo se designa como el contacto de referencia para reportar problemas del usuario final.
Una sección de rendimiento detalla la disponibilidad del servicio y los estándares de rendimiento del servicio acordados, y qué métricas se emplearán para medir el rendimiento. Generalmente, se define dentro de un acuerdo de objetivo de nivel de servicio (SLO) dentro de un SLA que establece un objetivo de rendimiento acordado para un servicio en particular durante un período.
A menudo incluye un flujo de trabajo que describe cómo se recopilará y compartirá la información con los stakeholders. Todas las partes deben considerar cuidadosamente tanto los niveles de rendimiento como las métricas empleadas para medir el rendimiento, ya que son fundamentales para todo el acuerdo.
Esta sección enumera los servicios o aspectos de la capacidad de servicios que están exentos del acuerdo. Esta sección excluye el tiempo de inactividad debido a problemas con el equipo del cliente o factores fuera de control razonable (fuerza mayor). También puede incluir excepciones para el mantenimiento programado, estableciendo que tales ventanas no cuentan para los acuerdos de tiempo de actividad garantizados.
Una sección de seguridad describe los protocolos y estándares de seguridad que mantiene el proveedor y proporciona información sobre cómo el proveedor protege los datos de los clientes. También enumera los acuerdos de confidencialidad (NDA) y las medidas relacionadas con la protección de la información confidencial o la propiedad intelectual.
Esta sección define las sanciones en las que incurrirá cualquiera de las partes en caso de no cumplir con los términos del acuerdo. Detalla los procedimientos de escalamiento, los plazos para las resoluciones y la compensación que se proporcionará en caso de que el proveedor de servicios no cumpla con los términos del SLA. La compensación puede ser financiera, créditos de servicio u otra cosa.
Esta sección también enumera los términos de canje, como la recuperación, una disposición que permite a los proveedores recuperar créditos de servicio al cumplir o superar los niveles de servicio estándar durante un periodo definido.
Una cláusula de indemnización es un componente de los acuerdos de SLA que protege al cliente al trasladar el riesgo del cliente al proveedor de servicios. Una cláusula de indemnización es una disposición en la que el proveedor de servicios se compromete a indemnizar (compensar los daños) al cliente por cualquier costo, pérdida o daño de litigio de terceros que resulte de un incumplimiento de las garantías de servicio.
Dichas disposiciones no siempre están presentes en los acuerdos, en particular en las plantillas estandarizadas de SLA, pero los clientes pueden tratar de agregarlas con la ayuda de un asesor legal.
Las capacidades del proveedor, las cargas de trabajo y los requisitos del cliente evolucionan con el tiempo. En consecuencia, debe haber un proceso establecido y un horario para revisar y repasar los términos acordados y los KPI que se utilizan para medir el rendimiento. Esta revisión permite que el SLA incorpore las características más recientes del producto o servicio del proveedor y aborde las necesidades actuales del cliente.
El acuerdo debe incluir una sección que esboce las circunstancias que permitan la cancelación del contrato de servicio antes de su fecha de vencimiento, y el plazo de notificación requerido por cada parte si se lleva a cabo dicha acción.
El acuerdo será firmado por stakeholders autorizados de cada parte, vinculando a todas las partes involucradas según los términos del acuerdo mientras esté vigente.
Los SLA son los acuerdos realizados entre el proveedor y el cliente que especifican los estándares de servicio acordados. Los KPI son las medidas utilizadas por el proveedor para medir el rendimiento en relación con estos objetivos y permitir que los equipos realicen mejoras continuas. Los KPI están diseñados para simplificar el proceso de evaluación y dar a los equipos una idea precisa de cómo se están desempeñando hacia cualquier objetivo establecido.
Por ejemplo, si una organización hizo ciertas garantías en torno a la ciberseguridad de su oferta, puede realizar un seguimiento de los KPI, como el número de incidentes de seguridad durante un periodo determinado, los intentos de intrusión y las tasas de éxito de los sistemas de detección o prevención de intrusiones, el costo por incidente o la calificación de seguridad del proveedor.
Los objetivos de nivel de servicio (SLO) son una parte de los SLA que establecen líneas de base de rendimiento para un aspecto específico del servicio, como tasas de error, latencia de solicitud o tiempo de actividad. Las métricas de rendimiento y los KPI se emplean para evaluar la calidad del servicio prestado y determinar si el proveedor de servicios cumple con los términos del SLA.
Supervisar las métricas adecuadas es una parte importante del éxito de un SLA. Sin los datos correctos, es difícil saber cómo el acuerdo está sirviendo a cualquiera de las partes. Y el seguimiento de demasiadas métricas puede crear un lío indescifrable. Los diferentes servicios requerirán el seguimiento de diferentes métricas; sin embargo, las métricas comunes de SLA incluyen:
El tiempo de actividad es la cantidad de tiempo que los servicios funcionan correctamente y están disponibles para su uso. Esta métrica generalmente se expresa como un porcentaje durante un periodo, digamos, 99.5 % cada 30 días (3.6 horas de tiempo de inactividad). Los requisitos de tiempo de actividad variarán según el tipo de negocio y el SLA lo reflejará.
Por ejemplo, 3.6 horas de tiempo de inactividad al mes puede ser demasiado para una plataforma de comercio electrónico que hace negocios en todo el mundo. Una empresa de este tipo podría necesitar garantizar más disponibilidad y buscaría un SLA que refleje eso.
Las tasas de error es una medida que realiza un seguimiento de los fallos de producción o servicio y el porcentaje de tiempo que el nivel de servicio de un proveedor de servicios de TI cae por debajo de los objetivos de rendimiento esperados. El acuerdo puede incluir SLO por plazos incumplidos, retrasos en las versiones de funciones o actualizaciones, interacciones negativas con el help desk, tasas de errores de programación, tasas de defectos y otras medidas de calidad técnica.
El tiempo de respuesta establece la cantidad de tiempo aceptable para que un proveedor registre y responda a un problema o solicitud de un cliente.
El tiempo de resolución establece la cantidad de tiempo aceptable para que un problema se resuelva una vez que ha sido registrado por el proveedor.
Esta métrica es el tiempo promedio que se tarda en recuperar un producto, servicio o sistema tras un fallo o interrupción.
Es una medida del porcentaje de clientes cuyo problema es resuelto por el proveedor durante su primera interacción con el servicio al cliente o el bot de chat.
Esta es una métrica clave para los proveedores de atención al cliente u organizaciones que tienen un componente de atención al cliente. Es el porcentaje de clientes que abandonan su consulta de atención al cliente antes de recibir una respuesta del help desk.
Se pueden medir diversas medidas de seguridad (como vulnerabilidades no divulgadas, actualizaciones antivirus o parches de software) para evaluar el compromiso de un proveedor con la seguridad de TI.
Utilizando las métricas y los KPI adecuados, las organizaciones pueden determinar cómo contribuyen los servicios o productos de un proveedor a los objetivos empresariales más amplios. Por ejemplo, una empresa que se encuentra en una transformación digital podría preguntarse: ¿las herramientas de recursos en la nube del proveedor nos están ayudando a controlar nuestros gastos en computación en la nube? El seguimiento de los datos permitirá responder esa pregunta.
Los SLA benefician tanto al proveedor de servicios como al cliente. Los SLA permiten:
Al crear un SLA, las organizaciones tienen la oportunidad de examinar de cerca sus productos, servicios y procesos (y las experiencias de los clientes asociadas con ellos) para determinar qué funciona bien y qué se puede mejorar. Un SLA establece objetivos de rendimiento claros que proporcionan puntos de referencia para medir el rendimiento y el éxito de la experiencia del cliente.
Los SLA aclaran las funciones y responsabilidades de todos los stakeholders, así como los procesos y canales para la resolución de problemas y la gestión de disputas. Esta claridad ayuda a eliminar la confusión y promueve una comunicación clara tanto internamente como con los clientes externos.
Los SLA definen las expectativas en torno a la disponibilidad del servicio, establecen políticas sobre el tiempo de inactividad y establecen procedimientos para la recuperación ante fallas y desastres. Estas medidas permiten minimizar las interrupciones y el tiempo de inactividad inesperado, y resolver rápidamente problemas técnicos e interrupciones del servicio. Una vez implementados los procesos satisfactorios, las organizaciones pueden aprovechar la automatización para mejorar la uniformidad del servicio.
El proceso de SLA ofrece la oportunidad de ser proactivo con la gestión de riesgos. El proceso identifica los riesgos y amenazas potenciales con anticipación y ayuda a los stakeholders de la empresa a desarrollar planes para evitar o mitigar dichos problemas. Las organizaciones pueden mejorar la capacidad de servicios y los tiempos de respuesta, crear planes de contingencia más estables y reforzar su estrategia general de gestión de riesgos.
Democratice la observabilidad con una solución que cualquiera pueda usar para obtener los datos que quiere con el contexto que necesita. Diseñada específicamente para la nube nativa, pero independiente de la tecnología, la plataforma IBM® Instana Observability proporciona de forma automática y continua datos de alta fidelidad (detalle de 1 segundo y rastreos de extremo a extremo) con el contexto de dependencias lógicas y físicas en dispositivos móviles, sitio web, aplicaciones e infraestructura.
En el cambiante escenario digital actual, las operaciones de TI se enfrentan a un reto sin precedentes: el enorme volumen y la complejidad de los datos de aplicaciones. Con la corrección automatizada de incidentes de Instana, puede reducir casi a cero el tiempo de inactividad de las aplicaciones mediante una gestión rápida de los incidentes y una resolución eficaz de los problemas.
Innove más rápido, reduzca los costos operativos y transforme las operaciones de TI (ITOps, por sus siglas en inglés) en un entorno cambiante con una plataforma AIOps que ofrece visibilidad de los datos de rendimiento y las dependencias en todos los entornos.
Explore la práctica de planificar, implementar, administrar y optimizar los servicios de tecnología de la información para satisfacer las necesidades de los usuarios finales y ayudar a las organizaciones a alcanzar sus objetivos comerciales.
Sepa por qué una biblioteca de infraestructura de tecnologías de la información (ITIL) es esencial para su organización y cómo la certificación lo beneficia a usted y a su empresa.
A medida que los paradigmas de arquitectura de software evolucionan de los monolitos a los microservicios, la observabilidad está ayudando a los desarrolladores a responsabilizarse más de sus programas, incluso después de la entrega.
Automatice las tareas de operaciones de TI, acelere la entrega de software y minimice el riesgo de TI con la ingeniería de confiabilidad del sitio.
La IA generativa, a veces llamada gen AI, es inteligencia artificial (IA) que puede crear contenido original, como texto, imágenes, video, audio o código de software, en respuesta a una instrucción o solicitud de un usuario.
Conozca cómo Exavault, una empresa que facilita más de 2000 millones de transferencias de archivos al año a sus clientes, pudo reducir el tiempo medio de resolución (MTTR) en un 56 % gracias a Instana.