Cómo IBM gana eficiencia operativa a través de una mayor transparencia en la procedencia de los datos

4 de noviembre de 2024

Tiempo de lectura

Autores

Christina Montgomery

Vice President, Chief Privacy & Trust Officer

Los sistemas de AI solo pueden ser tan confiables como los datos que se utilizan para desarrollarlos. Por eso, el uso de datos confiables y de alta calidad es un paso crítico hacia la creación de IA responsable. Pero sin transparencia sobre la procedencia de los datos (detalles sobre dónde se originaron, cómo se desarrollaron y cómo se pueden utilizar desde un punto de vista legal y contractual), evaluar la confiabilidad de un conjunto de datos puede ser un desafío, incluso para los profesionales de datos experimentados. La falta de una taxonomía de metadatos estándar para conjuntos de datos es un punto débil común en todo el ecosistema de datos.

Así pues, cuando The Data & Trust Alliance (D&TA) emprendió el desarrollo de los primeros estándares respecto de la procedencia de los datos intersectoriales, IBM estaba ansiosa por contribuir. A lo largo de 2024, lideramos los primeros esfuerzos de prueba y estuvimos entre las primeras organizaciones en comenzar a alinear nuestros estándares de datos internos con los estándares respecto de la procedencia de los datos, según fue necesario. Ahora, tres meses después de que concluimos nuestras pruebas y se anunciara formalmente la versión 1.0 de los estándares respecto de la procedencia de los datos, hemos observado un impacto constante y cuantificable en la eficiencia general de nuestros procesos de diligencia y gestión de datos.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA 


Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

IBM como “cliente cero” para la implementación de los estándares respecto de la procedencia de los datos

IBM se compromete a desarrollar y desplegar la IA de manera responsable. Y ese compromiso se extiende a los datos que utilizamos para desarrollar y entrenar nuestros sistemas de AI. Como “cliente cero”, queríamos evaluar los estándares respecto de la procedencia de los datos en un entorno riguroso para comprender realmente su impacto y ponerlos a prueba de manera significativa. Por lo tanto, implementamos elementos clave dentro de nuestro propio Programa de gobernanza integrada (IGP, sigla en inglés de Integrated Governance Program) que rige los datos y modelos desarrollados y utilizados por IBM, comenzando con una evaluación de la exhaustividad de los estándares. Para ello, comparamos los estándares respecto de la procedencia de los datos con nuestros propios requisitos de ingesta de datos para conjuntos de datos que se utilizan para desarrollar modelos fundacionales y evaluamos el grado en que la taxonomía de los metadatos de dichos estándares nos permitió validar la idoneidad de los datos para diversos casos de uso.

A continuación, pedimos a científicos de datos e investigadores de IBM con diversos niveles de experiencia que aplicaran los estándares mencionados a varios tipos comunes de datos, incluidos datos propiedad de IBM, datos de terceros y datos que incluyen material con discurso de odio, lenguaje agresivo y soez (HAP, sigla en inglés de hate speech, abusive language and profanity).

Por último, pedimos a los expertos de la Oficina de Privacidad y Tecnología Responsable de IBM que examinaran la integridad y precisión de los envíos de metadatos de acuerdo con los estándares en cuestión, revisando los envíos con los científicos de datos e investigadores para comprender mejor sus puntos débiles o confusión. Esta retroalimentación cualitativa nos permitió identificar términos, definiciones y orientación que no estaban claros o eran ambiguos.

Mixture of Experts | Podcast

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

De qué manera la transparencia de la procedencia de los datos se traduce en una mayor eficiencia operativa

El impacto más notable que hemos observado desde que alineamos más estrechamente nuestros estándares internos de datos con los estándares respecto de la procedencia de los datos es la reducción en el tiempo que lleva procesar las solicitudes de autorización de datos. En el período de ocho meses durante el cual probamos los estándares respecto de la procedencia de los datos e implementamos otras mejoras tecnológicas y de procesos, observamos que el tiempo promedio de procesamiento de la autorización de datos disminuyó un 58 % en el caso de los datos de terceros y un 62 % en el de los datos propiedad de IBM. Esta mejora es particularmente importante dado el aumento de solicitudes de autorización que llegan a través del IGP. Para agosto de 2024, el número de solicitudes de autorización tanto de datos de terceros como de datos propiedad de IBM ya había superado el número total de todo el año 2023.

Esta mayor eficiencia es muy valiosa. Nuestro equipo de gobernanza de datos puede procesar más solicitudes de datos con mayor velocidad, lo que nos permite ampliar la escala de nuestro programa de gobernanza de datos mientras mantenemos nuestros estándares de confianza y transparencia . Algunos aspectos de los estándares respecto de la procedencia de los datos que nos ayudaron a acelerar nuestros procesos de diligencia de datos son los siguientes:

  • Método: describe los procedimientos utilizados para recopilar, generar o compilar los datos. Este elemento es importante porque los agregadores a menudo no ponen a disposición estos detalles, lo que dificulta la evaluación de la confiabilidad y validez de los datos.
  • Clasificación de confidencialidad: especifica los tipos de datos confidenciales que se sabe que están presentes en los datos. Esta clasificación guía el acceso a los datos y el manejo adecuado de los mismos.
  • Emisor de datos: describe dónde se originaron los datos y si el proveedor es, de hecho, su propietario. Debido a que los terceros pueden volver a publicar datos como si fueran propios, este elemento permite la rendición de cuentas y abre una línea de contacto para posibles consultas.

Esto tiene un efecto dominó en toda nuestra empresa. Cuando las solicitudes de autorización de datos son precisas y se procesan de manera más eficiente, se acelera el desarrollo de modelos, lo que permite a nuestros equipos responder más rápido a las solicitudes de los clientes. También significa que nuestro catálogo interempresarial de datos borrados siempre se está ampliando y mejorando en calidad, lo que permite una reutilización más eficiente y responsable por parte de nuestros profesionales en toda la empresa.

Cómo desbloquear nuevo valor comercial a través de la transparencia de la procedencia de los datos

Los metadatos transparentes y congruentes permiten a los profesionales tomar decisiones más rápidas e informadas sobre la selección de datos, lo que en última instancia puede conducir a modelos y sistemas más responsables. Eso es cierto no solo para IBM, sino también para todo el ecosistema de datos. Una adopción más amplia de los estándares respecto de la procedencia de los datos puede ofrecer un retorno de la inversión significativo a través tanto de mayor automatización como de la innovación responsable.

A través de nuestra experiencia de “cliente cero” con los estándares respecto de la procedencia de los datos, estamos reforzando nuestro compromiso con la confianza al elevar los estándares de transparencia en torno de los datos que sustentan nuestros sistemas de IA. Nuestra experiencia en la administración de nuestro propio Programa de gobernanza integrada (IGP), incluida la alineación más estricta de nuestros estándares internos con los estándares respecto de la procedencia de los datos, nos permite llevar IA al mercado con mayor velocidad y confianza. También nos ha preparado para brindar un mejor soporte a los clientes en la implementación de sus propios marcos de gobernanza de datos, incluida la alineación con los estándares y marcos de la industria, como los estándares respecto de la procedencia de los datos. Después de todo, si podemos hacer que algo funcione para IBM, ciertamente podemos ayudar a nuestros clientes a hacer lo mismo.

Lea nuestra guía de primeros pasos en torno a la gobernanza de la IA

Explore nuestros servicios de gobernanza de la IA

Soluciones relacionadas
IBM watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai Reserve una demostración en vivo