Etiquetas

Cómo IBM gana eficiencia operativa a través de una mayor transparencia en la procedencia de los datos

Dos ingenieros mirando un iPad en una gran sala con una jaula de cristal y máquinas.

Autores

Vice President

Chief Privacy & Trust Officer

Los sistemas de AI solo pueden ser tan confiables como los datos que se utilizan para desarrollarlos. Por eso, el uso de datos confiables y de alta calidad es un paso crítico hacia la creación de IA responsable. Pero sin transparencia sobre la procedencia de los datos (detalles sobre dónde se originaron, cómo se desarrollaron y cómo se pueden utilizar desde un punto de vista legal y contractual), evaluar la confiabilidad de un conjunto de datos puede ser un desafío, incluso para los profesionales de datos experimentados. La falta de una taxonomía de metadatos estándar para conjuntos de datos es un punto débil común en todo el ecosistema de datos.

Así pues, cuando The Data & Trust Alliance (D&TA) emprendió el desarrollo de los primeros estándares respecto de la procedencia de los datos intersectoriales, IBM estaba ansiosa por contribuir. A lo largo de 2024, lideramos los primeros esfuerzos de prueba y estuvimos entre las primeras organizaciones en comenzar a alinear nuestros estándares de datos internos con los estándares respecto de la procedencia de los datos, según fue necesario. Ahora, tres meses después de que concluimos nuestras pruebas y se anunciara formalmente la versión 1.0 de los estándares respecto de la procedencia de los datos, hemos observado un impacto constante y cuantificable en la eficiencia general de nuestros procesos de diligencia y gestión de datos.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think.

IBM como “cliente cero” para la implementación de los estándares respecto de la procedencia de los datos

IBM se compromete a desarrollar y desplegar la IA de manera responsable. Y ese compromiso se extiende a los datos que utilizamos para desarrollar y entrenar nuestros sistemas de AI. Como “cliente cero”, queríamos evaluar los estándares respecto de la procedencia de los datos en un entorno riguroso para comprender realmente su impacto y ponerlos a prueba de manera significativa. Por lo tanto, implementamos elementos clave dentro de nuestro propio Programa de gobernanza integrada (IGP, sigla en inglés de Integrated Governance Program) que rige los datos y modelos desarrollados y utilizados por IBM, comenzando con una evaluación de la exhaustividad de los estándares. Para ello, comparamos los estándares respecto de la procedencia de los datos con nuestros propios requisitos de ingesta de datos para conjuntos de datos que se utilizan para desarrollar modelos fundacionales y evaluamos el grado en que la taxonomía de los metadatos de dichos estándares nos permitió validar la idoneidad de los datos para diversos casos de uso.

A continuación, pedimos a científicos de datos e investigadores de IBM con diversos niveles de experiencia que aplicaran los estándares mencionados a varios tipos comunes de datos, incluidos datos propiedad de IBM, datos de terceros y datos que incluyen material con discurso de odio, lenguaje agresivo y soez (HAP, sigla en inglés de hate speech, abusive language and profanity).

Por último, pedimos a los expertos de la Oficina de Privacidad y Tecnología Responsable de IBM que examinaran la integridad y precisión de los envíos de metadatos de acuerdo con los estándares en cuestión, revisando los envíos con los científicos de datos e investigadores para comprender mejor sus puntos débiles o confusión. Esta retroalimentación cualitativa nos permitió identificar términos, definiciones y orientación que no estaban claros o eran ambiguos.

Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Vea todos los episodios de Mixture of Experts

De qué manera la transparencia de la procedencia de los datos se traduce en una mayor eficiencia operativa

El impacto más notable que hemos observado desde que alineamos más estrechamente nuestros estándares internos de datos con los estándares respecto de la procedencia de los datos es la reducción en el tiempo que lleva procesar las solicitudes de autorización de datos. En el período de ocho meses durante el cual probamos los estándares respecto de la procedencia de los datos e implementamos otras mejoras tecnológicas y de procesos, observamos que el tiempo promedio de procesamiento de la autorización de datos disminuyó un 58 % en el caso de los datos de terceros y un 62 % en el de los datos propiedad de IBM. Esta mejora es particularmente importante dado el aumento de solicitudes de autorización que llegan a través del IGP. Para agosto de 2024, el número de solicitudes de autorización tanto de datos de terceros como de datos propiedad de IBM ya había superado el número total de todo el año 2023.

Esta mayor eficiencia es muy valiosa. Nuestro equipo de gobernanza de datos puede procesar más solicitudes de datos con mayor velocidad, lo que nos permite ampliar la escala de nuestro programa de gobernanza de datos mientras mantenemos nuestros estándares de confianza y transparencia . Algunos aspectos de los estándares respecto de la procedencia de los datos que nos ayudaron a acelerar nuestros procesos de diligencia de datos son los siguientes:

Método: describe los procedimientos utilizados para recopilar, generar o compilar los datos. Este elemento es importante porque los agregadores a menudo no ponen a disposición estos detalles, lo que dificulta la evaluación de la confiabilidad y validez de los datos.
Clasificación de confidencialidad: especifica los tipos de datos confidenciales que se sabe que están presentes en los datos. Esta clasificación guía el acceso a los datos y el manejo adecuado de los mismos.
Emisor de datos: describe dónde se originaron los datos y si el proveedor es, de hecho, su propietario. Debido a que los terceros pueden volver a publicar datos como si fueran propios, este elemento permite la rendición de cuentas y abre una línea de contacto para posibles consultas.

Esto tiene un efecto dominó en toda nuestra empresa. Cuando las solicitudes de autorización de datos son precisas y se procesan de manera más eficiente, se acelera el desarrollo de modelos, lo que permite a nuestros equipos responder más rápido a las solicitudes de los clientes. También significa que nuestro catálogo interempresarial de datos borrados siempre se está ampliando y mejorando en calidad, lo que permite una reutilización más eficiente y responsable por parte de nuestros profesionales en toda la empresa.

Cómo desbloquear nuevo valor comercial a través de la transparencia de la procedencia de los datos

Los metadatos transparentes y congruentes permiten a los profesionales tomar decisiones más rápidas e informadas sobre la selección de datos, lo que en última instancia puede conducir a modelos y sistemas más responsables. Eso es cierto no solo para IBM, sino también para todo el ecosistema de datos. Una adopción más amplia de los estándares respecto de la procedencia de los datos puede ofrecer un retorno de la inversión significativo a través tanto de mayor automatización como de la innovación responsable.

A través de nuestra experiencia de “cliente cero” con los estándares respecto de la procedencia de los datos, estamos reforzando nuestro compromiso con la confianza al elevar los estándares de transparencia en torno de los datos que sustentan nuestros sistemas de IA. Nuestra experiencia en la administración de nuestro propio Programa de gobernanza integrada (IGP), incluida la alineación más estricta de nuestros estándares internos con los estándares respecto de la procedencia de los datos, nos permite llevar IA al mercado con mayor velocidad y confianza. También nos ha preparado para brindar un mejor soporte a los clientes en la implementación de sus propios marcos de gobernanza de datos, incluida la alineación con los estándares y marcos de la industria, como los estándares respecto de la procedencia de los datos. Después de todo, si podemos hacer que algo funcione para IBM, ciertamente podemos ayudar a nuestros clientes a hacer lo mismo.

Lea nuestra guía de primeros pasos en torno a la gobernanza de la IA

Explore nuestros servicios de gobernanza de la IA

Comience a obtener el retorno de la inversión (ROI): una guía práctica para la IA agéntica

Aprenda a escalar la IA agéntica para obtener un ROI medible en toda su empresa. Este playbook describe las principales barreras que limitan el impacto, cómo medir eficazmente el ROI y un marco práctico para impulsar una adopción exitosa en toda la empresa.

Recursos

La empresa en 2030: diseñada para la innovación perpetua

Descubra nuestras cinco predicciones sobre lo que definirá a las empresas más exitosas en 2030 y los pasos que los líderes pueden tomar para obtener una ventaja de IA-first.

Comience a obtener el retorno de la inversión (ROI): una guía práctica para la IA agéntica

Descubra formas de avanzar, escalando con éxito la IA en todo su negocio con resultados reales.

Aumente sus conocimientos sobre IA

Compre una suscripción individual o multiusuario hoy mismo para acceder a nuestro catálogo completo de más de 100 cursos en línea. Amplíe sus habilidades en una amplia gama de nuestros productos a un precio bajo.

De los proyectos de IA a los beneficios: Cómo la IA agéntica puede mantener la rentabilidad financiera

Descubra cómo las organizaciones están pasando de lanzar IA en pilotos Dispar a usarla para impulsar la Transformación en el núcleo.

Explorar IBM Granite

IBM® Granite es una familia de modelos de IA abiertos, de alto rendimiento y confiables, diseñados para empresas y optimizados para escalar sus aplicaciones de IA. Explore opciones en lenguaje, código, series temporales y medidas de seguridad.

Academia de IA de IBM

Dirigido por los principales líderes de opinión de IBM, el plan de estudios está diseñado para ayudar a los líderes empresariales a obtener los conocimientos necesarios para priorizar las inversiones en IA que pueden impulsar el crecimiento.

Desbloquee el poder de la IA generativa y ML

Aprenda a incorporar con confianza la IA generativa y el aprendizaje automático en su negocio.

Cómo prosperar en esta nueva era de la IA con confianza y seguridad

Indague en los tres elementos críticos de una estrategia sólida de IA: crear una ventaja competitiva, escalar la IA en todo el negocio y avanzar en la IA confiable.

Soluciones relacionadas

IBM® watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Explore watsonx.ai

Soluciones de inteligencia artificial

Ponga a trabajar la IA en su negocio con la experiencia en IA líder del sector y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA

Consultoría y servicios de inteligencia artificial (IA)

Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.

Explore los servicios de IA

Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.