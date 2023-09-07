En los negocios, la confianza es su licencia para operar. “Confíe en nosotros” no es un argumento, especialmente cuando se trata de IA. Como una de las primeras empresas en desarrollar IA empresarial, el enfoque de IBM para el desarrollo de la IA se guía por principios básicos basados en compromisos de confianza y transparencia. Los productos IBM watsonx le permiten ir más allá de ser un usuario de IA y convertirse en un creador de valor de la IA. Cuenta con un proceso integral para construir y probar modelos fundacionales e IA generativa (comenzando con la recogida de datos y terminando en puntos de control para el seguimiento responsable de las implementaciones de modelos y aplicaciones) centrado en el gobierno, la evaluación, la mitigación de sesgos y el cumplimiento.

Dado que los modelos Granite estarán disponibles para que los clientes se adapten a sus propias aplicaciones, cada conjunto de datos utilizado en la formación pasa por un proceso definido de revisión de gobierno, riesgo y cumplimiento (GRC). Hemos desarrollado procedimientos de gobierno para incorporar datos en el IBM Data Pile que son coherentes con los principios de ética de la IA de IBM. Abordar los criterios de GRC para los datos abarca todo el ciclo de vida de los datos de entrenamiento. Nuestro objetivo es establecer un vínculo auditable desde un modelo fundacional hasta la versión específica del conjunto de datos sobre la que se entrenó el modelo.

Gran parte de la atención de los medios se ha centrado (con razón) en el riesgo de que la IA generativa produzca output de odio o difamatorio. En IBM sabemos que las empresas no pueden permitirse correr tales riesgos, por lo que nuestros modelos Granite se entrenan con datos examinados por nuestro propio "HAP detector", un modelo de lenguaje entrenado por IBM para detectar y erradicar contenido de odio y profano (de ahí "HAP", por sus siglas en inglés), que se compara con modelos internos y públicos contra una referencia. Después de asignar una puntuación a cada frase en un documento, se ejecutan análisis sobre las oraciones y puntuaciones para explorar la distribución, que determina el porcentaje de oraciones para filtrar.

Además de esto, aplicamos una amplia gama de otras medidas de calidad. Buscamos y eliminamos las duplicaciones que mejoran la calidad del output y utilizamos filtros de calidad de los documentos para eliminar aún más los documentos de baja calidad que no son adecuados para la formación. También implementamos salvaguardias regulares y continuas de protección de datos, incluida la monitorización de sitios web conocidos por piratear materiales o publicar otro tipo de material ofensivo, y evitamos esos sitios web.

Y dado que el panorama de la tecnología de la IA generativa cambia constantemente, nuestro proceso integral evolucionará y mejorará continuamente, lo que proporcionará a las empresas resultados en los que pueden confiar.