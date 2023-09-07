En los negocios, la confianza es su licencia para operar. “Confíe en nosotros” no es un argumento, especialmente cuando se trata de IA. Como una de las primeras empresas en desarrollar IA empresarial, el enfoque de IBM para el desarrollo de IA se guía por principios básicos basados en compromisos de confianza y transparencia. Los productos IBM watsonx le permiten ir más allá de ser un usuario de IA y convertirse en un creador de valor de IA. Cuenta con un proceso integral para construir y probar modelos fundacionales e IA generativa—comenzando con la recogida de datos y terminando en puntos de control para el seguimiento responsable de los despliegues de modelos y aplicaciones—centrado en la gobernanza, evaluación, mitigación de sesgos y cumplimiento.

Dado que los modelos Granite estarán disponibles para que los clientes se adapten a sus propias aplicaciones, cada conjunto de datos que se utiliza en el entrenamiento se somete a un proceso definido de revisión de gobernanza, riesgo y cumplimiento (GRC). Hemos desarrollado procedimientos de gobernanza para incorporar datos en IBM Data Pile que son coherentes con los principios de ética de IA de IBM. Abordar los criterios de GRC para los datos abarca todo el ciclo de vida de los datos de entrenamiento. Nuestro objetivo es establecer un enlace auditable desde un modelo fundacional entrenado hasta la versión específica del conjunto de datos en la que se entrenó el modelo.

Gran parte de la atención de los medios se ha centrado (con razón) en el riesgo de que la IA generativa produzca resultados de odio o difamatorios. En IBM sabemos que las empresas no pueden permitirse el lujo de asumir tales riesgos, por lo que nuestros modelos Granite se entrenan con datos analizados por nuestro propio detector de HAP, un modelo de lenguaje entrenado por IBM para detectar y eliminar contenido de odio y profano (de ahí “HAP”), que se compara con modelos internos y públicos. Después de asignar un puntaje a cada oración en un documento, se ejecutan analytics sobre las oraciones y puntajes para explorar la distribución, lo que determina el porcentaje de oraciones para filtrar.

Además de esto, aplicamos una amplia gama de otras medidas de calidad. Buscamos y eliminamos la duplicación que mejora la calidad de los resultados y utilizamos filtros de calidad de documentos para eliminar aún más los documentos de baja calidad que no son adecuados para el entrenamiento. También desplegamos salvaguardas de protección de datos periódicas y continuas, incluida la supervisión de sitios web conocidos por piratear materiales o publicar otro material ofensivo, y evitar esos sitios web.

Y debido a que el ámbito de la tecnología de IA generativa cambia constantemente, nuestro proceso de extremo a extremo evolucionará y mejorará continuamente, dando a las empresas Resultados en los que pueden confiar.