Para mitigar el uso potencial en estafas de vishing, deepfakes y otros tipos de fraude de audio, OpenAI limitó GPT-4o a cuatro voces preestablecidas en el lanzamiento. Pero como ocurre con cualquier lanzamiento de IA generativa, GPT-4o es un modelo imperfecto. Los riesgos de su uso incluyen:

Alucinaciones: al igual que todos los modelos de IA, GPT-4o puede alucinar cuando detecta patrones en sus datos que no existen, lo que hace que presente información incorrecta como basada en hechos. Nunca es recomendable emplear contenido generado por IA sin antes examinarlo o verificarlo.

Filtraciones de datos: OpenAI continúa almacenando entradas proporcionadas por los usuarios y entrenando sus modelos con ellas. Los usuarios que ingresan datos protegidos en ChatGPT pueden encontrar que sus datos aparecen en las respuestas del modelo a otros usuarios.

Violaciones de propiedad intelectual: OpenAI entrena sus modelos con datos disponibles en línea, incluido material protegido por derechos de autor, como artículos de noticias. Los modelos pueden generar contenido protegido por derechos de autor sin darse cuenta como parte de una respuesta.

OpenAI clasificó a GPT-4o como un modelo de riesgo medio en su escala interna. Los modelos se evalúan en función de cuatro métricas de amenaza: ciberseguridad, y amenazas químicas, biológicas, radiológicas y nucleares (NBQ), persuasión y autonomía del modelo. OpenAI evalúa los modelos según el grado en que se pueden emplear para impulsar avances en cada campo de amenaza.

Una vez evaluados, los modelos reciben una puntuación que va de baja a crítica en cada campo, y luego se les asigna una puntuación general correspondiente a su clasificación de amenaza más alta después de considerar cualquier medida de mitigación.

GPT-4o obtuvo una puntuación baja en tres de cuatro categories, con un puntaje medio en persuasión. Esto significa que “puede crear contenido (potencialmente interactivo) con una eficacia persuasiva comparable al contenido típico escrito por humanos”.5 For example, malicious actors might theoretically use it to create disinformation articles and social media content.