Hoy en día, la mayor parte de la atención en el campo de la IA se centra en los resultados: lo que genera un modelo, su precisión o credibilidad, su rendimiento en comparación con los parámetros de referencia. Pero para Hagerty, la verdadera tensión ética comienza antes, en el nivel del modelo fundacional. Se trata de la infraestructura básica de la IA moderna, la capa base del machine learning entrenada con vastos conjuntos de datos recopilados de la web. Es lo que alimenta a los modelos de lenguaje de gran tamaño (LLM), como ChatGPT y Claude.

“La base es donde ocurre todo”, me dijo Hagerty. “Es lo primero que aprende el sistema, y si está lleno de basura, esa basura no desaparece”.

Estos modelos básicos están diseñados para ser de uso general. Eso es lo que los hace tan poderosos y peligrosos, según Hagerty. Al no estar creados pensando en tareas o limitaciones específicas, tienden a absorberlo todo, desde valiosas estructuras semánticas hasta basura tóxica de internet. Y una vez entrenados, los modelos son difíciles de auditar. Incluso sus creadores a menudo no pueden decir con certeza qué sabe un modelo o cómo responderá a una determinada instrucción.

Hagerty comparó esto con verter una base de hormigón defectuosa para un rascacielos. Si la mezcla es incorrecta desde el principio, es posible que no se vean grietas inmediatamente. Pero con el tiempo, la estructura se vuelve inestable. En la IA, el equivalente es un comportamiento frágil, un sesgo no deseado o un uso indebido catastrófico una vez que se implementa el sistema. Sin una configuración cuidadosa desde el principio, un modelo conlleva los riesgos que absorbió durante el entrenamiento en todas las aplicaciones posteriores.

No está solo en esta preocupación. No es el único que comparte esta preocupación. Investigadores del Center for Research on Foundation Models (CRFM) de Stanford han advertido en repetidas ocasiones sobre los riesgos emergentes del entrenamiento a gran escala, entre los que se incluyen la propagación de sesgos, las alucinaciones de conocimiento, la contaminación de datos y la dificultad de identificar fallos. Estos problemas pueden mitigarse, pero no eliminarse, lo que hace que las decisiones de diseño iniciales, como la conservación, el filtrado y el gobierno de los datos, sean aún más críticas.

Según Hagerty, una de las mayores barreras éticas para un progreso significativo es la gran vaguedad de lo que las empresas entienden por “IA”. Si se pregunta a cinco equipos de producto qué entienden por tecnología “con IA”, es probable que se obtengan cinco respuestas diferentes. Hagerty considera que esta ambigüedad en la definición es uno de los principales fallos éticos de la era actual.

“La mayoría de las veces, cuando la gente habla de IA, se refiere a la automatización. O a un árbol de decisión. O a una instrucción if/else”, afirmó.

La falta de claridad en torno a los términos no es una sutileza académica. Cuando las empresas presentan un software determinista como razonamiento inteligente, los usuarios tienden a confiar en él. Cuando las startups promocionan herramientas básicas de búsqueda y filtrado como modelos generativos, los inversores invierten dinero en espejismos. Hagerty se refiere a esto como “fuga de hype” y lo considera una fuente creciente de confusión y daño a la reputación.

En sectores regulados como el financiero o el sanitario, las consecuencias pueden ser más graves. Si se induce a error a un usuario haciéndole creer que un sistema tiene una conciencia más profunda de la que realmente tiene, este puede delegar decisiones que deberían haber seguido siendo humanas. La línea entre herramienta y agente se difumina y, con ella, la responsabilidad.

Este problema también conduce a un esfuerzo inútil. Hagerty citó una investigación reciente sobre el uso indebido de los LLM para la previsión de series temporales, un método estadístico utilizado para predecir valores futuros basándose en datos históricos, una tarea en la que los métodos clásicos siguen siendo más precisos y eficientes. Sin embargo, algunas empresas siguen utilizando los LLM de todos modos, persiguiendo la novedad o señalando la innovación.

“Se están quemando GPU para obtener malas respuestas”, afirmó. “Y lo que es peor, a esto se le llama progreso”.

La cuestión ética no es solo la ineficiencia. Es una tergiversación. Los equipos crean productos basados en una tecnología que apenas comprenden, añaden un marketing que exagera sus capacidades y los implementan para usuarios que no tienen forma de evaluar lo que están utilizando.