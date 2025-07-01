Hoy en día, la mayor parte de la atención en la IA se centra en los resultados: lo que genera un modelo, qué tan preciso o convincente es, qué tan bien se desempeña en comparación con los puntos de referencia. Pero para Hagerty, la verdadera tensión ética comienza antes, a nivel del modelo fundacional. Esta es la infraestructura en bruto de la IA moderna, la capa base del machine learning entrenado con vastos conjuntos de datos extraídos de la web. Es lo que impulsa a los modelos de lenguaje grandes (LLM) como ChatGPT y Claude.

“La base es donde todo sucede”, me dijo Hagerty. “Eso es lo primero que aprende el sistema, y si está lleno de basura, esa basura no desaparece”.

Estos modelos básicos están diseñados para ser de uso general. Eso es lo que los hace poderosos y peligrosos, dijo Hagerty. Debido a que no se crean teniendo en cuenta tareas o restricciones específicas, tienden a absorber todo, desde estructuras semánticas valiosas hasta lodos tóxicos de Internet. Y una vez entrenados, los modelos son difíciles de auditar. Incluso sus creadores a menudo no pueden decir con certeza qué sabe un modelo o cómo responderá a una instrucción determinada.

Hagerty comparó esto con verter una base de concreto defectuosa para un rascacielos. Si la mezcla es incorrecta desde el principio, es posible que no vea grietas de inmediato. Pero con el tiempo, la estructura se vuelve inestable. En IA, el equivalente es un comportamiento frágil, un sesgo no intencionado o un mal uso catastrófico una vez que se despliega un sistema. Sin una configuración cuidadosa desde el principio, un modelo lleva los riesgos que absorbió durante el entrenamiento a cada aplicación posterior.

No es el único que comparte esta preocupación. Investigadores del Center for Research on Foundation Models (CRFM) de Stanford han advertido repetidamente sobre los riesgos emergentes del entrenamiento a gran escala, incluida la propagación de sesgos, la alucinación del conocimiento, la contaminación de datos y la dificultad de identificar fallas. Estos problemas pueden mitigarse, pero no eliminarse, lo que hace que las decisiones de diseño iniciales, como la curaduría, el filtrado y la gobernanza de los datos, sean más críticas.

Como lo ve Hagerty, una de las mayores barreras éticas para el progreso significativo es la gran vaguedad de lo que las empresas quieren decir cuando se refieren a la "IA". Pregúntele a cinco equipos de productos qué quieren decir con “impulsado por IA” y es probable que obtenga cinco respuestas diferentes. Hagerty considera esta escurridiza definición como uno de los principales fallos éticos de la era actual.

“La mayoría de las veces, cuando la gente dice IA, se refiere a automatización. O un árbol de decisiones. O una declaración si/si no”, dijo.

La falta de claridad en torno a los términos no es un problema académico. Cuando las empresas presentan el software determinista como razonamiento inteligente, los usuarios tienden a confiar en él. Cuando las startups presentan herramientas básicas de búsqueda y filtrado como modelos generativos, los inversionistas invierten dinero en espejismos. Hagerty se refiere a esto como "fuga de publicidad" y lo ve como una fuente creciente de confusión y daño a la reputación.

En industrias reguladas como las finanzas o la atención médica, las consecuencias pueden ser más severas. Si se engaña a un usuario para que piense que un sistema tiene una concientización más profunda de la que tiene, puede delegar decisiones que deberían haber seguido siendo humanas. La línea entre herramienta y agente se difumina, y con ella, la responsabilidad.

Este problema también lleva a un esfuerzo inútil. Hagerty citó una investigación reciente sobre el mal uso de los LLM para el forecasting de series temporales, un método estadístico utilizado para predecir valores futuros basado en datos históricos, una tarea en la que los métodos clásicos siguen siendo más precisos y eficientes. Sin embargo, algunas empresas siguen utilizando los LLM de todos modos, persiguiendo la novedad o señalando la innovación.

“Estamos quemando GPU para obtener malas respuestas”, dijo. “Y lo que es peor, lo llamamos progreso”.

La cuestión ética no es solo la ineficiencia. Es una interpretación errónea. Los equipos crean productos en torno a una tecnología que apenas entienden, agregan marketing que exagera su capacidad y la despliegan a usuarios que no tienen forma de evaluar lo que están usando.