Los expertos dicen que el camino a seguir va más allá de la simple reducción de costes. “Se puede usar IA generativa para mejorar la eficiencia de la codificación; la forma en que se codifica una aplicación puede hacer que su uso requiera mayor o menor intensidad energética. Algunas estimaciones sugieren que se puede reducir el consumo de energía del uso de una aplicación hasta en un 50 % cambiando a un lenguaje de codificación mejor y a un código más eficiente".

Las organizaciones también están utilizando la IA generativa para optimizar los diseños de los centros de datos y mejorar el diseño de los servidores. "Hay varias formas en las que la IA generativa puede contribuir a la eficiencia de sus operaciones y recursos informáticos", afirma Dencik. "Puede ser parte de la solución, en lugar de solo la fuente del problema".

Masood sugiere estrategias adicionales: "Hay formas creativas de abordar estos desafíos, como el enrutamiento LLM o la dirección inteligente de las solicitudes entrantes al modelo de lenguaje de gran tamaño más adecuado en función de factores como la complejidad, el coste y el rendimiento, garantizando una utilización eficiente de los recursos y resultados óptimos". También menciona "reducir el coste de ejecución de los LLM reduciendo su tamaño y haciéndolos más rápidos. El uso de la cuantificación para reducir la memoria necesaria para el modelo y la afinación eficiente para acelerar el entrenamiento implica menores costes de hardware y tiempos de procesamiento más rápidos, lo que hace que estos modelos sean más asequibles de implementar y usar".

La creciente complejidad de los modelos de IA es otro factor que eleva los costes. Dencik recomienda un enfoque estratégico: "No es necesario utilizar modelos de lenguaje de gran tamaño para todo", afirma. "Un modelo pequeño entrenado con datos de alta calidad puede ser más eficiente y lograr los mismos resultados, o mejores, dependiendo de la tarea en cuestión. Seleccionar el modelo adecuado es clave, mientras que reutilizar y ajustar los modelos existentes puede ser mejor que crear modelos nuevos para cada nueva tarea para la que desee utilizar IA”.

Aboga por un enfoque multimodal, multimodelo para la implementación de la IA: "Para ser rentable, debe permitir que su organización avance hacia un uso multimodal, multimodelo de la IA y tener una plataforma que le permita hacerlo dentro de la organización", dice. "Aunque pueda parecer más complejo, es una forma de que su organización aproveche al máximo la IA de la manera más rentable".

Los problemas de sostenibilidad también influyen en el coste total de propiedad de los sistemas de IA. Aunque los costes energéticos pueden estar ocultos en gran medida en los gastos de la nube, en lugar de aparecer directamente en las facturas de servicios públicos, existe una creciente conciencia del impacto medioambiental de la IA generativa. “No se trata solo de un coste económico; es un coste medioambiental asociado al uso de la IA", afirma Dencik. Señala prácticas emergentes como las "operaciones ecológicas", que tienen como objetivo optimizar el uso de la nube para reducir el impacto ambiental.

A medida que las empresas se enfrentan a estos desafíos, aprender a gestionar eficazmente los costes de la informática podría convertirse en un factor clave de diferenciación en el mercado. El informe concluye que "los CEO que mejor gestionen estos costes podrán dirigir su negocio como una máquina de alto rendimiento: reduciendo la resistencia mientras utilizan la última tecnología para superar a la competencia"