El entusiasmo por la inteligencia artificial ha dejado de ser una cuestión de ingenio técnico para convertirse en un dolor de cabeza financiero. En los últimos 18 meses, la industria tecnológica ha inyectado USD 50.000 millones en infraestructura computacional para escalar modelos de lenguaje de gran tamaño (LLM). El problema es que, mientras las capacidades de estos sistemas crecen, la rentabilidad de las empresas que los adoptan no sigue el mismo ritmo. El mercado finalmente despertó: la era de subsidiar el consumo de cómputo a cambio de volumen de usuarios ha llegado a su fin.
Muchos directivos han caído en la trampa de aplicar la tecnología más avanzada disponible a problemas que no lo requieren. Usar un modelo de frontera —sistemas de alta complejidad con miles de millones de parámetros— para tareas administrativas simples es el equivalente a intentar clavar un clavo con un martillo de oro. El retorno de inversión (ROI), entendido como el beneficio obtenido frente al capital desembolsado, se vuelve negativo desde el primer trimestre. Esta desconexión entre la potencia del modelo y la utilidad real es el primer síntoma de una mala estrategia financiera.
La ceguera de Wall Street ha priorizado métricas equivocadas. Durante meses, las valoraciones subieron impulsadas por la capacidad de inferencia, que es el proceso donde un modelo ejecuta tareas para dar una respuesta. Sin embargo, nadie se detuvo a calcular el costo marginal de cada token generado. Si una empresa gasta USD 0,05 en generar una respuesta para un cliente que deja un margen neto de apenas USD 0,02, la inteligencia artificial no es una ventaja competitiva, sino un motor de destrucción de valor. La eficiencia operativa ha sido sacrificada en el altar del crecimiento a cualquier precio.
La austeridad como ventaja competitiva
La próxima gran disrupción no vendrá de un nuevo modelo más capaz, sino de aquellas empresas que eliminen la grasa operativa de sus arquitecturas. En mercados como México o Colombia, hemos visto startups de software integrar IA en atención al cliente sin un plan de costos riguroso. El resultado es constante: un aumento en el gasto de infraestructura que devora los márgenes operativos, medidos a través del EBITDA ajustado —las ganancias antes de intereses, impuestos, depreciaciones y amortizaciones, excluyendo gastos extraordinarios—. La verdadera ventaja hoy no es implementar IA en todas partes, sino saber exactamente dónde es rentable apagarla.
Mi lectura es distinta a la de los optimistas ciegos: la madurez llegará cuando los equipos de ingeniería dejen de usar el modelo más grande por inercia. Las compañías que dominen el arte de combinar modelos pequeños y especializados con una capa mínima de inteligencia de frontera serán las que logren sobrevivir a la purga de capital. El uso indiscriminado de modelos costosos es, a estas alturas, la deuda técnica más peligrosa de la década. El costo por usuario activo ha subido un 40% interanual en muchas plataformas, obligando a recortes de personal para compensar el consumo desmedido de servidores.
El fin de la magia técnica
Los inversionistas ya no se dejan deslumbrar por un demo funcional; ahora exigen ver la unidad económica de cada interacción. Si la IA no reduce el costo por transacción de forma medible, el capital se agotará rápidamente. La austeridad no es un retroceso, es la única forma de alcanzar la sostenibilidad necesaria. Quien crea que el financiamiento ilimitado para infraestructura de unidades de procesamiento gráfico (GPU), que son los chips especializados en tareas de inteligencia artificial, continuará vigente, está ignorando la presión de los accionistas por rentabilidad inmediata.
Hay un detalle que importa y que muchos prefieren ignorar: la complejidad técnica es un pasivo, no un activo. Una arquitectura compleja requiere más energía, más mantenimiento y una mayor supervisión ante el riesgo de error. La austeridad obliga a la simplicidad. Aquellas empresas que obliguen a sus desarrolladores a justificar el costo de cada token, en lugar de celebrar la sofisticación del modelo, terminarán con una estructura de costos hasta un 30% más ligera que la de su competencia directa.
Mi predicción es clara: para diciembre de 2025, la mayoría de las empresas que hoy despliegan LLMs de uso general habrá regresado a modelos especializados o soluciones de automatización más austeras. Veremos una purga de proveedores de IA que no puedan demostrar un ahorro directo en el costo operativo de sus clientes. Los ganadores no serán quienes tengan el modelo más inteligente, sino los que tengan la factura de nube más baja por cada unidad de valor generado.