El vertiginoso avance de los modelos de lenguaje está marcando un antes y un después en la forma en que concebimos el trabajo y la inteligencia. Un reciente estudio sugiere que estas tecnologías, impulsadas por inteligencia artificial, pronto podrían ejecutar en horas tareas que actualmente requieren semanas de esfuerzo humano. Esta transformación, documentada por la revista IEEE Spectrum, está reformulando sectores enteros y genera interrogantes cruciales sobre el futuro del empleo, la seguridad y la gobernabilidad.
La capacidad de los LLMs se duplica cada siete meses

Una investigación realizada por Model Evaluation & Threat Research (METR), con sede en Berkeley, reveló que la capacidad de los grandes modelos de lenguaje se está duplicando cada siete meses, una cifra que supera incluso las previsiones más optimistas. La científica Megan Kinniment, coautora del estudio, destacó que este crecimiento ha sido más veloz y evidente de lo previsto.
El equipo de METR desarrolló un sistema de evaluación que va más allá de las métricas tradicionales, comparando directamente el rendimiento de los modelos con el desempeño humano en tareas de distintas complejidades. A través de pruebas específicas, se determinó si los modelos eran capaces de alcanzar una tasa de éxito del 50% al enfrentar desafíos similares a los que enfrentan las personas.
Proyecciones hacia 2030 y condiciones necesarias
Si la tendencia actual se mantiene, los modelos de lenguaje podrían resolver en pocas horas tareas que hoy implican más de 160 horas de trabajo humano. No obstante, Kinniment advirtió que estas proyecciones se basan en condiciones ideales, sin tener en cuenta las limitaciones del mundo real, como los cambios en la escala computacional o la fiabilidad del sistema en contextos económicos o industriales.
Para sostener este ritmo acelerado, será indispensable que el hardware continúe evolucionando, el software mejore de forma constante y haya suficiente disponibilidad de datos de entrenamiento. Sin estos elementos, podrían aparecer cuellos de botella tecnológicos o escasez de datos que ralentizarían el desarrollo de los LLMs.
Avances, desafíos y dilemas éticos emergentes
Uno de los aspectos más destacados del estudio es la capacidad creciente de los modelos para adaptarse y corregir errores. Desde la aparición de herramientas como ChatGPT, los sistemas han demostrado mayor flexibilidad estratégica ante fallos. Sin embargo, persisten limitaciones estructurales, como el umbral en la cantidad de tokens que pueden procesar eficazmente.
Para evaluar el rendimiento frente a escenarios impredecibles, METR empleó una escala de 16 puntos de “desorden”. Las pruebas más exigentes llegaron a un nivel 8. Según se detalló, un nivel 16 equivaldría a una operación de espionaje, caracterizada por múltiples restricciones y actores en oposición.
Además, este progreso ha reabierto el debate filosófico sobre la posible conciencia de los modelos. Kinniment explicó que, aunque actualmente operan sin conciencia, no descarta que en el futuro estos sistemas puedan alcanzar niveles de inteligencia comparables a los humanos, lo que plantea interrogantes sobre su eventual autoconciencia.
Monitoreo constante ante un futuro incierto
Ante estos avances, el equipo de METR continuará monitoreando el progreso de los modelos actuales, como el reciente o3 de OpenAI, que superó las expectativas de capacidad. La organización considera esencial informar a la sociedad sobre los riesgos y repercusiones de esta tecnología en áreas clave como la economía, la seguridad y la gobernabilidad.
IEEE Spectrum enfatizó que el seguimiento constante será crucial para anticipar y mitigar posibles impactos negativos, como la automatización masiva de empleos o el debilitamiento de estructuras democráticas en un mundo donde el trabajo humano podría volverse prescindible.
Inserta este artículo con este código HTML:
<a href="https://www.redimin.cl/el-auge-imparable-de-los-llms-como-la-ia-redefine-el-trabajo-humano/">El auge imparable de los LLMs: cómo la IA redefine el trabajo humano</a>