La IA ya supera al humano en casi la mitad de 44 profesiones evaluadas

Test GPDval de OpenAI muestra que la IA moderna realiza tareas humanas en múltiples profesiones, avanzando hacia la Inteligencia Artificial General.

OpenAI revela que la inteligencia artificial alcanza o supera al humano en 49% de trabajos de 44 profesiones, acercándose al desarrollo de AGI.

Inteligencia Artificial General y su evolución

Dentro del concepto de Inteligencia Artificial, existe una distinción importante entre los modelos actuales y la Inteligencia Artificial General (AGI). Este tipo de IA, aún hipotético, posee la capacidad de comprender, aprender y aplicar conocimientos en cualquier tarea intelectual que un ser humano pueda realizar. A diferencia de las IA especializadas, que dominan tareas específicas, la AGI promete una versatilidad completa.

Aunque todavía no se ha desarrollado un modelo de AGI funcional, el progreso en investigación y pruebas sugiere que su creación es cuestión de tiempo. Empresas líderes en IA, como OpenAI, trabajan activamente para medir la capacidad de los modelos actuales frente a las habilidades humanas mediante pruebas especializadas.

GPDval: el test que mide el progreso hacia la AGI

OpenAI presentó recientemente GPDval, un examen diseñado para evaluar qué tan cerca está la inteligencia artificial de alcanzar la AGI. El test analiza 44 profesiones distribuidas en nueve sectores, incluyendo farmacéuticos, periodistas, abogados, programadores, asistentes sociales y vendedores. El objetivo es medir la capacidad de las IA para realizar tareas que tradicionalmente requieren inteligencia humana.

Los resultados revelan que, en promedio, la IA ya iguala o supera al humano en un 49% de estas profesiones. Este avance demuestra el impacto creciente de la inteligencia artificial en áreas profesionales diversas y abre debates sobre la automatización, la eficiencia y la sustitución laboral.

Rendimiento de diferentes modelos de IA

Curiosamente, ChatGPT no es el modelo que lidera esta evaluación. La IA más avanzada en este test es Claude, de la empresa Anthropic, seguida por la versión más potente de ChatGPT, Gpt-5-high, que logra ejecutar un 40,6% de las tareas evaluadas. Otros modelos, como Gemini de Google y Grok de X, alcanzan un 24,1% y 23,4%, respectivamente.

Aunque estos datos impresionan, la validez del test aún genera discusión. OpenAI admite que los detalles de las pruebas no se han compartido públicamente, por lo que las cifras deben interpretarse con cautela. No obstante, el test representa un indicador significativo del progreso de la IA hacia su versión general.

Implicaciones y futuro de la IA en el trabajo

El hecho de que la IA pueda igualar o superar la capacidad humana en casi la mitad de las profesiones evaluadas plantea oportunidades y desafíos. Desde la optimización de procesos hasta la transformación del mercado laboral, los sectores productivos deben adaptarse a una realidad donde la colaboración entre humanos y máquinas será clave.

OpenAI asegura que el desarrollo hacia la AGI aún está al 50% de su proceso, lo que indica que el potencial de la inteligencia artificial seguirá aumentando, modificando la forma en que trabajamos, aprendemos y nos relacionamos con la tecnología.

Salir de la versión móvil