Hace unos días la startup china Zhipu AI, conocida también como Z.ai, anunció el lanzamiento de su nuevo modelo de inteligencia artificial de código abierto denominado GLM‑5.2, presentándolo con prestaciones tan impresionantes que parecían acercarlo por primera vez a los mejores modelos cerrados desarrollados por empresas como OpenAI y Anthropic, algo que hasta hace poco se consideraba casi imposible. Cuantos más análisis independientes se realizan sobre esta herramienta, mejores resultados obtiene, lo que hace pensar que podríamos estar ante el inicio de un cambio de tendencia importante en el sector. Z.ai lleva tiempo lanzando versiones sucesivas de su línea GLM, pero esta última es sin duda la más destacada: cuenta con una arquitectura de 744.000 millones de parámetros, de los cuales solo 40.000 permanecen activos en cada consulta, dispone de una ventana de contexto capaz de procesar hasta un millón de tokens y utiliza un nuevo sistema de organización de datos llamado IndexShare/IndexCache. Sus cifras de rendimiento son especialmente llamativas en tareas técnicas: en la prueba más exigente actual, FrontierSWE, superó a GPT‑5.5 y solo quedó ligeramente por debajo de Claude Opus 4.8, resultados que se repitieron en evaluaciones como PostTrainBench o SWE‑Marathon, diseñadas para medir su comportamiento en sesiones de programación muy largas y complejas. Estos datos no provienen solo de la propia compañía, sino que han sido confirmados por Artificial Analysis, una firma independiente de gran prestigio que mantiene un ranking actualizado de modelos; según sus mediciones, GLM‑5.2 alcanza un índice de inteligencia de 51 puntos, superando a herramientas como Gemini 3.5 Flash y otros competidores chinos como Qwen 3.7 Max, MiniMax‑M3 o DeepSeek V4, aunque todavía queda por detrás de GPT‑5.5 (55 puntos), Opus 4.8 (56) y Claude Fable 5 (60). El avance respecto a su versión anterior, GLM‑5.1, es mucho mayor que el registrado entre otros modelos líderes, aunque también tiene puntos débiles: destaca mucho en código, pero es menos fiable en la precisión de sus respuestas que sus rivales principales, si bien ha logrado reducir considerablemente el problema de las alucinaciones.
A su rendimiento hay que sumarle una ventaja decisiva: su coste es muchísimo más bajo que el de las alternativas de gama alta. Mantiene los precios de su versión anterior: 1,4 dólares por cada millón de tokens de entrada y 4,4 dólares por cada millón de tokens de salida, mientras que GPT‑5.5 cuesta 5 y 30 dólares respectivamente, y Opus 4.8 llega a 10 y 50 dólares. Aunque es cierto que consume más tokens por operación que estos dos modelos más eficientes, el gasto final sigue siendo considerablemente inferior. Para confirmarlo en la práctica, se han realizado pruebas directas: como suscriptor de la plataforma desde finales de 2025, se ha podido probar GLM‑5.2 durante varias horas, y aunque no se pueden extraer conclusiones definitivas, se percibe claramente un salto de calidad, especialmente en tareas de programación. Al revisar un proyecto propio de código, el modelo detectó fallos de seguridad y propuso mejoras de forma muy detallada y ordenada. En cambio, en el modo conversacional el resultado es más irregular: aunque mejora respecto a GLM‑5.1, sigue estando por detrás de los modelos más avanzados de Google, OpenAI y sobre todo Anthropic en cuanto a creatividad, redacción y capacidad de razonamiento complejo en temas generales. Además, tiene una característica que se nota al usarlo: tarda más tiempo en responder que otros chatbots, ya que dedica una fase más prolongada al proceso de razonamiento antes de entregar la respuesta final, algo que se puede comprobar directamente al acceder a su plataforma oficial
