Gemini 2.5 Flash le gana a GPT-4.1 en código y Google llega a 400 millones de usuarios

Modo nerd ON. Google acaba de hacer algo que llevaba meses intentando: plantar cara a OpenAI en su propio terreno y ganar. Y los números están ahí para quien quiera mirarlos.

Te recomendamos

Cuánto paga YouTube de verdad en 2026: el RPM real por nicho y país (sin humo)

El padre del deep learning dice que ChatGPT es un callejón sin salida (y tiene 1.000 millones para demostrarlo)

ChatGPT mete anuncios en el chat: adiós era dorada para millones de usuarios

GPT-5.6 llega con 1,5M de tokens y le para los pies al peloteo de la IA

En el escenario de Google I/O, Sundar Pichai se paseó con la seguridad de quien sabe que tiene algo gordo que enseñar. Detrás suyo, una diapositiva con el número 400 millones. Eso es lo que Gemini tiene ya en usuarios activos. No está mal para un producto que hace año y medio muchos consideraban «el eterno segundo» de la IA.

¿Qué es Gemini 2.5 Flash y por qué importa ahora?

Gemini 2.5 Flash es el modelo «todoterreno» de Google dentro de la familia Gemini 2.5. Es el modelo que Google quiere que uses para casi todo: rápido, barato y listo. El más eficiente de su catálogo, diseñado para velocidad y bajo coste.

Con este lanzamiento han subido el listón bastante. Ha mejorado en razonamiento, multimodalidad, código y contexto largo, usando además un 20-30% menos de tokens. Menos gasto, más resultado. En cristiano: más barato de usar y a la vez más capaz. Gamechanger.

Y aquí viene el dato que ha puesto a la comunidad del software en modo «espera, ¿cómo?»: Gemini 2.5 Pro lidera ya los rankings mundiales WebDev Arena y LMArenalas tablas de clasificación más seguidas por la industria.

Modelo	Terminal-Bench 2.1
Gemini 2.5 Flash	75,2%
GPT-4.1	70,3%

No es una diferencia enorme, pero es una diferencia real, verificada, y en el benchmark de programación que más pesa en la industria.

Para qué sirve de verdad

Flash no es el modelo más potente de Google (ese es el Pro), pero es el que la mayoría de desarrolladores y empresas van a usar en producción. Está diseñado para tareas empresariales de alto volumen. Vamos, el que va a estar metido en miles de productos que usas sin saberlo.

Las tareas para las que está optimizado incluyen:

Resúmenes a gran escala
Aplicaciones de chat
Extracción de datos eficiente

Además, Flash y Pro reciben ahora novedades relevantes de golpe:

Audio nativo para conversaciones más naturales
Salvaguardas de seguridad avanzadas
Control del presupuesto de razonamiento para equilibrar coste y calidad

Literal, puedes decirle al modelo «no te calientes la cabeza» o «piénsatelo bien» y él ajusta cuánto razona antes de responderte, lo que afecta directamente al precio.

Con Gemini 2.5 Flash tienes acceso a una ventana de contexto de 1 millón de tokenspresupuestos de razonamiento controlables y soporte para herramientas nativas como búsqueda con Google, ejecución de código y contexto de URL. Un millón de tokens es, por ponerlo en perspectiva, unas 750.000 palabras. Puedes meterle una novela entera y pedirle que la analice.

Cómo se usa (y qué tienes disponible ya)

Gemini 2.5 Flash ya está disponible para todo el mundo en la app de Gemini. Si eres desarrollador, también está disponible de forma general en Vertex AIla API de Gemini y Google AI Studio. No hay excusa para no probarlo.

Jon Hernández (@jonhernandezia), divulgador de IA que reacciona al lanzamiento en su canal, lleva tiempo siguiendo la evolución de Gemini y en este vídeo pone en contexto lo que este salto significa frente a la competencia.

Los límites (el «pero» obligatorio)

Nada es perfecto, bro. Hay tres matices que conviene tener en mente antes de tirar cohetes.

Primero, los benchmarks son benchmarks: miden escenarios específicos y no siempre se traducen en ventaja real en tu caso de uso concreto. Según la firma de análisis independiente Vals AIGemini 2.5 Flash muestra mejoras notables en Terminal-Bench y GPQA, pero los resultados varían según el tipo de tarea.

Segundo, el historial de Google con productos de IA ha sido irregular: lanzamientos prometedores que luego han tardado en consolidarse.

Tercero, la competencia no está dormida. OpenAIAnthropic y Meta están actualizando sus modelos a un ritmo brutal.

Y hay un dato de precio que conviene conocer:

Concepto	Precio por millón de tokens
Tokens de entrada	0,30 dólares
Tokens de salida	2,50 dólares

No es prohibitivo, pero tampoco es el más barato del mercado en su rango de comparables.

Veredicto claro: ¿merece la pena?

Sí, y sin muchas dudas. Google ha vuelto con algo sólido. Los 400 millones de usuarios no son solo un número bonito para una diapositiva: reflejan que el ecosistema Gemini ha ganado tracción real.

Los benchmarks en coding son verificables y favorables. La mejora en eficiencia de tokens es una noticia muy concreta para cualquiera que pague por una API de IA.

La gran pregunta es si Google va a mantener el ritmo de actualizaciones. Los últimos movimientos de Google reflejan una estrategia clara: mejorar rendimiento y usabilidad a través de actualizaciones continuas basadas en el feedback de desarrolladores, con Flash y Flash-Lite ofreciendo mayor flexibilidad y rendimiento. Si eso se sostiene en el tiempo, el título del vídeo de Jon Hernández empieza a tener mucho sentido: Google is back with a vengeance.