Alibaba Presenta Nuevos Modelos Qwen3 para Codificación y Traducción

Alibaba Presenta Nuevos Modelos Qwen3 para Codificación y Traducción

Alibaba Presenta Nuevos Modelos Qwen3 para Programación, Razonamiento Complejo y Traducción Automática

Alibaba ha revelado recientemente su última serie de modelos Qwen3, que incluye el Qwen3-Coder, Qwen3-235B y Qwen-MT, marcando un avance significativo en las capacidades de la inteligencia artificial de código abierto en áreas críticas como la programación, el razonamiento complejo y la traducción automática. Esta iniciativa refuerza el compromiso continuo de Alibaba con la comunidad de código abierto y su ambición de expandir los límites de la innovación en IA.

Qwen3-Coder: El Modelo de IA para Programación Más Avanzado de Alibaba

El **Qwen3-Coder** se destaca como el modelo de IA más avanzado para programación, diseñado para revolucionar el desarrollo de software. Su arquitectura se basa en un enfoque de Mixture-of-Expert (MOE), permitiendo que el modelo active solo una parte de sus 480 mil millones de parámetros por token, optimizando así su rendimiento en tareas complejas. Este modelo no solo genera código, sino que también gestiona complejas tuberías de desarrollo y depura bases de código enteras.

  • Arquitectura MOE: activa solo 35 mil millones de parámetros por token.
  • Ventana de contexto de 256K tokens, extensible hasta 1 millón.
  • Entrenamiento con técnicas innovadoras, incluyendo el aprendizaje por refuerzo a largo plazo.

Además, Alibaba ha lanzado Qwen Code, una herramienta de interfaz de línea de comandos (CLI) de código abierto que permite a los desarrolladores delegar tareas de ingeniería a la IA mediante lenguaje natural, convirtiéndose en un recurso esencial para los desarrolladores a nivel global.

Qwen3-235B: Un Modelo Abierto para Razonamiento Complejo

El **Qwen3-235B** también ha sido introducido como un modelo de razonamiento avanzado que exhibe una comprensión de contexto ampliada de 256K, mejorando significativamente su rendimiento en tareas de razonamiento lógico, matemáticas y ciencias. Este modelo es capaz de generar resultados competitivos en tareas académicas que normalmente requieren la experiencia humana.

  • Mejora en la capacidad de razonamiento lógico y científico.
  • Resultados de vanguardia en comparación con modelos cerrados de referencia.
  • Disponibilidad en plataformas como Hugging Face y GitHub.

Recientemente, se lanzó una versión no pensante, el Qwen3-235B-A22B-Instruct-2507-FP8, que presenta mejoras sustanciales en la cobertura de conocimientos y alineación con las preferencias del usuario.

Qwen-MT: Modelo de Traducción Automática Mejorado

Por último, Alibaba ha presentado el **Qwen-MT**, la última iteración de su modelo de traducción automática, que ahora soporta 92 idiomas. Este modelo se basa en técnicas avanzadas de aprendizaje por refuerzo, lo que le permite lograr un notable aumento en la precisión y fluidez de las traducciones, así como en la coherencia contextual.

  • Soporte para 92 idiomas oficiales y dialectos prominentes.
  • Arquitectura MOE ligera para una alta capacidad de traducción y reducción de costos.
  • Optimización de rendimiento para escenarios de traducción críticos y específicos de dominio.

Con el lanzamiento de estos modelos, Alibaba reitera su liderazgo en la innovación de IA de código abierto, habiendo creado más de 140,000 modelos derivados. La serie Qwen, que incluye 300 modelos, se ha convertido en una de las más adoptadas a nivel global, empoderando a desarrolladores, investigadores y empresas para construir aplicaciones inteligentes y enfrentar los desafíos de comunicación multilingüe de manera más eficiente e inclusiva.

Este artículo fue publicado originalmente en Alizila por Crystal Liu. Puedes leerlo completo aquí.

Deja una respuesta