Alibaba Lanza un Modelo de IA que Asegura Superar a DeepSeek-V3



BEIJING (Reuters) - La empresa tecnológica china Alibaba (BABA) presentó el miércoles una nueva versión de su modelo de inteligencia artificial Qwen 2.5, afirmando que supera al aclamado DeepSeek-V3. La elección del primer día del Año Nuevo Lunar para lanzar el Qwen 2.5-Max, un momento en el que la mayoría de los chinos están de vacaciones con sus familias, subraya la presión que el meteórico ascenso de la startup de IA DeepSeek ha ejercido no solo sobre sus rivales internacionales, sino también sobre la competencia local.

"Qwen 2.5-Max supera ... casi en todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B", declaró la unidad de nube de Alibaba en un anuncio publicado en su cuenta oficial de WeChat, refiriéndose a los modelos de IA más avanzados de OpenAI y Meta.

El lanzamiento el 10 de enero del asistente de IA de DeepSeek, impulsado por el modelo DeepSeek-V3, así como el lanzamiento el 20 de enero de su modelo R1, han sorprendido a Silicon Valley y provocado una caída en las acciones tecnológicas, ya que los supuestos bajos costos de desarrollo y uso de la startup china han llevado a los inversores a cuestionar los enormes planes de gasto de las principales empresas de IA en Estados Unidos.

Sin embargo, el éxito de DeepSeek también ha desencadenado una carrera entre sus competidores locales para actualizar sus propios modelos de IA. Dos días después del lanzamiento del DeepSeek-R1, ByteDance, propietario de TikTok, presentó una actualización de su modelo de IA insignia, afirmando que superaba al modelo o1 de OpenAI en AIME, una prueba de referencia que mide la capacidad de los modelos de IA para entender y responder a instrucciones complejas. Esto resonó con la afirmación de DeepSeek de que su modelo R1 competía con el o1 de OpenAI en varios indicadores de rendimiento.

DeepSeek y sus Competidores Locales

El modelo anterior de DeepSeek, el V2, desató una guerra de precios de modelos de IA en China tras su lanzamiento en mayo pasado. Su naturaleza de código abierto y su precio sin precedentes de solo 1 yuan (0.14 dólares) por cada millón de tokens - o unidades de datos procesados por el modelo de IA - llevaron a la unidad de nube de Alibaba a anunciar recortes de precios de hasta el 97% en una variedad de modelos. Otras empresas tecnológicas chinas siguieron su ejemplo, incluyendo a Baidu, que lanzó el primer equivalente de China a ChatGPT en marzo de 2023, y Tencent, la empresa de internet más valiosa del país.

Liang Wenfeng, el enigmático fundador de DeepSeek, declaró en una rara entrevista con el medio chino Waves en julio que la startup "no se preocupaba" por las guerras de precios y que su principal objetivo era alcanzar la AGI (inteligencia general artificial). OpenAI define la AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas económicamente valiosas.

Mientras que grandes empresas tecnológicas chinas como Alibaba cuentan con cientos de miles de empleados, DeepSeek opera como un laboratorio de investigación, compuesto principalmente por jóvenes graduados y estudiantes de doctorado de las mejores universidades chinas. Liang mencionó en su entrevista de julio que creía que las mayores empresas tecnológicas de China podrían no estar bien preparadas para el futuro de la industria de la IA, contrastando sus altos costos y estructuras jerárquicas con la operación ágil y el estilo de gestión flexible de DeepSeek. "Los grandes modelos fundamentales requieren innovación continua; las capacidades de los gigantes tecnológicos tienen sus límites", afirmó.

¡La carrera por la inteligencia artificial se intensifica!

Publicar un comentario

0 Comentarios