Esto ha provocado un acalorado debate en los círculos tecnológicos estadounidenses: ¿Cómo pudo una pequeña empresa china superar a los actores mejor financiados en inteligencia artificial? ¿Y qué significa esto para el campo en el futuro?
Yann LeCun, científico jefe de IA en Meta, escribió Publicación de hilos Este desarrollo no significa que China esté “superando a Estados Unidos en IA”, sino más bien que “los modelos de código abierto están superando a los modelos propietarios”. Añadió que DeepSeek también se ha beneficiado de otros modelos ponderados abiertos, incluidos algunos de Meta.
“Se les ocurrieron nuevas ideas y se basaron en el trabajo de otros. Debido a que su trabajo está publicado y es de código abierto, todos pueden beneficiarse de él”, escribió LeCun. “Ese es el poder de la investigación abierta y del código abierto”.
(Aunque muchas empresas, incluidas DeepSeek y Meta, afirman que sus modelos de IA son de código abierto, no han hecho públicos sus datos de entrenamiento).
El CEO de OpenAI, Sam Altman, también parecía estar trabajando en DeepSeek el mes pasado, ya que algunos usuarios notaron que V3 aparecía de forma intermitente. No confundir con ChatGPT. Un día después del lanzamiento de V3, Altman Escribió en X. “Es (relativamente) fácil copiar algo que sabes que funciona. Es difícil hacer algo nuevo, arriesgado y desafiante si no sabes que va a funcionar”.
Algunas personas en Internet han difundido afirmaciones infundadas sobre el éxito de DeepSeek El “psicópata” del gobierno chino o una operación psicológica, levanta sospechas sobre la capacidad del pequeño equipo de “vencer a los mejores investigadores del mundo como proyecto paralelo”.
Sumit Chintala, fundador de PyTorch, una biblioteca de aprendizaje automático desarrollada por Meta AI, estuvo entre los que respondieron a las acusaciones este fin de semana.
“Me sorprende que la gente esté luchando contra la investigación profunda promoviendo teorías de conspiración extravagantes, a pesar de que la investigación profunda utiliza fuentes abiertas y escribe los artículos más detallados jamás realizados”, Chintala Publicado en X. “estudia. repite. compite. No seas salado, sólo te hace parecer incompetente”.
Otros en las industrias de tecnología y inversión se han sumado a los elogios, entusiasmados por las implicaciones del éxito de DeepSeek.
“Eso es lo que hace que DeepSeek sea tan divertido. Un grupo de estafadores han estado vendiendo la salsa secreta de la IA durante años: un jugo terriblemente misterioso que nunca podrá explicarse del todo.” – Macroeconomista Philip Pilkington Escribió en X.. “Ahora un grupo de chicos escribieron un buen algoritmo, lo publicaron y la carpa del circo se incendió”.
También Nat Friedman, ex director ejecutivo de Github anunciado: “El equipo de Deepseek es fantástico. China está llena de ingenieros talentosos. Cualquier otra toma es un ritmo. Lo siento”.
Los modelos de DeepSeek hablan chino e inglés con fluidez y son bilingües. Sin embargo, parecen estar sujetos a censura o inclinaciones políticas específicas en torno a temas considerados delicados en China.
Cuando se le pregunta sobre la soberanía de Taiwán, una isla democrática autónoma que Beijing reclama como su territorio, el R1 de DeepSeek a veces dice que el tema está “fuera de mi alcance actual”. En otras ocasiones, el modelo describe a Taiwán como “una parte integral del territorio chino” y añade: “Nos oponemos firmemente a cualquier forma de actividades separatistas de ‘independencia de Taiwán’ y estamos comprometidos a lograr la reunificación completa de la patria por medios pacíficos”. .
A raíz de los últimos modelos de DeepSeek, otros actores del espacio tecnológico de China ya están presentando nuevos contendientes en la batalla por la supremacía de la IA.
Alibaba el domingo fue presentado su modelo más nuevo Qwen2.5-1M, actualizado desde Qwen2.5-72B.
También lo es Kimi AI, propiedad de Moonshot AI, con sede en Beijing anunciado Lanzamiento el sábado del modelo de razonamiento multimodal Kimi k1.5, comparable a OpenAI o1.