DeepSeek sigue generando noticias. Su enfoque se centra en desarrollar soluciones innovadoras que integren la nube y la inteligencia artificial de manera efectiva. Una de sus contribuciones más destacadas es el modelo V3 R1, que representa un avance significativo en sus capacidades. Este modelo ha sido diseñado para optimizar el procesamiento de datos, mejorar la eficiencia y garantizar resultados de alta calidad en diversas aplicaciones.
El modelo V3 R1 fue entrenado utilizando una combinación robusta de datos y algoritmos avanzados, lo que le permite generar resultados más precisos y coherentes. La infraestructura que respalda este modelo incluye potentes procesadores NVIDIA H800 (sobre una infraestructura con 2.800 chips), que han sido fundamentales para el desarrollo de DeepSeek. Estos procesadores están optimizados para realizar cálculos intensivos, lo que permite a DeepSeek manejar grandes volúmenes de información de manera ágil y eficiente. Y ahora hay un nombre propio que está sonando para la ejecución de DeepSeek en la nube: Huawei. La empresa cuenta con chips Ascend aptos para ello, así lo anuncia la propia empresa.
El modelo de lenguaje de DeepSeek utiliza unos chipsets creados por HUAWEI
Huawei, reconocido por su infraestructura de nube robusta y sus innovadores chips Ascend, ha demostrado su capacidad para soportar la ejecución de modelos complejos de IA. A pesar de los desafíos comerciales y restricciones globales, Huawei ha logrado mantener su relevancia en el ámbito de la computación en la nube, proporcionando servicios que facilitan el procesamiento eficiente de datos y el desarrollo de aplicaciones basadas en IA.
Como podemos leer en GSMArena, recientemente el filtrador especializado en IA, Alexander Doria, ha compartido un post en X, en el que afirma que el modelo de lenguaje detrás de DeepSeek, llamado DeepSeek R1, está siendo entrenado usando los chips HUAWEI Ascend 910C.
Los chips Ascend de Huawei han sido diseñados específicamente para satisfacer las exigencias de las aplicaciones de inteligencia artificial. Con un enfoque en el rendimiento y la eficiencia energética, estos chips son ideales para la ejecución de modelos de aprendizaje profundo y procesamiento de lenguaje natural, como los utilizados por DeepSeek. La arquitectura de los chips Ascend permite un procesamiento paralelo y un manejo eficaz de grandes volúmenes de datos, lo que reduce significativamente el tiempo requerido para entrenar y servir modelos de IA.
Un ejemplo práctico de esta sinergia se puede observar en el uso de la nube de Huawei para despliegues a gran escala. Al implementar DeepSeek en esta infraestructura, las empresas pueden aprovechar no solo la potencia de los chips Ascend, sino también la flexibilidad de la nube de Huawei, que permite ajustar recursos en función de la demanda. Esto optimiza los costos operativos y mejora la agilidad en el desarrollo de soluciones de IA. Además, las capacidades de seguridad de la nube de Huawei aseguran que los datos tratados en estos modelos de IA permanezcan protegidos y cumplan con las normativas vigentes. Esto demuestra que no hacen falta tener cientos de miles de las mejores GPU del mercado para competir en el negocio de la IA.
Lo más interesante llega cuando Huawei está desarrollando la próxima generación del Ascend 910C, el Ascend 920C. Este promete ya acercarse al nivel de los chip NVIDIA B200 Blackwell. El mejor chip de IA del mercado. De conseguirlo, ofrecería a toda la industria de China una alternativa nacional con una potencia similar para el entrenamiento de IA.
Desafíos y oportunidades para Huawei tras el veto comercial
Huawei ha enfrentado una serie de desafíos significativos desde que Estados Unidos impuso un veto comercial en su contra. Esta medida ha tenido un impacto profundo en la compañía, lo que le ha llevado a revaluar y modificar su estrategia operativa. Uno de los efectos más notorios ha sido la pérdida de acceso a servicios y aplicaciones esenciales de Google, lo que ha dificultado la capacidad de la empresa para atraer y retener consumidores a nivel global. Además, la restricción en el desarrollo de su tecnología de 5G ha colocado a Huawei en una posición desfavorable en un mercado donde la conectividad de alta velocidad es crucial para el progreso tecnológico.
Otro desafío considerable ha sido la limitación en la fabricación de chips avanzados. La empresa ha tenido que navegar por un entorno complicado que afecta no solo su oferta de smartphones, sino también su plataforma tecnológica más amplia, que incluye servidores y dispositivos interconectados. Sin embargo, ante estas adversidades, Huawei ha sabido adaptarse y explorar nuevas oportunidades. La compañía ha comenzado a enfocar sus esfuerzos en el desarrollo de servidores especialmente diseñados para la inteligencia artificial, utilizando sus propios procesadores Ascend, que han demostrado ser opciones competitivas en el mercado.
Esta estrategia de diversificación no solo permite a Huawei mitigar los efectos adversos del veto comercial, sino que también abre la puerta a nuevas aplicaciones y sinergias, especialmente en el ámbito de la IA y la nube. A medida que Huawei se adentra más en esta área, surgen oportunidades para colaborar con empresas como DeepSeek, que también se benefician de las capacidades avanzadas que brindan los procesadores Ascend. Así, los cambios en la estrategia de Huawei no solo tienen implicaciones para la empresa misma, sino que también pueden reconfigurar el futuro del desarrollo de modelos de inteligencia artificial en un contexto donde la cooperación y la innovación siguen siendo clave.