Nvidia lanzará un nuevo chip de inteligencia artificial (IA) para China a un precio significativamente más bajo que su recientemente restringido modelo H20 y planea comenzar su producción en masa tan pronto como en junio, según fuentes familiarizadas con el asunto.
La GPU, o unidad de procesamiento gráfico, será parte de la última generación de procesadores de IA con arquitectura Blackwell de Nvidia y se espera que tenga un precio entre los US$ 6.500 y US$ 8.000, muy por debajo de los US$10.000 - US$12.000 por los que se vendía el H20, según dos de las fuentes.
El menor precio refleja sus especificaciones más débiles y menores requisitos de fabricación.
Estará basada en la RTX Pro 6000D de Nvidia, un procesador gráfico de clase servidor, y utilizará memoria GDDR7 convencional en lugar de la memoria de alto ancho de banda (HBM) más avanzada, dijeron las dos fuentes.
Agregaron que no usará la tecnología avanzada de empaquetado Chip-on-Wafer-on-Substrate (CoWoS) de Taiwan Semiconductor Manufacturing Co.
El precio, el calendario de producción y los detalles mencionados de este nuevo chip no se habían reportado previamente. Las tres fuentes con las que Reuters habló para este artículo declinaron ser identificadas, ya que no estaban autorizadas a hablar con los medios.
Un portavoz de Nvidia dijo que la empresa todavía estaba evaluando sus opciones “limitadas”. “Hasta que definamos un nuevo diseño de producto y recibamos aprobación del gobierno de EEUU, estamos efectivamente excluidos del mercado de centros de datos de US$ 50.000 millones de China”.
TSMC declinó comentar.
China sigue siendo un mercado enorme para Nvidia, representando el 13% de sus ventas en el último año fiscal. Esta es la tercera vez que Nvidia tiene que adaptar una GPU para la segunda economía más grande del mundo tras las restricciones impuestas por las autoridades estadounidenses, que buscan frenar el desarrollo tecnológico chino.
A pesar de su capacidad de cómputo mucho más limitada en comparación con la H20, se espera que la nueva GPU de Nvidia permita a la compañía mantenerse competitiva, a pesar de la pérdida de una parte sustancial del mercado debido a las restricciones de exportación. Su principal rival en China es Huawei, que produce el chip Ascend 910B.
“Se espera que tecnologías domésticas chinas como Huawei alcancen el rendimiento de versiones degradadas en uno o dos años”, dijo Nori Chiou, experto en semiconductores y director de inversiones de White Oak Capital Partners, con sede en Singapur.
“La ventaja restante de Nvidia radica principalmente en su capacidad para integrar clústeres de IA con su plataforma CUDA”, añadió.
CUDA es la arquitectura de programación de la empresa que los ingenieros utilizan para construir modelos y aplicaciones de IA en sus GPUs. Su amplio uso y el ecosistema construido a su alrededor hacen que los desarrolladores quieran seguir trabajando con Nvidia.
El jefe de investigación tecnológica para Asia en UBS, Nicolas Gaudois, señaló, sin embargo, que una nueva GPU con memoria convencional sería insuficiente para ciertos usos de entrenamiento e inferencia de IA.
Otro chip
La participación de mercado de Nvidia en China se ha desplomado del 95% antes de 2022 —cuando comenzaron las restricciones de exportación de EEUU que afectaron sus productos— al 50% actualmente, dijo el CEO de Nvidia, Jensen Huang, a periodistas en Taipéi la semana pasada.
Huang también advirtió que, si continúan las restricciones, más clientes chinos comprarán chips de Huawei.
Según dos de las fuentes, Nvidia también está desarrollando otro chip con arquitectura Blackwell para China, cuya producción comenzaría tan pronto como en septiembre. Reuters no pudo conocer de inmediato las especificaciones de esa variante.
Tras la prohibición efectiva del H20 en abril, Nvidia consideró inicialmente desarrollar una versión degradada del H20 para China, dijeron fuentes, pero ese plan no resultó.
Huang ha dicho que la arquitectura Hopper anterior de la compañía —que utiliza el H20— ya no puede acomodar más modificaciones bajo las restricciones de exportación actuales de EEUU.
Reuters no pudo determinar el nombre final de la nueva GPU que será lanzada tan pronto como en junio.
La corredora china GF Securities dijo en una nota publicada la semana pasada que probablemente se llamará 6000D o B40, aunque no reveló el precio ni citó fuentes para la información.
La prohibición del H20 obligó a Nvidia a dar de baja US$ 5.500 millones en inventario, y Huang dijo en el pódcast Stratechery la semana pasada que la empresa también tuvo que renunciar a US$ 15.000 millones en ventas.
Las últimas restricciones de exportación introdujeron nuevos límites al ancho de banda de la memoria de las GPUs, una métrica crucial que mide la velocidad de transmisión de datos entre el procesador principal y los chips de memoria. Esta capacidad es particularmente importante para cargas de trabajo de IA que requieren procesamiento extensivo de datos.
El banco de inversión Jefferies estima que las nuevas regulaciones limitan el ancho de banda de la memoria a 1,7 - 1,8 terabytes por segundo. Esto se compara con los 4 terabytes por segundo que puede alcanzar el H20.
GF Securities prevé que la nueva GPU alcanzará aproximadamente 1,7 terabytes por segundo usando la tecnología de memoria GDDR7, justo dentro de los límites del control de exportaciones.