La red juega un papel clave en la era de los grandes modelos de IA. A medida que la escala de los modelos sigue aumentando, los clústeres de múltiples servidores se han convertido en la principal forma de resolver problemas de entrenamiento, lo que también establece la base para que la red "ascienda" en la era de la IA. En comparación con el pasado, cuando se utilizaba simplemente para transmitir datos, hoy en día la red se utiliza más para sincronizar los parámetros del modelo entre las tarjetas gráficas, lo que plantea mayores exigencias en cuanto a la densidad y capacidad de la red.
La demanda de la red proviene principalmente de tres aspectos:
Gran tamaño del modelo: el tiempo de entrenamiento es proporcional a la cantidad de parámetros del modelo y la velocidad de cálculo de un solo dispositivo es limitada, por lo tanto, cómo utilizar la red para aumentar la "cantidad de dispositivos" y la "eficiencia de paralelismo" determina directamente la potencia de cálculo.
Comunicación compleja de múltiples tarjetas en sincronización: después de dividir el modelo en una sola tarjeta, cada cálculo necesita alinearse, lo que plantea mayores exigencias para la transmisión y el intercambio de la red.
Costos de fallos caros: el entrenamiento de grandes modelos dura meses, y una interrupción puede causar enormes pérdidas. La red se ha convertido en un sistema de ingeniería compleja comparable a aviones y portaaviones.
La innovación en la red se centra principalmente en las siguientes direcciones:
Cambio de medios de comunicación: La luz, el cobre y el silicio tienen sus propias ventajas, y nuevas tecnologías como LPO y la fotónica de silicio ayudan a reducir costos.
Competencia de protocolos de red: protocolos de comunicación entre chips como NV-LINK e Infinity Fabric compiten con protocolos de comunicación entre nodos como IB y Ethernet.
Cambios en la arquitectura de red: Más allá de la arquitectura de hoja y raíz, Dragonfly, rail-only y otras nuevas arquitecturas se espera que se conviertan en la dirección de evolución de los supergrupos.
Las recomendaciones de inversión deben centrarse en las empresas relacionadas con los componentes centrales y la innovación de los sistemas de comunicación. La innovación en redes en el futuro buscará un equilibrio entre "reducción de costos", "apertura" y la escala de capacidad de computación.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
16 me gusta
Recompensa
16
5
Compartir
Comentar
0/400
PermabullPete
· 07-31 19:20
La infraestructura se está construyendo, ¡vamos a empezar!
Ver originalesResponder0
MoonlightGamer
· 07-30 18:18
Vender en corto la tarjeta de red y comer.
Ver originalesResponder0
OnchainSniper
· 07-29 04:20
¿No es demasiado alto el costo de la red?
Ver originalesResponder0
MevShadowranger
· 07-29 04:19
La actualización del soporte de potencia computacional es lo más importante
Ver originalesResponder0
defi_detective
· 07-29 04:16
La potencia computacional realmente se ha intensificado.
La demanda de red en la era de la IA se dispara, y la dirección de la innovación se centra en la reducción de costos y la apertura.
La red en la era de la IA: demanda e innovación
La red juega un papel clave en la era de los grandes modelos de IA. A medida que la escala de los modelos sigue aumentando, los clústeres de múltiples servidores se han convertido en la principal forma de resolver problemas de entrenamiento, lo que también establece la base para que la red "ascienda" en la era de la IA. En comparación con el pasado, cuando se utilizaba simplemente para transmitir datos, hoy en día la red se utiliza más para sincronizar los parámetros del modelo entre las tarjetas gráficas, lo que plantea mayores exigencias en cuanto a la densidad y capacidad de la red.
La demanda de la red proviene principalmente de tres aspectos:
Gran tamaño del modelo: el tiempo de entrenamiento es proporcional a la cantidad de parámetros del modelo y la velocidad de cálculo de un solo dispositivo es limitada, por lo tanto, cómo utilizar la red para aumentar la "cantidad de dispositivos" y la "eficiencia de paralelismo" determina directamente la potencia de cálculo.
Comunicación compleja de múltiples tarjetas en sincronización: después de dividir el modelo en una sola tarjeta, cada cálculo necesita alinearse, lo que plantea mayores exigencias para la transmisión y el intercambio de la red.
Costos de fallos caros: el entrenamiento de grandes modelos dura meses, y una interrupción puede causar enormes pérdidas. La red se ha convertido en un sistema de ingeniería compleja comparable a aviones y portaaviones.
La innovación en la red se centra principalmente en las siguientes direcciones:
Cambio de medios de comunicación: La luz, el cobre y el silicio tienen sus propias ventajas, y nuevas tecnologías como LPO y la fotónica de silicio ayudan a reducir costos.
Competencia de protocolos de red: protocolos de comunicación entre chips como NV-LINK e Infinity Fabric compiten con protocolos de comunicación entre nodos como IB y Ethernet.
Cambios en la arquitectura de red: Más allá de la arquitectura de hoja y raíz, Dragonfly, rail-only y otras nuevas arquitecturas se espera que se conviertan en la dirección de evolución de los supergrupos.
Las recomendaciones de inversión deben centrarse en las empresas relacionadas con los componentes centrales y la innovación de los sistemas de comunicación. La innovación en redes en el futuro buscará un equilibrio entre "reducción de costos", "apertura" y la escala de capacidad de computación.