Le réseau joue un rôle clé à l'ère des grands modèles d'IA. Avec l'augmentation continue de l'échelle des modèles, les clusters de serveurs multiples sont devenus la principale méthode pour résoudre les problèmes d'entraînement, établissant ainsi les bases d'un réseau "supérieur" à l'ère de l'IA. Contrairement au passé où il était simplement utilisé pour transmettre des données, le réseau est désormais davantage utilisé pour synchroniser les paramètres des modèles entre les cartes graphiques, ce qui impose des exigences plus élevées en termes de densité et de capacité du réseau.
La demande sur Internet provient principalement de trois sources :
Taille massive du modèle : le temps d'entraînement est proportionnel à la quantité de paramètres du modèle, et comme le taux de calcul sur un seul appareil est limité, la manière d'utiliser le réseau pour augmenter le "nombre d'appareils" et "l'efficacité parallèle" détermine directement la puissance de calcul.
Communication complexe de synchronisation multi-cartes : une fois que le modèle est divisé en cartes individuelles, chaque calcul nécessite un alignement, ce qui impose des exigences plus élevées en matière de transmission et d'échange de réseau.
Coût des pannes coûteux : l'entraînement de grands modèles dure des mois, et une interruption peut entraîner d'énormes pertes. Le réseau est devenu un système d'ingénierie complexe comparable à celui des avions et des porte-avions.
L'innovation en matière de réseau se concentre principalement sur les directions suivantes :
Changement de support de communication : la lumière, le cuivre et le silicium ont chacun leurs avantages, et de nouvelles technologies telles que LPO et la photonique sur silicium aident à réduire les coûts.
Compétition des protocoles réseau : les protocoles de communication inter-puces comme NV-LINK et Infinity Fabric rivalisent avec les protocoles de communication entre nœuds comme IB et Ethernet.
Changements de l'architecture réseau : au-delà de l'architecture leaf-spine, des nouvelles architectures comme Dragonfly et rail-only devraient devenir des directions d'évolution pour les super grands clusters.
Les conseils d'investissement devraient se concentrer sur les entreprises liées aux systèmes de communication dans les segments clés et d'innovation. L'innovation réseau à l'avenir cherchera un équilibre entre "réduction des coûts", "ouverture" et l'échelle de la puissance de calcul.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
16 J'aime
Récompense
16
5
Partager
Commentaire
0/400
PermabullPete
· 07-31 19:20
Les infrastructures sont en cours de construction.
Voir l'originalRépondre0
MoonlightGamer
· 07-30 18:18
Vendre à découvert la carte réseau pour manger.
Voir l'originalRépondre0
OnchainSniper
· 07-29 04:20
Le coût du réseau est trop élevé, non ?
Voir l'originalRépondre0
MevShadowranger
· 07-29 04:19
La mise à niveau de la puissance de calcul est la plus importante.
Voir l'originalRépondre0
defi_detective
· 07-29 04:16
La puissance de calcul est vraiment en train de s'intensifier.
La demande de réseau augmente dans l'ère de l'IA, les directions d'innovation se concentrent sur la réduction des coûts et l'ouverture.
Réseau à l'ère de l'IA : Demande et Innovation
Le réseau joue un rôle clé à l'ère des grands modèles d'IA. Avec l'augmentation continue de l'échelle des modèles, les clusters de serveurs multiples sont devenus la principale méthode pour résoudre les problèmes d'entraînement, établissant ainsi les bases d'un réseau "supérieur" à l'ère de l'IA. Contrairement au passé où il était simplement utilisé pour transmettre des données, le réseau est désormais davantage utilisé pour synchroniser les paramètres des modèles entre les cartes graphiques, ce qui impose des exigences plus élevées en termes de densité et de capacité du réseau.
La demande sur Internet provient principalement de trois sources :
Taille massive du modèle : le temps d'entraînement est proportionnel à la quantité de paramètres du modèle, et comme le taux de calcul sur un seul appareil est limité, la manière d'utiliser le réseau pour augmenter le "nombre d'appareils" et "l'efficacité parallèle" détermine directement la puissance de calcul.
Communication complexe de synchronisation multi-cartes : une fois que le modèle est divisé en cartes individuelles, chaque calcul nécessite un alignement, ce qui impose des exigences plus élevées en matière de transmission et d'échange de réseau.
Coût des pannes coûteux : l'entraînement de grands modèles dure des mois, et une interruption peut entraîner d'énormes pertes. Le réseau est devenu un système d'ingénierie complexe comparable à celui des avions et des porte-avions.
L'innovation en matière de réseau se concentre principalement sur les directions suivantes :
Changement de support de communication : la lumière, le cuivre et le silicium ont chacun leurs avantages, et de nouvelles technologies telles que LPO et la photonique sur silicium aident à réduire les coûts.
Compétition des protocoles réseau : les protocoles de communication inter-puces comme NV-LINK et Infinity Fabric rivalisent avec les protocoles de communication entre nœuds comme IB et Ethernet.
Changements de l'architecture réseau : au-delà de l'architecture leaf-spine, des nouvelles architectures comme Dragonfly et rail-only devraient devenir des directions d'évolution pour les super grands clusters.
Les conseils d'investissement devraient se concentrer sur les entreprises liées aux systèmes de communication dans les segments clés et d'innovation. L'innovation réseau à l'avenir cherchera un équilibre entre "réduction des coûts", "ouverture" et l'échelle de la puissance de calcul.