Les projets Crypto AI devraient acheter des puces correspondant à la totalité de leur capitalisation boursière pour répondre à leurs ambitions
Soutenir l’économie des créateurs avec des vidéos générées par l’IA nécessitera plus de GPU que toutes les grandes entreprises technologiques n’en utilisent.
- La possibilité de générer du texte en vidéo excite le marché de la Crypto , et les jetons d'IA ont augmenté lorsque OpenAI a dévoilé pour la première fois une démo de Sora.
- Mais pour que cela se généralise, la puissance de calcul sera stupéfiante. Il faudra plus de GPU H100 de qualité serveur que ce que Nvidia produit en un an, ou que ce que ses plus gros clients utilisent collectivement dans leurs centres de données.
Combien d’unités de traitement graphique (GPU) seront nécessaires pour généraliser la génération texte-vidéo ? Des centaines de milliers – et plus que ce qui est actuellement utilisé par Microsoft, Meta et Google réunis.
La première démo du générateur texte-vidéo d'OpenAI, Sora, a étonné le monde entier, et ce regain d'intérêt pour les jetons d'intelligence artificielle (IA), dont beaucoup ont augmenté à la suite de la démo.
Dans les semaines qui ont suivi, de nombreux projets de Crypto IA ont vu le jour, promettant également de générer du texte en vidéo et du texte en image, et la catégorie des jetons d'IA a désormais une capitalisation boursière de 25 milliards de dollars selon les données de CoinGecko.
Derrière la promesse des vidéos générées par l'IA se cachent des armées d'unités de traitement graphique (GPU), des processeurs comme Nvidia et AMD, qui rendent la révolution de l'IA possible grâce à leur capacité à calculer de grands volumes de données.
Mais combien de GPU faudra-t-il pour faire de la vidéo générée par l’IA une activité grand public ? Plus que ce que les grandes entreprises technologiques avaient dans leur arsenal en 2023.
Une armée de 720 000 GPU Nvidia H100
Un récent rapport de recherche de Factorial Funds estime que 720 000 GPU Nvidia H100 haut de gamme sont nécessaires pour soutenir la communauté des créateurs de TikTok et YouTube.
Sora, écrit Factorial Funds, nécessite jusqu'à 10 500 GPU puissants pendant un mois pour s'entraîner et ne peut générer qu'environ 5 minutes de vidéo par heure et par GPU pour l'inférence.
Comme le montre le graphique ci-dessus, cette formation nécessite beaucoup plus de puissance de calcul que GPT4 ou la génération d'images fixes.
Avec une adoption généralisée, l’inférence dépassera la formation à l’utilisation du calcul. Cela signifie qu'à mesure que de plus en plus de personnes et d'entreprises commenceront à utiliser des modèles d'IA comme Sora pour générer des vidéos, la puissance informatique nécessaire pour créer de nouvelles vidéos (inférence) deviendra supérieure à la puissance nécessaire pour entraîner initialement le modèle d'IA.
Pour mettre les choses en perspective, Nvidia a expédié 550 000 GPU H100 en 2023.
Les données de Statista montrent que les douze plus gros clients utilisant les GPU H100 de Nvidia possèdent collectivement 650 000 cartes, et les deux plus grands, Meta et Microsoft, en possèdent 300 000 à eux deux.
En supposant un coût de 30 000 dollars par carte, il faudrait 21,6 milliards de dollars pour concrétiser les rêves de Sora en matière de texte-vidéo généré par l'IA, ce qui représente actuellement la quasi -totalité de la capitalisation boursière des jetons d'IA .
C'est si vous pouvez acquérir physiquement tous les GPU pour le faire.
Nvidia n'est T le seul jeu en ville
Même si Nvidia est synonyme de révolution de l'IA, il est important de se rappeler que ce n'est pas le seul jeu en ville.
AMD, son éternel rival en matière de puces, fabrique des produits concurrents, et les investisseurs ont également généreusement récompensé l'entreprise, faisant passer son action de 2 dollars à l'automne 2012 à plus de 175 dollars aujourd'hui.
Il existe également d’autres moyens d’externaliser la puissance de calcul vers des batteries de GPU. Render (RNDR) propose un calcul GPU distribué, tout comme Akash Network (AKT). Mais la majorité des GPU sur ces réseaux sont des GPU de jeu de qualité commerciale qui sont nettement moins puissants que le H100 de qualité serveur de Nvidia ou que les concurrents d'AMD.
Quoi qu’il en soit, la promesse de la conversion texte-vidéo, promise par Sora et d’autres protocoles, nécessitera un effort matériel herculéen. Même s'il s'agit d'une prémisse intrigante qui pourrait révolutionner le flux de travail créatif d'Hollywood, ne vous attendez T à ce qu'elle devienne courante de si tôt.
Nous allons avoir besoin de plus de jetons.