I progetti di intelligenza artificiale Cripto dovrebbero acquistare chip del valore dell'intera capitalizzazione di mercato per soddisfare le loro ambizioni
Supportare l’economia dei creatori con video generati dall’intelligenza artificiale richiederà più GPU di quelle utilizzate da tutte le principali aziende tecnologiche.
- La possibilità di generare testo in video entusiasma il mercato Cripto e i token AI sono aumentati quando OpenAI ha presentato per la prima volta una demo di Sora
- Ma per rendere questo mainstream la potenza di calcolo sarà sconcertante. Saranno necessarie più GPU H100 di livello server di quelle che Nvidia produce in un anno o di quelle che i suoi maggiori clienti eseguono collettivamente nei loro data center.
Quante unità di elaborazione grafica (GPU) saranno necessarie per rendere mainstream la generazione da testo a video? Centinaia di migliaia – e più di quelli attualmente utilizzati da Microsoft, Meta e Google messi insieme.
La prima demo del generatore di testo-video di OpenAI, Sora, ha stupito il mondo, e questo rinnovato interesse per i token di Intelligenza Artificiale (AI), con molti in aumento dopo la demo.
Nelle settimane successive sono emersi molti progetti di intelligenza Cripto , promettendo anche di generare testo in video e testo in immagine, e la categoria dei token AI ha ora una capitalizzazione di mercato di 25 miliardi di dollari secondo i dati di CoinGecko.
Dietro la promessa dei video generati dall'intelligenza artificiale ci sono eserciti di unità di elaborazione grafica (GPU), processori del calibro di Nvidia e AMD, che rendono possibile la rivoluzione dell'intelligenza artificiale grazie alla loro capacità di elaborare grandi volumi di dati.
Ma quante GPU saranno necessarie per rendere i video generati dall’intelligenza artificiale una cosa mainstream? Più di quanto le grandi aziende tecnologiche avessero nel loro arsenale nel 2023.
Un esercito di 720.000 GPU Nvidia H100
Un recente rapporto di ricerca di Factorial Funds stima che siano necessarie 720.000 GPU Nvidia H100 di fascia alta per supportare la community di creatori di TikTok e YouTube.
Sora, scrive Factorial Funds, richiede fino a 10.500 potenti GPU per un mese per l'addestramento e può generare solo circa 5 minuti di video all'ora per GPU per l'inferenza.
Come dimostra il grafico sopra, l'addestramento richiede una potenza di calcolo significativamente maggiore rispetto a GPT4 o alla generazione di immagini fisse.
Con un’adozione diffusa, l’inferenza supererà la formazione sull’utilizzo del computer. Ciò significa che man mano che sempre più persone e aziende iniziano a utilizzare modelli di intelligenza artificiale come Sora per generare video, la potenza del computer necessaria per creare nuovi video (inferenza) diventerà maggiore della potenza necessaria per addestrare inizialmente il modello di intelligenza artificiale.
Per mettere le cose in prospettiva, Nvidia ha spedito 550.000 GPU H100 nel 2023.
I dati di Statista mostrano che i dodici maggiori clienti che utilizzano le GPU H100 di Nvidia hanno complessivamente 650.000 schede, mentre i due più grandi, Meta e Microsoft, ne hanno 300.000 in totale.
Supponendo un costo di 30.000 dollari per carta, ci vorrebbero 21,6 miliardi di dollari per realizzare i sogni di Sora di un testo-video generato dall'intelligenza artificiale, che al momento rappresenta quasi l' intera capitalizzazione di mercato dei token AI .
Questo se puoi acquisire fisicamente tutte le GPU per farlo.
Nvidia T è l'unico gioco in città
Sebbene Nvidia sia sinonimo di rivoluzione dell'intelligenza artificiale, è importante ricordare che non è l'unico gioco in circolazione.
Il suo perenne rivale di chip, AMD, produce prodotti concorrenti e gli investitori hanno anche generosamente ricompensato l'azienda, spingendo le sue azioni dalla fascia di 2 dollari dell'autunno del 2012 a oltre 175 dollari di oggi.
Esistono anche altri modi per esternalizzare la potenza di calcolo alle GPU farm. Render (RNDR) offre elaborazione GPU distribuita, così come Akash Network (AKT). Ma la maggior parte delle GPU su queste reti sono GPU da gioco di livello retail che sono significativamente meno potenti della H100 di livello server di Nvidia o della concorrenza di AMD.
Indipendentemente da ciò, la promessa di text-to-video, promessa da Sora e altri protocolli, richiederà un passaggio hardware erculeo. Anche se è una premessa intrigante e potrebbe rivoluzionare il flusso di lavoro creativo di Hollywood, T aspettarti che diventi mainstream in tempi brevi.
Avremo bisogno di più chip.