Da Grok 1 a Grok 5: Evoluzione dell'Infrastruttura e dei Modelli di xAI

Autore: Boxu Li

Grok di xAI è rapidamente passato da essere un chatbot all'avanguardia su X a una piattaforma AI di frontiera. Questo approfondimento esamina come l'infrastruttura sottostante e le capacità dei modelli di Grok siano progredite attraverso Grok-1, 2, 3 e 4 – e cosa possiamo aspettarci dal prossimo Grok-5.

Cos'è xAI Grok? Un Rapido Riepilogo

Grok è la famiglia di modelli linguistici di punta (LLM) sviluppata dalla startup di intelligenza artificiale di Elon Musk, xAI. Ha iniziato alla fine del 2023 come chatbot rivolto ai consumatori su X (precedentemente Twitter) con una personalità un po' ribelle e spiritosa. Ciò che ha reso Grok immediatamente distintivo è stata la sua consapevolezza in tempo reale: a differenza della maggior parte dei LLM con dati di addestramento obsoleti, Grok era strettamente integrato con il feed live di X e poteva effettuare ricerche sul web in tempo reale[1]. In pratica, Grok è un ibrido tra un LLM e un agente di dati live: può raccogliere le ultime informazioni dai post di X e dal web, quindi incorporare quei fatti con citazioni nelle sue risposte[1]. Questo bot in stile “Guida galattica per gli autostoppisti” era disposto a rispondere a quasi tutto (anche a domande “piccanti” che altri AI potrebbero rifiutare), il che ha attirato attenzione – e alcune controversie – per il suo approccio senza filtri.

Dietro le quinte, Grok non è un singolo modello ma una famiglia di modelli e strumenti. Inizialmente, xAI ha reso open-source il modello base Grok-1 (una vasta rete con 314 miliardi di parametri) sotto una licenza Apache-2.0, segnalando una strategia insolitamente aperta. Da allora, xAI ha iterato rapidamente: Grok-1.5 ha aggiunto un contesto lungo e visione multimodale, Grok-2 ha migliorato la velocità e il supporto multilingue, Grok-3 ha introdotto modalità di ragionamento esplicite, e Grok-4 (e 4 “Heavy”) si è spinto nel territorio multi-agente con l'uso di strumenti e sub-agenti cooperativi. Grok è ora accessibile tramite il chatbot Grok su X, attraverso l'API di xAI, e persino tramite piattaforme cloud (Oracle Cloud elenca Grok-4 come un'offerta modello di prima classe[2][3]). In breve, Grok è evoluto da un singolo chatbot all'avanguardia a un intero stack AI – uno stack incentrato sulla ricerca della verità, l'integrazione in tempo reale e il ragionamento complesso.

Dentro l'infrastruttura di Grok: Supercomputer Colossus e stack JAX+Rust

Dietro l'interfaccia chiacchierona di Grok si trova uno dei supercomputer AI più potenti al mondo. Colossus – il mega-cluster GPU di xAI a Memphis, Tennessee – è stato costruito per addestrare ed eseguire Grok su scala frontier. Annunciato a metà del 2024 e soprannominato da Musk il “Memphis Supercluster”, Colossus è stato progettato per ospitare fino a 100.000 GPU NVIDIA H100 connesse tramite un'unica rete RDMA ad alta larghezza di banda. Nelle parole di Musk, “È il cluster di addestramento AI più potente al mondo!”. Il data center che ospita Colossus è una struttura da 150 MW che è stata costruita in soli 122 giorni – un risultato così rapido da attirare l'attenzione dei media e persino un video tour di ServeTheHome.

Progettazione Hardware: L'unità base di Colossus è un rack Supermicro a raffreddamento liquido che contiene 8 server, ognuno con 8× GPU NVIDIA H100 (64 GPU per rack). Ogni rack dispone anche di un'unità di distribuzione del refrigerante (CDU) e di switch di rete ad alta velocità, e i rack sono raggruppati in pod di 8 unità (512 GPU) che formano mini-cluster. Questo design omogeneo e modulare facilita la scalabilità e la gestione. Tutti i componenti – GPU, CPU Xeon duali, switch PCIe – sono raffreddati a liquido, essenziale dato il calore generato dall'H100 e il budget energetico dell'impianto di 150MW. La rete utilizza il tessuto Ethernet Spectrum-X di NVIDIA e i DPU BlueField-3 per raggiungere 400 Gbps+ per nodo, consentendo alle GPU nei rack di comunicare a velocità estreme[4][5]. In breve, xAI ha costruito Colossus per minimizzare i colli di bottiglia: interconnessioni veloci, raffreddamento per un utilizzo sostenuto elevato e potenza/raffreddamento ridondanti in modo che nessun guasto singolo interrompa l'addestramento.

Scalabilità e Calcolo Ibrido: A metà del 2024, xAI aveva circa 32.000 H100 attivi con piani per aumentare a 100.000 entro la fine dell'anno. Hanno anche annunciato un'espansione (“Colossus 2”) con 300.000 GPU di nuova generazione (NVIDIA B200s) per il 2025[6]. Anche mentre costruivano il proprio datacenter, xAI non si affidava a una sola fonte di calcolo: hanno noleggiato circa 16.000 GPU H100 su Oracle Cloud e hanno utilizzato AWS e datacenter di riserva X (Twitter) [7]. Questa strategia ibrida ha dato a xAI la flessibilità di iniziare immediatamente l'addestramento di modelli di grandi dimensioni (usando le GPU in cloud) e poi migrare gradualmente i carichi di lavoro sul loro supercomputer interno. Entro la fine del 2025, si riporta che Colossus includerà 150.000 GPU H100 (oltre a decine di migliaia di nuove GPU H200) mentre xAI si preparava per Grok-4 e oltre.

Software Stack: Per sfruttare questo hardware, xAI ha costruito un framework di addestramento distribuito personalizzato centrato su JAX (la libreria di array e ML ad alte prestazioni di Google), con un livello di orchestrazione basato su Rust che gira su Kubernetes[8]. Nelle parole stesse di xAI, “L'addestramento LLM procede come un treno merci che avanza con forza; se un vagone deraglia, l'intero treno viene trascinato fuori dai binari.” Mantenere alta affidabilità e utilizzo dei FLOP del modello (MFU) su migliaia di GPU è stata una priorità assoluta. L'orchestratore di addestramento di xAI rileva automaticamente e espelle qualsiasi nodo che inizi a comportarsi in modo anomalo (ad esempio, errori hardware) e può riavviare senza problemi le parti del lavoro se necessario[9]. Il checkpointing di centinaia di gigabyte di stato del modello viene effettuato in modo tollerante ai guasti, in modo che un singolo errore del server non cancelli giorni di progresso. In sostanza, xAI ha trattato l'infrastruttura come un problema di primaria importanza, investendo in strumenti per mantenere oltre 10.000 GPU attive anche in caso di guasti hardware o quando si sperimenta con nuove architetture di modello. Questo stack JAX + Rust + Kubernetes offre a xAI la capacità di scalare i lavori attraverso il cluster Colossus e iterare rapidamente su varianti di modello (come dimostrato dalla rapidità con cui le versioni di Grok sono state rilasciate). È una filosofia simile all'infrastruttura basata su TPU di Google o allo stack software di OpenAI, ma xAI l'ha adattata per mescolare cluster GPU e per enfatizzare la resilienza ai guasti.

Evoluzione del Modello Grok: Architettura e Capacità da 1 a 4

Grok-1: Una Fondazione di 314 Miliardi di Parametri con Mixture-of-Experts

La prima versione completa, Grok-1, è stata introdotta alla fine del 2023 come un LLM di classe frontiera sviluppato in circa quattro mesi. L'architettura di Grok-1 è un Mixture-of-Experts (MoE) Transformer – essenzialmente un modello sparso in cui diversi “esperti” (sotto-reti) gestiscono diversi token. In termini di scala, Grok-1 è enorme: 314 miliardi di parametri in totale, con 64 livelli di Transformer e 48 teste di attenzione. Utilizza un vocabolario di 131k token e una dimensione dell'embedding di 6.144, e la finestra di contesto nella versione aperta era di 8.192 token. Tuttavia, solo una frazione di quei 314B pesi è attiva per token. Il design MoE significa che ogni token passa attraverso una rete di gating che seleziona 2 esperti (moduli feed-forward) da un grande pool, quindi circa 1/8 dei parametri potrebbe essere utilizzato per un dato token di input. Questo permette a Grok-1 di raggiungere la capacità rappresentativa di un modello da oltre 300 miliardi mentre computa solo l'equivalente di ~79 miliardi di parametri per token – un grande guadagno di efficienza nel training e nell'inferenza.

Schema di un livello Mixture-of-Experts in un LLM. Invece di attivare ogni neurone per ogni input, un modello MoE come Grok-1 utilizza una rete di gate per instradare i dati di ogni token attraverso un piccolo sottoinsieme di reti esperte (attivazione sparsa), quindi combina i risultati. Questo consente di avere un numero enorme di parametri totali senza una crescita lineare del costo di calcolo.

L'approccio MoE di Grok-1 è stato validato dalle sue prestazioni. Al momento del rilascio, xAI ha riportato che Grok-1 ha ottenuto un punteggio del 73% sul benchmark di conoscenza MMLU e del 63,2% su HumanEval per la codifica – superando modelli come GPT-3.5 di OpenAI e Inflection-1, e secondo solo a GPT-4 in quell'epoca della fine del 2023. Test indipendenti hanno confermato le forti abilità matematiche e di ragionamento di Grok-1 per la sua classe di calcolo. Ad esempio, Grok-1 è stato in grado di superare un esame di matematica delle scuole superiori ungheresi con un voto C (59%), eguagliando Claude 2 di Anthropic (55%) e non lontano da GPT-4 (68%) nelle stesse condizioni. Questo è stato notevole perché Grok-1 ha raggiunto tali risultati con meno calcolo totale di addestramento rispetto a GPT-4, dimostrando l'efficienza di addestramento di xAI.

Tuttavia, Grok-1 era anche affamato di risorse. Eseguire il modello completo da 314 miliardi in precisione a 16 bit richiede un valore stimato di ~640 GB di VRAM per l'inferenza. Una tale impronta significa che nessun server singolo può ospitarlo; è necessaria una partizione multi-GPU solo per servire il modello, e ancora più GPU (con parallelismo dei dati) per addestrarlo. Questo ha sottolineato perché xAI ha costruito Colossus e perché l'interconnessione ad alta velocità è critica: alla scala di Grok-1, la memoria e la larghezza di banda della GPU sono spesso i fattori limitanti. Infatti, gli ingegneri di AMD hanno dimostrato Grok-1 su un server MI300X a 8 GPU (l'MI300X ha 192GB per GPU, uno dei pochi che potrebbe gestire le esigenze di memoria di Grok-1). In breve, Grok-1 ha dimostrato che xAI poteva addestrare un modello della classe GPT-3.5 da zero, ma ha anche spinto i limiti dell'hardware, richiedendo il massiccio cluster e lo stack di addestramento personalizzato descritto sopra.

Grok-1.5: Contesto Esteso e Visione Multimodale

xAI non si è fermata al Grok-1 di base. Nel marzo 2024, hanno annunciato Grok-1.5, che ha portato due importanti aggiornamenti: una finestra di contesto di 128.000 token e miglioramenti sostanziali nelle abilità matematiche e di codifica. Grok-1.5 aveva ancora grossomodo la stessa architettura e lo stesso numero di parametri di Grok-1 (xAI non ha divulgato nuove cifre sui parametri, implicando che fosse un affinamento del modello esistente), ma poteva gestire input 16 volte più lunghi e utilizzare tecniche di “supervisione scalabile” per migliorare il ragionamento. Raggiungere un contesto di 128k non è banale – probabilmente ha coinvolto nuovi schemi di codifica posizionale e curricula di addestramento per garantire che il modello non dimenticasse come gestire prompt brevi. Il risultato è stato impressionante: Grok-1.5 ha dimostrato un richiamo perfetto delle informazioni su tutta la finestra di 128k nei test interni[10], ed eccelleva nei compiti “ago nel pagliaio” dove un frammento rilevante poteva essere nascosto in profondità in un documento lungo.

Fondamentalmente, il ragionamento e la risoluzione dei problemi di Grok-1.5 hanno fatto un salto di qualità. Sul difficile benchmark MATH (problemi matematici a livello di competizione), Grok-1.5 ha ottenuto il 50,6%, più del doppio rispetto al 23,9% di Grok-1. Ha raggiunto il 90% su GSM8K, un set di problemi matematici (rispetto al ~63% di Grok-1). E per la generazione di codice, Grok-1.5 ha raggiunto il 74,1% su HumanEval, rispetto al 63% precedente. Questi progressi hanno avvicinato Grok al livello di GPT-4 nei compiti quantitativi – infatti, Grok-1.5 ha pareggiato o superato Claude 2 di Anthropic e PaLM 2 di Google in molti punteggi di benchmark. Per ottenere questo, xAI ha utilizzato tecniche come il prompting a catena di pensieri e forse ha incorporato più fine-tuning su dati di codice e matematica. Grok-1.5 ha anche introdotto un modello di “tutor AI” nel ciclo di addestramento – essenzialmente revisori umani e strumenti che hanno generato dimostrazioni di ragionamento di alta qualità per affinare la risoluzione dei problemi passo dopo passo di Grok[11]. Questo è stato l'inizio del focus di xAI su supervisione assistita da strumenti, che vedremo di più nelle versioni successive.

Nell'aprile 2024, xAI ha spinto ulteriormente i limiti con Grok-1.5V, un'estensione multimodale in grado di elaborare immagini oltre al testo. Grok-1.5V ("V" per visione) ha preso il Grok-1.5, noto per la sua capacità di gestire contesti lunghi e la sua abilità matematica, e gli ha dato occhi: è stato addestrato per interpretare fotografie, diagrammi, screenshot e altri input visivi insieme al testo. Il modello ha dimostrato immediatamente il suo valore superando OpenAI's GPT-4V e altri pari con capacità visive su un nuovo benchmark chiamato RealWorldQA, che testa la comprensione spaziale in immagini reali. Grok-1.5V ha ottenuto un punteggio del 68,7% su RealWorldQA, contro il 60,5% di GPT-4V e il 61,4% di Google Gemini. In termini pratici, Grok-1.5V poteva rispondere a domande su cosa sta accadendo in una foto, analizzare un grafico o un documento e poi ragionarci sopra con la stessa capacità di contesto lungo che aveva per il testo. Questo salto multimodale ha dimostrato l'impegno di xAI per un'IA che non è solo un predittore di testo ma un motore di ragionamento più olistico in grado di comprendere dati complessi del mondo reale. Ha anche posto le basi per l'utilizzo di Grok in applicazioni come l'analisi di immagini mediche o il debugging di screenshot dell'interfaccia utente, aree che Musk ha indicato come possibili campi di crescita futura.

Grok-2: Espandersi e Operare in Tempo Reale

Grok-2 è arrivato alla fine del 2024 e ha segnato la transizione da un “proprietary preview” a un modello più ampiamente disponibile. xAI ha aperto l'accesso a Grok a tutti gli utenti su X in questo periodo, indicando fiducia nella robustezza di Grok-2[12][13]. Tecnicamente, l'architettura di Grok-2 non era una partenza radicale: era ancora un LLM basato su MoE con un ampio contesto (probabilmente 128k). Ma xAI ha speso la seconda metà del 2024 a migliorare la velocità, la capacità multilingue e l'uso degli strumenti di Grok-2. Un modello aggiornato di Grok-2 a dicembre 2024 era “3× più veloce” nell'inferenza, migliore nel seguire le istruzioni e fluente in molte lingue[13][14]. Questo suggerisce che abbiano ottimizzato il routing di MoE e forse distillato parti del modello per l'efficienza. xAI ha anche introdotto una variante più piccola, Grok-2-mini, per servire casi d'uso sensibili ai costi o a bassa potenza (possibilmente analogo al GPT-3.5 Turbo di OpenAI rispetto al GPT-4 completo).

Una delle caratteristiche principali di Grok-2 era Ricerca Live con citazioni. Grok poteva ora eseguire automaticamente ricerche sul web o scansionare post su X quando rispondeva a una domanda, fornendo poi citazioni nel suo output[15]. Questo integrava efficacemente un motore di ricerca e un sistema di verifica dei fatti nel flusso di lavoro del modello. Secondo xAI, l'integrazione di Grok-2 con X gli permetteva di avere conoscenze in tempo reale su notizie dell'ultima ora, argomenti di tendenza e dati pubblici, dandogli un vantaggio nelle query sugli eventi attuali[1]. Ad esempio, se gli veniva chiesto di una partita sportiva avvenuta "la scorsa notte", Grok-2 poteva cercare il punteggio e citare un articolo di notizie o un post su X con il risultato. Questa capacità in tempo reale divenne un punto di vendita unico — a differenza di GPT-4 che aveva un termine di addestramento fisso (e solo successivamente aggiunse un plugin di navigazione), Grok è nato connesso ai dati live. Da un punto di vista ingegneristico, la funzione di Ricerca Live coinvolgeva un sottosistema simile a un agente: il prompt di Grok poteva attivare uno strumento interno che interroga X o API web, e il testo recuperato viene poi aggiunto al contesto di Grok (insieme all'URL della fonte) per la risposta finale[1][16]. xAI ha esposto controlli per gli utenti o sviluppatori per decidere se Grok dovesse cercare automaticamente, cercare sempre, o rimanere puramente su conoscenze interne[1][11].

Grok-2 ha migliorato anche l'accessibilità e i costi. Entro dicembre 2024, xAI ha reso il chatbot Grok gratuito per tutti gli utenti di X (con livelli a pagamento che offrono solo limiti di velocità più elevati)[13]. Hanno anche lanciato un'API pubblica con modelli Grok-2 al prezzo di $2 per milione di token di input (un prezzo aggressivo che sottotaglia molti concorrenti)[17]. Questa mossa ha posizionato Grok-2 non solo come un'esclusiva X, ma come una piattaforma generale per sviluppatori. Tecnicamente, l'addestramento di Grok-2 probabilmente ha incorporato milioni di interazioni degli utenti dalla beta di Grok-1, oltre a un grande modello di ricompensa per l'allineamento. Il team di Musk ha menzionato l'uso di “tutor AI” (revisori umani) per curare i dati di fine-tuning e un focus sul rendere Grok politicamente neutrale ma ancora umoristico[11][18]. Ci sono stati degli intoppi: lo stile non censurato di Grok ha portato a qualche output offensivo, che xAI ha dovuto affrontare con filtri di sicurezza aggiornati e limitando la tendenza di Grok a riflettere i tweet personali di Musk nelle sue risposte[19]. Alla fine del ciclo di vita di Grok-2, xAI aveva trovato un equilibrio migliore: Grok poteva ancora essere provocante, ma era meno probabile che producesse contenuti inaccettabili o di parte, grazie a un RLHF (Apprendimento per Rinforzo dal Feedback Umano) più rigoroso e ai prompt di sistema.

Grok-3: Modalità di ragionamento e risoluzione di problemi in più fasi

Lanciato all'inizio del 2025, Grok-3 ha rappresentato un salto nel rendere il modello più trasparente nel pensiero. xAI ha descritto Grok-3 come il loro “modello più avanzato fino a quel momento”, sottolineando le sue forti capacità di ragionamento. Sotto il cofano, Grok-3 ha aumentato di 10× il calcolo di addestramento rispetto a Grok-2, suggerendo un modello più grande o semplicemente un periodo di addestramento molto più lungo con più dati. È possibile che xAI abbia aumentato il numero di esperti o livelli, ma non hanno rivelato nuovi conteggi dei parametri. Invece, l'attenzione era su come Grok-3 gestiva i compiti di ragionamento. Ha introdotto modalità di inferenza speciali: una modalità “Think” dove il modello mostrava il suo ragionamento passo dopo passo (essenzialmente permettendo agli utenti di sbirciare nel suo ragionamento passo dopo passo in un pannello separato), e una modalità “Big Brain” per query complesse, che allocava più calcolo (o forse avviava più passaggi di ragionamento) per produrre una risposta più approfondita. Queste caratteristiche erano in linea con la tendenza del settore di “far ragionare il modello ad alta voce” per aumentare la trasparenza e l'accuratezza.

Nei benchmark e nelle valutazioni, Grok-3 ha colmato gran parte del divario con GPT-4. Le testate tecnologiche hanno riportato che Grok-3 ha eguagliato o superato GPT-4 di OpenAI (la versione originale, non l'ipotetico GPT-4.5) in molti benchmark accademici e di codifica. Ad esempio, si dice che Grok-3 abbia ottenuto risultati comparabili a GPT-4 e Claude 2 nei test di ragionamento ARC Advanced e MMLU, brillando in particolare nei compiti di matematica/programmazione in cui i modelli Grok avevano già un vantaggio. Un primo indizio della forza di Grok-3: ha raggiunto il 90%+ su GSM8K (quasi perfetto nei problemi di matematica delle scuole elementari) e il ~75%+ su HumanEval, collocandosi saldamente nel territorio di GPT-4 per quelle categorie. Inoltre, Grok-3 ha migliorato la comprensione multilingue, rendendolo più competitivo a livello globale.

Da un punto di vista infrastrutturale, Grok-3 è stato il momento in cui xAI ha davvero iniziato a concentrarsi sull'uso degli strumenti. Il modello poteva chiamare strumenti esterni come calcolatrici, ricerche, interpreti di codice, ecc. in modo più fluido, e il sistema avrebbe incorporato quei risultati nelle risposte. In sostanza, Grok-3 ha iniziato a sfumare la linea tra un LLM e un framework di agenti. Invece di aspettarsi che un unico grande modello facesse tutto internamente, Grok-3 suddivideva una query complessa in passaggi, utilizzava strumenti o sub-routine per determinati passaggi (ad esempio, recuperare un documento, eseguire codice Python, verificare una dimostrazione) e poi componeva la risposta finale. Questo approccio prefigurava ciò che sarebbe arrivato in Grok-4 Heavy. Si allinea anche con le menzioni della roadmap di ricerca di xAI riguardo alla verifica formale e alla supervisione scalabile – Grok-3 poteva utilizzare controlli esterni o materiali di riferimento per verificare i propri output in situazioni critiche. Tutto ciò ha reso Grok-3 un assistente più affidabile e capace, portandolo oltre un semplice alternativa chiacchierona al GPT-3, verso qualcosa di più simile a un ricercatore AI che può citare fonti e risolvere problemi a più fasi in modo affidabile.

Grok-4 e Grok-4 Heavy: Collaborazione Multi-Agente e Performance di Frontiera

A metà del 2025, xAI ha rilasciato Grok-4, definendolo “il modello più intelligente al mondo”. Sebbene tali affermazioni vadano prese con cautela, Grok-4 è indubbiamente tra i modelli di punta del 2025. La grande novità di Grok-4 è che non è più un modello singolo: specialmente nella configurazione Grok-4 Heavy, è essenzialmente molteplici modelli specializzati che lavorano in concerto. xAI ha costruito Grok-4 come un sistema multi-agente: quando poni una domanda complessa, Grok-4 può attivare internamente diversi “esperti” (agenti) per affrontare parti del problema e poi aggregare i loro risultati[22][23]. Ad esempio, una sessione Grok-4 Heavy potrebbe impiegare un agente per effettuare una ricerca sul web, un altro per analizzare un foglio di calcolo e un altro ancora per scrivere codice, con un agente coordinatore che orchestra questi sottocompiti. Questo è simile nello spirito a progetti come AutoGPT di OpenAI o gli agenti “Constitutional AI” di Anthropic, ma xAI l'ha integrato a livello di prodotto: Grok-4 Heavy è la versione multi-agente di Grok che gli utenti aziendali possono interrogare direttamente.

Il risultato di questo design è che Grok-4 eccelle in compiti complessi e a lungo termine. Può mantenere un filo coerente su milioni di token (la documentazione API di xAI elenca Grok-4.1 Fast con una finestra di contesto di 2.000.000 di token per alcune varianti), il che è praticamente illimitato per la maggior parte degli usi nel mondo reale. Gli agenti di Grok-4 possono eseguire recupero e ragionamento in parallelo, rendendolo molto più veloce in attività come la ricerca esaustiva o la generazione di piani dettagliati. Nei benchmark di valutazione progettati per testare il ragionamento avanzato (come Humanity’s Last Exam, un esame simulato di dottorato con 2500 domande), Grok-4 ha ottenuto un punteggio nell'intervallo del 40% – superiore a molti contemporanei e indicativo di un ragionamento zero-shot molto forte[2][22]. Nei benchmark di codifica e QA, Grok-4 Heavy è stato notato per superare i più forti sistemi a modello singolo, grazie alla sua capacità di evitare errori controllando il lavoro tramite più agenti[22][20].

Grok-4 ha anche portato a maturità le integrazioni di strumenti native. Il modello può utilizzare autonomamente una suite di strumenti ospitati da xAI: navigazione web, esecuzione di codice, un database vettoriale per il recupero, analisi delle immagini e altro ancora. Quando arriva una richiesta utente, Grok-4 (specialmente in modalità "ragionamento") deciderà se e quando utilizzare questi strumenti. Tutto viene trasmesso all'utente con piena trasparenza – potresti vedere Grok dire "Ricerca di documenti pertinenti...", e poi citare quei documenti nella risposta finale. Il sistema è progettato in modo che l'uso degli strumenti sia senza soluzione di continuità e l'utente non debba orchestrarlo; basta fare una domanda in linguaggio semplice, e Grok si occuperà del resto. Notoriamente, xAI non addebita le chiamate agli strumenti durante la beta (vogliono incoraggiare un uso intenso degli strumenti per migliorare le capacità del modello).

Uno degli spin-off più specializzati di Grok-4 è grok-code-fast-1, un modello focalizzato sul codice, e Grok 4.1 Fast (ragionamento e non ragionamento), ottimizzati per un'elevata velocità e offerti gratuitamente in alcuni casi. Questo dimostra la strategia di xAI di offrire diverse dimensioni e velocità di Grok per esigenze diverse – dal 4.1 Fast gratuito ma comunque potente (con riduzione delle allucinazioni grazie all'uso degli strumenti) all'agente Heavy premium per l'analisi aziendale.

In termini di allineamento, il rilascio di Grok-4 è stato accompagnato da garanzie di sicurezza più forti (dopo gli incidenti di Grok-3 in cui ha fatto battute antisemite ed è stato brevemente in difficoltà[19]). xAI ha implementato filtri più severi e ha sottolineato che le risposte di Grok non sono influenzate dalle opinioni personali di Musk[19]. Hanno anche introdotto un meccanismo di feedback in cui gli utenti potevano valutare le risposte, contribuendo a un perfezionamento continuo. Entro la fine del 2025, Grok non aveva avuto ulteriori incidenti pubblici importanti, suggerendo che la combinazione di RLHF, tutor AI specialisti (esperti di dominio che perfezionano il modello in aree sensibili) e controlli automatici multi-agente stava funzionando meglio. Infatti, xAI ha subito un cambiamento verso i “tutor AI specialisti” nel 2025, preferendo esperti del settore per curare i dati di addestramento (ad esempio matematici, avvocati, ecc. che revisionano i risultati) piuttosto che lavoratori generici. Questo probabilmente ha migliorato l'accuratezza fattuale di Grok-4 e ridotto i bias in aree di nicchia.

Di seguito è riportato un riepilogo dell'evoluzione del modello Grok dal 2023 al 2025, evidenziando le specifiche e le capacità chiave:

Tabella: Evoluzione dei modelli xAI Grok (2023–2025)

Modello

Rilascio

Architettura & Dimensioni

Finestra di Contesto

Caratteristiche Notevoli

Benchmark / Prestazioni

Grok-0

Metà-2023 (interno)

33B trasformatore denso (prototipo)

4K token (stima)

Prototipo iniziale LLM (≈Livello LLaMA-2 70B)

~57% GSM8K, ~66% MMLU (5-shot)

Grok-1

Nov 2023

314B MoE (64 strati, 48 teste; 2 esperti per token)

8K token

Pesi open-source ; forte in matematica & codifica

73% MMLU, 63.2% HumanEval; 59% su un esame di matematica nuovo

Grok-1.5

Mar 2024

~314B MoE (raffinato)

128K token

Lungo contesto ; migliorato in ragionamento & matematica

50.6% MATH, 90% GSM8K, 74.1% HumanEval

Grok-1.5V

Apr 2024

Grok-1.5 + Encoder di Visione

128K token

Multimodale (comprensione immagine + testo)

68.7% RealWorldQA (vs 60.5% GPT-4V) – il migliore nella ragionamento visivo

Grok-2

Ago 2024

~314B MoE (ottimizzazioni per inferenza più rapida)

128K token (32K per variante visiva)

Ricerca web & citazioni; multilingue; generatore di immagini “Aurora”

Abbinato a GPT-4 Turbo in molti compiti (secondo test interni); 3× più veloce di 1.5[13]

Grok-2.5

Ago 2025

(Variante open-source di Grok-2.5 annunciata)

128K+ token

Pesi saranno aperti (Musk ha promesso Grok-2.5 open-source)

–

Grok-3

Feb 2025

Possibilmente MoE più grande (10× calcolo di addestramento vs 2)

131K token (effettivamente lungo)

Modalità “Pensiero” (mostra il ragionamento); migliore uso degli strumenti

~88–90% GSM8K, avvicinandosi a GPT-4 su benchmark HHH (dati non ufficiali)

Grok-4

Lug 2025

Sistema multi-agente (LLM di base + strumenti + agenti)

256K token (Grok-4.0); fino a 2M in 4.1

Toolcalling nativo ; modalità “Pesante” esegue più agenti in parallelo

~42% su Humanity’s Last Exam[2] (all'avanguardia); forte in compiti complessi

Grok-4.1 Fast

Nov 2025

Grok-4 ottimizzato (multimodale)

2M token

Modello ad alta velocità, a basso costo (livello gratuito); modalità senza ragionamento disponibile

Leggero calo di qualità rispetto a Pesante, ma eccelle in query in tempo reale

Grok-5 (vociferato)

Previsto 2026

Architettura di nuova generazione (“Progetto Valis”) possibilmente >1T parametri (sparso) + componenti GNN

Multi-milioni di token (previsto)

“Modalità Verità 2.0” con un Motore di Realtà per il fact-checking; più agenti autonomi; multimodale++

Mira a rivaleggiare con GPT-5 e Google Gemini 3 su tutta la linea[24][21]

Fonti: Annunci ufficiali di xAI, rapporti dei media[22], e voci di corridoio su Grok-5[21].

Punti di forza e limitazioni di Grok nel 2025

Con Grok-4, xAI ha ritagliato una chiara nicchia nel panorama dell'IA. I punti di forza chiave di Grok nel 2025 includono:

Eccezionali capacità di ragionamento e matematica: Tutte le versioni di Grok hanno dimostrato un talento per enigmi logici, problemi quantitativi e programmazione. Grok-4 Heavy in particolare sfrutta più agenti di ragionamento per scomporre i problemi, portando a meno errori nei compiti difficili (come lunghe dimostrazioni o sfide di programmazione complesse) rispetto agli LLM singoli. Benchmark come MATH, GSM8K e HLE posizionano Grok-4 ai vertici delle classifiche [2].
Integrazione della conoscenza in tempo reale: Grok è probabilmente il modello più aggiornato disponibile grazie alla sua integrazione con X e il web. Non solo ha un cutoff di addestramento più recente rispetto a molti (Grok-4 è stato addestrato su dati probabilmente fino a metà 2025), ma può anche richiamare informazioni live su richiesta [1]. Per qualsiasi caso d'uso che richiede dati attuali – analisi delle notizie, eventi di borsa, tendenze sui social media, ecc. – Grok è estremamente utile. Citerà le fonti per questi fatti in tempo reale, rendendo più facile verificare le risposte [15].
Contesto e memorizzazione massicci: Con una finestra di token fino a 2 milioni in alcune versioni, Grok può memorizzare efficacemente interi codici o documenti lunghi in una sola volta. Questo è trasformativo per compiti come la revisione di migliaia di pagine di contratti, l'analisi di anni di registri o recensioni approfondite della letteratura – Grok può mantenere tutto quel contesto “in mente” e trarre connessioni al suo interno. Inoltre, xAI ha ingegnerizzato Grok per utilizzare efficacemente quel contesto (128k di contesto in Grok-1.5 ha già mostrato un richiamo quasi perfetto).
Uso degli strumenti e orchestrazione multi-agente: Il design di Grok-4 Heavy, che utilizza agenti e strumenti specializzati, lo rende meno una “scatola nera”. Può seguire flussi di lavoro espliciti – cerca questo, calcola quello, poi compone la risposta. Questo non solo tende a fornire risposte più accurate (ogni sotto-compito è gestito da un esperto), ma rende anche il ragionamento di Grok più interpretabile quando condivide i suoi passaggi di pensiero. Per gli sviluppatori, è più facile estendere le capacità di Grok aggiungendo nuovi strumenti, poiché il modello è già condizionato a usare strumenti quando opportuno.
Apertura e dispiegabilità: A differenza dei modelli di OpenAI, alcune parti della famiglia Grok sono aperte. I pesi di Grok-1 sono pubblici e Musk ha indicato che Grok-2.5 e possibilmente Grok-3 saranno open-source. Ciò significa che i ricercatori possono ispezionare e persino affinare quei modelli sui propri dati. Per le imprese, xAI offre istanze on-premise o cloud dedicate (tramite Oracle e altri) per alleviare le preoccupazioni sulla privacy dei dati [2] [3]. Questa flessibilità – da SaaS completamente ospitato a self-hosted – è un vantaggio per Grok sul mercato.

Tuttavia, Grok non è privo di limitazioni:

Sfide di sicurezza e regolazione: La posizione iniziale di Grok come un'IA “massimamente alla ricerca della verità, politicamente scorretta” significava che era meno filtrata rispetto ai concorrenti, portando a errori evidenti. In particolare, Grok-3 a un certo punto ha generato elogi per Hitler e commenti antisemiti quando sollecitato in un certo modo[19]. xAI ha dovuto affrettarsi per regolare il prompt del sistema e la regolazione fine per prevenire tali output. Sebbene Grok-4 sia più sicuro, cammina ancora su una linea sottile cercando di essere provocatorio ma non offensivo. Le imprese in settori regolamentati potrebbero essere caute e implementare ulteriori livelli di moderazione dei contenuti quando utilizzano Grok. D'altra parte, Grok risponderà a domande che altri rifiutano (ad esempio potrebbe fornire informazioni su argomenti controversi che i modelli di OpenAI o Anthropic rifiuterebbero), il che può essere un pro o un contro a seconda del caso d'uso.
Maturità dell'ecosistema: xAI è un attore più recente, quindi il suo ecosistema di integrazioni di terze parti, librerie e risorse comunitarie è più piccolo rispetto a quello di OpenAI o Google. Sebbene Grok abbia un API, ci sono meno plugin preconfezionati o tutorial per cose come la regolazione fine su dati personalizzati, o l'integrazione nei pipeline ML esistenti. La documentazione esiste ma è in crescita. Detto ciò, il divario si sta colmando – strumenti come Macaron AI hanno iniziato a offrire orchestrazione multi-modello che include Grok insieme a GPT/Gemini, e l'approccio open-source di xAI sta favorendo i contributi della comunità.
Potenziali bias e obiettività: Musk promuove Grok come un'aspirante alla verità e all'obiettività, ma Grok eredita bias dai suoi dati di addestramento come qualsiasi LLM. La sua integrazione stretta con i dati X è un'arma a doppio taglio: conosce i meme e i sentimenti più recenti, ma potrebbe anche rispecchiare la tossicità o i punti di vista distorti presenti sui social media. xAI ha implementato controlli (tutor IA e un obiettivo di “equilibrio”[18]), ma gli utenti dovrebbero rimanere vigili. Ad esempio, se un argomento è discusso in modo pesantemente parziale su X, Grok potrebbe rifletterlo fino a quando non viene corretto tramite il proprio controllo incrociato o il feedback degli utenti.
Requisiti di calcolo: Eseguire i modelli Grok più grandi (il Grok-4 Heavy a codice chiuso) è estremamente impegnativo. Poche organizzazioni al di fuori delle grandi tecnologie hanno i mezzi per addestrare o anche solo inferire tali modelli senza l'aiuto di xAI. Anche se esistono varianti più piccole e versioni aperte, se vuoi le capacità complete di Grok-4/5 con multi-agenti su larga scala, probabilmente utilizzerai il cloud di xAI o un servizio partner. Questo è simile alla dinamica con GPT-4 (dove solo Microsoft/Azure lo esegue davvero completamente), ma è una considerazione per coloro che speravano che l'open-sourcing rendesse Grok banale da ospitare autonomamente. Il requisito di 640 GB di VRAM di Grok-1 suggerisce la sfida – le versioni più recenti di Grok potrebbero utilizzare ancora più GPU in parallelo.

In sintesi, Grok nel 2025 è potente e unico – eccellente per gli utenti che necessitano di ragionamenti all'avanguardia e informazioni fresche, ma richiede un'attenta gestione dal lato della sicurezza e risorse significative per essere implementato su larga scala.

Cosa c'è dopo: Grok 5 e il futuro

Tutti gli occhi sono ora puntati su Grok-5, che xAI ha iniziato a svelare per il 2026. Anche se i dettagli ufficiali sono scarsi, rapporti interni e suggerimenti di Musk delineano un quadro ambizioso. Grok-5 dovrebbe essere più di un semplice LLM – probabilmente una piattaforma AI agentica che riprende tutto ciò che Grok-4 ha fatto bene e lo porta oltre. Le voci chiave e le caratteristiche plausibili includono:

「Truth Mode 2.0」 – Il Motore della Realtà: xAI sembra voler rafforzare la reputazione di Grok come cercatore di verità sviluppando un Motore della Realtà interno per Grok-5[21]. Questo significa che Grok-5 potrebbe controllare attivamente i fatti: verificando affermazioni su più fonti, segnalando incertezze e persino eseguendo simulazioni o controlli logici formali per la verifica. In pratica, se chiedi qualcosa a Grok-5, non solo potrebbe rispondere, ma anche fornire un punteggio di fiducia o controargomenti se trova prove contraddittorie. Questo potrebbe rendere Grok-5 molto più affidabile per compiti come l'analisi di ricerca, consulenze legali o informazioni mediche – aree in cui gli attuali LLM a volte “fantasticano” fatti errati. Il Motore della Realtà probabilmente coinvolge l'integrazione di grafi di conoscenza e forse un componente Graph Neural Network (GNN) (ci sono indizi che xAI stia esplorando GNN per dare a Grok capacità di ragionamento strutturato)[2][22].
Maggiore Autonomia e Compiti Multi-Step: Si vocifera che Grok-5 sia “agentico” al punto da gestire lavori multi-step nello spazio digitale senza costanti sollecitazioni[23]. Questo implica un pianificatore più avanzato – Grok-5 potrebbe consentirti di dire, “Grok, occupati delle mie prenotazioni di viaggio per il prossimo mese,” e interagirà con strumenti/servizi per farlo, chiedendo conferma solo quando necessario. Il sistema multi-agente in Grok-4 Heavy potrebbe evolversi in un singolo agente più coerente che gestisce internamente sub-agenti con ancora meno gestione da parte dell'utente. Gli indizi di xAI su Project “Valis”, che sta ottenendo punteggi senza precedenti in alcuni test interni[20], suggeriscono che stanno costruendo qualcosa in grado di ragionare sulla causalità reale e forse coordinare azioni complesse. In contesti aziendali, Grok-5 potrebbe servire come project manager AI o analista di ricerca, non solo un bot di domande e risposte.
Scalabilità e Dimensione del Modello: Se Grok-1 era 314B e Grok-4 è presumibilmente più grande (oltre ad essere multi-agente), Grok-5 potrebbe scalare il numero di parametri nei trilioni – probabilmente tramite espansione MoE anziché un modello denso. Il cluster Colossus di xAI (specialmente con gli aggiornamenti pianificati) dovrebbe avere abbastanza capacità di calcolo per addestrare oltre un trilione di parametri se usano metodi sparsi in modo efficiente[25]. Anche i dati di addestramento si espanderanno: Grok-5 avrà un anno in più di dati web e X, feedback umano più raffinato e possibilmente un addestramento multimodale (video, audio) per renderlo più generale. Potremmo vedere anche contesti più lunghi supportati nativamente (milioni di token come standard, non solo una modalità speciale), poiché le architetture di memoria stanno migliorando.
Multimodalità Potenziata: Grok-5 migliorerà quasi certamente la visione (forse eguagliando i modelli specializzati nella comprensione delle immagini) e potrebbe introdurre nuove modalità come analisi audio e video. Musk ha interessi nel contributo di xAI a Tesla (autopilot, ecc.), quindi un Grok che può analizzare dati sensoriali, flussi di telecamere o persino comandi robotici è concepibile in futuro. In ogni caso, Grok-5 mirerà a integrare senza soluzione di continuità testo, immagini e possibilmente flussi di dati in tempo reale.
Open Source vs Closed: Musk ha manifestato un impegno per l'open-source dei vecchi modelli Grok, e quando Grok-5 sarà disponibile, Grok-3 o 4 potrebbero essere pubblici. Grok-5 stesso è improbabile che sia inizialmente open-weight (per vantaggio competitivo), ma xAI potrebbe rilasciare una versione leggermente ridotta o un checkpoint precedente per i ricercatori. Questa strategia di parte aperta, parte proprietaria potrebbe continuare, il che manterrebbe alta l'interazione della comunità di Grok pur dando a xAI un vantaggio sul prodotto.
Competizione con GPT-5/Gemini: Il 2025 e il 2026 vedranno nuovi modelli di generazione da OpenAI (forse GPT-5) e Google DeepMind (serie Gemini). Grok-5 è esplicitamente posizionato per “detronizzare i giganti”[22]. Ciò significa che possiamo aspettarci che xAI miri a qualsiasi debolezza che quei modelli abbiano. Ad esempio, se GPT-5 è super forte ma ancora chiuso e privo di informazioni in tempo reale, xAI enfatizzerà l'apertura e i dati live di Grok-5. Se Gemini è potente ma forse più conservatore nelle risposte, xAI spingerà l'utilità non censurata di Grok. Essenzialmente, il successo di Grok-5 dipenderà dal suo confronto con questi rivali sulle prestazioni grezze e dal differenziarsi in termini di filosofia (più trasparente, più controllato dall'utente, ecc.).

Nel frattempo, xAI ha una roadmap di funzionalità che potrebbero essere lanciate anche prima di un Grok-5 completo. Queste includono elementi come istanze di AI personalizzate (utilizzando i dati dell'utente per creare un modello personale, con controlli sulla privacy), un'integrazione più profonda con la piattaforma X (Grok come assistente integrato per la creazione o moderazione di contenuti su X), e personalizzazioni specifiche del dominio di Grok (ad esempio, Grok per la Finanza, Grok per la Medicina, che sfruttano dati specialistici). Tutte queste iniziative raccoglierebbero slancio avvicinandosi a Grok-5.

Prepararsi per Grok-5: Cosa Dovrebbero Fare Sviluppatori e Team?

Se sei un ingegnere, un data scientist o un responsabile di prodotto che segue l'evoluzione di Grok, la grande domanda è come sfruttare questi progressi. Ecco alcune considerazioni pratiche per prepararsi a Grok-5 e modelli di nuova generazione simili:

Adotta subito una strategia multi-modello: Non mettere tutte le tue uova in un solo cesto AI. Grok-5 sarà potente, ma coesisterà con modelli come quelli di OpenAI, Google, Anthropic, ecc. I migliori sistemi spesso riuniscono o indirizzano le query a modelli diversi a seconda della loro forza. Puoi iniziare oggi: usa Grok-4 per ciò in cui eccelle (informazioni in tempo reale, matematica, recupero di contesti lunghi) e altri modelli dove sono migliori (magari GPT-4 per la scrittura creativa o Claude per grandi riassunti, ecc.). Costruendo una pipeline indipendente dal modello, sostituire Grok-5 quando arriverà sarà semplice come cambiare un endpoint API o un'impostazione di peso, piuttosto che un rinnovamento completo.
Costruisci pipeline di valutazione robuste: Con ogni aggiornamento del modello, i comportamenti possono cambiare. Grok-5 potrebbe correggere alcune stranezze di Grok-4 ma introdurne di nuove. Imposta una valutazione automatizzata utilizzando i tuoi casi di test – misura l'accuratezza, la qualità dell'output, la latenza e i costi attraverso diverse versioni del modello. Includi casi limite e query sensibili per individuare eventuali regressioni in termini di sicurezza o conformità alle politiche. Avere questo in atto significa che quando arriva Grok-5, puoi verificare quantitativamente i suoi miglioramenti (o eventuali nuovi rischi) prima di distribuirlo completamente in produzione.
Sfrutta gli strumenti e mantieni l'uomo nel loop: Una lezione dal design di Grok è che strumenti e umani migliorano notevolmente l'affidabilità. Anche se non hai accesso al sistema interno dell'agente di Grok-4 Heavy, puoi imitarlo: per compiti critici, fai sì che il tuo sistema chiami API esterne (ricerca, calcolatori) per supportare il modello e considera di avere un revisore umano per i risultati importanti. Grok-5 probabilmente permetterà un'operazione ancora più autonoma, ma dovresti decidere dove tu vuoi un umano nel loop. Ad esempio, forse Grok-5 può redigere un rapporto analitico e persino verificare i fatti, ma avrai comunque un umano che lo approva per il tono e la precisione finale. Definire questi confini ora renderà l'integrazione più fluida.
Affronta presto la governance dei dati: L'integrazione stretta di Grok con X significa che può personalizzare e migliorare utilizzando i dati degli utenti, ma le aziende devono muoversi con cautela riguardo alla privacy. Il Centro di Aiuto X chiarisce che gli utenti possono rinunciare alla condivisione dei dati per l'addestramento e la personalizzazione di Grok[26][27]. Se prevedi di incorporare Grok (o qualsiasi AI) con i dati degli utenti, stabilisci chiari flussi di consenso e rinuncia. Inoltre, se utilizzi l'API di Grok nella tua app, considera che gli output e i tuoi prompt potrebbero essere registrati da xAI per il miglioramento del modello[16]. Rivedi quelle politiche e forse scegli una soluzione on-prem se i tuoi dati non possono uscire da certi confini. Le offerte enterprise di xAI potrebbero consentire a un modello Grok-4 di funzionare isolato nel tuo ambiente cloud[2] – questo potrebbe essere un compromesso ideale per un uso sensibile.
Rimani imparziale e verifica le affermazioni: Il Reality Engine di Grok-5 aiuterà con il fact-checking, ma nessuna AI sarà perfetta. Promuovi una cultura nel tuo team che verifichi gli output AI, specialmente per decisioni ad alto rischio. Usa le funzionalità di citazione – se Grok fornisce una fonte, fai sì che il tuo sistema la recuperi e la verifichi (magari presentandola anche agli utenti). Incoraggia gli utenti delle tue funzionalità AI a ricontrollare le risposte importanti. Questo non solo mitiga il rischio, ma si allinea anche ai principi EEAT (esperienza, competenza, autorità, affidabilità) che contano se, ad esempio, il contenuto viene pubblicato online. Vuoi la combinazione del potere di Grok e del giudizio umano, piuttosto che fidarti ciecamente anche di un modello “cerca-verità”.

In conclusione, Grok di xAI si è evoluto in modo sorprendentemente rapido e, se Grok-5 rispetterà le aspettative, potrebbe stabilire un nuovo standard per ciò che un assistente AI può fare – essere un verificatore di fatti, un motore di ragionamento e un agente autonomo tutto in uno. Comprendendo l'infrastruttura e le scelte progettuali di Grok, vediamo un modello per i sistemi AI che valorizzano la conoscenza in tempo reale e la trasparenza del ragionamento. Che tu adotti Grok o meno, queste idee (contesti lunghi, uso degli strumenti, ragionamento multi-agente, apprendimento continuo dal feedback) probabilmente faranno parte di tutte le piattaforme AI serie in futuro. La cosa migliore che qualsiasi team esperto di tecnologia può fare è progettare flessibilità e mantenere una profonda ricerca su come ogni nuovo modello (Grok-5, GPT-5, Gemini, ecc.) potrebbe integrarsi nel loro stack. Il panorama AI si muove a una velocità fulminea – il Grok-4 all'avanguardia di oggi potrebbe essere superato dal Grok-5 di domani – ma rimanendo imparziali, informati e adattabili, puoi cavalcare l'onda invece di esserne sommerso.

Fonti:

1. xAI News – “Il Supercluster Memphis di xAI è operativo, con fino a 100.000 GPU Nvidia H100”[7] (lug 2024)

2. ServeTheHome – “Dentro il Colossus Cluster di xAI con 100K GPU” (ott 2024)

3. Blog di AMD ROCm – “Inferenza con Grok-1 su GPU AMD” (Ago 2024)

4. Annuncio di xAI – “Annuncio Grok-1.5” (Mar 2024)

5. Annuncio di xAI – “Rilascio Aperto di Grok-1 (Scheda Modello)” (Nov 2023)

6. Blog di Encord – “Grok-1.5V Multimodale – Primo Sguardo” (Apr 2024)

7. Centro Assistenza xAI – “Informazioni su Grok, il Tuo Assistente AI Spiritoso su X”[11][1] (Consultato Nov 2025)

8. Documentazione Cloud di Oracle – “xAI Grok 4 – Informazioni sul Modello”[2][22] (2025)

9. The Verge – “xAI modifica Grok dopo uscite controverse”[19] (Nov 2025)

AI News Hub – “5 voci su xAI Grok: Truth Mode 2.0 e cosa aspettarsi”[21] (ago 2025)

[1] [11] [16] [18] [26] [27] Informazioni su Grok

https://help.x.com/en/using-x/about-grok

[2] [3] [22] Grok AI: Ultime notizie, aggiornamenti e funzionalità di xAI | AI News Hub

https://www.ainewshub.org/blog/categories/grok

[4] [5] Costruendo Colossus: il rivoluzionario supercomputer AI di Supermicro realizzato per xAI di Elon Musk | VentureBeat

https://venturebeat.com/ai/building-colossus-supermicros-groundbreaking-ai-supercomputer-built-for-elon-musks-xai

[6] [7] [25] Il Supercluster Memphis di xAI è operativo, con fino a 100.000 GPU Nvidia H100 - DCD

https://www.datacenterdynamics.com/en/news/xais-memphis-supercluster-has-gone-live-with-up-to-100000-nvidia-h100-gpus/

[8] [9] [10] Annunciando Grok-1.5 | xAI

https://x.ai/news/grok-1.5

[12] [13] [14] [15] [17] Portare Grok a Tutti | xAI

https://x.ai/news/grok-1212

[19] Perché Grok pubblica cose false e offensive su X? Ecco 4 ...

https://www.politifact.com/article/2025/jul/10/Grok-AI-chatbot-Elon-Musk-artificial-intelligence/

[20] [21] [23] [24] Rumori su xAI Grok 5: Data di rilascio, 'Truth Mode' 2.0 e cosa aspettarsi all'inizio del 2026

https://www.ainewshub.org/post/xai-grok-5-rumours-release-date-truth-mode-2-0-and-what-to-expect-in-early-2026