Acceleratore Gaudi 3 di Intel: Una svolta nell’intelligenza artificiale

9 Aprile 2024

INTEL PRESENTA L’ACCELERATORE GAUDI 3

In occasione dell’evento Intel Vision 2024, la società guidata da Pat Gelsinger ha presentato l’acceleratore Gaudi 3 che porta prestazioni, standard aperti e possibilità di scelta sul versante dell’Intelligenza Artificiale generativa (GenAI) per le imprese.
Gaudi 3 alimenterà i sistemi di IA costituendo un passo avanti significativo nella formazione e nell’inferenza per le aziende che desiderano implementare soluzioni di intelligenza artificiale su larga scala. Intel mette in evidenza un aspetto importante: è possibile collegare migliaia di acceleratori tramite interfaccia Ethernet in modo tale da estendere e scalare a dismisura il potenziale di Gaudi 3.

L’ECOSISTEMA SI UNISCE PER SVILUPPARE UNA PIATTAFORMA APERTA DI ENTERPRISE AI

In collaborazione con Anyscale, DataStax, Hugging Face, KX Systems, MariaDB, MinIO, Qdrant, Red Hat, Redis, SAP, SAS, VMware, Yellowbrick e Zilliz, Intel ha annunciato l’intenzione di creare una piattaforma aperta per l’Enterprise AI. L’iniziativa ha come obiettivo primario quello di sviluppare sistemi GenAI aperti e multi-vendor che offrano facilità di implementazione, le migliori prestazioni e valore, abilitati dell’approccio RAG (Retrieval-Augmented Generation).
RAG migliora la qualità e la coerenza del testo generato incorporando informazioni provenienti da fonti esterne. Questo approccio consente di produrre testo più informativo e accurato, in grado di rispondere in modo più preciso a una vasta gamma di domande o compiti nel contesto dell’elaborazione del linguaggio naturale.
Nel caso di Intel, il fine ultimo è quello di abilitare l’utilizzo delle estese fonti di dati proprietarie delle aziende, sfruttando soluzioni standard sicure basate su Intel Xeon con funzionalità LLM aperte, accelerando l’utilizzo della GenAI nelle imprese.
La soluzione presentata da Intel consente a un ecosistema ampio e aperto di attori nel settore dell’IA, di offrire soluzioni che soddisfano le esigenze specifiche di ciascuna azienda. Della “partita” sono produttori di apparecchiature, fornitori di database, system integrator, fornitori di Software e servizi… Ogni impresa può affidarsi ai partner e alle soluzioni già note e fidate.

IL SOFTWARE RESTA PUNTO NODALE PER UN’OFFERTA CHE VUOLE DAVVERO COMPETERE NEL CAMPO DELL’IA

Come ha dimostrato il dominio sin qui incontrastato di NVIDIA con CUDA, l’ecosistema software è altrettanto critico quanto l’Hardware. Intel celebra “le virtù” della sua piattaforma software end-to-end e afferma che “la maggior parte” dei suoi ingegneri sta attualmente lavorando per rafforzare il supporto.
L’azienda di Gelsinger si sta attualmente concentrando sul supporto per modelli di addestramento e inferenza multi-modalità e RAG.
Hugging Face ha oltre 600.000 differenti versioni di modelli di IA attualmente disponibili. I portavoce di Intel affermano che la collaborazione con Hugging Face, PyTorch, DeepSpeed e Mosaic ha facilitato il processo di porting del software al fine di facilitare l’implementazione di sistemi basati su Gaudi 3.
Intel afferma che la maggior parte dei programmatori sta utilizzando framework o pacchetti software di alto livello (ad esempio semplicemente utilizzando PyTorch e scripting con Python): per la società di Santa Clara, lo sviluppo a basso livello con CUDA non sarebbe così comune come si potrebbe ritenere.

SEMPLIFICARE IL PORTING DELLE APPLICAZIONI PER FORNIRE UN’ALTERNATIVA CONCRETA A CUDA

La complessità sottostante è gestita da Intel OneAPI, che funge da libreria kernel e di comunicazione. Il comportamento della libreria segue le specifiche delineate dalla Unified Accelerator Foundation (UXL), un consorzio industriale che include Intel, ARM, Qualcomm, Samsung e altri nomi con l’obiettivo di fornire un’alternativa a CUDA. PyTorch 2.0 è ottimizzato per utilizzare OneAPI per l’inferenza e l’addestramento con CPU e GPU Intel. D’altra parte, anche Intel OpenVINO è in rapida crescita, con oltre un milione di download finora quest’anno.
OpenVINO è un potente toolkit di deep learning sviluppato da Intel che ottimizza e accelera l’inferenza delle reti neurali su diverse piattaforme hardware. Questo strumento consente l’esecuzione efficiente di modelli di deep learning basati su reti neurali convoluzionali (CNN) e altri tipi di reti neurali su una vasta gamma di dispositivi Intel, come CPU, GPU, VPU, FPGA e altri acceleratori Intel. OpenVINO facilita lo sviluppo di applicazioni di computer vision, riconoscimento vocale automatico, elaborazione del linguaggio naturale, sistemi di raccomandazione e altro ancora, offrendo prestazioni elevate e opzioni di distribuzione flessibili, dall’edge al cloud.
Inoltre, OpenVINO fornisce un’ampia gamma di funzionalità, tra cui la possibilità di eseguire l’inferenza di modelli di deep learning, supportando modelli provenienti da diversi framework come TensorFlow, PyTorch, PaddlePaddle, ONNX e altri.

NUOVI PROCESSORI INTEL XEON 6 A SOSTEGNO DEI WORKLOAD LEGATI ALL’INTELLIGENZA ARTIFICIALE

Oltre all’acceleratore Gaudi 3, Intel ha svelato i nuovi processori Xeon 6. Offrono una soluzione efficiente in termini di prestazioni per eseguire le attuali soluzioni GenAI, tra cui RAG, per produrre risultati argomentati e di qualità sfruttando le informazioni e la proprietà intellettuale della singola realtà aziendale.
I processori Intel Xeon 6 con i nuovi E-core (Sierra Forest) a elevata efficienza energetica assicureranno un’esperienza di primo livello: saranno lanciati sul mercato questo trimestre. Gli Intel Xeon 6 con P-core (Granite Rapids) offriranno prestazioni di IA migliorate e saranno presentati successivamente.

L’ARTICOLO COMPLETO POTREBBE ESSERE LETTO A QUESTO [LINK](https://www.ilsoftware.it/acceleratore-gaudi-3-di-intel-cose-e-come-funziona-ecosistema-aperto-per-lia/).

ARTICOLI COLLEGATI:

Acceleratore Gaudi 3 di Intel: Una svolta nell’intelligenza artificiale

Financial Times e OpenAI: sinergia con ChatGPT per l’intelligenza artificiale

Intelligenza Artificiale rivoluziona oculistica: GPT-4 alla pari degli esperti umani

L’impatto dell’Intelligenza Artificiale sulla crisi energetica: i data center in difficoltà

ULTIMI ARTICOLI:

Warframe: arriva Protea Prime, il nuovo Tenno dell’Era Orokin

Arlecchino, il nuovo personaggio di Genshin Impact: un cosplay eccezionale

Hellblade 2: anteprime e sorprese dal team social di Ninja Theory

Starfield: arrivo dei Veicoli di Superficie e aggiornamenti in arrivo – Novità dal mondo di Bethesda Game Studios

Arriva il pacchetto FUT Starter Pack per EA Sports FC 24 su PlayStation Plus a maggio