IBM ha presentato le specifiche sui nuovi processori IBM Telum® II e di IBM Spyre™ Accelerator in occasione dell’evento Hot Chips 2024. Queste nuove tecnologie sono progettate per aumentare significativamente la capacità di elaborazione della prossima generazione di sistemi mainframes IBM Z, contribuendo ad accelerare l’adozione dei modelli AI tradizionali e dei Large Language Models (LLM) anche in tandem, grazie a una nuova metodologia di AI detta di tipo “ensemble”.

Una ricerca di Morgan Stanley, pubblicata ad agosto, prevede per i prossimi anni un incremento annuo del 75% del fabbisogno energetico dell’AI generativa, arrivando così a consumare nel 2026 una quantità di energia pari a quella consumata dalla Spagna nel 2022. Molti clienti IBM hanno, infatti, sottolineato l’importanza crescente di effettuare scelte architetturali a supporto di foundation model di dimensioni adeguate, come pure l’adozione di approcci “hybrid-by-design” allo sviluppo dei carichi di lavoro AI.

Le principali innovazioni presentate riguardano:

Sviluppato per sostenere i sistemi IBM Z di prossima generazione, il nuovo chip IBM presenta, rispetto alla prima iterazione dei processori Telum, una frequenza ed una capacità di memoria incrementate, una cache aumentata del 40%, un acceleratore AI integrato migliorato ed una nuova "Coherently Attached Data Processing Unit". •Una nuova unità di elaborazione dati (DPU), integrata nel chip del processore Telum II, è stata sviluppata per accelerare su mainframe i complessi protocolli di I/O necessari al networking e all'interazione con lo storage. •Fornisce capacità di elaborazione AI addizionali a supporto del processore Telum II. Lavorando insieme, i chip Telum II e Spyre formano un'architettura scalabile per supportare i metodi di "Ensemble AI" – ovvero la pratica di combinare più modelli di machine learning o di deep learning con gli encoder LLM., partner di lunga data di IBM, e si baseranno sul suo nodo di processo a 5 nm ad alte prestazioni ed efficienza energetica.