Parameter-efficient finetuning: cosa cambia per l’AI

Il parameter-efficient finetuning interessa perché potrebbe cambiare il modo in cui vengono aggiornati i grandi modelli AI senza doverli riaddestrare completamente. Se il problema individuato da questo studio fosse confermato su larga scala, chatbot e assistenti intelligenti potrebbero perdere parte delle loro capacità originali ogni volta che vengono specializzati per nuovi compiti.

Contenuti di questo articolo

Il lavoro si intitola PEFT-Arena: Understanding Parameter-Efficient Finetuning from a Stability-Plasticity Perspective ed è stato pubblicato su arXiv dagli autori Yangyi Huang, Ruotian Peng, Zeju Qiu e Jiale Kang. Va chiarito subito che si tratta di un preprint non ancora peer-reviewed.

Parameter-efficient finetuning: cosa succede quando un modello AI viene aggiornato

I grandi modelli linguistici vengono addestrati su quantità enormi di dati. Questo processo richiede potenza di calcolo, tempi lunghi e costi elevati. Per questo molte aziende preferiscono aggiornare solo alcune parti del modello, invece di rifare l’addestramento da zero.

Questa strategia si chiama parameter-efficient finetuning, spesso abbreviata in PEFT. L’idea è modificare una porzione ridotta dei parametri per adattare il modello a nuovi compiti, mantenendo intatta la base di conoscenze già acquisita.

Il rischio è che il modello diventi più bravo in un’attività specifica ma perda qualità in altre competenze. È un po’ come uno studente che si prepara solo per un esame e dimentica parti importanti del programma precedente.

Il tema riguarda direttamente la fiducia nei sistemi AI e richiama discussioni già emerse nell’analisi su OpenAI e la crisi di fiducia nell’intelligenza artificiale, dove affidabilità e coerenza dei modelli restano nodi centrali.

Come funziona PEFT-Arena tra stabilità e plasticità

Il concetto chiave dello studio è il rapporto tra stabilità e plasticità. La stabilità indica la capacità di conservare ciò che il modello sa già. La plasticità misura invece quanto il modello riesce ad adattarsi a nuovi compiti.

Una metafora utile è quella della memoria umana. Se una persona resta troppo legata alle abitudini precedenti, fatica a imparare. Se cambia metodo a ogni nuova informazione, rischia di dimenticare ciò che aveva già consolidato.

Gli autori scrivono: “Il PEFT dovrebbe essere valutato attraverso il compromesso stabilità-plasticità”. La traduzione è fedele al testo originale del preprint.

Per misurare questo equilibrio, Huang, Peng, Qiu e Kang propongono PEFT-Arena, una piattaforma di benchmark che confronta diversi metodi di finetuning. Il punto non è valutare solo l’accuratezza finale, ma anche quanto il modello conservi delle proprie capacità iniziali.

Il lavoro si collega ad altre ricerche che cercano di rendere i sistemi AI più robusti rispetto ai cambiamenti nei dati, come il progetto sui Mollifier Layers per le equazioni inverse.

Cosa mostra il benchmark sul finetuning efficiente

La linea di cpu intel core di undicesima generazione per desktop con nome in codice rocket lake-s verrà lanciata il prossimo anno con quattro modelli includendo il falgship intel core i9-11900k. (foto) l'informazione è stata pubblicata su twitter da davidbepo e trasformata in un utile grafico da harukaze5719 che ci dà modo di dare uno sguardo generale alle nuove cpu e alle rispettive specifiche. La gamma di cpu desktop intel rocket lake-s includerà i nuovissimi core cypress cove che, come vedremo dai benchamark di cui ti parlerò nella seconda parte di questo articolo, hanno mostrato un potenziale enorme, con specifiche da vera ammiraglia. Tuttavia bando alle ciance e iniziamo a parlare delle specifiche di questi nuovi intel core di undicesima generazione che, per comodità sono descritte in dettaglio di seguito. Intel core di undicesima generazione: core i9-11900k 8 core e 16 thread rocket lake (foto) ad aprire questa lista di intel core di undecisma generazione ci pensa l'intel core i9-11900k il quale sarà la cpu desktop rocket lake di di punta. Il chip presenterà 8 core e 16 thread e ciò si tradurrà in 16 mb di cache l3 (2 mb per core) e 4 mb di cache l2 (512 kb per core). In termini di boost clock, l'intel core di undicesima generazione funziona a frequenze di base di 3,5 ghz ma per quanto riguarda il boost, la cpu presenterà un boost clock massimo di 5,2 ghz (1 core) mentre la frequenza di boost all-core verrà mantenuta a 4,8 ghz. Il chip presenterà anche thermal velocity boost che dovrebbe fornire un salto di 100 mhz nella frequenza di clock massima, ciò dovrebbe portare a un boost clock single-core di 5,3 ghz, rendendola la prima cpu a raggiungere una frequenza così alta fuori dagli schemi. Tuttavia, ricorda che indipendentemente dall'utilizzo dei core cypress cove, l'intel core i9-11900k presenterà core e thread inferiori rispetto all'intel core i9-10900k, ciò è in parte dovuto al backporting di cypress cove sul raffinato nodo di processo a 14 nm. (foto) si dice che la cpu presenti un limite di potenza del 1° stadio di 125 w che è standard per una sku intel di punta, mentre invece il limite di potenza del 2° stadio o pl2 è valutato a 250 w. Ciò significa che quando raggiunge la velocità di clock massima pubblicizzata, la cpu potrebbe effettivamente prelevare la suddetta quantità di watt dall'alimentatore rendendolo uno dei chip a 8 core più assetati di energia mai prodotti. Questo potrebbe anche spiegare perché intel non ha scelto 10 core e 20 thread sulla sua linea intel core di undicesima generazione poiché si sarebbe rivelato essere un mostro assetato di potenza di un chip che supera anche il limite di potenza di 250 w. Intel core di undicesima generazione: core i7-11700k 8 core e 16 thread rocket lake (foto) al secondo posto di questa lista di intel core di undicesima generazione c'è il core i7, e possiamo notare che intel non segmenterà il conteggio core/thread su un livello inferiore al core i9. Il core i7-11700k presenta la stessa configurazione di core dell'intel core i9-11900k ma viene fornito con velocità di clock ridotte. Si dice che il chip presenti un boost clock di 5,0 ghz su un singolo e 4,6 ghz su tutti i suoi 8 core. La cpu trasporterà anche la stessa quantità di cache, quindi non è cambiato nulla, ma la differenza principale dovrebbe derivare dai clock e dai limiti di potenza. Questo chip con cestello inferiore avrà un limite di circa 225-250 w in pl2 (power limit 2) mentre il limite pl1 sarà standard a 125 w. Sarà interessante vedere come le cpu rocket lake overcloccano poiché la minima differenza tra i chip core i9 e core i7 può essere superata da un piccolo overclock; per quanto riguarda i prezzi, il core i7 sarà anche più economico della variante core i9, ma non sappiamo ancora come intel determinerà il prezzo delle sue cpu desktop rocket lake-s a 8 core. (foto) ci sono rumors secondo i quali intel potrebbe valutare in modo aggressivo questa serie di intel core di undicesima generazione, piazzandoli a circa $ 400 us per il core i9 e $ 300 us per il core i7, il che potrebbe rivelarsi un'ottima decisione se vogliono davvero andare contro le parti basate sullo zen 3 di amd nel sotto i $ 500 segmento usa. Intel core di undicesima generazione: core i5-11600k 6 core e 12 thread rocket lake (foto) il core i5-11600k è un chip a 6 core con 12 thread. Il core i5-11600k dovrebbe andare contro l'amd ryzen 5 5600x che è una cpu fenomenale a sé stante. Si dice che il core i5-11600k abbia una velocità di clock di 4,9 ghz su un singolo e 4,6 ghz su tutti i core. Si noti che il thermal velocity boost non sarà disponibile sugli sku inferiori ai modelli core i9, quindi non dovremmo aspettarci un limite di frequenza esteso sugli sku core i7 e core i5, mentre per quanto riguarda le cache, il chip conterrà 12 mb di cache l3 e 3 mb di cache l2. Ora il principale terreno di prova per questo chip contro l'amd ryzen 5 5600x sarà la sua prestazione in rapporto al prezzo visto che il ryzen 5 5600x con un prezzo consigliato di $ 299 negli stati uniti è leggermente più alto in termini di prezzo se confrontato con il suo predecessore. Il core i5-11600k invece sostituirà il core i5-10600k che ha un prezzo al dettaglio di circa $ 260 us e, se intel si attiene alla sua strategia di prezzo, il core i5-11600k potrebbe effettivamente diventare un chip di vendita caldo nel mercato dei giochi mainstream. (foto) detto questo, dobbiamo anche tenere conto della disponibilità del core i5-11600k in quanto, tecnicamente, le sku tradizionali non sono influenzate molto dai problemi di fornitura come nel caso del ryzen 5 5600x, ma un piccolo ritardo nelle scorte potrebbe far perdere a intel l'opportunità di creare un'ammaccatura nel segmento ryzen 5 di amd. I consumatori hanno già visto ciò che amd ha fornito come successore del suo ryzen 5 3600x, quindi ora è il momento di vedere cosa può fare il successore del core i5-10600k. Intel core di undicesima generazione: core i5-11400 6 core e 12 thread rocket lake infine, in questa lista dei nuovi intel core di undicesima generazione, abbiamo il core i5-11400 che è una cpu desktop rocket lake di 11a generazione bloccata e non k. (foto) intel difficilmente prende la strada dei chip bloccati, anzi, è un qualcosa che fa raramente in quanto, come in questo caso, ciò divorerà le vendite delle sue sku della serie k; il core i5-11400 tra l'altro, in quanto tale, sarà un chip a 6 core e 12 thread con una configurazione del core simile al core i5-11600k ma velocità di clock inferiori di 4,4 ghz (boost di 1 core) e 4,2 ghz (boost di tutti i core). Il chip presenterà un limite di potenza standard da 65 w in pl1 e 125 w in pl2. Sebbene la cpu tecnicamente non supporti l'overclock, i fornitori di schede madri incorporeranno bios e funzionalità per aumentare i limiti di potenza delle sku non k per i chip rocket lake, ciò dovrebbe produrre una base più alta e frequenze di boost più stabili quindi, nel complesso, otterrai prestazioni simili alle sku della serie k a un prezzo inferiore. Ecco tutto ciò che sappiamo sulle cpu desktop intel core di undicesima generazione la piattaforma cpu desktop intel rocket lake-s dovrebbe supportare il socket lga 1200 che farà il suo debutto con le cpu comet lake-s anche se su schede madri della serie 400. (foto) i processori intel core di undicesima generazione verranno lanciati insieme alle schede madri della serie 500, ma da allora è stato confermato che le schede madri lga 1200 offriranno il supporto per le cpu rocket lake-s, soprattutto considerando il fatto che pcie gen 4. 0 è una caratteristica importante di z490 schede madri che sarebbero abilitate solo con l'uso di cpu desktop rocket lake-s. Tra le "main feature" di questi nuovi intel core di undicesima generazione abbiamo: prestazioni migliorate con la nuova architettura core cypress cove fino a 8 core e 16 thread (guadagni ipc a doppia cifra su skylake) nuova architettura grafica xe (prestazioni fino al 50% in più rispetto a gen9) maggiore supporto di memoria ddr4 3200 mhz corsie cpu pcie 4. 0 (disponibile sulle schede madri z490 e z590) display avanzato (hdmi 2. 0b integrato, dp1. 4a, hbr3) corsie pcie cpu x4 aggiunte = 20 corsie pcie 4. 0 cpu totali enhanced media (12 bit av1 / hvec, compressione e2e) memoria collegata alla cpu o memoria intel optane nuove caratteristiche e capacità di overclock offload audio usb cnvi e wireless-ax integrati usb 3. 2 gen 2x2 integrato (20g) lan discreta ethernet da 2,5 gb intel thunderbolt 4 discreto(compatibile usb4) si dice che l'architettura per le cpu intel core di decima generazione sia cypress cove, che secondo quanto riferito è un ibrido tra il design di sunny cove e willow cove, ma presenterà l'architettura della gpu xe gen 12. Ai colleghi di wccftech è stato anche detto che la serie di schede madri z590 con supporto thunderbolt 4. 0 sarà annunciata entro la fine dell'anno, quindi aspettatevi maggiori informazioni sulle cpu rocket lake nei prossimi mesi. I benchmark dell'intel core di undicesima generazione all'inizio di questo mese, l'intel core di undicesima generazione di punta, ovvero il core i9-11900k, è apparso nel database di benchmark ashes of the singularity abbinato a una gpu geforce rtx 3080. Ora, il processore è stato confrontato con una geforce rtx 2080 ti, consentendo di fare ulteriori confronti tra esso e altri processori desktop recenti. Https://twitter. Com/tum_apisak/status/1334669804330860544 secondo le new entry, il core i9-11900k ottiene circa 6. 075 punti con una geforce rtx 2080 ti e 32 gb di ram. Il processore ha anche raggiunto un framerate di 61,9 fps sul preset crazy_1080p che esegue il preset directx 12, al contrario, un sistema core i9-10900k simile ha ottenuto 5. 700 punti, anche se ha due core in più rispetto al core-11900k. Come ti dicevo sopra, sulla base delle informazioni passate, il flagship degli intel core di undicesima generazione, aveva già fatto trapelare le sue specifiche, inoltre avrà avrà 4 mb di cache l3 in meno rispetto al suo predecessore comet lake-s. Tuttavia, il core i9-11900k è comunque riuscito a superare il ryzen 9 5950x con un buon margine e, come mostra lo screenshot qui sopra, il ryzen 9 5950x perde quasi 500 punti e 5 fps nello stesso preset, sebbene abbia lo svantaggio di 16 gb di ram, anziché 32 gb. I due processori sono stati confrontati sulla stessa api e con la stessa gpu, come riferimento, i core aggiuntivi del ryzen 9 5950x lo aiuteranno a superare il core i9-11900k nella maggior parte dei benchmark, come abbiamo già visto su geekbench.

Il risultato principale del paper è netto: alcuni metodi di parameter-efficient finetuning ottengono buone prestazioni sui nuovi compiti ma degradano capacità già presenti nel modello originale.

Questo significa che un modello AI potrebbe sembrare migliorato se lo si guarda solo sul nuovo benchmark, ma risultare peggiore in ragionamento generale, comprensione linguistica o conoscenze precedenti.

capacità di apprendere nuovi task
conservazione delle abilità precedenti

bilanciamento tra memoria e adattamento
comportamento del modello dopo più aggiornamenti

Secondo il preprint, il problema emerge soprattutto nei casi di specializzazione aggressiva. Gli autori suggeriscono quindi di non valutare il finetuning solo in base ai punteggi finali, ma anche in base alle competenze che il modello mantiene dopo l’aggiornamento.

Questa osservazione può avere conseguenze pratiche. Assistenti vocali, software professionali e sistemi integrati negli smartphone vengono aggiornati spesso. Un cattivo equilibrio tra stabilità e plasticità potrebbe creare risposte incoerenti o perdita di affidabilità.

Il problema tocca anche le AI integrate nei dispositivi personali, come mostra il caso di Apple Intelligence su iPhone, dove il modello deve adattarsi all’utente senza compromettere funzioni già presenti.

I limiti del preprint e cosa manca ancora

Il lavoro resta sperimentale. PEFT-Arena è un benchmark utile, ma non copre tutte le situazioni reali in cui un grande modello linguistico può essere aggiornato o personalizzato.

Gli autori testano modelli e dataset specifici. Non è quindi automatico che gli stessi risultati valgano per ogni architettura AI, ogni dominio applicativo o ogni tecnica PEFT disponibile.

C’è anche un problema di misurazione. Stabilire cosa un modello abbia davvero dimenticato non è banale. Alcune capacità emergono solo in contesti particolari e potrebbero non essere rilevate dai benchmark standard.

Un altro limite riguarda la velocità del settore. Tecniche di finetuning, architetture e dataset cambiano rapidamente. PEFT-Arena dovrà essere aggiornata e confrontata con altri metodi prima di diventare un riferimento solido.

Cosa cambia per il futuro dei grandi modelli AI

Negli ultimi anni il settore ha puntato soprattutto su modelli più grandi e più potenti. Questo studio sposta l’attenzione sulla qualità dell’adattamento, cioè su quanto un modello riesca a imparare senza perdere ciò che sapeva già.

Se la ricerca su stabilità e plasticità dovesse maturare, i futuri sistemi AI potrebbero diventare più affidabili negli aggiornamenti continui. Non basterà più dire che un modello è migliorato su un singolo benchmark: servirà verificare cosa ha conservato.

La domanda aperta riguarda il lungo periodo: quanti aggiornamenti consecutivi può sostenere un grande modello linguistico prima che la sua conoscenza originale inizi a deteriorarsi in modo significativo?

Parameter-efficient finetuning: perché l’AI rischia di dimenticare

Un nuovo preprint analizza il compromesso tra adattamento e memoria nei grandi modelli linguistici.

Parameter-efficient finetuning: cosa succede quando un modello AI viene aggiornato

Come funziona PEFT-Arena tra stabilità e plasticità

Cosa mostra il benchmark sul finetuning efficiente

I limiti del preprint e cosa manca ancora

Cosa cambia per il futuro dei grandi modelli AI

Lascia un commento Annulla risposta

Parameter-efficient finetuning: cosa succede quando un modello AI viene aggiornato

Leggi Altro

Noble Audio Osprey sfida i modelli premium con due soli driver

Louisiana, un volontario misura 738 mm: record da verificare

Il Giappone punta a 30 lanci spaziali l’anno, ma oggi è fermo a due

Missione umana su Marte: costruire il veicolo non basta

Come funziona PEFT-Arena tra stabilità e plasticità

Cosa mostra il benchmark sul finetuning efficiente

I limiti del preprint e cosa manca ancora

Cosa cambia per il futuro dei grandi modelli AI

Lascia un commento Annulla risposta