MetaNerd #4 : Le ultime news sull'AI

Normative, Etica, Controllo, Allucinazioni e i migliori papers del 2023

dic 18, 2023

Cari lettori di MetaNerd,

Negli ultimi tempi, ho dovuto mettere in pausa questa newsletter per dedicarmi a pieno a progetti che mi hanno appassionato e sfidato in modi inaspettati. Questa pausa mi ha dato l'opportunità di riflettere, imparare e crescere, ma mi ha anche fatto capire quanto mi mancasse scrivere e condividere con voi le mie scoperte e riflessioni.

Con questa newsletter inzia un nuovo percorso alla scoperta di argomenti intriganti da esplorare insieme. In particolare, l'intelligenza artificiale – un campo che continua a stupirmi con sviluppi sorprendenti e innovazioni rivoluzionarie – sarà al centro della nostra attenzione. L'AI sta plasmando il nostro futuro in modi che solo pochi anni fa avremmo potuto solo immaginare, rendendolo un argomento di cruciale importanza per chiunque, in qualsiasi settore.

In questa nuova fase vi prometto aggiornamenti regolari sulle ultime notizie dal mondo dell'AI, esplorazioni degli strumenti più innovativi e consigli pratici su come rimanere sempre informati.

L’obiettivo è di fornirvi una lettura di una serie di articoli che ho trovato interessante ed in ogni paragrafo troverete un link alla fonte in modo da approfondire la lettura.

Grazie per avermi aspettato. Sono impaziente di riprendere questa avventura insieme, con la stessa passione e curiosità di sempre.

AI ACT

Vorrei subito inziare con una notizia che segna un momento storico nel campo dell'intelligenza artificiale: l'approvazione, da parte dell'Unione Europea, di una normativa rivoluzionaria sull'IA, la prima nel suo genere a livello globale. Dopo intensi negoziati, l'AI Act è diventata una realtà, promettendo di plasmare il futuro dell'IA in Europa e oltre.

Questa legislazione è un passo importante per garantire che l'evoluzione dell'IA non solo rispetti i diritti umani fondamentali e l'ambiente, ma anche che promuova l'innovazione. È un equilibrio delicato e vitale: da un lato, dobbiamo salvaguardare i valori etici e la sicurezza; dall'altro, incoraggiare il progresso e l'innovazione che l'IA può portare.

Normative sull’AI

Questa normativa introduce una supervisione più rigida su come le aziende utilizzano le tecnologie di AI, richiedendo una trasparenza totale sia negli algoritmi che nei dati utilizzati.

Questa regolamentazione rappresenta una svolta per il mercato, ponendo la responsabilità dell'autovalutazione non più sui produttori, ma sugli utilizzatori di queste tecnologie. È un cambiamento significativo che sposta l'enfasi sulle imprese che implementano soluzioni AI, sottolineando la loro responsabilità nel garantire che le loro applicazioni rispettino le nuove norme europee.

Le sanzioni previste dall'AI Act non riguardano solo chi produce intelligenza artificiale, ma si estendono anche a chi la utilizza. Questo significa che aziende di spicco come Google e OpenAI, secondo esperti del settore come Andrea Rigoni di Deloitte, attualmente si trovano in una posizione di non conformità con alcuni aspetti della legge. Queste aziende, insieme a molte altre, hanno ora due anni di tempo per adeguarsi a queste nuove regole, una finestra che offre sia una sfida che un'opportunità per riallinearsi in modo etico e responsabile.

Innovazione e produttività

Da quando OpenAI ha lanciato ChatGPT circa un anno fa, svelando al mondo il potenziale inesplorato dei modelli di linguaggio , si è accesa una competizione feroce a livello mondiale per creare le applicazioni più efficaci e redditizie.

Oltre il 90% delle maggiori imprese statunitensi sta già utilizzando soluzioni basate sull'AI, con impatti rilevanti su vari settori. E mentre ci avviciniamo al 2024, l'ampliamento dell'infrastruttura, l'implementazione di standard elevati di sicurezza, l'addestramento di modelli sempre più sofisticati e la comprensione di come sfruttare al meglio il potenziale dell'AI diventano temi fondamentali. Inoltre, la domanda crescente mette sotto pressione l'infrastruttura di calcolo, con una corsa all'accaparramento di risorse tecnologiche come i processori grafici avanzati.

Le aziende si trovano di fronte a scelte strategiche fondamentali su come investire in questa tecnologia per trarne benefici sostenibili. Si tratta di decidere su come integrare l'IA nei processi aziendali, migliorare la produttività dei dipendenti e aumentare i margini operativi. Campi promettenti includono la pubblicità, l'assistenza digitale professionale, i modelli predittivi, i ChatBot e la mobilità autonoma.

E dal punto di vista degli individui, l'IA segna l'inizio di una nuova era caratterizzata da scoperte scientifiche accelerate, aumento della produttività del lavoro e più tempo libero. Settori come istruzione, assistenza sanitaria e intrattenimento diverranno più accessibili e convenienti, anche nei paesi in via di sviluppo.

Il lato oscuro dell’AI

Al centro di questo scenario, l'automazione guidata dall'intelligenza artificiale generativa sta iniziando a riscrivere le regole del gioco nel mercato del lavoro. Settori e professioni che un tempo sembravano al riparo dall'automazione, ora si trovano di fronte alla prospettiva di un radicale cambiamento, se non addirittura di un'obsolescenza accelerata.

Questa evoluzione solleva domande fondamentali sulla natura del lavoro umano nell'epoca dell'AI. Cosa significa essere un lavoratore in un mondo dove macchine intelligenti possono svolgere compiti sempre più complessi, talvolta con maggiore efficienza e minori costi rispetto agli esseri umani? Come si trasformeranno le professioni tradizionali e quali nuovi ruoli emergeranno in risposta a questa ondata di cambiamento?

In questa nuova era, la necessità di riconfigurare le nostre abilità e reinventare il nostro approccio al lavoro diventa importante. L'adattabilità, la creatività e l'apprendimento continuo si affermano come competenze chiave per navigare in questo mare in tempesta. Allo stesso tempo, sorge l'urgente necessità di un dialogo approfondito su come garantire che l'evoluzione dell'AI avanzi in modo responsabile e inclusivo, senza lasciare indietro nessuno.

Algor-etica (“sviluppo etico degli algoritmi”)

In questo scenario di rapido cambiamento, emerge una voce di speranza. Nel suo messaggio per la 57ª Giornata Mondiale della Pace, Papa Francesco riflette sulle sfide e le opportunità presentate dall'intelligenza artificiale e dalle nuove tecnologie. Il Papa evidenzia le "entusiasmanti opportunità" che queste tecnologie offrono, come il miglioramento del lavoro, delle condizioni di vita, e degli strumenti medici. Allo stesso tempo, mette in guardia contro i "gravi rischi" che possono derivare dal loro uso improprio, come la promozione della guerra attraverso l'uso di armi "intelligenti" e interventi per destabilizzare governi legittimi, incluso il condizionamento delle elezioni politiche.

Il Papa sottolinea che la vera pace passa anche attraverso il progresso della scienza e della tecnologia, che dovrebbe contribuire al miglioramento della società umana. Tuttavia, esprime preoccupazione per l'uso delle nuove tecnologie per promuovere la guerra e l'ingiustizia, sottolineando che ciò non può essere considerato vero progresso.

Gli sviluppi tecnologici che non portano a un miglioramento della qualità di vita di tutta l’umanità, ma al contrario aggravano le disuguaglianze e i conflitti, non potranno mai essere considerati vero progresso.

Come controllare l’AI?

Uno dei timori riguardante questo campi è che un giorno possa esserci uno sviluppo di un sistema di intelligenza artificiale superiore alle capacità umane.
OpenAI, sotto la guida di Sam Altman, sta affrontando questa sfida con il team Superalignment, guidato da Ilya Sutskever.
Il team sta esplorando un approccio innovativo: utilizzare modelli AI meno avanzati, come GPT-2, per gestire quelli più sofisticati, come GPT-4. Questa strategia simula il modo in cui gli esseri umani potrebbero controllare un'intelligenza artificiale sovrumana.
L'obiettivo è poi condividere le loro scoperte per contribuire alla sicurezza globale dell'IA e promuovere il suo sviluppo a beneficio dell'umanità.

Il vantaggio delle allucinazioni

I Large Language Models (LLM) sono assistenti utili: eccellono nel combinare concetti e sanno leggere, scrivere e programmare per aiutare le persone a risolvere i problemi. Ma potrebbero scoprire conoscenze completamente nuove?

Poiché è stato dimostrato che gli LLM “soffrono” di allucinazioni creando informazioni errate, utilizzarli per fare scoperte verificabilmente corrette è una sfida. Ma cosa accadrebbe se potessimo sfruttare la creatività degli LLM identificando e sviluppando solo le loro idee migliori?

Una nuova ricerca di Google ha fatto proprio questo, ampliando la nostra comprensione di ciò di cui sono capaci i modelli di intelligenza artificiale.

Il paper dal titolo "Mathematical discoveries from program search with large language models", pubblicato su Nature, esplora l'uso di Large Language Models (LLM) per risolvere complesse sfide matematiche e scientifiche

A diagram of the FunSearch process showing screenshots of code, a network and images of graphs with checkmarks and x's.

I ricercatori hanno sviluppato un nuovo metodo chiamato FunSearch (ricerca nello spazio delle funzioni) e lo hanno applicato al problema del cap set – un problema di lunga data nella matematica combinatoria estrema – per scoprire nuove soluzioni al problema che vanno “oltre quelle più conosciute, "secondo gli autori.

Questa è la prima volta che un modello di intelligenza artificiale viene utilizzato per scoprire nuove soluzioni a problemi aperti in scienza e matematica, ma gli autori hanno anche dimostrato un’applicazione nel mondo reale di questa scoperta applicandola al problema dell’ “online bin-packing” , che può essere utilizzato per applicazioni come la creazione di data center più efficienti e l'imballaggio dei camion di trasporto in modo più efficiente.

A differenza della maggior parte degli approcci di ricerca informatica, FunSearch cerca programmi che descrivano come risolvere un problema, piuttosto che quale sia la soluzione

Questo studio evidenzia come l'intelligenza artificiale stia emergendo come uno strumento potente non solo per l'elaborazione del linguaggio, ma anche per la scoperta scientifica e la risoluzione di problemi complessi.

Nel 2023, l'intelligenza artificiale ha visto significativi progressi in varie aree, tra cui modelli di linguaggio, elaborazione di immagini, generazione di immagini e video editing. Riassumo qui i più influenti in questi ambiti e i vantaggi che hanno portato o potrebbero portare:

Sparks of AGI di Microsoft: Analizza una versione iniziale di GPT-4, che rappresenta una nuova classe di modelli di linguaggio di grandi dimensioni con capacità di intelligenza più generalizzata. GPT-4 ha mostrato capacità impressionanti in diversi domini, inclusi matematica, codifica, medicina, legge e psicologia. Questo lavoro suggerisce che GPT-4 potrebbe essere considerato un primo, seppur incompleto, esempio di intelligenza artificiale generale (AGI).
PALM-E di Google: Introduce un modello di lingua che incorpora input sensoriali continui, collegando parole e percezioni del mondo reale. Questo modello di linguaggio integra frasi multimodali con informazioni visive, di stima dello stato e testuali, dimostrando notevoli capacità in compiti come la pianificazione della manipolazione robotica sequenziale e il question answering visivo.
LLaMA 2 di Meta AI: È una versione migliorata del suo predecessore, addestrata su un nuovo mix di dati, che esibisce prestazioni superiori in termini di utilità e sicurezza rispetto ai modelli open-source e comparabili a quelli closed-source. Questo lavoro mira a contribuire allo sviluppo responsabile di modelli di linguaggio di grandi dimensioni (LLM).
Generative Agents di Stanford University e Google: Presenta agenti generativi in grado di simulare comportamenti umani credibili, con applicazioni in scenari di role-play e prototipazione sociale nei mondi virtuali. Questi agenti possono memorizzare esperienze, sintetizzare ricordi e recuperarli dinamicamente per la pianificazione del comportamento.
LLaVA by University of Wisconsin–Madison, Microsoft, and Columbia University:
LLaVA (Large Language and Vision Assistant), un modello multimodale all'avanguardia che sfrutta GPT-4, basato solo sul linguaggio, per generare dati che seguono istruzioni sia per testi che per immagini. Questo approccio innovativo estende il concetto di "instruction tuning" allo spazio multimodale, consentendo lo sviluppo di un assistente visivo a uso generale.
Segment Anything di Meta AI: Introduce un modello innovativo per la segmentazione di immagini, creando il più ampio dataset di segmentazione esistente, con oltre 1 miliardo di maschere per 11 milioni di immagini. Il modello SAM (Segment Anything Model) dimostra prestazioni competitive rispetto ai risultati completamente supervisionati su una gamma diversificata di compiti a valle.
DALL-E 3 di OpenAI: Affronta una delle sfide più significative nei modelli di generazione di immagini da testo: il prompt following. Il documento presenta un sistema di didascalie per immagini specializzato, in grado di generare didascalie altamente descrittive e precise, migliorando significativamente le capacità del modello DALL-E nel seguire i prompt ed essere più preciso nella generazione dell’immagine
.
ControlNet di Stanford University: Una struttura di rete neurale progettata per controllare modelli di diffusione preaddestrati e supportare condizioni di input aggiuntive. ControlNet apprende condizioni specifiche per il compito in modo end-to-end e dimostra un apprendimento robusto anche con piccoli set di dati di allenamento.
Gen-1 di Runway: Introduce un avanzamento rivoluzionario nell'editing video attraverso l'unione di modelli di diffusione generativi guidati da testo. Questo modello ha superato sfide significative nell'editing video basato su descrizioni testuali o visive.
DreamerV3: Un algoritmo innovativo basato su modelli che dimostra prestazioni eccezionali in una vasta gamma di domini. DreamerV3 combina percezione ricca e formazione immaginativa, incorporando tre reti neurali per la predizione di risultati futuri, la valutazione del valore di diverse situazioni e l'apprendimento su come navigare verso situazioni di valore.
Sei strategie per ottenere il meglio da ChatGPT
In attesa di chatGPT 4.5 (voci di corridoio parlano di un’ uscita imminente di un GPT 4.5-turbo dopo i recenti leak che spiegherebbe il miglioramento delle prestazioni delle ultime settimane) openAI ha rilasciato la propria Guida al Prompt Engineering.
La guida è utile per chiunque cerchi di massimizzare i LLM.

Ecco le 6 strategie delineate per ottenere risultati migliori da GPT-4:
1. Scrivi istruzioni chiare
  Per ottenere il massimo dai modelli di intelligenza artificiale, è importante essere specifici nelle richieste. Se desideri risposte più brevi o avanzate, specifica le tue esigenze. Fornire esempi del formato desiderato aiuta il modello a comprendere meglio le tue preferenze, riducendo il margine di errore nell'interpretazione delle tue richieste.
2. Fornisci un testo di riferimento
  Per ridurre il rischio di ricevere risposte inesatte dai modelli linguistici, specialmente su argomenti complessi o richieste di citazioni, è utile fornire testi o contesti di riferimento. Questo approccio aumenta la probabilità di ottenere risposte più precise e meno inventate.
3. Suddividi le attività complesse in sottoattività più semplici
  Per minimizzare gli errori quando si utilizza un modello linguistico, è consigliabile suddividere i compiti complessi in una serie di compiti più semplici e modulari. Questo approccio, simile alla decomposizione di sistemi in ingegneria del software, consente di utilizzare i risultati dei compiti precedenti come input per quelli successivi, rendendo l'intero processo più gestibile e accurato.
4. Dai al modello il tempo di "pensare"
  Per ridurre gli errori di ragionamento nei modelli linguistici, è utile chiedere loro di esporre il proprio processo di pensiero prima di fornire una risposta. Questo metodo, simile al prendersi il tempo per risolvere un calcolo, permette al modello di procedere passo dopo passo verso la soluzione, migliorando l'affidabilità e l'accuratezza delle risposte.
5. Utilizza strumenti esterni
  Per massimizzare l'efficacia dei modelli linguistici, è consigliabile integrarli con altri strumenti. Sistemi di recupero testi possono fornire al modello informazioni rilevanti, mentre motori di esecuzione di codice possono assistere in calcoli e nell'esecuzione di codici. Utilizzando strumenti specializzati per compiti specifici, si ottiene una sinergia che migliora l'affidabilità e l'efficienza complessiva delle risposte.
6. Testa le modifiche in modo sistematico
  Per assicurarsi che le modifiche ai prompt portino a un miglioramento effettivo delle prestazioni di un modello linguistico, è importante misurare queste prestazioni. Questo si fa definendo una suite di test completa che valuti le modifiche su un ampio e rappresentativo insieme di esempi, anziché solo su pochi casi isolati. Questo approccio consente di valutare in modo più accurato l'impatto complessivo delle modifiche.
Un prompt per ChatGPT
Voglio che tu mi faccia da interprete per i mei sogni. Ti descriverò i miei sogni e tu mi fornirai interpretazioni basate sui simboli e sui temi presenti nel sogno. Non fornirmi opinioni o supposizioni personali su di me. Dammi solo le interpretazioni basati sulle informazioni che ti racconto.
Ecco un mio sogno :
Mi ritrovo ad essere inseguito e mentre corro mi accorgo di rimanere sempre allo stesso posto
Un prompt per MidJourney
Closeup of a woman at home, with a soft, warm lighting, wearing casual clothing. She has a calm facial expression that reflects her contentment with life. The setting is cozy and intimate, emphasizing the comfort of being at home. The style is reminiscent of vintage photography, --ar 2:3
Un prompt per Stable Diffusion
a beautiful german woman is standing in the rain near the hofbräuhaus in munich, dark night, heavy rain, bokeh, highly detailed
Negative prompt: (worst quality:0.8), cartoon, halftone print, (cinematic:1.2), signature, text, logo, copyright
Steps: 60, Size: 1024x640, Seed: 1668295779, Sampler: DPM++ 3M SDE Karras, CFG scale: 5, Hires steps: 20, Hires upscale: 2, Hires upscaler: 8x_NMKD-Superscale_150000_G, Face restoration: GFPGAN, Denoising strength: 0.5
Spero di avervi dato qualche spunto di riflessione e che hai trovato interessante quanto ti ho segnalato. Se hai suggerimenti, richieste o vuoi condividere il tuo pensiero su uno degli argomenti affrontati sentiti libero di lasciare un commento!
Lascia un commento
Grazie per aver letto “Metà nerd e metà.. verso” Iscrivetevi gratuitamente per ricevere nuovi post.
“Metà nerd e metà.. verso“ vive grazie al passaparola. Condividi l'articolo con qualcuno a cui piacerebbe
Condividi

Metà nerd e metà..verso

MetaNerd #4 : Le ultime news sull'AI

Normative, Etica, Controllo, Allucinazioni e i migliori papers del 2023