AI-Gorà del 2/02/2025

Sguardi sul futuro a cura dell'Osservatorio sulle prospettive cliniche dell'intelligenza Artificiale: Innovazione, Educazione e Applicazioni.

Alessandro Pezzano

Edoardo Ares

Carlo Alfredo Clerici

, e 2 altri/altrи

feb 01, 2025

🚀 In primo piano

Il Garante della Privacy blocca DeepSeek a tutela dei dati italiani

Il Garante per la protezione dei dati personali ha disposto il blocco di DeepSeek-R1 in Italia per presunte violazioni della normativa sulla privacy. Il modello AI, sviluppato dalla startup cinese DeepSeek, avrebbe trattato dati personali senza adeguate garanzie di trasparenza e sicurezza, sollevando preoccupazioni simili a quelle che avevano portato alla temporanea sospensione di ChatGPT nel 2023.

Violazioni della privacy: DeepSeek-R1 è accusato di raccogliere e trattare dati personali senza il consenso degli utenti, in potenziale violazione del GDPR.
Intervento d’urgenza: il Garante ha ordinato la sospensione del trattamento dei dati italiani per prevenire rischi di esposizione e uso improprio delle informazioni personali.
Precedenti simili: il caso richiama la temporanea sospensione di ChatGPT in Italia nel 2023 per ragioni analoghe, poi revocata dopo adeguamenti normativi.
Rischio sicurezza dati: le autorità temono che l'AI cinese possa essere utilizzata per la raccolta massiva di informazioni sensibili senza adeguati controlli.
Possibili sviluppi: DeepSeek dovrà fornire chiarimenti e adeguarsi alle normative europee per poter riprendere le operazioni in Italia.

C'è una nuova AI cinese che fa tremare il mondo

DeepSeek-R1 è un nuovo modello di intelligenza artificiale open source sviluppato dalla startup cinese DeepSeek. Con 671 miliardi di parametri, si distingue per un’architettura ottimizzata che riduce i costi computazionali e migliora l’efficienza. Il modello rappresenta una minaccia diretta ai competitor occidentali come OpenAI e Meta, con prestazioni competitive in matematica e logica.

Efficienza avanzata: utilizza la Multi-head Latent Attention (MLA) e l'architettura Mixture-of-Experts (MoE), riducendo il consumo di memoria del 40%.
Ottimizzazione dei costi: l’addestramento è costato circa 15 milioni di dollari, rispetto ai 150 milioni dei modelli Meta, con un risparmio significativo in risorse computazionali.
Prestazioni competitive: in alcuni test matematici e logici supera il modello OpenAI o1, dimostrando capacità avanzate nel ragionamento.
Disponibilità open source: DeepSeek-R1 è rilasciato con licenza MIT e può essere testato gratuitamente su piattaforme come Ollama.
Limiti e criticità: la qualità delle risposte in italiano è inferiore rispetto a quelle in cinese e inglese, e ci sono dubbi sulla gestione della privacy e dei dati utente.

Velvet, presentata l'IA italiana di Almawave: cos'è e come funziona

Almawave, società italiana specializzata in data e intelligenza artificiale, ha recentemente presentato Velvet, una famiglia di modelli linguistici di grandi dimensioni (LLM) sviluppati interamente in Italia. I principali modelli della serie sono Velvet 14B e Velvet 2B.

Velvet 14B:

Parametri: 14 miliardi
Lingue supportate: italiano, tedesco, spagnolo, francese, portoghese e inglese
Vocabolario: 127.000 parole
Finestra di contesto: 128.000 token
Addestramento: svolto sul supercalcolatore Leonardo gestito da Cineca, utilizzando oltre 4.000 miliardi di token

Velvet 2B:

Parametri: 2 miliardi
Lingue supportate: italiano e inglese
Finestra di contesto: 32.000 token
Vocabolario: 127.000 parole
Addestramento: svolto sul supercalcolatore Leonardo, utilizzando oltre 2.000 miliardi di token

Entrambi i modelli sono stati progettati per essere efficienti, agili e a basso consumo energetico. Sono disponibili in modalità open source e possono essere utilizzati su diverse piattaforme, sia in cloud che on-premise. Un aspetto distintivo è l'attenzione alla tutela delle lingue supportate, con un focus particolare sull'italiano.

Per garantire un utilizzo etico e sostenibile, Almawave ha implementato tecniche di data lineage e algoritmi proprietari per ridurre i bias e proteggere la privacy. In particolare, l'algoritmo PAE (Privacy Association Editing) consente di eliminare informazioni sensibili direttamente dal modello senza necessità di riaddestramento.

🧑‍⚕️AI e salute

"Automatizzare la Scienza: Siamo Pronti a Sfruttare le Opportunità e Affrontare le Sfide?"

Musslick S, Bartlett LK, Chandramouli SH, Dubova M, Gobet F, Griffiths TL, Hullman J, King RD, Kutz JN, Lucas CG, Mahesh S, Pestilli F, Sloman SJ, Holmes WR. Automating the practice of science: Opportunities, challenges, and implications. Proc Natl Acad Sci U S A. 2025 Feb 4;122(5):e2401238121.

L'Intelligenza Artificiale sta trasformando la ricerca scientifica, accelerando la scoperta e migliorando la riproducibilità. Questo articolo esplora come l'automazione possa ridefinire la pratica scientifica, analizzando opportunità e limiti attuali. Tra i vantaggi emergono l'ottimizzazione della generazione di ipotesi, la progettazione sperimentale e l'analisi dei dati. Tuttavia, permangono sfide etiche e tecnologiche, come il rischio di bias e la necessità di supervisione umana. L'AI non sostituirà gli scienziati, ma potrebbe rivoluzionare il modo in cui lavorano.

📰 Attualità

La strana obsolescenza di Google vista da Deepseek

a cura di Silvia Riva, professore ordinario, dipartimento di lingue, letterature, culture e mediazioni, Università degli studi di Milano

È notoria la mortalità dei siti nel web da un po' di mesi a questa parte. Alessandro Marchesi, nel giugno 2024, riportava sul sito dell'ANSA la notizia che “Il 40% dei siti web visitati nel 2013 non esistono più". Continuava ponendo interrogativi sul destino della "memoria collettiva di Internet" e sulla "conservazione del patrimonio digitale". Il problema del destino del web, così come lo abbiamo conosciuto dalla sua nascita, è evidente per chiunque abbia usato internet per fare ricerche di recente.

L’uscita dell’app cinese Deepseek mi ha stimolata a porre un quesito sui risultati, sempre più deludenti e limitati in numero, relativi alle query per parole chiave nei motori di ricerca (tipo Google). Ho inoltre chiesto se si tratti di una involuzione legata all’obsolescenza dei siti o invece di un modo per spingere le persone all’uso dell'IA. I risultati sono stati molto interessanti. Si parla di “cannibalizzazione del web” e si scopre, fra il resto, che “la proliferazione di articoli generati da IA, spesso di bassa qualità ma ottimizzati per posizionarsi in cima ai risultati, ha reso più difficile individuare fonti affidabili. Google sta cercando di contrastare questo fenomeno, ma l'efficacia è ancora limitata”.

Deepseek ha fornito una risposta dettagliata, evidenziando che Google sta integrando l'IA nei suoi algoritmi, cambiando il modo in cui i risultati vengono generati. Questo include risposte dirette e riassunti generati dall'IA, che possono far sembrare i risultati meno numerosi. Inoltre, la saturazione di contenuti ottimizzati per SEO e la competizione con altri motori di ricerca stanno influenzando la qualità dei risultati.

Deep thinking
Deepseek ha analizzato diverse fonti per rispondere alla domanda. Ha rilevato che Google sta integrando l'IA per migliorare la comprensione delle query e fornire risposte sintetiche. Tuttavia, questo cambiamento ha portato a una maggiore presenza di contenuti generati da IA, spesso di bassa qualità, che complicano la ricerca di informazioni affidabili. Inoltre, la competizione con altri motori di ricerca e la necessità di innovare stanno spingendo Google a modificare i suoi algoritmi, a volte a scapito della qualità dei risultati tradizionali.

Risposta in lingua italiana
L'evoluzione recente dei motori di ricerca, incluso Google, è legata a una combinazione di fattori tecnologici, economici e strategici. Ecco una sintesi delle cause principali e del ruolo dell'intelligenza artificiale (IA) in questo cambiamento:

1. Integrazione dell'IA nei motori di ricerca
I motori di ricerca stanno passando da algoritmi basati su parole chiave a modelli avanzati di comprensione del linguaggio naturale. L'IA generativa (come Gemini di Google o ChatGPT integrato in Bing) permette di interpretare domande complesse e fornire risposte sintetiche, riducendo la necessità di navigare tra link esterni. Google e altri motori stanno introducendo "risposte uniche" generate dall'IA, che spesso sostituiscono i tradizionali risultati a elenco. Questo può far sembrare i risultati meno numerosi o meno approfonditi, soprattutto per query semplici.
2. Cambiamenti nell'ecosistema
La proliferazione di articoli generati da IA, spesso di bassa qualità ma ottimizzati per posizionarsi in cima ai risultati, ha reso più difficile individuare fonti affidabili. Google sta cercando di contrastare questo fenomeno, ma l'efficacia è ancora limitata. Gli algoritmi premiano ora contenuti che rispondono all'"intento di ricerca" anziché alla semplice densità di parole chiave. Questo richiede una maggiore cura nella struttura e nella qualità dei testi, penalizzando siti meno aggiornati.
3. Strategie commerciali e monetizzazione
Il modello tradizionale di Google, basato su annunci e click su link esterni, è minacciato dall'ascesa dell'IA. Servizi come ChatGPT o Perplexity offrono risposte immediate senza far visitare siti web, riducendo i ricavi pubblicitari. Alcuni analisti ipotizzano che Google stia spingendo l'IA per riconquistare utenti e creare nuovi modelli di business (es. abbonamenti premium per funzionalità avanzate). La partnership tra Bing e OpenAI ha accelerato l'adozione di strumenti conversazionali, costringendo Google a rinnovarsi rapidamente per non perdere quote di mercato.
4. Problemi tecnici e rischi dell'IA
I modelli di IA generativa commettono ancora errori (es. informazioni inventate o distorte), rendendo alcuni risultati inaffidabili. Google sta lavorando per mitigare questo problema, ma la sfida è complessa. Se l'IA fornisce risposte dirette, molti siti perdono traffico, disincentivando la creazione di contenuti originali. Questo potrebbe danneggiare l'ecosistema informativo nel lungo periodo.
5. Alternative e soluzioni per gli utenti
Motori di ricerca focalizzati sulla privacy come DuckDuckGo, Startpage o Qwant offrono risultati senza tracciamento, spesso più trasparenti. Per ricerche approfondite, motori come WolframAlpha (dati scientifici) o Ecosia (sostenibilità) possono integrare Google. Usare chatbot come Gemini o ChatGPT per query complesse, ma verificare sempre le fonti, soprattutto per temi sensibili.

Conclusione
Sì, è plausibile che i motori di ricerca tradizionali siano stati volutamente orientati verso l'IA per rispondere alla concorrenza e riconfigurare il mercato. Tuttavia, il calo percepito nella qualità dei risultati è anche dovuto a una transizione tecnologica verso modelli semantici avanzati, ancora in fase di affinamento, e all'abuso di tecniche SEO da parte di creatori di contenuti di bassa qualità. Per mitigare la frustrazione, gli utenti possono formulare query più specifiche, sperimentare motori alternativi o integrare strumenti IA con verifiche incrociate.

⚖️ Diritto e regolamentazione

Arriva GhostGPT! L’AI senza Censura che aiuta i criminali informatici a colpire senza pietà

👩‍🏫 AI e Istruzione

3 febbraio Innovazione e ricerca AI Day, la strategia della Statale in tema intelligenza artificiale

Chatbot e IA, Minerva 7B dell'Università Sapienza assistente virtuale che pensa in italiano

💻🙏🏻Ringraziamenti

La newsletter è realizzata da Carlo Alfredo Clerici, Edoardo Ares Tettamanti, Alessandro Pezzano, Carlotta Ghironi, Rocco Ditaranto e Giampaolo Collecchia.

Si ringrazia, in particolare Silvia Riva, per il contributo presente in questa edizione

Siamo a disposizione per qualsiasi richiesta, espressione di interesse o anche solo per scambiare due chiacchiere!

Contatta gli autori

Questo post è pubblico, quindi non esitare a condividerlo.

AI-gorà

Discussione su questo Post