L’intelligenza artificiale (d’ora in poi, IA) è un campo di ricerca che sviluppa sistemi in grado di eseguire compiti complessi, come la capacità di classificare, raccomandare o generare nuovi contenuti (testo, immagini, audio).
I servizi comunemente detti “IA” si basano sull’apprendimento automatico, ovvero su algoritmi che analizzano enormi quantità di dati per individuare pattern statistici e costruire modelli in grado di fare previsioni per eseguire un compito. L’output di un modello è dato da calcoli di probabilità e, pertanto, presenta sempre un margine di errore.
Oggi, chiunque può interagire con modelli generativi grazie a chatbot accessibili online. Questi strumenti hanno “modellato” il linguaggio naturale e simulano conversazioni producendo sequenze di parole plausibili.
È bene ricordare che i chatbot:
‒ non sono motori di ricerca → possono generare informazioni false, le cosiddette “allucinazioni”;
‒ non consultano una memoria-archivio quando rispondono → generano risposte plausibili dato il contesto della richiesta;
‒ non imparano in tempo reale → correggere un errore non cambia il modello.
Educare gli studenti e le studentesse alle potenzialità e ai rischi presentati dall’IA è imprescindibile.
Utilizzare strumenti di IA come docenti per la preparazione di materiale didattico o in classe deve prevedere sempre responsabilità, consapevolezza dei limiti e pensiero critico nell’analisi dell’output.
Il mondo intero si sta confrontando con una realtà che fino a poco tempo fa sembrava confinata alle storie di fantascienza: l’intelligenza artificiale. Una rivoluzione tecnologica il cui impatto si può comparare alla scoperta dell’elettricità, ma la cui pervasività e rapidità di adozione, in ogni settore della società, non ha precedenti.
Demistifichiamo subito alcuni luoghi comuni.
L’intelligenza artificiale non è un sistema informatico, non è un software dotato di intelligenza, non è nemmeno una “nuova” tecnologia. L’IA è un ambito di ricerca.
Il termine viene coniato nel 1956 da John McCarthy quando è ufficialmente istituita come disciplina accademica.
Negli anni ’80, Marco Somalvico, professore di Intelligenza Artificiale al Politecnico di Milano, ne chiarì bene l’ambito di ricerca: sviluppare sistemi che emulano prestazioni ritenute esclusive dell’essere umano in un dato momento del progresso tecnologico. Di conseguenza, la categoria in cui rientrano questi sistemi è dinamica, in continua evoluzione.
Ad esempio, nel 2012 il riconoscimento facciale era considerato un’avanguardia dell’IA, mentre oggi è una funzionalità scontata di ogni smartphone. Con l’avanzare della tecnologia, il confine di ciò
che consideriamo IA si sposta di pari passo.
Usare l’espressione “intelligenza artificiale” per riferirsi a un sistema o a uno strumento può essere fuorviante perché un sistema di IA (almeno per ora) non ha in realtà nulla di intelligente, come denota l’aggettivo “artificiale”, che significa tanto “fatto dall’uomo” quanto “simulato”. Ciò che ad oggi rientra nella definizione di IA sono più propriamente tutti quei sistemi costruiti con l’apprendimento automatico.
Il campo di ricerca dell’intelligenza artificiale si basa quasi esclusivamente su modelli di apprendimento automatico (in inglese, Machine Learning). Vediamo più nel dettaglio di che cosa si tratta.
Una macchina utilizza un algoritmo, ovvero una sequenza di istruzioni, per “imparare” da una serie di dati (immagini, testi o suoni) che le sono forniti.
Il processo di addestramento è come insegnare a un bambino o a una bambina a riconoscere gli animali mostrando loro migliaia di foto e indicando volta per volta “mucca”, “cavallo”, “pecora” e così via.
L’algoritmo della macchina utilizza complessi calcoli statistici per individuare schemi ricorrenti e imparare quali combinazioni di pixel (nel caso di immagini) o parole (nel caso di testi) si associano
più frequentemente tra loro. In questo modo, la macchina costruisce un modello matematico, capace di fare previsioni su dati simili a quelli da cui ha imparato. È un processo, detto addestramento, che richiede molto tempo ed enormi risorse computazionali.
Si tratta di un apprendimento “automatico” perché non innesca nessun ragionamento sul significato dei dati.
Come chi ripete un contenuto “a pappagallo”, senza prestare attenzione a quello che dice, il modello impara a riconoscere pattern senza sviluppare una vera comprensione di ciò che sta facendo.
Il filtro spam delle e-mail è uno dei primi esempi applicati di modello di apprendimento, quindi un vero e proprio sistema di IA in uso dall’inizio degli anni 2000.
Il modello che classifica la posta indesiderata non è costruito su regole fisse (per esempio, “se contiene la parola gratis è spam”), ma ha imparato in maniera induttiva a riconoscere le caratteristiche tipiche dello spam analizzando migliaia di email già classificate. Va sottolineato questo punto cruciale: le risposte dei modelli sono di tipo probabilistico, quindi fallibile. Come può capitare che il filtro spam “sbagli”, qualsiasi sistema di apprendimento automatico esegue un compito dando l’output più probabile sulle basi statistiche elaborate dall’algoritmo. Quindi, per quanto raffinato, un sistema di IA avrà sempre intrinsecamente una percentuale di errore.
I sistemi di apprendimento automatico operano tutti seguendo la logica probabilistica, ma si dividono in tre categorie principali:
L’avanguardia dell’IA oggi sono proprio i modelli generativi.
Lo spartiacque nella ricerca in questa disciplina fu trovare l’algoritmo capace di predire le parole in una frase. Questo ha portato allo sviluppo dei Grandi Modelli del Linguaggio (Large Language Models o LLM), algoritmi che, analizzando milioni di testi con miliardi di frasi, hanno imparato a generare sequenze di parole che noi umani consideriamo dotate di senso.
I più noti prodotti derivati dagli studi sugli LLM sono i chatbot. Il primo, ELIZA, fu creato nel 1966 per simulare uno psicoterapeuta. Con modelli progressivamente più sofisticati, a novembre del 2022 è arrivato ChatGPT.
Addestrare un LLM richiede mesi, infinite quantità di dati e considerevoli finanziamenti. Per questo ce ne sono molto pochi al mondo e vengono chiamati modelli di base (in inglese, foundation models).
Ad oggi, la quasi totalità dei servizi che utilizzano IA generativa si appoggia a uno di questi. I più noti LLM sono sviluppati da società americane: oltre a OpenAI, con il suo ChatGPT, sono presenti Google con Gemini, Meta con Llama e Anthropic con il suo modello Claude.
In Europa, è stato sviluppato in Francia il modello Mistral (accessibile tramite la piattaforma Le Chat). In Cina, infine, si usa DeepSeek.
Tutti i modelli partono da basi simili, essendo addestrati su testi presi da internet: libri, articoli, forum, siti web. Le differenze tra i modelli emergono nella fase di post-addestramento. È qui che ogni azienda “affina” e imprime la propria direzione al modello, addestrandolo su come deve comportarsi, che tipo di risposte deve dare, quali argomenti evitare o privilegiare.
Altre differenze riguardano le funzionalità, come la possibilità di caricare file, usare la voce, generare immagini e il numero di richieste disponibili nelle versioni gratuite o a pagamento.
Parlando di chatbot disponibili online, è da sottolineare da subito che cosa non sono.
1. Non sono motori di ricerca.
Digitare parole chiave nella barra di un browser come Google non è la stessa cosa di “chiedere a un chatbot”. Il primo fornisce un elenco di fonti tra cui scegliere in base a rilevanza e attendibilità. Il chatbot non esegue nessuna ricerca online: restituisce solo la sequenza più probabile di parole basandosi sui dati con cui è stato addestrato. Questo può portare a risposte del tutto plausibili e verosimili ma completamente inventate, un fenomeno noto come “allucinazione”. A meno che non sia esplicitamente collegato a un browser (con la funzionalità “cerca” attivata), l’output di un chatbot non è necessariamente né aggiornato, né corretto. Per date, nomi o fatti specifici è quindi fondamentale verificare sempre l’attendibilità tramite fonti autorevoli e aggiornate.
2. Non sono sistemi di domanda-risposta attendibili.
I modelli pubblici e non specializzati come ChatGPT non sono stati addestrati come assistenti virtuali con una memoria-archivio dello scibile umano. Dato qualsiasi input, generano un output perché il loro compito è simulare una conversazione, indipendentemente dalla veridicità.
3. Non sono sistemi che imparano in tempo reale.
La fase di apprendimento è un momento specifico e delimitato che precede la pubblicazione del modello. Una volta completata questa fase, il modello è “congelato”: non cambia più fino alla versione successiva. Nei chatbot standard disponibili al pubblico, dire al chatbot che ha commesso un errore non migliora il modello, e lo si può verificare facilmente: aprendo una nuova chat e replicando la domanda, c’è un’altissima probabilità che il chatbot ripeta l’errore.