Deep learning: quando il cervello umano diventa un modello di riferimento
Quando parlate con Siri o con l’assistente Google state di fatto utilizzando il deep learning. Senza questa tecnologia le voci degli smartphone e degli altoparlanti non sarebbero in grado di fornire risposte adeguate, né di comprendere la nostra lingua.
Il deep learning non è quindi una novità, ma solo negli ultimi anni è stato ottimizzato a tal punto da offrire un reale valore aggiunto, entrando a far parte della nostra vita quotidiana. Lo sviluppo in questo ambito procede alla massima velocità. Le multinazionali come Google stanno conducendo un’intensa ricerca sul deep learning, e non solo per poter intraprendere un giorno delle conversazioni umane con l’assistente Google: i campi di applicazione sono molteplici.
Vi spieghiamo come funziona questa tecnologia, quali sono i suoi punti di forza e di debolezza e quali sono i campi di applicazione attuali e futuri.
Che cos’è il deep learning?
Affinché i computer siano percepiti come macchine intelligenti, devono prima essere in grado di apprendere in autonomia. Il deep learning rappresenta un settore della ricerca scientifica che si occupa di intelligenza artificiale. Più precisamente, è un sottoinsieme del machine learning. L’apprendimento automatico, infatti, può essere implementato con diverse modalità. Una di queste è, per l’appunto, il deep learning.
Il deep learning, in italiano apprendimento profondo, è un sottoinsieme del machine learning, metodo in cui i computer elaborano grandi quantità di dati utilizzando reti neurali ispirate al funzionamento biologico del cervello umano. Ottenendo sempre nuove informazioni, i collegamenti esistenti possono essere modificati e ampliati, in modo che il sistema impari senza l’intervento umano e fornisca conclusioni e previsioni sempre più precise.
Per l’elaborazione delle informazioni vengono utilizzate le reti neurali artificiali, che consistono in uno strato di ingresso, uno o più strati intermedi (layer) e uno strato di uscita. Le informazioni vengono inoltrate dallo strato di ingresso come vettore di input, pesate da neuroni artificiali negli strati intermedi e infine emesse come modello sullo strato di uscita. Più strati contiene una rete neurale artificiale, più complessi possono essere i compiti che l’IA deve eseguire.
Esempio: riconoscimento delle immagini
La classificazione delle immagini, a seconda che rappresentino cani, gatti o persone, è un compito impegnativo per i computer. Ciò che può essere immediatamente chiaro per una persona quando osserva un’immagine, non lo è per il computer che deve prima di tutto fare un’analisi delle caratteristiche delle singole immagini.
Nel deep learning l’input di dati grezzi, in questo caso l’immagine, viene analizzato strato per strato. Nel primo strato di una rete neurale artificiale, ad esempio, il sistema verifica i colori di ogni singolo pixel dell’immagine. Ogni pixel viene elaborato da un proprio neurone. Nel livello successivo vengono identificati i bordi e le forme e, a seguire, vengono controllate le caratteristiche più complesse.
Le informazioni raccolte sono mappate in un algoritmo flessibile. I risultati di uno strato vengono trasportati allo strato successivo e cambiano l’algoritmo, in modo tale che il computer sia in grado di decidere con una serie di operazioni se un’immagine possa essere assegnata a una categoria piuttosto che a un’altra (ad esempio “cane” o “gatto”).
Inizialmente c’è una fase di addestramento in cui gli errori di assegnazione sono corretti dall’uomo per ottimizzare l’algoritmo, che in poco tempo saprà riconoscere in autonomia le immagini. Cambiando il collegamento tra i neuroni della rete e regolando la ponderazione delle variabili all’interno dell’algoritmo, alcuni modelli di ingresso (immagini di gatti in varie versioni) portano a modelli di uscita (riconoscimento del gatto) sempre più precisi. Più materiale ha a disposizione il sistema, meglio è.
Non sempre si possono comprendere i processi che portano il computer a fare una certa assegnazione, soprattutto perché il sistema ottimizza continuamente da sé le proprie regole decisionali.
Storia del deep learning
Il termine deep learning è relativamente recente poiché è stato menzionato per la prima volta intorno al 2000; l’utilizzo di reti neurali artificiali per consentire ai computer di prendere decisioni intelligenti risale invece a molti decenni precedenti.
La ricerca di base in questo campo risale agli anni '40. Le prime reti neurali artificiali sono state sviluppate negli anni '80, ma la qualità delle decisioni era all’epoca piuttosto deludente. Il deep learning, ovvero l’apprendimento autonomo delle macchine, richiede grandi quantità di dati e questi in origine non erano ancora disponibili in formato digitale. Fu solo all’inizio del millennio con l’avvento dei Big Data, che l’interesse della scienza e dell’economia per il deep learning si ripresentò.
Punti di forza e punti di debolezza
L’apprendimento profondo è decisamente più potente delle tecnologie IA precedenti, aspetto che giustifica l’elevata attenzione mediatica e l’interesse della ricerca. Restano, tuttavia, ancora dei punti deboli da risolvere, prima che la tecnologia possa dispiegare tutto il suo potenziale.
Punti di forza del deep learning
Uno degli argomenti più importanti per l’apprendimento profondo è la qualità dei risultati. Soprattutto nel riconoscimento delle immagini e nel linguaggio, la tecnologia è chiaramente superiore a tutte le altre. A condizione che si parta da dati di addestramento di alta qualità, il deep learning è in grado di svolgere il lavoro di routine in modo molto più efficiente e rapido di qualsiasi persona, senza alcuno sforzo e mantenendo un livello di qualità costante.
In altre forme di machine learning gli sviluppatori analizzano i dati grezzi e definiscono regolarmente le caratteristiche aggiuntive di cui l’algoritmo dovrebbe tenere conto durante l’apprendimento, per ottimizzare la capacità predittiva dell'IA. Nell’apprendimento profondo è il sistema stesso a identificare le variabili utili e a integrarle nel suo processo di apprendimento. Il computer è quindi in grado di imparare da solo, senza istruzioni umane, dopo una fase di addestramento inziale. In questo modo si risparmia tempo e denaro, dal momento che non è necessario personale qualificato.
In precedenza, invece, bisognava contrassegnare manualmente grandi quantità di dati per consentire l’apprendimento della macchina. Per il riconoscimento delle immagini, ad esempio, erano necessari dipendenti che assegnassero l’etichetta del cane o del gatto alle immagini. Con il deep learning l’addestramento manuale è molto più breve. Ciò è particolarmente importante perché nella realtà commerciale vengono raccolte grandi quantità di dati, ma solo in pochissimi casi essi sono disponibili come dati strutturati (numeri di telefono, indirizzi, carte di credito, ecc.), perché solitamente sono memorizzati come dati non strutturati (immagini, documenti, e-mail, ecc.). A differenza degli altri metodi di machine learning, il deep learning può valutare diverse fonti di dati non strutturati in relazione al compito da svolgere.
La questione per cui la tecnologia sarebbe troppo costosa per rispondere alla produzione di massa non è così rilevante. Sempre più spesso stanno emergendo servizi come Google Vision e IBMs Watson, che permettono alle aziende di basarsi su reti neurali già disponibili, invece di svilupparle da zero. Questo permetterà all’apprendimento profondo di introdursi pienamente nelle realtà aziendali.
Punti di forza in sintesi
- Risultati migliori rispetto ad altri metodi di apprendimento automatico
- Sviluppo di funzioni ed etichettatura dei dati non necessari
- Esecuzione efficiente delle attività di routine senza variazioni di qualità
- Facile gestione di dati non strutturati
- Sempre più servizi per semplificare l’uso di reti neurali artificiali
Punti di debolezza del deep learning
L’apprendimento profondo richiede un’elevata potenza di calcolo per sostenere le reti neurali ed elaborare la grande quantità di dati richiesti. La potenza di calcolo dipende in larga misura dalla complessità e dalla difficoltà del compito da risolvere e dalla dimensione del set di dati utilizzato. Questo ha reso finora la tecnologia costosa e utilizzata solo nella ricerca e in poche multinazionali.
In questo settore sono stati compiuti passi da gigante. Ciò che non cambierà neanche in futuro, tuttavia, è il fatto che le decisioni prese nell’ambito del deep learning non sono completamente comprensibili dal punto di vista umano. La rete neurale è (finora) una scatola nera. Per alcune applicazioni in cui la tracciabilità è fondamentale, la tecnologia è quindi irrilevante.
Perché l’apprendimento profondo funzioni in modo efficace, sono necessari grandi quantità di dati di addestramento. Se questi set di dati non sono disponibili, i computer non potranno dare buoni risultati. Sono state pubblicate le prime librerie per le reti neurali, al fine di semplificare l’uso del deep learning a un pubblico più ampio. Tuttavia, i servizi non sono adatti a tutte le applicazioni, quindi lo sviluppo di algoritmi di apprendimento continua a richiedere un elevato investimento di tempo e richiede potenzialmente più tempo rispetto ai metodi alternativi.
Punti di debolezza in sintesi
- Richiede un’elevata potenza di calcolo
- Lo sviluppo di algoritmi di apprendimento richiede tempi relativamente lunghi
- Database di grandi dimensioni
- Necessità di più dati di addestramento rispetto ad altri metodi
- Decisioni poco o per niente comprensibili (scatola nera)
Ambiti di applicazione dell’apprendimento profondo
Il deep learning è attualmente applicato in vari settori industriali e continuerà a esserlo in molti altri settori della nostra vita quotidiana in futuro.
User experience
Alcuni chatbot sono già ottimizzati per l’apprendimento profondo per poter rispondere al meglio alle richieste dei clienti e alleggerire il lavoro di supporto umano.
Assistenti di lingua
Il deep learning è usato in vari assistenti di lingua come Alexa, l’assistente Google o Siri. Questi ampliano il loro vocabolario e la comprensione del linguaggio in modo indipendente.
Traduzioni
L’apprendimento profondo è già utilizzato in alcuni programmi di traduzione. Grazie alla tecnologia, anche i dialetti e i testi sulle immagini possono essere tradotti automaticamente in altre lingue, cosa che non era possibile con le precedenti applicazioni di machine learning che si basavano su dati strutturati.
Creazione di testi
I computer possono utilizzare il deep learning per creare testi non solo grammaticalmente e ortograficamente corretti, ma anche per imitare lo stile di un autore, a condizione che ricevano sufficiente materiale didattico. In questo modo sono stati creati articoli per Wikipedia e testi shakespeariani sorprendentemente autentici.
Sicurezza informatica
I sistemi IA con l’apprendimento profondo sono particolarmente adatti a rilevare irregolarità nelle attività di sistema grazie al loro apprendimento indipendente e continuo. Possono quindi rilevare possibili attacchi informatici. Tramite riprese video, il sistema può aiutare a proteggere luoghi particolarmente vulnerabili, come gli aeroporti, rilevando anomalie nelle normali attività aeroportuali.
Finanze
La capacità di rilevare anomalie è particolarmente utile anche nel sensibile ambito delle operazioni finanziarie. Se l’algoritmo viene addestrato adeguatamente, gli attacchi alle reti bancarie e le frodi con le carte di credito possono essere difese più efficacemente di prima.
Marketing e vendite
I sistemi IA possono usare il deep learning per eseguire le sentiment analysis, possono cioè filtrare i messaggi dei clienti (in chat e e-mail) per individuare eventuali problemi, trasmettendoli poi ai dipendenti.
I sistemi potrebbero anche adottare misure definite in modo indipendente per ristabilire la soddisfazione del cliente e prevenire un reclamo. Attraverso una valutazione dei dati dei clienti raccolti nel CRM, i sistemi dotati di IA deep learning potrebbero fare previsioni sul comportamento futuro del cliente, in modo da adottare preventivamente misure mirate per i clienti pronti all’acquisto, piuttosto che per i clienti che stanno considerando di fare un reclamo.
Guida autonoma
Un’automobile senza conducenti umani che circola in sicurezza nel traffico stradale è ancora una visione del futuro. La tecnologia, però, esiste e combina vari algoritmi dell’apprendimento profondo: un algoritmo, ad esempio, riconosce i segnali stradali, mentre un altro è specializzato nella localizzazione dei pedoni.
Robot industriali
Robot dotati di IA deep learning potrebbero essere utilizzati in molti settori industriali. Semplicemente osservando un essere umano, i sistemi potrebbero imparare a far funzionare le macchine e poi ottimizzarsi.
Manutenzione
Soprattutto nel campo della manutenzione industriale ci sono importanti possibilità di applicazione. In sistemi complessi, per garantire la sicurezza, è necessario monitorare costantemente un certo numero di parametri. L’apprendimento profondo potrebbe monitorare sistemi complessi per un funzionamento privo di errori, ma anche prevedere quali unità di un sistema richiederanno presto una manutenzione (manutenzione predittiva).
Medicina
Grazie all’IA deep learning si possono scansionare le immagini per individuare eventuali anomalie, in modo più accurato rispetto ad un osservatore umano, anche se specializzato. Con l’aiuto di sistemi intelligenti, le TAC o i raggi X possono essere utilizzati per rilevare le malattie prima ancora che si sviluppino, migliorando così le possibilità di guarigione dei pazienti.
Apprendimento profondo: un grande potenziale, ma nessuna soluzione universale
Nel dibattito pubblico spesso il deep learning emerge come l’unica tecnologia futura di IA. Effettivamente, l’apprendimento profondo permette di ottenere risultati significativamente migliori rispetto ai metodi precedenti in molti ambiti, ma l’applicazione è ancora agli inizi e l’enorme potenziale delle reti neurali artificiali è ancora lungi dall’essere sfruttato a pieno.
Il deep learning non è la soluzione tecnologica migliore per ogni problema. Esistono, infatti, anche altri approcci per rendere i computer “intelligenti”, soluzioni che funzionano anche con insiemi di dati più piccoli e dove le persone possono comprendere i percorsi decisionali.
Alcuni ricercatori nel campo IA vedono l’apprendimento profondo come un fenomeno temporaneo e sono convinti che si troveranno approcci migliori non ispirati al modello del cervello umano. La strategia aziendale di Google dimostra che le criticità di questa tecnologia non possono essere trascurate: il deep learning è solo una delle tecnologie IA. Si pensi agli altri metodi di apprendimento automatico, come anche allo sviluppo dei computer quantistici.
- Conformità al GDPR e hosting sicuro in Europa
- Potenti modelli basati sull'intelligenza artificiale
- Assenza di vendor lock-in grazie all'open source