Il tallone d’Achille delle reti neurali e il machine learning

Gli esseri umani impariamo in primo luogo assimilando e processando i dati sul mondo che ci circonda. Più tardi, quando iniziamo a capire il linguaggio, possiamo essere “programmati” attraverso rappresentazioni formali di informazione: ascoltando le persone di più età e facendo domande, leggendo e guardando, ascoltando contenuti di video e audio.

Ci sono una serie di fattori che determinano quanto una persona impara, compresa la capacità dei loro “insegnanti” e il desiderio individuale di imparare, ma forse quello più critico è ciò che viene insegnato. Quali sono gli input di dati?

Dì a un bambino piccolo che il blu è arancione, o che un albero è un’auto, e pensarà che sia blu o arancione o un albero finché non riceverà prove sufficienti (o tante prove convincenti) da credere un’altra cosa. E anche allora, potrebbe essere difficile fargli cambiare le sue convinzioni iniziali.

E così, arriviamo al tema della tecnologia. L’intelligenza artificiale (IA) e le sue componenti, come il machine learning e le reti neurali, si stanno integrando nelle reti aziendali in una serie di settori, tra cui quello finanziario, l’assistenza sanitaria e la produzione.

Le organizzazioni utilizzano macchine intelligenti per migliorare l’efficienza, ridurre i costi, automatizzare i processi, prendere decisioni, aiutare i leader aziendali a prendere decisioni più rapide e migliori, prevedere eventi interni ed esterni e molto altro ancora. L’intelligenza artificiale è stata persino utilizzata da un paio di tecnici e musicisti per creare un CD di musica originale di “black metal”.

Ma, perché una rete neurale ha realizzato un CD di musica di “black metal”? Perché è ciò che gli è stato insegnato attraverso l’algoritmo costruito per questo, e un algoritmo può funzionare solo con i dati che gli si presentano. I musicisti lo hanno alimentato con “dati” sotto forma di bit di audio provenienti da un CD di “black metal” realizzato da una banda umana.

Ma cosa accade se alimentano il sistema a caso con dati che provengono da un CD di un concerto di Mozart o una ballata folk di Pete Seeger? A meno che l’algoritmo ignori questi bit di audio perché non li riconosce, la loro introduzione nella rete neurale renderebbe il CD di “black metal” meno autentico (come tendono a fare fagotti e banjo).

“Il problema è vecchio quanto l’informatica stessa: spazzatura entra, spazzatura esce,” scrive Cory Doctorow in BoingBoing. “Assemblare i set di dati grandi e ben etichettati necessari per addestrare i sistemi di machine learning è un lavoro noioso (infatti, l’obiettivo del machine learning è appunto insegnare ai computer a fare questo lavoro, che gli esseri umani non amano e nel quale non sono bravi). Le scorciatoie che utilizziamo per produrre set di dati sono accompagnate da costi elevati che non sono ben compresi dall’industria”.

Pete Warden, un ingegnere e autore di tecnologia, scrive in dettaglio su come il progresso nel machine learning sia stato impedito perché richiede troppo tempo ed energia per migliorare gli algoritmi e poco sforzo sulla qualità dei dati di addestramento.

“Come parte del mio lavoro, sono a stretto contatto con molti ricercatori e team di prodotti, e la mia convinzione nel potere del miglioramento dei dati deriva dai massicci guadagni che ho visto ottenere quando si concentrano su quel lato del loro modello di costruzione”, afferma Warden. “Il più grande ostacolo all’utilizzo del deep learning nella maggior parte delle applicazioni sta ottenendo una precisione sufficiente nel mondo reale, e il miglioramento del set di allenamento è il percorso più veloce che ho visto per migliorare la precisione”.

Realizzare ciò significa non cedere alle scorciatoie a cui allude Doctorow.

“Può sembrare ovvio, ma il tuo primo passo dovrebbe essere quello di esaminare in modo casuale i dati di allenamento con i quali parti”, scrive Warden. “Mi sento sempre un po’ stupido attraversando questo processo, ma non me ne sono mai pentito in seguito”.

Conclusione: garantire la qualità dei dati è fondamentale se ti preoccupi della qualità della tua intelligenza artificiale e delle iniziative del machine learning.

I dati di scarsa qualità rappresentano senza dubbio un problema reale nel mondo dell’IA e del machine learning.


Chris Nerney è uno scrittore di tecnologia che si occupa di tecnologia mobile, collaborazione sul posto di lavoro, automazione, intelligenza artificiale e cloud computing.

 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: