Concretizzare un progetto di deep learning
L’efficacia del deep learning nella visione artificiale è ormai più che dimostrata. Di conseguenza, molte aziende manifatturiere vorrebbero implementare o almeno eseguire un primo progetto sfruttando il deep learning, in particolare se qualcuno ha mostrato loro una presunta fattibilità basata sulla valutazione di un set di immagini. Ma dalla teoria alla pratica si possono presentare diverse sfide, perchè può esistere un enorme divario tra un modello di lavoro approssimativo e una soluzione funzionante in produzione. Non solo, ma i processi e le parti fabbricate si evolveranno e la soluzione di deep learning dovrà essere in grado di far fronte a cambiamenti inevitabili.
Un approccio basato sul deep learning è fondamentalmente una soluzione basata sui dati. Ciò significa, in primo luogo, che i sistemi di acquisizione sono fondamentali – qui possiamo affermare che “se entra spazzatura, spazzatura è ciò che otterremo”. Nella visione artificiale, più è facile su un’immagine distinguere le regioni difettose da quelle non difettose per l’occhio umano, più sarà facile per un computer. Se da una parte è vero che il deep learning sopporta meglio i cambiamenti nel processo di acquisizione delle immagini, rispetto alle soluzioni tradizionali di visione artificiale, non aspettatevi che esso rilevi cose che un essere umano qualificato non sarebbe in grado di distinguere. Quindi, prima di tutto, la strategia di imaging deve essere studiata e realizzata nel modo corretto.
Una seconda considerazione è che la comprensione verticale dei dati è fondamentale. Gli algoritmi di deep learning e i mezzi per addestrarli stanno diventando prodotti primari, mentre la comprensione verticale dei dati e degli ambiti in qui questi hanno origine no. L’ottimizzazione dell’architettura del modello può dare qualche punto in più di precisione, ma il vero punto di svolta è la qualità dei dati. Per capirci meglio, mettiamo che dopo alcune settimane di raccolta e annotazione dei dati, si crei un modello che sembra funzionare bene. Lo si collauda in produzione, ma in quel momento ci si rende conto che le specifiche di qualità sono state fraintese estremizzando così la tolleranza ai difetti. Per risolvere il problema, tutti i dati devono essere annotati nuovamente, il che porta a settimane di ritardo nel progetto oltre a costituire un danno economico.
In una fabbrica, le cose tendono spesso a cambiare e compaiono sempre casi imprevedibili. Di conseguenza, l’utente non può aspettarsi che un modello addestrato su alcune immagini di un giorno specifico in una determinata configurazione si generalizzi per sempre a tutti i casi possibili. Ciò significa che i modelli di deep learning devono essere mantenuti nel tempo e devono avere la capacità di adattarsi rapidamente.
Riassumendo, realizzare una soluzione di visione basata su deep learning è un compito delicato, non a causa degli algoritmi utilizzati, ma per la cura che si deve applicare alla scelta e all’utilizzo dei dati e alla loro tracciabilità, nonché al mantenimento dei modelli nel tempo.