Cosa è la computer vision? È l’abilità delle macchine di osservare l’ambiente circostante, catturare informazioni e capire quello che sta succedendo intorno a loro.
La computer vision è una delle tecnologie che più si è diffusa all’interno della società in cui viviamo: il face recognition per sbloccare lo smartphone o la guida autonoma di Tesla sono due esempi.
Si tratta di una delle applicazioni di machine learning con più alta probabilità di generare ROI misurabile all’interno di aziende e istituti pubblici.
In questo approfondimento vedremo le applicazioni più diffuse di questa tecnologia, case study e la strategia dietro alla raccolta dati per raggiungere la percentuale di accuratezza necessaria per creare valore di business.

Come funziona la computer vision
Per decine di anni gli informatici hanno cercato di sviluppare software in grado di riconoscere immagini e video senza doverli programmare condizione per condizione.
Grazie al deep learning (e all’aumento esponenziale di dati e potenza computazionale), i cosiddetti CNN (Convolutional Neural Network) hanno fatto passi da gigante nel riconoscimento delle immagini.
I CNN applicano filtri alle immagini, e sono in grado di individuare sotto diversi punti di vista l’aggregazione dei pixel, così da riconoscere, ad esempio, un volto umano rispetto a qualsiasi altra forma.

Il tutto sta nell’avere a disposizione abbastanza immagini dell’oggetto (o volto) che si vuole riconoscere.
Più grande è il nostro training set, maggiore sarà il livello di accuratezza del nostro algoritmo.
La computer vision è spesso chiamata in diversi modi, a seconda della sua funzionalità (come face recognition, emotion recognition oppure object detection).
Applicazioni della computer vision nella sanità
Come dicevo a inizio approfondimento, la computer vision vanta una vasta gamma di possibili applicazioni.
Alcune di queste hanno a che fare con il mondo della medicina e della sanità.
In particolare può essere usata per individuare in modo rapido e preciso la presenza di un tumore.
Il processo è relativamente semplice: le immagini ottenute tramite la risonanza magnetica vengono analizzate usando un neural network.
Grazie al deep learning, il software è in grado di individuare tumori con un grande livello di accuratezza, dando quindi un’enorme aiuto al duro lavoro dei dottori.
La computer vision può essere usata anche in altri modi:
- Analisi dei movimenti: analizzando i movimenti di una persona con il deep learning, è possibile identificare problemi neurologici o muscolari. I risultati di queste analisi possono aiutare i dottori nell’effettuare diagnosi più rapide e accurate.
- Identificazione di un cancro: l’image detection consente ai ricercatori di individuare anche i più piccoli segnali della presenza di un cancro, similmente a quanto avviene con i tumori.
- Classificazione delle cellule: il software è in grado di distinguere le cellule sane da quelle cancerogene.
- Mask detection: particolarmente utile in questo periodo di pandemia, La mask detection è in grado di analizzare immagini e individuare se le persone stiano indossando le mascherine protettive. Immaginate di usare un simile software all’ingresso di un edificio, di un centro commerciale o di un autobus del trasporto pubblico.
Nel futuro, l’uso della computer vision nella medicina migliorerà in modo drastico l’efficienza della sanità, e sarà certamente in grado di salvare molte vite umane.

Grazie a questa tecnologia potremo giovare di un sistema sanitario molto più preciso, veloce ed efficace.
Ora passiamo a un case study, e vediamo come la computer vision sia stata effettivamente usata nel campo della sanità.
Case study: AI e computer vision nella diagnosi dei tumori
Nel case study odierno analizzeremo come l’intelligenza artificiale sia stata usata per incrementare la velocità e l’accuratezza della diagnosi dei tumori.
Dott. Feert Kazemier, professore di chirurgia dell’UMC, ha descritto brevemente il modo in cui di solito viene trattato un cancro.
in poche parole: il miglior modo per gestirlo sarebbe rimuoverlo, ma spesso i tumori potrebbero essere troppo grandi per venir semplicemente estratti.
Per questo motivo, il paziente deve sottostare a una determinata terapia per ridurre il volume del tumore (ad esempio la chemioterapia).
Dopo alcuni determinati periodi di terapia, i tumori vengono scannerizzati e analizzati manualmente.
In questo modo, il dottore è in grado di vedere l’andamento delle cure e lo stato della malattia, così da capire come proseguire con il trattamento.
Questo approccio, tuttavia, registra varie criticità:
- Analizzare i tumori è un processo che richiede molto tempo
- Tipicamente vengono analizzati solo i due tumori più voluminosi, lasciando quindi passare inosservati quelli più piccoli
- Il giudizio è soggettivo: diversi radiologi potrebbero proporre diverse soluzioni per uno stesso tumore
- L’occhio umano potrebbe non essere in grado di rilevare piccoli ma fondamentali cambiamenti sullo stato di un tumore.
- L’errore di valutazione umano è sempre presente
Insomma, nonostante il loro duro lavoro e impegno, anche i dottori possono commettere errori.
L’uso della tecnologia e della computer vision potrebbe radicalmente risolvere queste problematiche, e salvare numerose vite umane.

Per questo motivo Amsterdam UMC, insieme a SAS, hanno lavorato per implementare l’intelligenza artificiale nella diagnosi dei tumori.
Le piattaforme AI sviluppate da SAS e implementate da Amsterdam UMC utilizzano la computer vision e il deep learning per selezionare la migliore terapia.
Questo processe avviene nel più breve tempo possibile, e con un’elevata accuratezza.
Le parole del Dott. Kazemier riguardo alle potenzialità di questa tecnologia sono chiare: “Siamo ora in grado di eseguire valutazioni completamente automatiche. Il processo non è solo più veloce, ma anche più accurato“.
Il modello di deep learning è stato sviluppato partendo dai dati di 52 pazienti con il cancro: ogni immagine è stata inserita nel training set per addestrare l’algoritmo a individuare nuovi tumori di nuovi soggetti.
In aggiunta, l’intelligenza artificiale ha permesso di ottenere dati sempre più accurati riguardo ai nuovi pazienti, e di creare una rappresentazione 3D di ciascun tumore.
Queste informazioni aggiuntive hanno aiutato i dottori a eseguire diagnosi sempre più accurate e precise.
L’importanza dei dati nella compter vision
Non è un segreto che l’intelligenza artificiale abbia bisogno di dati per funzionare bene, ma non so in quanti abbiano capito la difficoltà nell’avere il giusto dataset.
Ho già parlato di quanto la predizione possa cambiare i modelli di business e di quanto i dati giochino una partita fondamentale per l’accuratezza del modello.
Dopotutto chi mi segue da un po’ di tempo sa bene quanto io sia un sostenitore dei dati proprietari per i propri progetti di intelligenza artificiale, e dell’importanza della data dominance per creare barriere d’entrata.
In modo particolare per la computer vision ricordo che i dati, a seconda del caso, devono rispettare alcune caratteristiche:
- Qualità: a seconda della nostra necessità possono essere sufficienti immagini scattate con uno smartphone oppure lenti altamente sofisticate che possano distinguere i più minimi dettagli.
- Quantità: soprattutto per raggiungere accuratezze elevate, il deep learning ha bisogno di una mole significativa di informazioni.
- Varietà: un dataset non bilanciato può causare nel migliore dei casi errori troppo evidenti, e nel peggiore algoritmi discriminanti. La mancanza varietà non è affatto un problema scontato e spesso passa in secondo piano
Tra i fattori da tenere in considerazione ricordo quindi la data collection e il come inserirla nel processo di business per costruire l’algoritmo e mantenere il modello aggiornato.
Applicazioni della computer vision nell’agricoltura e allevamento

Un altro interessante campo di applicazione della computer vision risiede nell’agricoltura e nell’allevamento.
Ad esempio, questa tecnologia è in grado di rilevare gli ortaggi danneggiati o imperfetti, e di rimuovere così i prodotti che non rispettano determinati standard di qualità.
L’alternativa sarebbe analizzare manualmente e singolarmente ogni ortaggio: un processo molto lento e soggetto a errori.
Altri utili applicazioni della computer vision nell’agricoltura sono:
- Conteggio: il raccolto può essere analizzato da un algoritmo in grado di contare quanti oggetti sono presenti sulla scena. In questo modo gli agricoltori possono avere dati accurati sui risultati dei propri campi.
- Monitoraggio degli animali: gli animali possono essere monitorati per identificarne possibili malattie, cambiamenti nel comportamento o gravidanze.
- Automazione della fattoria: monitorando lo stato del campo e delle piante, robot e trattori autonomi possono svolgere il loro lavoro, dalla semina al raccolto, in completa autonomia.
- Riconoscimento delle piante: la computer vision può riconoscere la specie di una pianta (ma anche di un animale) semplicemente analizzando una fotografia.
Per approfondire l’uso dell’intelligenza artificiale nell’agricoltura, ho scritto un approfondimento a riguardo con tanto di case studies.
Case study: computer vision e monitoraggio degli animali
Viso.ai è una compagnia specializzata in applicazioni di computer vision, il cui obiettivo è fornire alle aziende la possibilità di giovare del visual deep learning.
Secondo la compagnia, “l’occhio” del computer è immensamente più efficiente di quello umano, ed è in grado di rilevare caratteristiche che altrimenti passerebbero inosservate.
Ad esempio, la computer vision può essere usata per rilevare possibili malattie, infezioni o problematiche varie tra il bestiame (come febbre, debolezza, presenza di virus o batteri, ecc. ecc.).
Questi problemi vengono rilevati quando sono ancora alle prime fasi, consentendo così un’intervento tempestivo per limitare al massimo i danni.
La particolarità è che questi sistemi di monitoraggio sono assolutamente non invasivi, e spesso si limitano alla sola analisi di una registrazione video.

Ad esempio, se il sistema rileva una diminuzione nel movimento quotidiano del bestiame, allora è probabile che un’infezione stia lentamente prendendo piede nell’allevamento.
Grazie ai modelli di deep learning e alla computer vision, è possibile tenere traccia del comportamento dei propri animali così da essere sempre consapevoli del loro stato fisico.
Pensieri finali
Abbiamo visto una delle applicazioni di machine learning più capillari dell’intero mondo digitale, e abbiamo parlato di come venga applicata in diverse industrie per automatizzare i processi e creare valore di business.
Quello che, a mio parere, in pochi hanno capito, è che abbiamo a disposizione una tecnologia molto avanzata e spesso accessibile anche ad aziende di dimensioni non colossali.
Questo vale per tutto il mondo AI, ma per la computer vision il discorso si rafforza.
Molto spesso è la creatività a giocare la carta fondamentale per trasformare in meglio il proprio business.
Con l’AI, nel 2021 non vince l’azienda con i migliori data scientists (big tech a parte), ma vince l’azienda che ha capito come sfruttare al meglio la tecnologia per risolvere problemi reali all’interno dei propri processi.