INTERCLUB RC MILANO SAN SIRO
Relatore Prof. Davide Scaramuzza
DRONI AUTONOMI: PRESENTE E FUTURO
 

Ospiti del RC Milano San Siro, dopo il saluto alle bandiere, i saluti e i ringraziamenti da parte mia e di tutto il Club per l’invito, il Presidente del Club ospitante, Agostino Chisari, passa subito la parola al Prof. Davide Scaramuzza, dopo aver letto alcune parti del suo già lungo curriculum nonostante la giovane età, dati e informazioni che evito qui di riportare invitandovi a voler visitare la pagina a lui dedicata da Wikipedia

Allo stesso modo, poiché nel corso della serata sono stati proiettati diversi filmati, vi invito anche a voler visitare quelli pubblicati su YouTube di cui, per vostra comodità, di seguito riporto tre link

https://www.youtube.com/watch?v=kxqonQLyF9w

https://www.youtube.com/watch?v=Sh0MXi8XTNI

https://www.youtube.com/watch?v=KQpKQXU7dkM

È stata una serata “leggera”, nonostante il suo valore scientifico, leggera allo stesso modo del volo di un drone, che si vede librare nell’aria come per magia, come se non avesse peso.

Merito dell’Oratore che ha saputo trasferire informazioni scientifiche in modo semplice, con termini e modalità capaci di raggiungere tutti i partecipanti, anche quelli di cultura e professione diverse.

L’Oratore ci parla di fatto del suo lavoro, quello di tutti i giorni, impegnato nel rendere i droni capaci di volare in autonomia, grazie all’intelligenza artificiale.

L’impiego dei droni non è certo quello che nel corso dell’emergenza COVID abbiamo visto mandato in onda sui telegiornali della sera, quello delle immagini di quel cittadino di Pescara che correva sulla spiaggia inseguito dal drone.

Certamente il controllo del territorio, come quello delle foreste, che viene effettuato in diversi Paesi del mondo, contro il bracconaggio o gli incendi, è un utilizzo di interesse pubblico, ovvero anche di ordine pubblico laddove i droni impiegati per documentare disordini cittadini e individuare coloro che si “mischiano” a pacifici cortei per commettere reati.

All’utilizzo pubblico dei droni si affianca anche un utilizzo privato, atteso il costo in alcuni casi veramente modesto di questi apparecchi, che sono entrati nelle nostre vite quotidiane come oggetti per il divertimento e per l’intrattenimento, utilizzati per il gioco o per realizzare riprese video uniche; ai modelli c.d. professionali che arrivano a costare diverse decine di migliaia di euro, infatti, vi sono modelli che solo con qualche centinaio di euro offrono prestazioni veramente interessanti.

Certamente i droni di cui ci parla l’Oratore sono diversi da questi, che presuppongono la “guida” dell’uomo, perché lui e il suo staff si occupano di droni dotati di capacità di volo autonomo, di solito limitata alla gestione delle fasi di decollo o di atterraggio, ma in alcuni casi molto di più.

Parliamo di droni in grado di decidere da soli la propria rotta, che si possono trovare solo nei laboratori di ricerca o in utilizzi militari.

Sono apparecchi che non hanno limiti di utilizzo, ma hanno limiti di durata di volo, in quanto hanno limiti di durata delle batterie che consentono loro una capacità di autonomia al momento abbastanza modesta, 30/40 minuti.

Naturalmente questa autonomia si riferisce ai droni c.d. quadricotteri o multicotteri, ovvero ad apparecchi a quattro o più eliche, che costituiscono categoria diversa da quella dei droni ad ala portante utilizzati per scopi militari, i quali hanno anche 35 ore di autonomia grazie all’utilizzo di motori a combustione.

 

Con le prestazioni attuali dei quadricotteri (i più diffusi) è difficile pensare a un loro impiego efficace e a basso costo, in compiti di sorveglianza prolungata e senza il controllo umano, a prescindere dal fatto che possano anche trovare legittime contrarietà le attività di una simile presenza costante sopra le nostre teste e a prescindere dal pericolo di incidenti o cadute.

Il Prof. Scaramuzza, ad ogni modo, è con noi per informarci su quali direzioni stia prendendo la scienza del volo autonomo con droni, in quanto appartenente ad uno dei più attivi e qualificati gruppi di ricerca in tal senso, il Robotics and Perception Group dell’Università di Zurigo, diretto appunto dal nostro scienziato italiano e Oratore della serata.

“Da sempre”, esordisce, “mi sono posto il problema dell’autonomia dei droni e quando iniziai a occuparmene si pensava di usare il GPS, come ausilio alla navigazione, con la controindicazione, però, che con segnale cattivo o assente, per esempio vicino o all’interno di edifici, per le strade di una città con un’edilizia verticale imponente, tale sistema di guida non funziona.

Dalle difficoltà e problematiche del GPS ecco che il nostro scienziato arriva ad immaginare, per il volo autonomo dei droni, una tecnologia che il medesimo aveva messo a punto in precedenza, per le auto a guida autonoma, denominata Visual SLAM (Visual Simultaneous Localization And Mapping), cioè localizzazione e mappatura simultanea basata su telecamere.

Quello che vedete sopra è un drone il cui filmato di volo è stato proiettato dal Prof. Scaramuzza nel corso della serata, un drone che ha la caratteristica di modificare la propria “apertura elica” e quindi introdursi anche in anfratti con ingressi più piccoli delle sue normali dimensioni.

È un drone a volo autonomo, ovvero con intelligenza artificiale ed utilizza la sopra descritta tecnologia di volo, orientamento e posizionamento, ciò in quanto dotato di un computer che analizza le immagini da cui estrae una serie di punti di riferimento o salienti ‘features’.

Si tratta di punti ad alto contrasto, ovvero facilmente identificabili in immagini successive, quando il drone si muove in volo, una tecnica questa che ha l’obiettivo d’individuare punti di ancoraggio, grazie ai quali è possibile ricostruire la posizione relativa del drone nello spazio.

Si realizza in questo modo una vera e propria mappatura della zona di volo del drone e simultaneamente si stima il movimento del velivolo nella zona d’interesse.

Localizzazione e mappatura sono aspetti fondamentali su cui si basa ogni sistema di navigazione a guida autonoma, che sia utilizzato per un’auto, un drone o un robot spaziale.

Senza di queste attività preliminare non si può procedere oltre; solo una volta che il robot o il drone ha a disposizione la mappa locale di dove si trova, conosce la sua posizione e quella degli ostacoli e solo a quel punto può iniziare a pensare alla navigazione, al ‘path planning’, o pianificazione del percorso, un’attività che genera tracciati eseguibili all’interno della mappa locale e costruiti in modo da consentire al drone di evitare gli ostacoli.

Sembra che si sia pensato a tutto, ma non è così, rimane un’attività altrettanto importante quanto le prime, ovvero quella della esecuzione della traiettoria, che consente al drone di eseguire il movimento; non dimentichiamoci che stiamo parlando di un apparecchio di pochi chilogrammi e di dimensioni ridotte che pensa in modo autonomo, che calcola in modo autonomo tutto questo.

Un apparecchio che mentre vola continua a ricevere segnali dall’ambiente attraverso i suoi sensori, in particolare telecamere, accelerometri o giroscopi, quindi li sequenzia in blocchi di navigazione ripetutamente e per tutto il tempo del volto.

Si sofferma il Prof. Scaramuzza sui sensori evidenziando come gli stessi possiedano un’importanza estremamente rilevante e, soprattutto, come gli stessi abbiano subito un forte sviluppo negli ultimi anni, grazie allo sviluppo del mercato degli smartphone e dei dispositivi portatili.

Questi sensori hanno ormai dimensioni molto piccole e a un altissimo livello di precisione, possono per questo motivo essere installati anche sui droni e contribuire a mantenerli estremamente leggeri.

Nel laboratorio diretto dal Prof. Scaramuzza, ad esempio, si sviluppano droni tra i 20 e i 250 grammi di peso complessivo che si distinguono molto da quelli commerciali, che risultano pesanti diversi chilogrammi e che sono anche decisamente più ingombranti.

Grazie ai sensori di bordo, questi droni di nuova concezione non si servono più del GPS e possono quindi essere utilizzati con efficacia anche all’interno di ambienti chiusi.

Ed è proprio per queste loro capacità e capacità di essere utilizzati in ambienti al chiuso che l’Oratore ci apre gli occhi su diversi scenari, dall’esplorazione e soccorso dopo un terremoto alla perlustrazione di grotte, sotterranei e tunnel, fino alla ricerca e ispezione in foreste, impianti nucleari o altri luoghi complessi.

Per ovviare al principale limite attuale di questi oggetti volanti, cioè la durata limitata delle batterie, il gruppo di studio del Prof. Scaramuzza ha iniziato a lavorare sulla navigazione veloce, che nonostante la sua complessità, in quanto trattasi di algoritmi di navigazione, viene descritta in termini comprensibili dall’Oratore.

Trattasi di algoritmi così veloci e robusti da consentire di accelerare il volo dei droni in modo da coprire un’area maggiore o svolgere un maggior numero di operazioni nel tempo limitato che hanno a disposizione, ciò attraverso sensori, in particolare di telecamere, che forniscono una grande quantità di informazioni.

Per l’uomo è facile individuare e contestualizzare le informazioni di una foto, per capire ad esempio che ciò che vediamo è un vaso, un animale o altro oggetto comune e conosciuto, mentre per un robot la contestualizzazione non è immediata, anche se a partire dal 2012, con l’avvento del deep learning, sono cambiate molte cose.

Attraverso algoritmi conosciuti da tempo ma che solo ora, grazie all’impiego a fini di calcolo delle GPU, le Graphic Processing Units, possono essere “fatti girare” molto velocemente e anche su processori molto leggeri, di appena 60 grammi, il robot acquista una capacità di contestualizzazione che lo rende affidabile nel volo autonomo.

Tale miniaturizzazione non ha nulla di specialistico, anzi il contrario, perché è direttamente collegata alla diffusione di uno strumento comune e quotidiano: lo smartphone.

I droni moderni, dotati di GPU su cui possono girare reti neurali superficiali (dette ‘shallow’), sono in grado di rendere molto più robusti gli algoritmi di navigazione.

Per farcelo comprendere il nostro Oratore precisa che bisogna sapere come avveniva la programmazione dei robot classica in epoca precedente, ovvero prima della diffusione su larga scala delle reti neurali profonde, iniziata come detto nel 2012.

Fino ad allora il robot costruiva la mappa, da cui estraeva il percorso realizzabile, definiva la traiettoria e la eseguiva ma se, per esempio, il sensore non era pulito, a causa di polvere o di un’impronta, facendo sì che i pixel dell’immagine non fossero tutti nitidi o a fuoco, gli algoritmi fallivano e il robot rovinava a terra o su altro ambiente.

Oggi è diverso, anche se anche gli algoritmi possono sbagliare ancora, perché non così spesso come avveniva prima, in quanto le reti neurali consentono di calcolare il percorso più sicuro anche partendo da un’immagine non necessariamente perfetta.

È un pò quello che facciamo noi umani, che quando dobbiamo spostarci non facciamo il calcolo di una mappa metrica calcolata al millimetro; questo per le reti neurali è possibile attraverso l’addestramento, cioè la raccolta di una grande quantità di dati, la ‘data collection’ e poi la supervisione del loro apprendimento”.

L’Oratore fa un caso concreto, relativo al lavoro del proprio team di qualche anno fa, per un progetto finanziato dal Governo svizzero, in cui è stato sviluppato un algoritmo per consentire ai droni di riconoscere i sentieri di un bosco per la ricerca di persone disperse.

Si stima, infatti, che la maggior parte delle persone che si smarriscono in montagna resta comunque vicina ai sentieri e l’algoritmo aveva la funzione, data l’immagine della telecamera, di indicare al drone dove si trovasse il sentiero, in modo da mantenerlo sul giusto percorso; inizialmente è stato scelto un approccio classico, dice il Prof. Scaramuzza: “Avevamo deciso che il sentiero poteva identificarsi con un tratto di terreno piano, orizzontale, di fronte al drone, per estrarre dalle immagini della telecamera tutte le zone che avessero quella caratteristica. La soluzione però non funzionava. Era precisa soltanto il 60% delle volte. Per risolvere il problema abbiamo allora sviluppato una rete neurale che cercava di imitare il comportamento di un uomo. In che modo? Abbiamo installato tre telecamere GoPro su un elmetto e siamo andati a fare passeggiate in montagna per circa 7 km, raccogliendo circa 80.000 immagini. Una GoPro aveva una posizione frontale e guardava davanti, sul sentiero, le altre due puntavano ai lati. Quella centrale era la telecamera che ‘diceva’ alla rete neurale che quello che inquadrava era proprio il sentiero. Le due laterali invece davano l’esempio negativo. Le loro immagini erano quelle che ‘non’ contenevano il sentiero. In questo modo abbiamo insegnato alla rete neurale, sia con esempi positivi che con esempi negativi, che cosa sia e che cosa non sia un sentiero”.

Oggi bastano poche ore per istruire una rete neurale a un compito di questo genere, mentre all’epoca della ricerca ci volle qualche giorno di calcolo, ma alla fine fu possibile definire un “concetto” di sentiero, espresso in coefficienti ricavati dalla rete neurale. “Parliamo di milioni di coefficienti”, osserva il Prof. Scaramuzza, “che, una volta estratti, possono essere caricati sulla rete neurale superficiale alloggiata sul drone. Il risultato di tutto questo lavoro è stato che i droni hanno imparato a riconoscere perfettamente i sentieri”.

Il Prof. Scaramuzza ha pubblicato su “Science Robotics” un articolo firmato dal suo gruppo dell’Università di Zurigo in cui si descrive un drone in grado di schivare in volo un ostacolo che gli si para davanti all’improvviso … una cosa eccezionale.

La rivista, che è la più importante sulla ricerca robotica, ha dedicato la copertina a questo studio, che rientra nel campo delle ricerche sul volo veloce, un tema per cui il nostro Oratore ha vinto un ERC, un grant da 2 milioni di euro messi a disposizione dal Consiglio Europeo della Ricerca per finanziare questi studi.

Aumentando la velocità del volo aumentiamo la capacità dei droni di svolgere più funzioni nello stesso tempo, ma li esponiamo anche a un maggior rischio di collisioni; nello studio pubblicato da Science Robotics il team del Prof. Scaramuzza ha preso in considerazione il caso peggiore, quello di un uccello che attacca il drone.

Non potendo ovviamente fare esperimenti con i volatili sono stati utilizzati oggetti lanciati al drone, in particolare palloni, per capire come riuscire a schivarli. Per farlo sono necessari sensori molto veloci, quindi con una latenza minima di percezione.

Le telecamere standard hanno di solito una latenza compresa tra un millisecondo e centinaia di millisecondi, così che in situazioni medie, quelle che si riscontrano con un’illuminazione naturale all’interno di edifici, la loro latenza è tra i 10 e i 20 millisecondi, circa 1/100-1/50 di secondo; sono tempi troppo lunghi per droni che si muovono a una velocità di 5-10 m/s, anche perché, una volta ricevuta l’immagine, devono essere anche analizzati tutti i pixel, che sono tanti, basti immaginare che un’immagine VGA conta circa 300.000 pixel, che andrebbero analizzati tutti.

Ma è un problema che non ha preoccupato il Prof. Scaramuzza, che per risolvere il problema ha optato per l’utilizzo delle c.d. telecamere “neuromorfiche” o telecamere a eventi (“event cameras”), comparse sul mercato da una decina d’anni e che hanno pixel che potremmo definire intelligenti, perché ogni volta che osservano un moto inviano l’informazione sul cavo USB della telecamera al computer di bordo, in modo che ogni singolo pixel è in grado di effettuare questa operazione.

Questo è importante perché, se c’è un oggetto che si muove, non tutti i 300.000 pixel della telecamera devono inviare l’informazione che anche lo sfondo si sta muovendo; l’oggetto, se è lontano, può coprire anche solo pochi pixel e quindi basta una mole di informazioni molto inferiore, rispetto a una telecamera tradizionale, per individuare il moto di un oggetto.

Non solo, perché la telecamera neuromorfica è anche un sensore differenziale, dotato di pixel asincroni, che non inviano l’informazione tutti insieme, ma soltanto quando rilevano il moto.

Telecamere di questo tipo hanno una latenza di frazioni di millisecondo (circa 0,1 ms); calcolando anche il tempo di elaborazione dell’informazione da parte del computer di bordo, i droni che utilizzano telecamere neuromorfiche sono in grado di volare a velocità anche dieci volte superiori rispetto a quelli che usano telecamere standard.

Parliamo in particolare di velocità relative rispetto all’oggetto che va incontro al nostro drone che possono giungere a 10 m/s, cioè 36 km/h di velocità relativa.

Ed ecco quindi che l’Oratore ci descrive quali nuovi utilizzi si aprono: innanzi tutto la possibilità di volare più velocemente anche in presenza di ostacoli dinamici, oltre che stazionari, quindi si aumenta la velocità di esplorazione di un edificio o di un’area ignota.

Le telecamere a eventi hanno anche un più alto range dinamico rispetto a quelle tradizionali, cioè un rapporto più elevato tra la luminosità più alta e più bassa che può misurare e funzionano quindi molto meglio nel riconoscere oggetti in controluce, in situazioni in cui il sole è a bassa quota.

Più volte con le auto a guida autonoma si sono riscontrati incidenti in condizioni di luce particolari, con il sole basso all’orizzonte, mentre queste telecamere a eventi questo problema non si pone.

Un altro impiego potrebbe essere quello del trasporto urbano, per esempio di provette per analisi da un sito a un altro di un complesso ospedaliero, come è già stato testato in Svizzera, proprio a Zurigo, con un servizio di collegamento tra l’ospedale universitario e un centro analisi distante qualche chilometro; nel suo tragitto il drone passava vicino a un asilo nido e, nel marzo 2019, in seguito a un incidente, è precipitato proprio nelle sue vicinanze.

Ecco che il Prof. Scaramuzza, per superare il problema, ha pensato a una soluzione dotando il drone, che era “cieco” e navigava quindi solo con il GPS, di un occhio, cioè di una telecamera leggera, che è stata sviluppata dal suo team e può essere facilmente applicata alla parte inferiore del velivolo autonomo.

La startup fondata dal Prof. Scaramuzza con il suo team, Suind, lavora proprio a questo scopo: se un drone si accorge che la batteria sta per scaricarsi o il GPS non funziona più, il sistema entra in gioco e lo guida ad atterrare verso il sito più vicino che garantisce la massima sicurezza, questo grazie al Visual SLAM e a tecnologie che riconoscono e classificano la tipologia del terreno sottostante, guidando così a vista il drone.

Sono anche in corso progetti per sviluppare droni in grado di effettuare operazioni di manipolazione in volo, sui quali il team del Prof. Scaramuzza lavora come partner di un progetto europeo denominato Aerial Core, a cui partecipano anche centri di ricerca italiani come il Prisma Lab dell’Università Federico II di Napoli, diretto dal professor Bruno Siciliano.

Il progetto consiste nello sviluppo di tecnologie cognitive che consentano a droni, dotati di sistemi di manipolazione, di ispezionare oggetti installati su fili e tralicci dell’alta tensione e di intervenire su di essi; il gruppo di Bruno Siciliano sta sviluppando algoritmi per effettuare le operazioni di manipolazione, mentre il gruppo svizzero sta lavorando sui sistemi di percezione, basati su telecamere tradizionali o a eventi per individuare nell’area di intervento punti di riferimento visivi che consentano ai droni di stabilizzarsi in aria, e di mantenersi in posizione anche quando i bracci di manipolazione si muovono.

Il loro movimento, infatti, genera forze di reazione che spostano il baricentro del robot mentre quest’ultimo deve essere informato costantemente su questo spostamento.

Un altro oggetto della ricerca è il riconoscimento degli oggetti su cui vanno effettuate le manipolazioni, in genere isolanti disposti sulle linee ad alta tensione oppure dissuasori che hanno la funzione di tenere distanti gli uccelli; questi oggetti tuttora vengono tutti installati da personale umano, con tecniche complesse e rischiose.

Davide Scaramuzza si è laureato in Ingegneria elettronica dell’informazione all’Università di Perugia nel 2004 e poi, dopo la tesi di laurea, che aveva come argomento la robotica mobile, si è trasferito in Svizzera per un dottorato di ricerca in robotica e computer vision all’ETH di Zurigo. Successivamente ha ottenuto un post-dottorato alla University of Pennsylvania, a Filadelfia, nel gruppo di uno dei “guru” mondiali dei droni, Vijay Kumar, che ha un laboratorio di ricerca con il suo nome ed infine e diventato professore nel 2012 all’Università di Zurigo, dove lavora tuttora.

Il Robotics and Perception Group dell’Università di Zurigo diretto da Davide Scaramuzza è composto da 15 persone, tra cui 9 dottorandi, 3 postdoc e 2 ingegneri ed è stato il primo al mondo a impegnarsi nell’ambito della navigazione autonoma di droni basata sulla visione, anche se molti altri laboratori hanno iniziato a indagare in questo campo.

Da tre anni a questa parte, per mantenere la loro leadership, il team ha iniziato a lavorare sulla navigazione veloce e stanno spingendo molto anche sullo sviluppo per competizioni che sono molto seguite nel mondo degli appassionati, quelle del drone racing, diffuse ovunque, anche in Italia, e con premi in denaro molto consistenti.

Il team del Prof. Scaramuzza intende sviluppare un drone autonomo in grado di competere in queste gare, dove i velivoli sono teleguidati e di vincere, anche se al momento è un obiettivo molto lontano, perché osservando le competizioni ci si rende conto di quanto la conduzione umana sia di gran lunga superiore a quella oggi ottenibile con gli algoritmi e con l’intelligenza artificiale.

L’idea, che è stata anche premiata dall’ERC con un grant assegnato a Scaramuzza, è realizzare un AlphaDrone, idealmente modellato su AlphaGo di Google, il sistema di intelligenza artificiale che ha battuto i più grandi campioni del gioco coreano Go.

Le competizioni sono già iniziate e nel 2018 il gruppo del nostro Relatore ha vinto la terza edizione della IROS Autonomous Drone Racing Competition (gara internazionale di soli droni autonomi), stabilendo il record mondiale, attraversando 9 cancelli (di cui uno mobile) in meno di 30 secondi. Un trionfo di cui ha parlato anche il New York Times.

Ispirati da questa competizione, la competizione internazionale Drone Racing League (che ogni anno organizza le gare di droni telecomandati da umani) e la Lockheed Martin nel 2019 hanno organizzato la prima edizione della AlphaPilot Competition, una gara internazionale di droni autonomi poi ribattezzata AIRR (AI Robotic Racing), alla quale il team del Prof. Scaramuzza si è piazzato secondo.

La serata si è conclusa con numerose domande, segno dell’interesse scaturito dalla relazione.

Grazie quindi al Prof. Scaramuzza e piena fiducia a questa scienza i cui benefici abbiamo appena iniziato a percepire quali potrebbero essere.

Per un appassionato di fantascienza e possessore di una grande fiducia nel futuro scientifico dell’uomo una bella e consolatrice serata.

Marco Loro