Professioni del futuro: l’Annotator che “insegna” ai robot

Abbiamo spesso parlato delle nuove skills digitali che le aziende richiedono ai giovani che cercano lavoro. Tra queste ce n’è una di cui si sente parlare poco, ma che sicuramente sarà sempre più richiesta, l’”educatore di intelligenza artificiale”. Un compito di grande responsabilità perché senza dati non esisterebbe alcun modello di intelligenza artificiale e più sono accurati e più il modello progredisce ed è affidabile. Ne abbiamo parlato con una giovane “istruttrice”, Renata Yusupova, della pluripremiata start up italiana, Asc27.

Un lavoro difficile anche solo da descrivere, ci può spiegare in che cosa consiste?
Partiamo dal presupposto che nessun sistema AI (Artificial Intelligence) potrebbe elaborare o comprendere informazioni senza una fase iniziale di apprendimento e che l’”annotation”, o classificazione dei dati, rappresenta uno step imprescindibile che si configura come apripista rispetto a qualsiasi algoritmo dell’Intelligenza Artificiale. Si tratta, fondamentalmente, del Fattore Umano dell’IA.

L’”annotator”, o “istruttore”, naviga nello sconfinato oceano dei dati, che siano visuali, scritti o sonori. Compito nostro è doverli aggiustare, verificarne la coerenza, magari integrarli. Un “annotator” deve essere a conoscenza in tutto e per tutto dello scopo e delle intenzioni del progetto per fornire dataset soddisfacenti e deve stare molto attento all’equilibrio. Se vuoi insegnare a una macchina a riconoscere la vegetazione e fornisci dati che riguardano esclusivamente un tot di tipologie di alberi, molto probabilmente avrà difficoltà a riconoscere un fiore o una pianta particolare. Non è scorretto dire che non li inserirebbe nella macrocategoria “vegetazione”. Questo esempio può applicarsi a un’infinità di campi semantici. Altro compito importante è assicurarsi che i dati siano di qualità. Per esempio, le immagini non devono essere sfocate o non facilmente riconoscibili.

Può scendere un po’ più nel dettaglio?
L’”annotator” si occupa di addestrare i modelli mediante tool specifici e idee ben definite, ponendosi come un adulto che insegna ad un bambino a distinguere tra giorno e notte. Inoltre, interviene anche in fasi successive nelle verifiche, revisioni ed aggiornamenti del training, correggendo sempre il tiro. L’”annotation” sull’audio permette il riconoscimento automatico di file audio (canzoni e sigle), la durata, il titolo. Un addestramento differente permette di analizzare lo stato d’animo delle persone in base alla voce. A livelli più alti permette anche di riconoscere il tipo di luogo dove si trova la persona che sta parlando (abitazione, bar, parco…). L’”annotation” sul testo può avere varie funzioni, tra cui stabilire un campo semantico e precise etichette di interesse (Name Entity Recognition); associare un testo ad una specifica categoria determinata in base all’argomento; analizzare i sentimenti ad esempio attraverso i commenti di Facebook.

In apparenza potrebbe sembrare un compito meccanico, più adatto a una macchina che a una persona, è richiesta anche della creatività in quello che fa?
Non lo considero un lavoro meccanico, non quando hai bene in mente l’obiettivo. L’apprendimento della macchina si basa sull’esperienza umana. Molti processi mentali necessari a una buona esecuzione richiedono assolutamente creatività. La creatività in sé richiede la capacità di uscire fuori dagli schemi e di non ragionare secondo basi acquisite nel tempo. Devi partire sempre dal presupposto che non sai niente e che devi impararlo. Nel caso dell’”annotation”, maggiormente ci estraniamo dal nostro essere umani e tentiamo di ragionare come una macchina, migliori sono i risultati. Inoltre, non è impossibile dover affrontare tematiche di cui non si immagina nemmeno l’esistenza. Di fatto, il lavoro sui dati avviene dopo un percorso di studio individuale, molto specifico ed estremamente flessibile.

Quali sono i requisiti richiesti?
Pazienza, la quantità di dati è elevata, ci vuole tempo. Logica, bisogna saper ragionare come una macchina e non dare nulla per scontato. Distacco, i dati sono dati e non hanno empatia. Creatività, perché a volte devi inventare oppure guidare tu gli sviluppatori. Curiosità: ci saranno sempre argomenti nuovi, magari potresti dover studiare un po’ di Medicina. Ogni progetto inizia con l’assunto che non sai niente.

È richiesta una formazione specifica?
Più che un reale percorso di formazione, sono fondamentali alcuni requisiti dal punto di vista umano, che vanno oltre al pacchetto Office o la conoscenza delle lingue. La formazione viene da sé, progetto dopo progetto.

Lei che studi ha fatto? Immaginava che avrebbe lavorato per una società così altamente tecnologica e innovativa?
Sin da bambina avrei voluto fare l’astronauta, l’avvocato, il pittore, lo scrittore, l’investigatore, lo scienziato e chi più ne ha più ne metta. Personalmente non sono mai riuscita a stare ferma in un percorso singolo. Ho sempre avuto il desiderio di intraprendere strade nuove. Considerando il fatto che il nostro tempo vitale è, tutto sommato, limitato e la reattività del cervello pure, ho dovuto un po’ ridimensionare le mie aspettative e ho deciso di seguire il cosiddetto cuore. Ho iniziato nell’ambito artistico, poi architettonico e, infine, nel campo geopolitico. Ed eccomi qui. Se me lo immaginavo? Non proprio. Non questo caso specifico. Ma immaginavo che non sarei mai finita in un luogo considerato magari più “standard”. Tutto sommato, non escludo la possibilità di intraprendere percorsi ulteriori.

Lei, dunque, non ha studiato materie stem, ma si ritrova a lavorare in un ambiente tecnico-scientifico fino ad oggi appannaggio degli uomini. Ritiene che esistano preclusioni per le donne che vogliano avventurarsi in questi ambiti?
A parer mio no. Il pregiudizio sulle poche figure femminili in questo mondo continuerà a sopravvivere finché non saremo noi a provarci. La possibilità c’è, le mie colleghe femminili sono anche molto brave e di conseguenza non ritengo che ci sia o ci debba essere una disparità. Conta solo la testa. E non è nemmeno così scontato che bisogna avere il fior fiore di certificazioni appresso, a volte si tratta di incontrare persone con una visione più ampia. È vero anche che, se non avessi conosciuto il nostro Amministratore Delegato, Nicola Grandis, e lui non avesse visto in me un potenziale, non avrei mai pensato a un percorso del genere.

È la prima volta che ci capita di incontrare un “istruttore” di AI italiano. Sono più conosciuti i grandi team di annotatori cinesi o indiani. Ci sono differenze di scuole tra voi?
L’”annotation” non è così nuovo come si potrebbe pensare. Esistono molti team in tutto il mondo. Google ha un intero esercito, per esempio. L’unica differenza di pensiero l’ho citata prima: vuoi addestrare in modo generico o vuoi risultati più specifici? Se la risposta è la seconda, è necessario un “annotator” totalmente integrato nel progetto. Nei team di “annotation” molto grandi arrivano dei compiti, con numeri altrettanto vasti, con determinate richieste. Ma se nessuno degli istruttori conosce il progetto, difficilmente si otterranno dataset mirati. Un “annotator”, o un” team di annotation”, che si dedica interamente a un progetto dall’inizio alla fine è sicuramente più costoso e più lento. Ma i risultati poi si vedono.