GenEthicAI: la linea sottile tra quello che è e quello che dovrebbe essere - ALTEN Italy

GenEthicAI: la linea sottile tra quello che è e quello che dovrebbe essere

Dal 3 al 7 giugno scorso, ALTEN ha ospitato la sua prima International Tech Week, con una serie di webinar distintivi e approfonditi sul tema: comprendere l’impatto dell’IA e del ML sulle nostre industrie e sulla vita quotidiana.

Una sessione di spicco è stata GenEthicAI, la linea sottile tra ciò che è e ciò che dovrebbe essere, tenuta da Tommaso Villa, Flight Simulation Developer con sede in Italia, e da Eider Elbitar, Software Developer Analyst presso ALTEN Spagna. L’intervista approfondisce le questioni etiche sollevate nel corso del loro intervento, in particolare quelle relative alla rapida evoluzione dell’IA generativa.

Intervista a Tommaso Villa e Eider Elbitar

Che cos’è l’IA generativa e come può essere utilizzata nella nostra società?

Tommaso: L’IA generativa si riferisce a un sottoinsieme di tecnologie di intelligenza artificiale che sfruttano modelli di apprendimento automatico, in particolare modelli generativi, per creare contenuti nuovi e originali a partire da dati di input. Questi contenuti possono essere sotto forma di testo, immagini, audio, video o altri formati di dati.

I sistemi di IA generativa sono progettati per apprendere i modelli e le strutture sottostanti dei dati in ingresso e utilizzare questa conoscenza per generare nuove istanze simili per stile, struttura e contesto ai dati originali.

I contenuti realizzati con l’IA generativa possono essere molto utili nell’industria dell’intrattenimento, ad esempio per regolare le performance degli attori, per generare arte come ispirazione per i progetti o per scoprire ulteriori dettagli su un determinato argomento.

Quali sono i tipi di IA generativa attualmente esistenti e le relative applicazioni che ritenete più utili?


Eider: Ce ne sono molti, ma forse i più noti sono i seguenti:

  • Text-to-text Gen AI: un modello di linguaggio naturale che genera testo sulla base di una richiesta, simulando il linguaggio umano. Chat-GPT è una delle piattaforme più utilizzate, così come Bing di Microsoft e Gemini di Google.
  • Text-to-image Gen AI: generazione di immagini sulla base di richieste di testo. Alcuni esempi di strumenti ampiamente utilizzati sono MidJourney (approccio incentrato sull’arte), DALL-E e Stable Diffusion. Possiamo anche citare applicazioni industriali esistenti come Cuebric (Hollywood lo usa per lo streaming) o Stitch (immagini fisse che fondono immagini reali con immagini generate dall’intelligenza artificiale).
  • Image-to-image Gen AI: la generazione di nuove immagini a partire da quelle esistenti, con 2 reti neurali. I due attori chiave sono il generatore, che crea le immagini, e il discriminatore, addestrato a capire se le immagini generate sono reali. Canva, ad esempio, è una suite visiva completa che ci permette di generare immagini e video con la tecnologia AI.
  • Video basati sull’AI: generazione di video e animazioni basate su una richiesta testuale. Il generatore di video AI, HeyGen, consente ai suoi utenti di semplificare il processo di creazione di video.
  • Gen AI basata sull’audio: generazione di nuovo audio per/dal parlato umano o dalla musica. Le applicazioni più diffuse che possono essere esplorate sono Respeecher (genera nuovi contenuti vocali che suonano esattamente come l’originale), AIVA (crea nuove canzoni e suoni) e LyricsStudio (crea i testi delle canzoni).

Qual è, secondo te, la minaccia più pericolosa che l’uso dell’AI generativa rappresenta per la nostra società? Può descrivere la sua produzione e il modo in cui viene creata?

Tommaso: I deepfakes sono attualmente il problema più urgente. Possono essere generati utilizzando software gratuiti e ampiamente accessibili, aprendo la porta al furto di identità, alla diffusione di discorsi politici falsi e all’uso improprio delle identità individuali. I deepfake sono media sintetici in cui una persona in un video viene sostituita con le caratteristiche di qualcun altro.

Tuttavia, esistono anche applicazioni positive per questa tecnologia. Ad esempio, i deepfakes possono essere utilizzati per la correzione delle performance nell’intrattenimento (per evitare di dover rigirare le scene), così come per il de-invecchiamento degli attori nei film e per il doppiaggio. Nel settore delle vendite, possono essere utilizzati anche per inviare messaggi personalizzati per migliorare l’esperienza del cliente.

Il processo di sviluppo dei deepfake può essere riassunto come segue:

  • Raccolta dei dati: Raccogliere un ampio set di immagini o video della persona target (la persona da sostituire) e della persona source (la persona da inserire).
  • Preelaborazione dei dati: Utilizzare algoritmi per rilevare ed estrarre i volti dalle immagini o dai video raccolti. Quindi, allineare i volti estratti a un orientamento standard per garantire la coerenza.
  • Selezione e addestramento del modello: Scegliere un modello generativo adeguato.
  • Scambio di volti: Fondere senza soluzione di continuità il volto generato con i fotogrammi del video di destinazione. Questo comporta la regolazione della tonalità della pelle, dell’illuminazione e della texture per adattarle alla testa e allo sfondo dell’obiettivo.
  • Post-elaborazione: Applicare tecniche di post-elaborazione per affinare i bordi e correggere eventuali artefatti. Ciò può includere lo smoothing, la correzione del colore e la regolazione di ombre e luci.
  • Sincronizzazione audio

I contenuti creati dagli esseri umani sono tipicamente protetti da copyright e da pregiudizi. Ma per quanto riguarda i contenuti generati dall’IA, quali ruoli giocano il copyright e la parzialità?

Eider: Per quanto riguarda il diritto d’autore, dobbiamo riconoscere una dura verità: il lavoro generato dall’IA non può ricevere diritti d’autore. Di conseguenza, le persone che si affidano in larga misura all’IA per svolgere il proprio lavoro potrebbero non essere pagate e il loro lavoro non essere riconosciuto. Coloro che possono essere colpiti negativamente da questa situazione sono i designer grafici e altri professionisti che si occupano di creazioni digitali. In considerazione di ciò, le raccomandazioni principali sono di evitare di fare riferimento a marchi specifici e di affidarsi esclusivamente alla GenAI per il brainstorming e l’ideazione.

Per quanto riguarda i pregiudizi, anche i contenuti generati dall’IA possono esserne influenzati. L’IA non è in grado di capire o fare la differenza tra informazioni di parte e informazioni non di parte. Pertanto, i contenuti generati dall’IA possono essere alimentati con informazioni inappropriate e generare risultati contenenti pregiudizi nei confronti di altri.

Personalmente, combinando entrambi i concetti, ritengo che l’origine dei contenuti generati dall’IA debba essere pienamente conosciuta e limitata a un uso privato e di ricerca, non per gli utenti pubblici, come avviene attualmente. Come società, non siamo ancora sufficientemente consapevoli dei conflitti che questa tecnologia pone quando viene usata in modo inappropriato.

Quali misure preventive si possono adottare individualmente, o come azienda, per ridurre i rischi a cui GenAI ci espone?

Tommaso: Singolarmente, possiamo imparare di più sui processi che coinvolgono la creazione di dati GenAI. Possiamo anche assicurarci di verificare la fonte dei dati in ingresso (il contenuto di bias, l’origine, lo scopo, ecc.).

Una misura preventiva fondamentale che può essere adottata come azienda è la formazione di team di progetto che abbiano una buona conoscenza dell’IA e siano consapevoli e coscienti dei possibili rischi associati. Lo sviluppo di progetti che soddisfano requisiti normativi specifici e che possiedono una forte cultura etica è inoltre favorevole. Infine, vi è la promozione della trasparenza dei dati verso le parti esterne dell’azienda.

Infine, per dimostrare come l’IA scateni dilemmi etici globali, avete casi reali rilevanti da condividere?

Eider: Ci sono due casi reali che mi hanno colpito al termine della mia ricerca e che dimostrano esempi di usi etici e non etici della GenAI:

  • WORLDCOIN AND IRISES SCANNED: A CRYPTO PROJECT CO-FOUNDED BY OPENAI (Pratica non etica): Worldcoin sconvolge la società sollevando gravi problemi etici e di privacy attraverso la scansione dell’iride, ottenendo con questo metodo i dati privati di migliaia di persone. In seguito a queste operazioni illegali, la maggior parte, se non tutti, i Paesi hanno vietato le operazioni di Worldcoin, ritenendole un problema di sicurezza nazionale.
  • 007 FAKE TRAILER CREATED USING GENERATIVE AI (Pratica etica accettabile): KH Studio, un creatore di contenuti video e canale YouTube, dichiara chiaramente nelle descrizioni dei suoi video che i suoi filmati sono concept trailer realizzati come esperimento creativo, utilizzando la tecnologia AI.