Banner OM D E M5Mk.II Zuiko 75mm

Improvvisamente entra in gioco l’AI, e a gamba tesa…

 

    Sono anni che sento parlare di Intelligenza Artificiale ("Artificial Intelligence" o anche, sempre più spesso, "AI", come qualcosa con cui si ha già confidenza). Dapprima come di un qualcosa di eternamente atteso ma eternamente deludente. Poi, quasi all'improvviso, come di una minaccia per il genere umano, qualcosa che ci farà concorrenza, "il computer che pensa", eccetera

white mirrorless camera

Eccone uno, di quei "risultati più eccentrici" di cui parlo più avanti: è quanto ha prodotto DALL-E 3 in risposta a questo mio prompt:

"(disegna) una fotocamera mirrorless bianca, con un enorme zoom rosso, dipinta in stile puntinista, arte digitale"

    Lasciati perdere i toni sensazionalistici e quelli drammatici(1), da quanto ho capito frequentando un corso introduttivo sull'argomento il motivo di questo brusco ed inatteso incremento dei risultati dei sistemi di AI, che ha stupito persino chi in questo settore ci lavora da anni, risiede nella possibilità di poter disporre di dataset(2) giganteschi a costi ragionevoli, una condizione che è diventata realizzabile solo da pochi anni. In pratica, l'AI avrebbe già funzionato da anni, se solo avesse potuto disporre dell'enorme numero di dati che si è rivelato necessario per poter "fare esperienza"; appena ciò è stato possibile è "sbocciata" e si sono visti quei fortissimi miglioramenti nei suoi risultati che l'hanno fatta balzare avanti da protagonista nei media di tutto il mondo, anche su quelli generalisti che non se ne erano mai occupati prima

    Non voglio discutere in questa sede dei rischi legati all'AI, sebbene mi preoccupino, quanto dei sorprendenti risultati alla portata di chiunque, dato che da più parti è stato reso possibile accedere ai sistemi di AI per sottoporgli un prompt(3) a piacere (anche se le richieste che coinvolgono certi temi "sensibili" vengono intercettate e bloccate dai controlli preliminari, inseriti per evitare che insorgano problemi etici, razziali o politici). In particolare mi interessano gli output grafici dell'AI, cioè i "disegni" che  questi sistemi sono capaci di generare a partire dalle richieste degli utenti, spesso apparentemente impossibili da soddisfare

    Così, quando qualche giorno fa ho letto che "Finalmente, con Image Creator è possibile accedere a DALL-E 3(4) da Bing, il motore di ricerca di Microsoft" ci ho subito provato anch'io, dando in pasto al sistema quanto mi veniva in mente di getto, senza pensarci troppo. Sorvolo sui risultati più eccentrici, per concentrarmi su una delle mie richieste di tipo esplicitamente "artistico":

"disegna un mazzo di fiori in stile impressionista con colori invertiti, arte digitale"

    Il sistema ha velocemente generato due immagini, entrambe "in negativo" (cosa di cui mi sono subito pentito, ma l'avevo chiesto io…) ma comunque gradevoli e stimolanti:

 

  Prodotto_AI_2
Le due immagini prodotte da DALL-E 3 in risposta al mio prompt. Pur essendo entrambe valide, a me è piaciuta di più la seconda, che mi è sembrato rendesse maggiormente l'impressione di essere stata "dipinta", e l'ho usata come punto di partenza per generare l'immagine finale

 

    Fra queste due ho scelto la seconda come base di un'ulteriore elaborazione grafica tradizionale(5), il cui risultato mi pare più che soddisfacente, eccolo:

 

Vaso_AI
Questo è il gradevole quadretto realizzato in tecnologia digitale venuto fuori con l'aiuto di DALL-E 3 (uno dei più avanzati sistemi di AI dedicati alla grafica) ed un prompt… mio

 

(1) "Lasciati perdere" …in realtà, solo in parte: anch'io prevedo guai, magari non in forma di un distopico "Grande Fratello" in grado di controllarci, ma più prosaicamente di un sistema capace di rendere in breve tempo inutili milioni di posti di lavoro, sostituendo noi umani in decine di tipi di mansioni diverse, da quelle ripetitive fino a ruoli di responsabilità, per il semplice motivo di essere a basso costo. E temo che la risposta usuale "bisogna darsi delle regole" non sia affatto rassicurante: quando c'è di mezzo molto denaro, se una cosa si può fare, qualcuno, da qualche parte nel mondo, la farà

(2) i Dataset sono l'insieme di dati strutturati usati dai sistemi di machine learning come "esempi" su cui basarsi per poter costruire la propria "conoscenza statistica". Perché siano efficaci, solitamente contengono milioni di relazioni

(3) il prompt è il mezzo di comunicazione usato dall'utente per interfacciarsi con i generatori di AI (ne esistono di vari tipi, ma il più semplice è tipicamente una riga di testo in linguaggio informale). Questi comunicano cosa dovrebbe contenere l'immagine ai modelli di machine learning che trasformano quel testo in un'immagine

(4) DALL-E è è un algoritmo di intelligenza artificiale capace di generare immagini a partire da descrizioni testuali. Sviluppato da OpenAI, viene presentato il 5 gennaio 2021. La versione 3.0 (lanciata nel settembre 2023), che ho usato per generare il mazzo di fiori, è in grado di sviluppare dettagli molto complessi e si integra per la prima volta con ChatGPT, consentendo la generazione di immagini all'interno di una conversazione testuale

(5) ho scritto "tradizionale" perché l''elaborazione non ha più coinvolto l'AI, ma è consistita in questa sequenza di passaggi realizzati con Photoshop:

    • inversione dei colori
    • aumento di vivacità e contrasto
    • sovrapposizione di un pattern ("arenaria") che potesse rendere l'idea della carta da acquerello
    • aggiunta della "firma" (doppia: mia per il prompt e l'eleaborazione, del sistema di AI per la paternità dell'immagine)
    • aggiunta di un "effetto cornice", in tinta con i colori dell'immagine

 


Me@2023

 

      (Ivan – 23/10/2023)


.   

Commenti offerti da CComment

Stella inattivaStella inattivaStella inattivaStella inattivaStella inattiva