L'Officiel Art

DALL-E 2 présente l'avenir de l'art grâce à l'IA

Avec le système d'IA DALL-E 2, la Silicon Valley a volé notre attention.

tie formal wear beard person head face man adult male coat

La chute de l'histoire de l'art a peut-être commencé avec le décolleté, en particulier le décolleté de la robe verte en mousseline de soie Versace de Jennifer Lopez lors de la 42e cérémonie des Grammy Awards le 23 février 2000. Google aurait pu être déçu, car la recherche d'images n'avait pas encore été inventée. L'ancien PDG de Google, Eric Schmidt, a révélé plus tard que l'abondance de recherches pour la robe avait inspiré Google à créer Google Images, et en juillet 2001, ils avaient réussi. Vingt et un ans plus tard, le concept pionnier de photos accessibles au public et consultables a amassé plus de 1,12 milliard d'images pour Internet tout en façonnant la compréhension visuelle pour l'humanité et la robotique. Grâce à l'étendue des données que nous avons téléchargées, partagées, créées et oubliées, nous avons créé une nouvelle formule pour l'accumulation d'images et, sans le savoir, développé un vaste ensemble de données de formation pour les chercheurs en IA et leurs algorithmes à utiliser.

Il a fallu des années pour arriver à la puissance de traitement actuelle des générateurs de texte en image IA. Pour la plupart, l'étiquetage des images a été la contribution la plus importante, prenant d'énormes heures de travail pour un changement progressif. En 2007, des informaticiens de Stanford et de Princeton ont commencé à classer les images déraillées par des étiquettes superficielles que les utilisateurs généraux avaient simplement attribuées à leurs photos de "cat.jpeg". Ils ont réalisé la nécessité d'une entrée humaine pour créer des légendes d'images sophistiquées pour les programmes de classification afin de rationaliser la capacité de recherche. (C'est là que réside la différence entre « chat » et « gros chat blanc et pelucheux dans un panier ».) Le projet a employé plus de 20 000 personnes pour étiqueter les images ; en 2012, l'équipe avait créé une base de données de 14 millions de photos sous-titrées. Satisfaits des développements, les scientifiques ont épinglé une affiche annonçant l'ensemble de données dans un centre de conférence de Miami Beach, qui "a rapidement évolué en un concours annuel pour voir quels algorithmes pourraient identifier les objets dans les images de l'ensemble de données avec le taux d'erreur le plus faible". Ainsi commença l'humble genèse d'un réseau antagoniste génératif (GAN).

flower bouquet flower arrangement flower plant person dress clothing
"Fête de naissance de sirène Lucious pendant la Renaissance flamande avec les cheveux préraphaélites, photographiée par Tim Walker." Sarah Hoover.

Les GAN ont commencé comme des guerres de geeks. Comme l'a expliqué l'écrivain technologique Loz Blain, les GAN ont mis "deux IA en compétition, toutes deux" formées "en montrant un grand nombre d'images réelles, étiquetées pour aider les algorithmes à apprendre ce qu'ils regardent." Une IA « génératrice » commence alors à créer des images, et une IA « discriminatrice » essaie de deviner s'il s'agit de vraies images ou de créations d'IA. Au fil des milliards d'itérations, l'IA est devenue plus sophistiquée dans la création et le déchiffrement, mais est restée rudimentaire dans son raisonnement conceptuel imaginatif. Parfois, l'IA était convaincue de la réalité de photos que des enfants sauraient irréalistes. Par exemple, en 2015, le générateur d'images IA de Google, DeepDream, a inséré de façon fantasmagorique des visages de chien dans plusieurs de ses créations en réagissant à la popularité des images de chiots dans l'ensemble de données. Pourtant, les ingénieurs ont persisté et la popularité des GAN s'est propagée.

En 2016, Andrew Conru, un homme d'affaires titulaire d'un doctorat en génie mécanique de l'Université de Stanford qui a aidé à lancer les paniers d'achat en ligne, a poussé les GAN un peu plus loin. Pour Conru, la "prochaine étape logique dans le parcours de l'évolution artistique" consistait à sous-traiter la fabrication à des ingénieurs qui, avec une vaste compréhension du matériel et des logiciels, pouvaient rendre les peintres obsolètes. À partir de là, RobotArt a été fondé. Le concours, couvert par Smithsonian et Popular Mechanics, était un nerdgasme dystopique de passionnés de robots recréant superficiellement des peintures sans la main humaine. Certains robots ont créé de "nouvelles œuvres", certains ont reproduit le pop art, tandis que d'autres ont été codés pour créer stylistiquement de "nouvelles" versions des tableaux de Van Gogh via des générateurs d'IA. En fin de compte, les gagnants se sont partagé un prix de 100 000$, ont emballé leurs robots et sont rentrés chez eux, imperturbables par la gifle métaphorique. (Duchamp, qui affirmait que l'art devait simplement être déclaré « art », n'avait probablement jamais anticipé les prix en espèces de la Silicon Valley.) Néanmoins, le concours était une menace inoffensive, le gagnant Pindar Van Arman a finalement été ridiculisé par le critique d'art senior du magazine new-yorkais Jerry Saltz, et le monde de l'art a ignoré le Battle of the Art Bots, GANs et Silicon Valley. Nous nous sommes moqués, à juste titre, et sommes passés à autre chose.

flower arrangement flower bouquet flower plant rose portrait person face photography finger
"Le courage d'être réel." Stuart Vevers.

Mais ensuite est venu le GANisme. Comme il est naturel dans l'histoire de l'art, des artistes ont émergé dans l'espace pour libérer le médium de ses chaînes commerciales. Des artistes tels que Trevor Paglen et la chercheuse Kate Crawford ont réécrit les étiquettes sans parti pris inhérent et les ont alimentées via leur système propriétaire pour créer de nouvelles données. Le collectif parisien Obvious a créé un système GAN en utilisant des portraits peints entre le XIVe et le XXe siècle, générant finalement un portrait IA et le vendant chez Christie's pour 432 500$. Dans le même temps, le film Deep Meditations de Memo Akten de 2018 s'entraînait sur des images taguées de concepts abstractionnistes véhiculant le sens de l'existence. Le médium a pris pied, soutenu par des approches méthodologiques critiques de Casey Reas, Lev Manovich, Arthur I. Miller et Nora N. Khan, des acheteurs intéressés, et des approches innovantes pour déconstruire le GAN. Des superstars du GAN Art comme Refik Anadol et Mario Klingemann, anciens élèves de la résidence Google Arts & Culture, ont commencé à émerger, tandis que des institutions telles que le MoMA et le Centre Pompidou ont ouvert leurs portes. Le monde de l'art avait enfin trouvé une lentille à travers laquelle GAN pouvait avoir un sens, principalement en tant que subversion de ses origines de la vallée. Les légendes d'images créées par les artistes étaient une approche nuancée pour examiner nos systèmes vivants et notre perception.

Le 20 juillet 2022, une autre itération GAN est sortie : son nom est DALL-E 2. Un savant mélange entre WALL-E de Pixar et Salvador Dalí, il s'agit peut-être de l'une des technologies les plus extraordinaires et potentiellement apocalyptiques jamais créées. L'idée originale des entrepreneurs technologiques Elon Musk, Greg Brockman, Ilya Sutskever, Wojciech Zaremba et John Schulman, OpenAI - la société mère de DALL-E - a créé des capacités génératives sans précédent conçues sur mesure pour le monde de l'art. Intéressé par un « Alien en Kodak 400 dans le style d'Annie Leibovitz » ? DALL-E 2 l'a. Qu'en est-il de "Entrer dans la quatrième dimension à la manière de Van Gogh" ? Vous êtes fin prêt avec DALL-E 2. "La Cour Suprême descend sur la piste de danse à la manière de Norman Rockwell" ? Oui, DALL-E 2 peut le faire. Jamais auparavant un générateur de texte en image n'avait été conçu pour le monde de l'art, et jamais auparavant il n'avait été adopté aussi rapidement. C'était intentionnel.

fashion dress clothing gown formal wear person
"Déchets post-apocalyptiques, grande prêtresse divine." Julia Fox.

"Jamais auparavant un générateur de texte en image n'avait été conçu pour le monde de l'art, et jamais auparavant il n'avait été adopté aussi rapidement. C'était intentionnel."

À la fin de l'été 2022, OpenAI a envoyé un million d'invitations bêta DALL-E 2 à des initiés, notamment des artistes, des journalistes, des chercheurs, des entrepreneurs et des créateurs de goût. Et en une semaine, la présence de DALL-E 2 était omniprésente sur Instagram, les discussions de groupe et Twitter. Les peintres et les entrepreneurs technologiques ont adopté le générateur : la cover star de L'OFFICIEL Emma Stern a posté sur sa grille, et le co-fondateur milliardaire de LinkedIn Reid Hoffman a vendu ses créations DALL-E 2 pour 24 000$ sur le marché NFT Magic Eden. En utilisant le plan de jeu du Fyre Festival (le fameux carré orange), DALL-E 2 est devenu cool. Mais, à l'instar du festival malheureux, il est important de noter que les usagers ne sont pas les bienfaiteurs, et la gestion est en crise.

OpenAI s'est métamorphosé à partir de sa charte d'origine, qui affirmait que « l'obligation fiduciaire principale de l'entreprise est envers l'humanité » alors qu'elle développait AGI - une machine dotée des pouvoirs d'apprentissage et de raisonnement de l'esprit humain, contournant la ligne de singularité. La technologie AGI, redoutée par ceux qui comprennent la menace existentielle, serait moins acceptable si elle était engendrée par la cupidité des entreprises riches, alors pour commencer sa mission, OpenAI s'est enregistrée en tant qu'association à but non lucratif. Comme Karen Hao l'a écrit dans MIT Technology Review, "Bien que cela n'ait jamais rendu la critique explicite, l'implication était claire : d'autres laboratoires, comme DeepMind, ne pouvaient pas servir l'humanité parce qu'ils étaient limités par des intérêts commerciaux." Pendant qu'ils étaient fermés, OpenAI serait ouvert. Ou alors nous l'avons pensé.

publication person comics book horse mammal animal equestrian
"Couverture d'un roman occidental d'un cow-boy à cheval sautant par-dessus une boîte de maïs cuisinant au-dessus d'un feu de camp." Canyon Castator.

Avance rapide de quelques années, OpenAI a révoqué sa charte à but non lucratif et s'est enregistrée en tant qu'entreprise à but lucratif en 2019 - c'était une décision controversée et un point clé crucial. Immédiatement après l'annonce, Elon Musk, qui pense que l'IA est "potentiellement plus dangereuse que les armes nucléaires", a quitté OpenAI, en publiant un tweet, "Je n'étais pas d'accord avec une partie de ce que l'équipe d'OpenAI voulait faire" , qui s'est senti dupé par le revirement idéaliste, un investissement d'un milliard de dollars de Microsoft, et OpenAI a perdu son it girl mojo. N'étant plus l'institut de recherche qui promettait d'être « ouvert », la croissance des bénéfices est devenue la responsabilité légale de l'entreprise. Ses fans de la Silicon Valley, qui défendaient la surveillance d'AGI dans le contexte à but non lucratif, ont perdu confiance, tandis que la réponse pavlovienne des investisseurs a induit une bave financière. Ainsi, OpenAI avait besoin d'une refonte de l'image, et DALL-E est devenu leur rentrée amusante dans les bonnes grâces. DALL-E était stupide, branché, époustouflant, incroyablement viral et uniquement disponible pour les personnes qui respectaient ses pouvoirs de traitement. Au début, les utilisateurs n'étaient pas autorisés à vendre des œuvres d'art générées et le modèle sous-jacent n'apprenait plus (c'est-à-dire la collecte d'images que nous avons créées en tant que données). Mais, en tant qu'entreprise à but lucratif, son modèle d'entreprise n'était pas durable pour générer les rendements de capital nécessaires et était sujet à changement - une évolution déjà en cours. Depuis juillet, DALL-E 2 est passé de basé sur des jetons gratuits et a levé son interdiction de vendre des œuvres d'art génératives. Des séances d'information mises à jour ont été diffusées aux utilisateurs et le code de conduite s'est assoupli, ce qui a conduit à une publication publique du générateur, ajoutant des millions d'utilisateurs et de générations supplémentaires. Bien que sa version "gratuite" puisse sembler contre-intuitive à la rentabilité, comme l'a déclaré l'ancien éthicien du design de Google et co-fondateur du Center for Humane Technology, Tristan Harris , "si vous ne payez pas pour le produit, alors vous êtes le produit." Ce précédent n'a jamais profité aux utilisateurs.

Les changements récents dans DALL-E 2 présentent quelques problèmes éthiques. Premièrement, en devenant le produit, la collecte de données sur l'expérience humaine de déconstruction du cerveau de l'artiste dans le cadre des ambitions de l'organisation de développer l'IAG n'est jamais clairement expliquée. Deuxièmement, produire des œuvres « dans le style de » puis les vendre est éthiquement douteux et potentiellement fatal pour les artistes et les successions d'artistes. La capacité de recherche "dans le style de" a des implications dramatiques concernant la propriété intellectuelle, et les quelque 200 employés d'OpenAI n'ont pas la force humaine pour répondre à cette préoccupation. Si un artiste possède une création, possède-t-il le dérivé créatif ? Comment les artistes peuvent-ils protéger leur propriété intellectuelle s'il n'y a pas de correspondance entre OpenAI et l'œuvre qu'ils ont utilisée ? Quel type de système de freins et contrepoids existe-t-il ? Pire, quel genre de comportement émergera si les partenariats commencent ?

head person face
"Girafe Moustache." Bill Pouvoirs.

"Ces avancées technologiques nous permettent de contourner l'imagination en recherchant l'image parfaite livrée directement sur son bureau à la demande d'un algorithme."

Si vous générez "Un chat chevauchant un monstre dans le style de Basquiat", OpenAI ne fait pas de chèque au domaine Basquiat. Et s'ils le faisaient ? Une couche de gestion des droits commerciaux pourrait fournir un contrôle et une compensation à « Dans le style de » (ITSO), mais cela aussi peut avoir des conséquences imprévues. Que faut-il pour établir l'ITSO ? À quel point les limites du style sont-elles étroites? Quelle est la taille de l'espace de style artistique ? Combien de styles distincts pourraient exister ? Supposons que les styles individuels soient largement délimités, pour rendre l'espace des styles possibles fini et limité. Dans ce cas, cela pourrait précipiter une course folle pour établir un précédent et revendiquer une partie particulière de l'espace de style. Les artistes peuvent alors avoir deux phases distinctes dans leur carrière : premièrement, ils devront générer suffisamment de travail nouveau, le faire ingérer dans l'ensemble de formation de Dall-E 2 et appliquer un style singulier. Ensuite, la deuxième phase de leur carrière consistera à monétiser leur style en utilisant le système pour générer de nouveaux matériaux en utilisant leur vecteur de style, ou en permettant à d'autres de l'utiliser pour créer de l'art nouveau et être rémunéré passivement.

Si l'ITSO peut être délimitée sur le plan éthique, une compensation sera nécessaire si DALL-E 2 met en œuvre un système de gestion des droits. Toute approche financière nécessitera la consultation des artistes, dont il semble y avoir peu, voire aucune. Même dans son état actuel, ITSO est abusé par les utilisateurs, laissant les artistes en plan. Les artistes devraient avoir une myriade d'options créatives et commerciales si la fonctionnalité ITSO persiste, y compris la fixation de frais d'utilisation ou le rationnement des utilisations ITSO finies par le biais d'enchères. Certains artistes peuvent exiger un flux de travail d'approbation, dans lequel les artistes approuvent l'œuvre d'art, et l'utilisateur paiera des frais importants. Enfin, un artiste peut restreindre l'utilisation d'ITSO à lui-même et l'utiliser pour adapter sa propre production. Cela aussi présente son propre ensemble de problèmes.

finger person hand body part baby face head eating food
"Un bébé mais un homme qui mange un jambon." Austyn Weiner.

Les artistes utilisant la technologie pour augmenter la production ne sont pas un dilemme sans fondement, car les horaires des galeries et les foires d'art exigent que les artistes produisent constamment des œuvres. C'est une vérité laide et souvent non discutée menant à un moment particulièrement sombre dans l'art. Une telle pression peut amener les artistes à utiliser DALL-E 2 pour respecter les délais, bien que le générateur n'ait aucune subjectivité, aucune expérience de vie et utilise des légendes sous-jacentes non pertinentes pour l'œuvre et, par conséquent, radicalement déconnectées. Y aurait-il un refoulement ? Un besoin de transparence ? Dans un marché chaud, si nous continuons à vendre ce qui se vend, est-ce que quelqu'un pose les questions nécessaires ? Bien qu'il puisse s'agir d'une approche plus distinctive de la « recherche », la pratique ancestrale de « trouver » et de « ruminer » deviendra de plus en plus rare. En effet, la vitesse d'accumulation d'un vocabulaire visuel n'est pas un problème à régler mais un problème à ralentir pour assurer l'héritage de l'art.

Alors que le Maître imaginait une horloge dégoulinant de la table, nous n'avons peut-être qu'à la saisir dans Google, Pinterest, DALL-E 2, ou pire, son shootoff open-source gratuit, Stability Diffusion. Ces avancées technologiques nous permettent de contourner l'imagination en recherchant l'image parfaite livrée directement sur son bureau à la demande d'un algorithme. Ceci en dépit d'une IA n'ayant aucune compréhension de l'expérience humaine, malgré les meilleures tentatives du programmeur pour reproduire la singularité créative (en supposant que l'effort est prioritaire dans l'éthique de la Silicon Valley). Il n'est pas contesté d'affirmer que les générateurs de texte en image visent à remplacer la création par une technique de collecte de données, ce qui signifie qu'ils ne respectent pas les frontières éthiques et éthérées que l'art et l'humanité ont institutionnalisées. Sans protection ITSO, contribuer aveuglément à AGI semble trompeur et dangereux. En ce sens, DALL-E 2 ne fait qu'amplifier un problème contribuant à l'ère actuelle du flop commercial de l'art, limité au respect des délais de la galerie et manquant de respect de base pour le processus de création. L'innovation est profondément problématique et, par conséquent, ne doit pas être prise à la légère, même si elle est incroyablement amusante. Ce dernier point est un point crucial dans cet argument car, aussi nihiliste que DALL-E 2 puisse nous rendre, c'est une huée absolue avec laquelle jouer.

Tags

Recommandé pour vous