ОСОБЛИВОСТІ – WOMBO Dream та AI Art із Салманом Шахідом

ВСІ ФУНКЦІЇ Енні Трууверт16 лютого 2022 р.

Зробити Я мрію про електричні вівці? Так, якщо ми їм скажемо.

Насправді електричні вівці можуть виглядати приблизно так:

Електрична вівця. Створено Енні Трууверт разом із WOMBO Dream.

Ці вівці були створені Dream, додатком WOMBO, який використовує штучний інтелект (ІІ) для створення хитромудрих творів мистецтва. Користувач просто вводить підказку (або вибирає із пропозицій Dream, наприклад «Футуристичне місто», «Повзучі мізки» або «Діамантові дерева»). ) і вибирає художній стиль, наприклад Далі, Фентезі, Укіє-е або Стімпанк. Потім вони в режимі реального часу спостерігають, як Dream створює витвір мистецтва на основі цих даних. Користувачі настільки захоплені своїми творіннями, що у соціальних мережах і Discord виникли яскраві спільноти, де вони охоче діляться своїми «мріями».

«Я великий шанувальник італійського мистецтва епохи Відродження, — каже мені в інтерв'ю інженер Dream Салман Шахід, — і гадаю, коли я вперше побачив «Афінську школу», я був просто загіпнотизований. Я запитав WOMBO Dream, як, на їхню думку, виглядає Афінська школа в стилі Synth Wave. Це було дуже круто.

Афінська школа. Створено Салманом Шахідом спільно з WOMBO Dream.Приєднавшись до команди WOMBO у липні, Шахід працював над моделями машинного навчання для обох додатків WOMBO: Dream, випущеного наприкінці 2021 року, та першої програми компанії WOMBO, яка анімує фотографію користувача для синхронізації губ за піснею на його вибір. . В команду входять дизайнери додатків, творці контенту, менеджери з продуктів, інженери мобільних та веб-додатків, а також інженери зі штучного інтелекту, такі як Шахід.

«Ми дійсно цінуємо демократизацію творчості за допомогою штучного інтелекту», — каже Шахід. «Ми працюємо над тим, щоб абстрагуватися від складнощів та надати мільйонам користувачів по всьому світу справді круті моделі штучного інтелекту».

Алгоритм Dream використовує підхід, що базується на CLIP. CLIP – це нейронна мережа з відкритим вихідним кодом (вільно доступний алгоритм, що вивчає закономірності даних), створена дослідницькою лабораторією OpenAI. Мережа навчається на парах зображень та підписів, знайдених в Інтернеті, і може оцінити, наскільки підписи, введені користувачами, відповідають зображенням.

Для створення своїх творів модель Dream починається з випадково згенерованого вектора — математичного представлення зображення. Кожен запис у векторі відповідає крихітній деталі зображення. Деякі можуть відповідати кольору, деякі формі, деякі абстрактнішим значенням. Часто випадковий вектор спочатку відповідає сірій плямі пікселів. Потім алгоритм використовує CLIP, щоб визначити, наскільки добре поточне зображення відповідає підказці користувача, і покращує відповідність за кілька ітерацій. Користувач спостерігає, як алгоритм проводить цей процес у режимі реального часу; програма створює кілька зображень, перш ніж з'явиться кінцевий продукт. Випадковість процесу означає, що Dream ніколи не створює один і той же твір двічі.

Я питаю Шахіда, чому програма називається Dream. Він каже, що команда змінила кілька різних назв, у тому числі Paint і Paint. та «Мистецтво», перш ніж зупинитися на «Мрії». «Ми виявили, що це жартівлива інтерпретація того, як ми віримо у мрії ІІ». [Внутрішнє] уявлення – це не те, чим ми спеціально керуємося, коли ми говоримо, що один атрибут має ставитись до однієї конкретної речі. Це просто те, чому модель навчається під час навчання. Сам вектор ні в якому сенсі не читається людиною». class=”wp-image-11914″ alt=”Коричневий особняк оточений фігурами в червоних плащах під грозовим небом».Будинок мрії Сатани, фламандське бароко. Створено користувачем Twitter @baileurban2 спільно з WOMBO Dream. Це зображення – одне з улюблених творів Шахіда та переможець першого конкурсу Dream. <р>WOMBO Dream нещодавно розширилася, і тепер пропонує багатомовну підтримку. Його модель тепер може приймати підказки на широкому спектрі мов, включаючи японську, хінді та індонезійську. На додаток до більшої кількості мов, програма незабаром запропонує соціальні функції, такі як можливість бачити та ставити лайки; інші користувачі’ мрії, якщо вони захочуть поділитися ними. Команда також експериментує з 3D-анімацією снів, щоб користувачі могли переміщатися по створених ними снам у віртуальній реальності. Офорт, здавалося, підкреслював суть підказок, створюючи прості твори жахливої ​​якості. Бароко, навпаки, вражає переконливими мазками та палітрою кольорів того періоду.

Горе і покажи мені, як ти виглядаєш. Створено Енні Трууверт разом із WOMBO Dream.

Однак деякі зображення змусили мене задуматися про можливі наслідки програми, яка створює зображення на основі частоти пар підпису та зображення в Інтернеті. Повторення деяких підказок показали, наскільки мова, яку я використовував, може бути сповнена соціальними конотаціями та культурними стереотипами: варіант «Кліки»; утворилася група жахливих блідих осіб в уніформі, їхні тіла зливалися одне з одним. Негативний зміст очевидний. Ітерація займенника «Її» продемонструвала традиційно жіночне біле тіло, загорнуте в рожеве вбрання, що розвівається.

Кліка і вона. Створено Енні Трууверт разом із WOMBO Dream.

Подібні ітерації дають нам з перших рук можливість поглянути на поточні межі творчості ІІ. Як пояснює Шахід: «Один фактор, який часто називають «особливим соусом», що відрізняє людей, полягає в тому, що навіть з великомасштабними моделями [ІІ], які працюють дуже добре і мають продуктивність, близьку до людської, вони не є. вони не мають можливості… впроваджувати інновації чи створювати нову інформацію крім тієї, що вони вже бачили. Вони просто узагальнюють інформацію, яку вже бачили, по-новому, і я думаю, що протягом тривалого часу так буде й надалі».

Для деяких артистів програма посилює цей «особливий соус». людської творчості.

“З появою мистецтва, що генерується штучним інтелектом, художники зможуть створювати все більш і більш круті речі”, – з ентузіазмом говорить Шахід. Багато художників розповіли команді, що використовують додаток, щоб знайти натхнення для палітри кольорів або вихідних структур для своїх власних робіт. Художники, що діляться анімаціями своєї мрії на сервері Dream Discord, надихнули команду WOMBO Dream на 3D-роботу, яку зараз розробляє. Ще одна функція, яка незабаром буде випущена, дозволить користувачам вводити зображення, з яких алгоритм може черпати натхнення.

“Я думаю, що в цілому це чудовий інструмент для розширення прав і можливостей людей”, – сказав він. Шахід розмірковує. «І я думаю, що на нас чекає майбутнє з ще красивішим мистецтвом».

Зліва: Чистилище. Створено Twitter та інженером штучного інтелекту WOMBO @CafeSamosaBlue спільно з WOMBO Dream. Це зображення – улюблений приклад Шахід з нової функції Dream, яка дозволить користувачам вводити зображення в алгоритм. Справа: мистецтво WOMBO Dream на гала-концерті Velvet FS Gala у Солт-Лейк-Сіті, штат Юта, у січні 2022 року. Фото Вівека Бхакти.

Щоб дізнатися більше про Салмана Шахіда, відвідайте його особистий Twitter. Щоб дізнатися більше про WOMBO та побачити більше мистецтв штучного інтелекту, відвідайте офіційний сайт WOMBO, Twitter та Instagram.

*

Поділитися цим повідомленням

Схожі повідомлення:

  1. ОСОБЛИВОСТІ – STEM From Dance
  2. ФУНКЦІЇ – Fairly Intelligent™ від А.М. Дарк
  3. ФУНКЦІЇ – Ілюстрація космічного простору з Софі Шен
  4. CREATORS – Оуен Фернлі

Про автора

Енні Трууверт

Енні має ступінь магістра експериментальної психології та ступінь бакалавра наук Університету Торонто. Вона була редактором студентського психологічного журналу Inkblot та писала статті для газети коледжу Вікторії The Strand. Під час навчання вона працювала науковим співробітником у кількох психологічних лабораторіях, що надихнуло її на розробку власних наукових експериментів та здобуття наукового ступеня. Під час навчання в аспірантурі Енні досліджувала зорову увагу та пам'ять, виступала на численних конференціях та допомагала на курсах психології для студентів. Саме завдяки такій активній ролі в науковому співтоваристві Енні захопилася науковими комунікаціями та прозорістю. За допомогою Art the Science вона сподівається розпочати обговорення того, як сучасні наукові ініціативи впливають на громадськість, а також інноваційні способи, за допомогою яких вчені можуть повідомляти про свої відкриття. У вільний час Енні може дивитися останній психологічний трилер або фотографувати на природі.

Позначки:, , , , , , , , ,
close