Мыслишки. Художники vs. GenAI

Недавний релиз обновления для модели GPT-4o дал ей возможность генерации изображений на основе уже существующих. И хотя, Midjourney в том или ином виде умела делать это раньше, GPT-4o делает это гораздо точнее.

Очень быстро пользователи обнаружили, что GPT-4o довольно неплохо делает картинки в стиле Studio Ghibli, и интернет быстро заполонили портреты людей и мемы, оформленные в этом стиле.

Но вместе с волной подобных картинок с новой силой вспыхнули споры об этичности применения генеративных нейросетей для генерации картинок. Сегодня немного порассуждаю на эту тему.

О чём вообще спор?

Против GenAI в основном высказываются художники. В качестве главной претензии выдвигается тезис, что обучение подробных нейросетей является нарушением авторских прав, так как неизвестно, откуда берутся все эти датасеты. Менее прошаренные говорят о том, что так или иначе нейронки крадут некий "стиль", чтобы это не означало.

Также много вопросов вызывает и качество изображений, генерируемых ИИ. Нейросетевые арты заполонили интернет, что вызывает некоторого рода батхёрт у художников. В ход вступает аргументация про дурновкусие, и что работа нейросети считывается сразу, хотя и с этим можно поспорить. Как минимум есть пример того, что даже опытное жюри на конкурсе не смогло определить работу нейросети. И это было два с половиной года назад.

Немного об эмпатии

На мой взгляд, истинная причина беспокойства художников не столько в нарушении авторских прав и смерти искусства, а в более приземленных вещах.

Дело в том, что GenAI уже применяются в коммерческих целях, причём довольно широко. Чаще всего их используют для генерации каких-нибудь маркетинговых изображений, и это уже экономит компаниям кучу денег. Но если это экономит деньги, значит кто-то их не получает. Компании (особенно непрофильные) быстро поняли фишку, и перестали нанимать иллюстраторов в былых масштабах. И поэтому проблема очевидна - художники (или люди, которые считают себя таковыми), перестают зарабатывать. К сожалению, рыночек порешал.

Многие сравнивают GenAI с появлением первых станков, когда произошла промышленная революция и многие люди потеряли свою работу. Но когда мы говорим о GenAI в этом контексте, то здесь следует различать искусство и ремесло. Очевидно, что рисование иллюстраций для пачки чипсов - ремесло, а не искусство.

Проблема здесь значительно глубже. Многие художники нарабатывают опыт, а также зарабатывают себе на жизнь таким ремеслом, а в свободное время занимаются рисованием "для души", создавая свой magnum opus. И когда мы вводим GenAI в игру, переставая брать заказы у людей, мы лишаемся потенциальной возможности получить какое-то эпохальное творение, так как художник, который мог бы его создать ̶у̶м̶р̶ё̶т̶ ̶с̶ ̶г̶о̶л̶о̶д̶у̶ будет вынужден найти себе какое-то другое занятие. Просто потому, что учиться на художника будет экономически не выгодно. Здесь, кстати, появляется и ещё одна фундаментальная проблема. Если начинающих художников заменит AI, то откуда будут браться новые опытные художники? Та же самая проблема и в IT с джунами, кстати.

И конечно, я бы не хотел, чтобы люди теряли работу и средства к существованию, и я могу понять все эти опасения, которые уже начинают сбываться. И уж тем более я не хочу злорадствовать по этому поводу.

А что делать?

Проблема в том, что ситуацию невозможно решить в пользу художников и иллюстраторов. Ящик Пандоры уже открыт.

Если спросить у художника, который высказывается резко против GenAI, что можно сделать, то с очень большой вероятностью мы получим ответ "запретить".

Такой подход нерационален и вызывает много вопросов о его реализации. Что запретить? Деятельность разработчиков моделей? Закрыть Midjourney Inc., OpenAI и кучу других компаний, предоставляющих эту услугу? Или запретить использовать модели в коммерческих целях? А сбоку ещё машут рукой вопросы про юрисдикции.

Конечно, тут можно привести судебные иски против корпораций от художников и писателей, которые считают, что их работы использовались для обучения моделей. Но я особо не видел каких-то движений по данным процессам, и, на мой взгляд, у художнико вряд ли что-то получится доказать. Я не силён в авторском праве, но на мой взгляд, доводы о некоем "стиле" и том, что картинки являются копиями реальных работ, просто несостоятельны с точки зрения права. Вот одна из цитат:

По его словам, его проекты стоят «десятки тысяч», но ИИ способен выдавать копии его работ за считанные секунды. На некоторых изображениях, по-видимому, сгенерированных программным обеспечением, снежные барсы точно с такими же пятнами, как и на его снимках.

Уже представляю, как судья под лупой разглядывает две картинки, сравнивая пятна на снежных байтах.

Доказать это мог бы прямой доступ к датасетам, которые использовались для обучения. Но и тут есть проблема - размеры датасетов условных Midjourney могут измеряться десятками, а то и сотнями терабайт.

Поэтому и с этой точки зрения какое-то законодательное регулирование затруднительно. А даже если и кому-то из художников удастся выиграть дело, доказав использование своих работ в обучении, вряд ли это станет поводом для запрета использования GenAI, и уж тем более это не решит проблемы художников.

Ну и честно, я против вообще какого бы то ни было регулирования в этой области, особенно государственного. Интернет и индустрия в целом стремительно начал портиться после того, как государства запустили в него свои шаловливые ручки и начали закручивать гайки. И хотя, разработки в области генеративного ИИ приносят баснословные деньги, всё же глупо отрицать их пользу для общества. Будет очень грустно, если мы окажемся в одном шаге от создания AGI из-за жесткого регулирования ИИ-сферы.

Да, с первого взгляда может показаться, что генерация котиков и артов в стиле Миядзаки - не лучшее использование ресурсов (тут же вспоминается исследование, что GPT тратит три бутылки воды на генерацию 100 слов), но это слишком поверхностное суждение. Условная генерация картинок базируется на огромном количестве других исследований, полезных в других задачах. Иными словами - это вершина айсберга.

Смерть искусства

Искусство становится доступнее и демократизируется. Теперь каждый может, вбив промпт, получить нужное ему изображение. Это помогает людям, которые не умеют рисовать, быстро визуализировать какие-то свои идеи.

Да и генерация изображений - не такой простой процесс, как может показаться. Да, для достижения какого-нибудь простого результата достаточно простого промпта, но для более сложных изображений нужно порядком постараться над промптом и параметрами модели.

Очевидно, что активное применение генеративных нейросетей - не помеха для традиционного искусства. Опять же, приведу избитый пример, но появление фотоаппаратов не привело к исчезновению картин, а появление кино не привело к закрытию театров. Да и давайте будем честны друг с другом, современное изобразительное искусство и так всегда было элитарным, и нейросети хуже не сделают.

Выводы будут примерно такие же, как и в прошлых мыслишках. Очевидно, что в данной ситуации выиграют те, кто по-максимуму адаптируется к ситуации. Многие художники уже используют GenAI для генерации различных референсов. Плюс, хоть сейчас многие компании активно используют нейронки, люди с навыками рисования нужны, чтобы править неидеальные картинки.

Обсудить написанное и накидать автору в панамку можно здесь.