Сб. Июл 2nd, 2022


Сгенерированные искусственным интеллектом изображения женщин в сари

Единственные реальные ограничения в ДАЛЛ-Э Мini – это творчество ваших собственных подсказок и его невероятная манера письма. Доступный для всех Генератор интернет-изображений с искусственным интеллектом может вызвать в воображении размытые, искривленные, плавящиеся приближения любого сценария, который вы можете придумать. Кошмары Сайнфелда? Ты понятно. Эскизы животных из зала суда, транспортные средстваи известные люди в переменный комбинации? Очень просто. Никогда раньше не видел монстры ужасов из ума безмозглых. Конечно, что угодно.

Но дай ДАЛЛ-Э Мini буквально ничего, и он быстро обнажает границы собственного «воображения». Без направления или руководства модель ИИ, кажется, застряла. Сабсолютно не подсказка, программа будут без сомнения вернуть вам изображение женщины в сари (одежда, которую обычно носят в Южной Азии).

Даже разработчик инструмента, Борис Дайма, не знает точно, почему. к отчету от Остальной мир. «Это довольно интересно, и я не уверен, почему это происходит», — сказал он Остальному миру об этом явлении.

сетка из 9 изображений, сгенерированных ИИ

Что такое DALL-E mini?

DALL-E mini был вдохновлен ДАЛЛ-Э 2, мощный генератор изображений от OpenAI. Изображения, которые создает DALL-E 2, намного более реалистично чем те, которые может сделать «мини», но компромисс заключается в том, что для этого требуется слишком много вычислительной мощности, чтобы его мог использовать любой старый пользователь Интернета. Там ограниченная вместимость и список ожидания.

Поэтому Дайма, не связанный с OpenAI, решил создать свою собственную, менее эксклюзивную версию, которая была запущена в июле 2021 года. последние несколько недель, это стало дико популярным. По словам Даймы, программа обрабатывает около 5 миллионов запросов каждый день. По состоянию на понедельник DALL-E Mэто было переименовано мелок и перешел на новое доменное имя по настоянию OpenAI.

Как и любая другая модель искусственного интеллекта, DALL-E Mini/Craiyon создает выходные данные на основе входных данных обучения. В случае Мini программа была обучена на диете из 15 миллионов пар изображений и подписей, а также дополнительных 14 миллионов изображений, плюс хаос открытого интернета.

Из остального мира:

Мини-модель DALL·E была разработана на основе трех основных наборов данных: Набор данных концептуальных подписейкоторый содержит 3 миллиона пар изображений и подписей; Концептуальный 12Mкоторый содержит 12 миллионов пар изображений и подписей, а The OpenAI корпус около 15 миллионов изображений. Соавтор Dayma и DALL·E mini Педро Куэнка отметил, что их модель также обучалась с использованием нефильтрованных данных из Интернета, что открывает неизвестные и необъяснимые отклонения в наборах данных, которые могут просачиваться в модели генерации изображений.

И эти основные данные почти наверняка имеют какое-то отношение к феномену сари. Положение дел сари, если хотите.

Сетка из девяти изображений, созданных ИИ

Почему DALL-E mini застревает на Saris?

Дайма предположил, что изображения южноазиатских женщин в сари могли быть широко представлены в тех оригинальных фотосетах, которые подаются DALL-E M.ини. И что причуда также может иметь какое-то отношение к длине подписи, поскольку ИИ может ассоциировать подсказки без символов с короткими описаниями изображений.

Однако Майкл Кук, исследователь ИИ из Университета королевы Марии в Лондоне, сказал Остальному миру, что он не так уверен в теории чрезмерного представительства. «Обычно у систем машинного обучения есть обратная проблема — они на самом деле не включают достаточно фотографий небелых людей», — сказал он.

Вместо этого Кук считает, что причина может заключаться в языковой предвзятости процесса фильтрации данных. «Одна вещь, которая пришла мне в голову во время чтения, заключается в том, что многие из этих наборов данных вырезают текст, который не является английским», — сказал он. Он объяснил, что подписи к изображениям, которые включают хинди, например, могут быть удалены, оставив изображения без вспомогательного, пояснительного текста или меток, свободно плавающих в изначальном бульоне ИИ.

До сих пор ни идеи Кука, ни Даймы не были доказаны, но обе они являются хорошими примерами проблем, очень распространенных в ИИ. пзапрограммированы и обучены людьми, искусственный интеллект так же надежен, как и его создатели. Если вы скормите генератору изображений файл cookie, он выдаст кучу файлов cookie. А так как мы живем в аду, ИИ несет на себе досадное бремя человеческие предрассудки а вместе с ним и стереотипы.

Как бы ни было забавно думать, что изображение «женщины в сари» — это какое-то первичное сообщение из глубин ничем не ограниченного Интернета, реальность такова, что это, вероятно, побочный продукт случайности данных или старой доброй предвзятости. Женщина в сари — загадка, но существующие проблемы ИИ нет.





Source link

READ  «Создана «реконструкция» никогда не существовавшего «боя»: МО РФ сообщило о съёмке Киевом постановочных видеосюжетов

от admin