Загрузил Юля Кардамонова

Генеративный дизайн

реклама
Министерство науки и высшего образования Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего образования
Воронежский государственный технический университет
Факультет информационных технологий и компьютерной безопасности
Кафедра графики, конструирования и информационных технологий
в промышленном дизайне
ОТЧЕТ ПО ЛАБОРАТОРНОЙ РАБОТЕ №1
По дисциплине:
«Генеративный дизайн»
.
наименование
на тему: «Использование нейросетей для генерации изображений по запросу»
.
Автор работы:
Ю. К. Перепелица
подпись, дата
Профиль подготовки:
инициалы, фамилия
группа бПД-201
обозначение
54.03.01 «Промышленный дизайн»
номер, наименование
Руководитель: ________________
доц. С. В. Рязанцев
подпись, дата
должность, инициалы, фамилия
Воронеж
2024
.
.
Цель
работы:
освоить
использование
нейросетей
для
генерации
изображений по запросу.
Задание на лабораторную работу:
1. Найти нейросети, способные генерировать изображения
2. Составить промт для нейросети
3. Сгенерировать изображения
4. Проанализировать полученные результаты
Ход работы
В ходе изучения информации о нейросетях, были найдены следующие
бесплатные или предоставляющие ограниченный бесплатный доступ нейросети,
способные генерировать изображения:
1. MiraMuse AI
2. StockIMG
3. Leonardo AI
4. Microsoft Designer (Copilot)
5. Ideogram
6. Dream Studio
7. Deep AI
8. Night Cafe
9. Craiyon
10. Wombo (Dream)
Для генерации запроса, была также использована нейросеть ChatGPT от Open
AI. Для лучшего понимания нейросетей необходимо составлять запросы на
английском языке. Запрос для чата был следующий: «Сформулируй запрос для
нейронной сети, создающей изображения. Я хочу увидеть автомобиль будущего
или какой-то вид транспорта, которым люди будут пользоваться в будущем. Это
должно быть детализированное изображение, какая-то концепция.» (Рисунок 1)
2
Рисунок 1. Работа с ChatGPT
Ответ был получен в течении нескольких секунд, но вышел слишком
объемным, поэтому с помощью переводчика он был сокращён до запроса,
представленного на рисунке 2. Этот промт будет использоваться для генерации
изображений в других нейросетях.
Рисунок 2. Составление промта
Далее приступаем к генерации изображения. На рисунке 3 показан интерфейс
и работа с нейросетью MiraMuse AI. В данной нейросети есть окошко для текста,
по которому генерируется картинка, есть выбор стиля, соотношения сторон и
количества изображений. Генерация одного изображения в реалистичном стиле
заняла 17 секунд. Из минусов на картинке присутствует водяной знак.
3
Рисунок 3. Нейросеть MiraMuseAI – реалистичный стиль
Генерация одного изображения в стиле 3D заняла уже 12 секунд, полученный
результат представлен на рисунке 4.
Рисунок 4. Нейросеть MiraMuseAI – 3D-стиль
Далее рассмотрим нейросеть StockIMG. Здесь есть различные варианты
использования – стоковое изображение, рисунок, логотип и т.д. Есть окошко для
4
промта, стиль изображения, ориентация и количество. Генерация стокового
изображения в стиле Cinematic 2 заняла 10 секунд и представлена на рисунке 5.
Рисунок 5. Нейросеть StockIMG – Cinematic 2
Генерация рисунка в стиле Futuristic заняла 5 секунд и представлена на
рисунке 6.
Рисунок 6. Нейросеть StockIMG – Futuristic
Перейдём к нейросети Leonardo.Ai. Здесь очень большое количество
параметров для генерации изображений. Был установлен параметр PhotoReal и
назначен размер изображения. 4 изображения в стиле Cinematic были получены в
течении 45 секунд и представлены на рисунке 7.
5
Рисунок 7. Нейросеть Leonardo - Cinematic
Также был использован стиль Creative, генерация двух изображений заняла
30 секунд и представлена на рисунке 8.
Рисунок 8. Нейросеть Leonardo - Creative
Нейросеть Microsoft Designer (Copilot) имела только окошко для ввода
промта и за 15 секунд создала 4 изображения, представленные на рисунке 9. В
отличии от других нейросетей, она попыталась создать именно концепт-арт, что
очень хорошо соответствует запросу.
6
Рисунок 9. Нейросеть Copilot
Ещё одна интересная нейросеть – Ideogram. В окошке можно ввести промт,
выбрать соотношение сторон, модель и несколько стилей для изображения
(Рисунок 10).
Рисунок 10. Нейросеть Ideogram
Особенность данной нейросети состоит в том, что она показывает процесс
генерации в реальном времени. Процесс генерации показан на рисунке 11.
Рисунок 11. Процесс генерации изображения
7
За 10 секунд нейросеть сгенерировала 4 изображения, представленные на
рисунке 12.
Рисунок 12. Результат от нейросети Ideogram
Следующая нейросеть – DreamStudio от Stability AI. В окошке с промтом
можно выбрать стиль, загрузить референс, настроить параметры изображения. 3
изображения в стиле 3D-модели генерировались больше минуты, однако генерация
одного изображения в стиле Cinematic заняло лишь 15 секунд. Результаты
представлены на рисунке 13.
Рисунок 13. Нейросеть DreamStudio
Далее рассмотрим нейросеть Deep AI. В параметрах была выбрала модель
HD, стиль Cyberpunk и горизонтальная ориентация изображения. Его генерация
заняла 15 секунд и представлена на рисунке 14.
8
Рисунок 14. Нейросеть Deep AI - Cyberpunk
В нейросети Night Cafe можно было выбрать количество изображений, время
генерации, ориентацию и пресет. За 10 секунд было создано 4 изображения в
пресете Mecha, представленные на рисунке 15.
Рисунок 15. Нейросеть Night Cafe - Mecha
Craiyon оказалась очень необычной нейросетью, которая за 50 секунд сумела
сгенерировать 9 изображений в стиле Photo (рисунок 16).
9
Рисунок 16. Нейросеть Craiyon - Photo
Помимо количества изображений, эта нейросеть необычна тем, что по
введенному промту можно искать уже созданные другими пользователями
изображения (Рисунок 17).
Рисунок 17. Поиск запроса в нейросети Craiyon
И последняя нейросеть – Dream от Wombo. Бесплатно за раз она генерирует
только одно изображения и выбирается только стиль. За 10 секунд она создала 1
изображение в стиле HDR v3, процесс и интерфейс представлен на рисунке 18.
10
Рисунок 18. Нейросеть Dream – HDR v3
В результате исследования работы десяти различных нейросетей, было
получено множество изображений. Наиболее удачные и соответствующие запросу
представлены на рисунках 19-23.
Рисунок 19. StockIMG
11
Рисунок 20. Leonardo.Ai
Рисунок 21. Ideogram
Рисунок 22. Ideogram
12
Рисунок 23. DreamStudio
В ходе анализа была составлена Таблица 1, отражающая работу различных
нейросетей для генерации изображений по запросу.
Нейросеть
MiraMuse
AI
StockIMG
Leonardo
Kopilot
Ideogram
Время
генерации
Качество
изображения
~15 c
~8 с
~25 с
~15 с
~10 с
9/10,
водяной
знак
2/10,
плохое
качество
10/10
Соответствие
запросу
Оригинальность
результата
Количество
генерируемых
изображений
Количество
бесплатных
генераций
9/10
8/10,
10/10
невысокое
разрешени
е
9/10
8/10
10/10
10/10
7/10
7/10
6/10
10/10
10/10
1-2
1-4
1-4
4
4
12
1
Зависит от 15
параметро
в
Контроль над
параметрами
3
параметра
3
параметра
>10
параметро
ви
вариаций
13
25
отстутству 5
ет
параметро
в
Нейросеть
Dream
Studio
Deep AI
Night cafe
Craiyon
Dream
Wombo
Время
генерации
Качество
изображения
~15 c
~15 с
~10 с
~50 с
~10 с
8/10,
9/10
невысокое
разрешени
е
9/10
8/10
9/10
1/10
7/10,
водяной
знак
9/10
6/10
3/10
10/10
7/10
9/10
6/10
4/10
1-10
1
1-16
9
1(может
быть 3 в 1)
Соответствие
запросу
Оригинальность
результата
Количество
генерируемых
изображений
Количество
бесплатных
генераций
5
Не
Не
кредитов, ограничен ограничен
зависит от о
о
параметро
в
Контроль над
10
4
10
2
1 параметр
параметрами
параметро параметра параметро параметра
в
в
Таблица 1. Анализ работы нейросетей для генерации изображений по запросу
25
кредитов,
около 120
генераций
Не
указывает
ся
Вывод:
В ходе лабораторной работы освоены нейросети, способные генерировать
изображения. Был также получен навык составления промта для нейросетей,
сгенерированы изображения и проанализированы полученные результаты.
14
Скачать