Использование диффузионных моделей для аугментации данных и улучшения качества сегментации изображений (на примере модели Stable Diffusion и наборе данных Caltech-UCSD Birds-200-2011) : магистерская диссертация

Морий, С. М.; Moriy, S. M.

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/129161

Название:	Использование диффузионных моделей для аугментации данных и улучшения качества сегментации изображений (на примере модели Stable Diffusion и наборе данных Caltech-UCSD Birds-200-2011) : магистерская диссертация
Другие названия:	Using diffusion models to augment data and improve the quality of image segmentation (using the example of the Stable Diffusion model and the Caltech-UCSD Birds-200-2011 data set)
Авторы:	Морий, С. М. Moriy, S. M.
Научный руководитель:	Ронкин, М. В. Ronkin, M. V.
Дата публикации:	2023
Библиографическое описание:	Морий, С. М. Использование диффузионных моделей для аугментации данных и улучшения качества сегментации изображений (на примере модели Stable Diffusion и наборе данных Caltech-UCSD Birds-200-2011) : магистерская диссертация / С. М. Морий ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2023. — 61 с. — Библиогр.: с. 56-61 (38 назв.).
Аннотация:	Объект исследования: процесс аугментации изображений для решения задачи сегментации. Предмет исследования: методы аугментации и машинного обучения, с помощью которых осуществляется сегментация изображений. Цель работы: исследование эффективности генеративной аугментации изображений, выполненной с помощью диффузионной модели Stable Diffusion на примере задачи семантической сегментации. В процессе исследования проводились: рассмотрение основных подходов сегментации изображений и методов аугментации данных, разработка и реализация экспериментов для оценки эффективности генеративной аугментации изображений. В работе продемонстрирована эффективность подхода аугментации изображений, реализованного за счет расширения части исходного датасета путем генерирования новых данных с помощью диффузионной модели. Область практического применения: предложенный подход может быть использован для улучшения качества работы моделей семантической сегментации изображений в условиях ограниченного количества исходных данных, дефицита размеченных данных или дисбаланса данных. Object of study: the process of image augmentation to solve the segmentation problem. Subject of research: augmentation and machine learning methods used for image segmentation. Purpose of the work: to study the effectiveness of generative image augmentation performed using the Stable Diffusion model using the example of a semantic segmentation task. During the research process, the following was carried out: consideration of the main approaches to image segmentation and data augmentation methods, development and implementation of experiments to evaluate the effectiveness of generative image augmentation. The work demonstrates the effectiveness of the image augmentation approach, implemented by expanding part of the original dataset by generating new data using a diffusion model. Area of practical application: the proposed approach can be used to improve the quality of work of semantic image segmentation models in conditions of a limited amount of source data, a shortage of labeled data, or data imbalance.
Ключевые слова:	МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ КОМПЬЮТЕРНОЕ ЗРЕНИЕ СЕМАНТИЧЕСКАЯ СЕГМЕНТАЦИЯ АУГМЕНТАЦИЯ ДАННЫХ СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ ДИФФУЗИОННЫЕ МОДЕЛИ MASTER'S THESIS COMPUTER VISION SEMANTIC SEGMENTATION DATA AUGMENTATION CONVOLUTIONAL NEURAL NETWORKS DIFFUSION MODELS
URI:	http://elar.urfu.ru/handle/10995/129161
Условия доступа:	Предоставлено автором на условиях простой неисключительной лицензии
Текст лицензии:	http://elar.urfu.ru/handle/10995/31613
Располагается в коллекциях:	Магистерские диссертации

Файлы этого ресурса:

Файл	Описание	Размер	Формат
m_th_s.m.moriy_2023.pdf		8,32 MB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Статистика Google Scholar

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.