Новая технология от Google на основе ИИ сможет улучшить разрешение изображения в 16 раз
Разработчики Google презентовали новую технологию, способную существенно улучшить качество исходной картинки. ИИ попиксельно воспроизводит недостающие участки даже у самого сжатого изображения.
Разработкой занимается команда Brain Team. Ими были представлены два алгоритма получения фото. Первая - SR3, она способна масштабировать изображение посредством повторного уточнения. Увеличение разрешения происходит за счет заимствования недостающих фрагментов из гауссовского шума. Обучение ИИ строится на методиках искажения картинки и последующей обратной процедуре.
Другая диффузная технология - CDM. В ней искусственный интеллект подвергли обучению с помощью миллионов изображений в высоком разрешении из базы данных ImageNet. Масштабирование здесь идет поэтапно. Так, исходную картинку 32×32 пикселя улучшают до 64×64, а далее - до 256×256 (в 8 раз). Оригинал 64×64 и вовсе можно увеличить таким образом до 1024×1024, то есть в 16 раз.
По словам разработчиков, новая технология показывает лучшие результаты в сравнении с современными способами масштабирования с помощью ИИ BigGAN-deep и VQ-VAE-2.
Более подробной информации о представленной технологии кроме демонстрационных анимаций команда не предоставила. Сроки выхода коммерческой версии разработки неизвестны.
Разработкой занимается команда Brain Team. Ими были представлены два алгоритма получения фото. Первая - SR3, она способна масштабировать изображение посредством повторного уточнения. Увеличение разрешения происходит за счет заимствования недостающих фрагментов из гауссовского шума. Обучение ИИ строится на методиках искажения картинки и последующей обратной процедуре.
Другая диффузная технология - CDM. В ней искусственный интеллект подвергли обучению с помощью миллионов изображений в высоком разрешении из базы данных ImageNet. Масштабирование здесь идет поэтапно. Так, исходную картинку 32×32 пикселя улучшают до 64×64, а далее - до 256×256 (в 8 раз). Оригинал 64×64 и вовсе можно увеличить таким образом до 1024×1024, то есть в 16 раз.
По словам разработчиков, новая технология показывает лучшие результаты в сравнении с современными способами масштабирования с помощью ИИ BigGAN-deep и VQ-VAE-2.
Более подробной информации о представленной технологии кроме демонстрационных анимаций команда не предоставила. Сроки выхода коммерческой версии разработки неизвестны.
Войдите на сайт или зарегистрируйтесь чтобы оставлять комментарии
Комментариев 0