Исследователи Google нашли способ создавать более правдоподобные изображения еды, животных и насекомых

Благодаря искусственному интеллекту исследователи из британского подразделения Google DeepMind и Университета Хериот-Ватт довольно близко подошли к созданию системы, способной создавать убедительные синтетические фотографии.

Об этом сообщает Venture beat.

В статье «Обучение крупным масштабам GAN для синтеза естественного изображения высокой точности», опубликованной на этой неделе на сервере preprint Arxiv.org, исследователи сообщили, что «в этой работе мы решили закрыть разрыв в верности и разнообразии между изображениями, создаваемыми [нашей системой искусственного интеллекта] и изображениями реального мира из [нашего] набора данных… Мы находим, что существующих … методов достаточно, чтобы … значительно улучшить уровень техники».

Как и в других проектах по созданию искусственных изображений, данная технология основана на генеративно-соревновательной нейросети.

Система состоит из двух частей: генератора и дискриминатора. Первая создает изображение, а вторая оценивает их сходство с образцами идеального результата.

Чтобы научить BigGAN создавать фотографии бабочек, собак и пищи, использовались различные наборы изображений. Сначала для обучения использовалась база ImageNet, а затем — более масштабный набор JFT-300M с 300 млн изображений, разделенных на 18 000 категорий.

Обучение BigGAN заняло 2 дня. Для этого надо было 128 тензорных процессоров Google, разработанных специально для машинного обучения.

«Расширенное количество каналов (следствие для пропускной способности) привело к дальнейшему усилению, равно как и к «усечению», что заставило генератор создавать образы приближенные к изображениям из набора учебных материалов», — утверждают исследователи.

Также, напомним, что исследователи из DeepMind, разработали нейросеть, которая способна диагностировать около полусотни болезней глаз по одному только снимку сетчатки.

Читайте также по теме