Что можно сделать с огромным количеством информации, которая аккумулируется в виде миллиардов загружаемых в сеть фотографий? День за днем гиганты интернета – Google, Yahoo, Facebook, Microsoft – с помощью чрезвычайно сложных самообучающихся алгоритмов анализируют содержимое картинок, которые загружаются, копируются, цитируются и получают лайки. Сейчас это делается в первую очередь ради рекламы, но что еще можно сделать со всей этой информацией?
Об этом размышляет Пол Мелчер (Paul Melcher), фотограф, консультант и предприниматель из Нью-Йорка.
Например, можно генерировать изображения с желаемым содержимым. Искусственный интеллект, способный автоматически генерировать картинки, используя полученные в результате изучения фотоснимков знания – включая знания о том, какие типы изображения помогают продавать большей изделий, какие сочетания цветов сильнее мотивируют покупателей, какие композиционные решения наиболее эффективны – такой искусственный интеллект создаст фотографию, исходя из ваших нужд. Вы даже сами не будете знать заранее, какой именно она получится.
Поиск картинок Google’а сможет, вместо того чтобы подбирать подходящую фотографию с миллионов проиндексированных сайтов, на основании вашего запроса и своего понимании того, что представляет собой хорошая фотография, создать совершенно новое изображения с нуля – причем изображение, которое будет наилучшим образом соответствовать вашему запросу. Вместо того, чтобы искать фото, его можно просто создать.
Компании-фотостоки, такие как Shutterstock или Getty Images, смогут отказаться от десятков тысяч авторов и десятков миллионов фотографий в своих базах данных, заменив их достаточно продвинутыми алгоритмами, которые мгновенно сгенерируют то самое изображение, которое вам нужно.
Вам кажется безумной эта идея? Подумайте немного. Уже сейчас алгоритмы создания текста могут «писать» совершенно нормальные, хорошо читаемые статьи путем обработки различных материалов, посвященных, например, определенному спортивному событию. Есть все шансы, что вы уже читали статьи, сгенерированные компьютером, и даже не заметили этого.
Компьютерные алгоритмы создания изображений стали уже настолько продвинутыми, что целые кинофильмы создаются путем съемки актеров на зеленом фоне, который затем заменяется на абсолютно реалистичные, но тем не менее просто нарисованные, элементы и объекты. Хороший специалист по фотошопу легко скомбинирует несколько исходных изображений и создаст реалистичную сцену, которая никогда не существовала. Компания IKEA в прошлом году сообщила, что 75% изображений в их каталоге – не фотографии. Они полностью сгенерированы компьютером.
Представители Facebook недавно объявили, что могут генерировать фотографии, которые в 40% случаев люди не отличают от настоящих.
Разработки подпитываются не только желанием заменить реальные фотографии компьютерно-сгенерированными. Помимо этого, разработчики систем компьютерного зрения серьезно работают над переходом от «тренируемого обучения» к «неподконтрольному самообучению». Сейчас компьютер учится распознавать объекты «под присмотром тренера». Машине «скармливаются» тысячи изображений объекта, после чего он научается распознавать этот объект, когда встречает его еще раз. Следующий шаг – обучение без тренера, которое не базируется на наборах изображений. В этом случае компьютер, увидев несколько раз новый объект, сам научится узнавать его, затем сравнит его с базой известных объектов, будет находить ассоциации и решать, что же он видит. Пока до такого ученые еще не дошли.
Однако мы не так далеки от создания хорошо натренированного компьютера, получившего массу информации о том, как мы воспринимаем изображения, и способного заменить как фотографов, так и мастеров фотошопа, в деле создания снимков из ничего.
Последствия будут огромными. Издательским компаниям не придется нанимать фотографов и заботиться об авторских правах. Вместо этого, программные алгоритмы будут автоматически генерировать картинки исходя из содержания статьи, при этом даже размещать их в тексте в местах, где они произведут наибольшее впечатление на читателя. Интернет-магазины смогут создавать тысячи изображений продаваемых изделий, встраивая их в идеальное окружение с идеальным освещением. Даже картинки в соцсетях будут легко генерироваться из ничего - причем такие картинки, которые получат кучу лайков и море подписчиков.
Стоимость создания фотографий радикально упадет, а эффективность соответственно вырастет. Не нужно будет отправлять съемочную группу в далекие страны. Качество визуального контента будет все лучше, потому что машины станут разбираться, что же именно мы понимаем под этим “лучше”. Вопросы авторских прав вообще отпадут, поскольку компьютеры не имеют никаких прав и отчислять им будет ничего не нужно.
Оборотной стороной всего этого процесса станет коллапс «реальной» фотоиндустрии. Хотя люди-фотографы не исчезнут вовсе, останутся лишь немногие самые талантливые и креативные индивидуумы, чья оригинальность и уникальность не сможет быть сымитирована компьютером. Самые лучших, наверное, даже пригласят участвовать в разработке фото-генерирующих алгоритмов следующего поколения.