Вверх
  • Орбитальную камеру адаптируют для распознавания рака на снимках кожи
  • «Наноземлетрясения» могут улучшить работу камер при недостатке освещения
  • Контактные линзы с зумом 2.8х – включаете, моргнув глазом
  • Как люди учат компьютеры видеть и понимать фотографии
  • Патент Apple – камера с тремя матрицами и разложением света призмой
  • Камера без внешнего питания делает снимки, используя только энергию света
  • Banner 80x80 02 779bbaa679dc6b7f4c049292657342c566f6285974b656e2652cf5dfbf093090

Как люди учат компьютеры видеть и понимать фотографии

Обсудить

Даже трехлетние дети способны понять, что именно они видят на снимках, а также рассказать нам об этом, но самые мощные компьютеры с теми же задачами справляются с большим трудом. Впрочем, в последние годы ситуация быстро меняется, поскольку компьютерные специалисты разрабатывают новые алгоритмы, позволяющие компьютерам распознавать, что же изображено на фотографиях.

Ролик, представленный в рамках видеоконференций TED, показывает выступление Фей-Фей Ли (Fei-Fei Li), профессора Стэнфордского Университета, одного из ведущих мировых экспертов в области компьютерного зрения. Она рассказывает о своей революционном проекте ImageNet, призванном научить компьютеры «видеть».

Проект использует базу из 15 миллионов фотографий для обучения компьютеров распознаванию изображенных объектов. Сначала команда Ли приложила колоссальные усилия для отбора снимков и формирования коллекции, которая затем была открыта для свободного доступа всем желающим и стала одним из стандартов индустрии. С ее помощью тестируются способности компьютеров распознавать объекты.

Сначала Ли учила компьютеры узнавать на фотографиях простые объекты.

Как люди учат компьютеры видеть и понимать фотографии
Как люди учат компьютеры видеть и понимать фотографии
Как люди учат компьютеры видеть и понимать фотографии
Как люди учат компьютеры видеть и понимать фотографии
Как люди учат компьютеры видеть и понимать фотографии
Как люди учат компьютеры видеть и понимать фотографии

Следующим шагом было научить компьютер описывать сцену, примерно как это сделал бы трехлетний ребенок: короткими связными предложениями вместо списка отдельных слов. Иногда результаты бывают весьма впечатляющими…

Как люди учат компьютеры видеть и понимать фотографии

"Мужчина стоит возле слона"

Как люди учат компьютеры видеть и понимать фотографии

"Большой самолет стоит в начале взлетно-посадочной полосы аэропорта"

Как люди учат компьютеры видеть и понимать фотографии

"Зебра стоит на травяном поле"

…хотя в других случаях ясно, что предстоит большая работа:

Как люди учат компьютеры видеть и понимать фотографии

"Кошка лежит на кровати в одеяле"

Как люди учат компьютеры видеть и понимать фотографии

"Маленький мальчик держит бейсбольную биту"

Как люди учат компьютеры видеть и понимать фотографии

"Мужчина едет по улице на лошади рядом со зданием"

Специалисты компании Microsoft недавно объявили, что созданная ими технология при анализе фотографий из базы ImageNet дала результаты, превосходящие те, которые показали люди (4,94% ошибок против 5,1%). Компьютер смог корректно распознать, что изображено на большинстве снимков:

Как люди учат компьютеры видеть и понимать фотографии
Как люди учат компьютеры видеть и понимать фотографии

«Шаг за шагом, мы даем машинам зрение», говорит профессор Фей-Фей Ли. «Сначала мы научим видеть их. Затем уже они помогут лучше видеть нам».

Опубликовано: 31.03.2015

Обсудить
Понравился материал? Есть советы, вопросы, предложения?
comments powered by Disqus
F933c09b b053 45d7 8ffe 449744f694d2