В рамках исследования специалистами британской компании DeepMind, принадлежащей Google, было установлено, что глубокие нейронные сети могут понимать и определять сцену в формате изображения и “представлять” ее с любого угла, даже если ранее никогда не видели картинку.

Об этом сообщает Arstechnica.

В ходе создания данной технологии разработчики ориентировались на способности человека: к примеру, если показано изображение стола с тремя ножками, то большинство лиц интуитивно поймет, что, скорее всего, должна быть и четвертая ножка.

Исследователи научили ИИ понимать сцену под другим углом, принимая во внимание перспективу, тень и другие визуальные эффекты.

Команда исследователей DeepMind научила ИИ обрабатывать упрощенные геометрические сцены. Так, обработав группу “снимков” виртуальной сцены, ИИ создает компактное математическое представление этой сцены, используя его для визуализации изображений с новых углов.

“Один из самых удивительных результатов мы получили, когда увидели, что ИИ может предсказывать такие вещи, как перспектива и окклюзия, освещение и тени”, – пояснили в компании.

ИИ от Google

Фото: Arstechnica

28 июня сообщалось, что японские инженеры создали систему видеонаблюдения AI Guardsman с искусственным интеллектом.
21 июня стало известно, что власти столицы Китая Пекина готовят к запуску в местной метро биометрическую систему распознавания личности человека.
18 мая сообщалось, что в средней школе китайского Ханчжоу установили экспериментальную систему, позволяющей руководству школу следить, как ученики сконцентрированы на уроках.