Ученые из Массачусетского технологического института (MIT) разработали систему машинного обучения, которая может идентифицировать объекты на основе их описания.

Об этом сообщает Engadget.

Так, алгоритм способен определять на картинке описанные предметы в реальном времени.

При его разработке ученые взяли за основу сверхточную нейронную сеть, состоящую из двух частей: первая анализировала изображения, а вторая — спектрограммы (визуальный рисунок аудиозаписей). Чтобы искусственный интеллект научился сопоставлять отдельные слова и объекты, были использованы 400 тысяч пар картинок с описанием, сообщается на сайте института.

В итоге алгоритм обучился разделять изображение на сетку из пикселей, а спектрограмму на сегменты длиной около секунды (в которых помещалось одно-два слова). Система может соотносить получившиеся ячейки из пикселей с аудиосегментами.

Работу искусственного интеллекта ученые продемонстрировали на примере рисунка, на котором изображена девочка в голубом платье. Алгоритм правильно отметил ребенка, маяк и одежду по указанному описанию.

Данные разработки могут впоследствии использоваться в системах распознавания речи и перевода.

рисунок1

Фото: MIT

 

Исследователи из подразделения Google DeepMind, совместно со специалистами Университетского колледжа Лондона и медучреждения Moorfields Eye Hospital разработали нейросеть, которая по снимку сетчатки может определить свыше 50 различных глазных заболеваний.
Международная группа исследователей создала искусственный интеллект, распознающий распознавать виды птиц по издаваемым ими звукам.