Новая система искусственного интеллекта (ИИ) DeepCube за 44 часа самостоятельно научилась собирать кубик Рубика.

Об этом сообщает Gizmodo.

Раньше ИИ могли самостоятельно обучаться игре в шахматы и в Го. Однако система обучения с подкреплением, которая использовалась в этих случаях, не подходила для решения 3D-головоломок вроде кубика Рубика. 

В случае с шахматами или Го ИИ достаточно легко оценить свой ход как удачный или неудачный и, исходя из этого, сделать выводы для дальнейшей игры. Но в случае с кубиком Рубика ИИ не мог быстро определить последствия принятого решения, не получал условной “награды”, которая стимулирует обучение, и, соответственно, не обучался.

При создании DeepCube команда программистов во главе со Стивеном Макалиром использовали специальную систему установок. Благодаря ей после каждого хода ИИ “перепрыгивает” к уже собранному кубику и таким образом определяет “силу” ходов. Когда система собирает достаточно данных, она использует классический метод “дерева решений”, проверяя каждое движение чтобы узнать, благодаря какому можно быстрее всего решить головоломку.

В США был создан робот, который сумел собрать кубик Рубика за 0,38 секунды.