Исследователи Physical Intelligence опубликовали результаты модели π0.7, которая решает задачи, отсутствующие в её обучающем наборе. В эксперименте с аэрогрилем система собрала знания из двух видеороликов и открытых данных о том, как готовить сладкий картофель, достигнув 5 % успеха, а после уточнения подсказок – 95 %.
Что произошло
Модель умеет комбинировать навыки, полученные в разных ситуациях, и применять их к новым задачам. В отличие от традиционного обучения, где каждый робот настраивается под одну задачу, π0.7 перемешала фрагменты знаний и выполнила такие действия, как приготовление кофе, складывание белья и сборка коробок, показывая результаты, сопоставимые со специализированными моделями.
Почему это важно
- Продемонстрировано, что увеличение объёма данных в робототехнике может приводить к нелинейному росту возможностей, как это наблюдается в языковых и визуальных моделях.
- Обучение через простые вербальные инструкции позволяет быстро адаптировать роботов к новым условиям без полного переобучения.
- Отсутствие стандартных бенчмарков усложняет внешнюю проверку, но внутренние сравнения с предыдущими системами подтверждают конкурентоспособность.
Что дальше
Компания планирует привлечь дополнительное финансирование, возможно, увеличить оценку до $11 млрд, и продолжит исследовать способы уменьшения зависимости от точных подсказок. Коммерциализация пока не определена, но успех модели считается шагом к более универсальным робототехническим решениям.