Guide Labs анонсировала Steerling‑8B — LLM с 8 млрд параметров, каждый токен которого можно проследить до исходных обучающих фрагментов. Модель открыта в репозитории и обещает достичь 90 % возможностей современных систем, используя меньше данных благодаря новому «концептуальному слою», который группирует информацию в трассируемые категории.
Что произошло
Компания, основанная Julius Adebayo и Aya Abdelsalam Ismail, представила архитектуру, в которой разработчики заранее аннотируют данные, после чего модель автоматически связывает токены с их источниками. Adebayo отметил, что это устраняет необходимость «нейронауки» модели и делает процесс контроля над генерируемым содержимым более надёжным. Steerling‑8B уже обучена и показала 90 % эффективности типичных задач, при этом использует значительно меньше обучающих примеров.
Почему это важно
Традиционные LLM часто дают «галлюцинации» и не позволяют точно понять, откуда берутся выводы. Новая инженерная парадигма позволяет:
- блокировать использование защищённого авторским правом контента;
- ограничивать генерацию опасных тем (насилие, наркотики);
- обеспечивать чистоту решений в регулируемых сферах, например, при оценке кредитных заявок без учёта расы.
В научных проектах, таких как предсказание белковой структуры, интерпретируемость ускорит проверку гипотез и уменьшит «чёрный ящик» ИИ.
Что дальше
После закрытого посевного раунда в размере $9 млн от Initialized Capital команда планирует масштабировать архитектуру до крупномодульных моделей, открыть API и предоставить агентный доступ. Adebayo считает, что развитие интерпретируемых LLM станет решающим фактором доверия к «сверхинтеллектуальным» системам.