Перейти к содержимому
ТехнологииВажное

Guide Labs представила новый вид интерпретируемой LLM

Сан‑францисская стартап‑компания Guide Labs выпустила с открытым исходным кодом 8‑миллиардный LLM Steerling‑8B, построенный на архитектуре, позволяющей отследить каждый сгенерированный токен до конкретных обучающих данных.

Модель внедрила «концептуальный слой», который классифицирует обучающие примеры, требующий более тщательной разметки, но обеспечивающий прозрачность без необходимости «нейронауки» модели. По словам CEO Julius Adebayo, такая интерпретируемость устраняет хрупкость традиционных подходов.

Сигнал: появление инженерно‑ориентированных интерпретируемых LLM открывает путь к контролируемому использованию ИИ в регулируемых отраслях (финансы, медицина, научные исследования) и может стать новой отраслевой нормой.

Guide Labs анонсировала Steerling‑8B — LLM с 8 млрд параметров, каждый токен которого можно проследить до исходных обучающих фрагментов. Модель открыта в репозитории и обещает достичь 90 % возможностей современных систем, используя меньше данных благодаря новому «концептуальному слою», который группирует информацию в трассируемые категории.

Что произошло

Компания, основанная Julius Adebayo и Aya Abdelsalam Ismail, представила архитектуру, в которой разработчики заранее аннотируют данные, после чего модель автоматически связывает токены с их источниками. Adebayo отметил, что это устраняет необходимость «нейронауки» модели и делает процесс контроля над генерируемым содержимым более надёжным. Steerling‑8B уже обучена и показала 90 % эффективности типичных задач, при этом использует значительно меньше обучающих примеров.

Почему это важно

Традиционные LLM часто дают «галлюцинации» и не позволяют точно понять, откуда берутся выводы. Новая инженерная парадигма позволяет:

  • блокировать использование защищённого авторским правом контента;
  • ограничивать генерацию опасных тем (насилие, наркотики);
  • обеспечивать чистоту решений в регулируемых сферах, например, при оценке кредитных заявок без учёта расы.

В научных проектах, таких как предсказание белковой структуры, интерпретируемость ускорит проверку гипотез и уменьшит «чёрный ящик» ИИ.

Что дальше

После закрытого посевного раунда в размере $9 млн от Initialized Capital команда планирует масштабировать архитектуру до крупномодульных моделей, открыть API и предоставить агентный доступ. Adebayo считает, что развитие интерпретируемых LLM станет решающим фактором доверия к «сверхинтеллектуальным» системам.

Все материалы