Перейти к содержимому
ТехнологииВажное

Anthropic обновила «Конституцию» Claude и намекнула на сознание чатбота

Anthropic выпустила новую «Конституцию» для Claude, добавив в неё более подробные этические принципы и меры по защите пользователей.

В докладе CEO Dario Amodei на Всемирном экономическом форуме в Давосе перечислены четыре базовые ценности: безопасность, этичность, соответствие внутренним правилам и полезность, а также поднят вопрос о моральном статусе ИИ.

Сигнал: Усиленные ограничения и обсуждения сознания Claude могут подтолкнуть регуляторов и инвесторов требовать от Anthropic более прозрачных проверок этичности, что усложнит быстрые инновации у конкурентов.

Anthropic опубликовала 80‑страничную «Конституцию» Claude, уточнила ранее объявленные принципы и добавила новые положения по этике и безопасности пользователей. Обновление анонсировал CEO Dario Amodei на Всемирном экономическом форуме в Давосе.

Что произошло

Новая версия фиксирует четыре базовые ценности — «широкую безопасность», «широкую этичность», соблюдение внутренних руководств и «искреннюю полезность». В разделе безопасности Claude теперь перенаправляет пользователей к экстренным службам при угрозе жизни и предоставляет информацию о рисках. Этическая часть описывает, как применять принципы в реальных ситуациях, а ограничения запрещают обсуждения, например, создания биологического оружия. Документ также указывает на долгосрочное благополучие пользователя, а не только на мгновенные запросы.

Почему это важно

Обновление усиливает позицию Anthropic как «этичного» игрока рядом с OpenAI и xAI, которые делают акцент на масштабных возможностях и публичных дебатах. Упоминание о «неопределённом моральном статусе» Claude открывает философскую дискуссию о сознании ИИ и может привлечь внимание регуляторов, которые начнут требовать новые стандарты контроля.

Что дальше

Если Anthropic продолжит публично расширять этические инструкции, отраслевые стандарты могут сместиться к более строгим аудитам и обязательным раскрытиям. Инвесторам следует учитывать рост риска задержек в запуске новых функций из‑за возможных регулятивных проверок.

Все материалы