Технологии

OpenAI добавила открытые инструменты защиты подростков

OpenAI объявила о наборе подсказок, которые разработчики могут добавить в свои приложения, чтобы лучше защищать подростков. Политики охватывают графическое насилие, сексуальный контент, вредные представления о теле, опасные действия, ролевые сценарии и товары с возрастными ограничениями.

OpenAI сотрудничала с Common Sense Media и everyone.ai при формировании этих рекомендаций.

Сигнал: Публичный выпуск инструментов показывает растущий интерес индустрии ИИ к защите несовершеннолетних и может подтолкнуть другие компании к аналогичным решениям.

24 марта 2026 г.

OpenAI выпустила набор open‑source подсказок, которые разработчики могут встроить в свои проекты для повышения защиты подростков. Подсказки работают с моделью gpt-oss-safeguard, а их prompt‑based дизайн позволяет использовать их и с другими моделями.

Что включено

Политики покрывают шесть областей: графическое насилие и сексуальный контент, вредные представления о теле и поведении, опасные действия и челленджи, романтические или насильственные ролевые игры, а также товары и услуги с возрастными ограничениями. При их разработке OpenAI привлекала экспертов из Common Sense Media и everyone.ai.

Почему это важно

Robbie Torney, глава AI & Digital Assessments в Common Sense Media, отметил, что открытый характер подсказок создаёт «правильный уровень безопасности» и позволяет сообществу улучшать их со временем. Он подчеркнул, что многие разработчики сталкиваются с трудностями при переводе общих целей безопасности в конкретные правила, что часто приводит к пробелам или избыточной фильтрации.

Перспективы

OpenAI признаёт, что подсказки не решат всех проблем ИИ‑безопасности, но они дополняют существующие меры, такие как родительский контроль и предсказание возраста. Компания рассчитывает, что независимые разработчики быстрее внедрят надёжные защиты, повысив доверие к AI‑приложениям для несовершеннолетних.

Все материалы

Дайджест каждый день

Краткая выжимка ключевых событий — прямо на почту. Без спама, только самое важное.