OpenAI выпустила набор open‑source подсказок, которые разработчики могут встроить в свои проекты для повышения защиты подростков. Подсказки работают с моделью gpt-oss-safeguard, а их prompt‑based дизайн позволяет использовать их и с другими моделями.
Что включено
Политики покрывают шесть областей: графическое насилие и сексуальный контент, вредные представления о теле и поведении, опасные действия и челленджи, романтические или насильственные ролевые игры, а также товары и услуги с возрастными ограничениями. При их разработке OpenAI привлекала экспертов из Common Sense Media и everyone.ai.
Почему это важно
Robbie Torney, глава AI & Digital Assessments в Common Sense Media, отметил, что открытый характер подсказок создаёт «правильный уровень безопасности» и позволяет сообществу улучшать их со временем. Он подчеркнул, что многие разработчики сталкиваются с трудностями при переводе общих целей безопасности в конкретные правила, что часто приводит к пробелам или избыточной фильтрации.
Перспективы
OpenAI признаёт, что подсказки не решат всех проблем ИИ‑безопасности, но они дополняют существующие меры, такие как родительский контроль и предсказание возраста. Компания рассчитывает, что независимые разработчики быстрее внедрят надёжные защиты, повысив доверие к AI‑приложениям для несовершеннолетних.