Технологии

Кем определяется, что ИИ говорит вам? Кэмпбелл Браун, бывший глава новостей Meta, делится мнением

Бывший глава новостного отдела Meta и основатель Forum AI объявила, что её стартап проверяет генеративные модели ИИ на точность в темах с высоким риском, таких как геополитика и финансы, стремясь к 90 % согласия с ведущими экспертами.

Инициатива началась после выхода ChatGPT, когда Браун заметила, что ИИ формирует большую часть новостного потока, а разработчики уделяют больше внимания коду, чем достоверности контента.

Сигнал: рост спроса со стороны компаний на проверку правдивости ИИ усиливает потребность в независимых бенчмарках и формирует новые требования отрасли.

Компания Forum AI, основанная в Нью‑Йорке 17 месяцев назад, создаёт экспертизу для оценки моделей ИИ по темам, где ответы неоднозначны. В проектах по геополитике участвуют Niall Ferguson, Fareed Zakaria, бывший госсекретарь Tony Blinken, бывший спикер палаты представителей Kevin McCarthy и специалист по кибербезопасности Anne Neuberger. Цель — достичь примерно 90 % согласия ИИ‑судей с этими специалистами.

Что произошло

Браун, ранее руководившая новостями в Meta, создала Forum AI после того, как увидела, что ChatGPT стал основным источником информации. Первые тесты показали, что модели, в том числе Gemini, часто используют неподходящие источники и демонстрируют отклонения в сторону левых взглядов. Кроме того, ИИ часто упускает контекст, искажает аргументы и не учитывает альтернативные точки зрения.

Почему это важно

  • Недостаточная точность ИИ повышает риск распространения дезинформации в критически важных сферах.
  • Компании, использующие ИИ в кредитовании, страховании и подборе персонала, нуждаются в надёжных проверках, чтобы избежать юридических последствий.
  • Текущие стандарты аудитов и чек‑листов оказываются неэффективными, открывая пространство для более глубоких экспертных оценок.

Что дальше

Forum AI планирует предлагать услуги корпоративным клиентам, но масштабирование проверок и соответствие требованиям регуляторов остаются сложными задачами.

Все материалы