GigaConf 2024: Сбер и SberDevices представили AI-детектор GigaChek

Он позволяет с высокой точностью устанавливать, кем был написан текст — человеком или системой искусственного интеллекта
Сбербанк
Фото: Александр Тен, ИА SakhalinMedia

28 июня. На технологической конференции GigaConf 2024 исследователи Сбера и компании SberDevices представили GigaCheck (12+) — детектор для определения авторства русскоязычных текстов. Решение отличается высокой точностью и скоростью работы, предоставляется по API и встраивается в любые сторонние приложения. В русскоязычном сегменте разработки у детектора практически нет альтернатив с близкими показателями. Об этом сообщает ИА IrkutskMedia со ссылкой на пресс-службу банка. 

Ключевая метрика TPR&FPR (True positive rate & False positive rate) = 0,01 — 94,7% означает, что при частоте ложных срабатываний не более 1% точность работы GigaCheck составляет 94,7%. Показатель ближайшего конкурента — не более 85%. На сегодняшний день GigaCheck — достоверный и качественный детектор подобного рода. Чтобы взломать его, в большинстве случаев текст придётся изменить до степени неприменимости в реальных задачах. 

Сейчас GigaCheck даёт обобщённую оценку авторства. Если в одном тексте использованы как фрагменты, написанные человеком, так и фрагменты, сгенерированные искусственным интеллектом, то определение авторства осуществляется по преобладающему контенту. В ближайшее время GigaCheck сможет также определять, какие именно фрагменты текста сгенерированы LLM. 

Работу детектора текстов GigaCheck оценят эксперты, занимающиеся проверкой подлинности научных публикаций, диссертаций и дипломов. Владельцы пабликов в соцсетях с помощью детектора смогут быстро обнаруживать созданные генеративными моделями комментарии и посты. Редакторы и все, принимающие работу копирайтеров, также получат эффективный инструмент для её проверки и оценки.

"С помощью GigaCheck мы проанализировали 220 000 текстов новостных ресурсов за последний месяц и выявили, что в среднем 6% из них создано LLM, а в некоторых крупных изданиях превышает треть от всего опубликованного контента. До сих пор вероятность создания подобного работающего детектора текстов считалась крайне низкой. Многие эксперты расценивали эту задачу как практически нерешаемую. Для разработки такого сервиса требуются серьёзные ресурсы и большие объёмы данных. Но даже неограниченных ресурсов может оказаться недостаточно. Например, один из признанных лидеров в области разработки систем искусственного интеллекта, компания OpenAI, в начале 2023 года анонсировал свой детектор для англоязычных текстов, но со временем был вынужден закрыть доступ к нему из-за невысокой точности. Тем важнее достижение нашей команды, которой, несмотря на все сложности, удалось разработать собственную эффективную технологию", — сказал управляющий директор Управления экспериментальных систем машинного обучения SberDevices Сергей Марков.

Сейчас протестировать возможности GigaCheck можно в свободном доступе на сайте и через телеграм-бот (18+). Для коммерческого использования бизнес может оставить заявку, чтобы получить доступ к GigaCheck API.

Реклама. Рекламодатель — ПАО "Сбербанк".

Услуги предоставляются ПАО "Сбербанк" (ОГРН 1027700132195. Юридический адрес: Москва, ул. Вавилова, 19). 

Смотрите полную версию на сайте >>>


Следующая новость