05.04.2026 21:54
Новости.
Просмотров всего: 8436; сегодня: 27.

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?

Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?

Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?

Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

Какие техники усложняют попытки извлечения модели через API (model extraction)?

Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?

Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?

Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Тематические сайты: Безопасность, Информтехнологии, связь, Интернет, Инфраструктура, Искусственный интеллект
Сайты субъектов РФ: Москва, Московская область
Сайты федеральных округов РФ: Центральный федеральный округ
Сайты стран: Россия
Сайты объединений стран: БРИКС (BRICS)

Ньюсмейкер: UDV Group — 59 публикаций
Сайт: udv.group

Интересно:

Герой двух стран Фёдор Полетаев
10.05.2026 10:38 Персоны
Герой двух стран Фёдор Полетаев
Более восьми десятилетий отделяет нас от майского дня 1945 года, когда весь мир вздохнул с облегчением, когда на исстрадавшуюся землю Европы пришёл мир. Победа была одержана благодаря мужеству и героизму советского народа, воинов Красной армии, внёсшей главный вклад в разгром ненавистного врага. Были и другие факторы, которые приближали Победу. Особое место в разгроме фашизма в Европе стало движение Сопротивления. Начало Второй мировой войны ознаменовалось тем, что многие патриоты пошли в действующую армию, а после оккупации – в подполье. Движение Сопротивления было распространено во Франции, Польше, Югославии, Греции и в других странах, но костяк многих групп Сопротивления, что очень примечательно, составляли русские люди, бывшие военнопленные, эмигранты. Во многих странах до сих пор бережно хранят память о русских солдатах, которые плечом к плечу вместе с местными бойцами громили...
08.05.2026 18:04 Интервью, мнения
ГИГАНТ - Компьютерные системы: новый закон об ИИ
Игорь Юрин, технический директор (CTO) компании «ГИГАНТ - Компьютерные системы» рассказал о том, что российские производители в целом готовы к росту спроса на ИИ-инфраструктуру, описал три базовых архитектурных сценария для таких систем, а также объяснил, какие факторы ведут к неизбежному удорожанию проектов из-за локализации.  Насколько российские производители серверов и вычислительных систем готовы к возможному росту спроса на инфраструктуру для обучения и эксплуатации ИИ-моделей? Мы более 10 лет занимаемся разработкой, проектированием и поставкой суперкомпьютеров для различных задач, в том числе для инженерных, прогнозных и сложных вычислений, поэтому у нас накоплена значительная экспертиза в построении таких систем. Изначально решения создавались на базе западного оборудования и программного обеспечения, однако за последние три года мы освоили построение аналогичных систем...
Банк Уралсиб стал партнером форума «Золото Дальнего Востока»
08.05.2026 16:20 Мероприятия
Банк Уралсиб стал партнером форума «Золото Дальнего Востока»
Банк Уралсиб выступил финансовым партнером ежегодного горного форума-выставки «Золото Дальнего Востока: стратегии устойчивого развития», посвященного разведке и добыче золота и других твердых полезных ископаемых на Дальнем Востоке. Форум объединил представителей финансовых и бизнес-структур, инвесторов и поставщиков инженерно-технологических решений, а также представителей органов государственной власти. Участие в его работе приняло руководство Федерального агентства по недропользованию (Роснедра), министры природных ресурсов Магаданской области и Хабаровского края, представители крупнейших компаний-золотодобытчиков и переработчиков драгметаллов. Одной из ключевых задач этого мероприятия являлось формирование комплексной среднесрочной стратегии развития золотодобывающего сектора Дальнего Востока – с учетом реальной специфики минерально-сырьевой базы и условий работы на данной...
Город, который не сдался: пять портретов героев обороны Москвы
08.05.2026 14:29 Аналитика
Город, который не сдался: пять портретов героев обороны Москвы
81 год отделяет от Великой Победы. Но чем дальше, тем отчетливее понимание: она случилась во многом благодаря жертвам миллионов людей — каждый день, каждую смену, каждое ночное дежурство. Москва в 1941-м стояла на краю: враг был в нескольких десятках километров от города. И все-таки она не сдалась — единственная из европейских столиц. За этим стоят герои, награжденные медалью «За оборону Москвы», и многие из тех, кто не дожил до заслуженной награды. Государственный музей обороны Москвы собрал множество историй — вот лишь некоторые из них. Под ударом, но не сломлена К концу 1941 года в Москве оставалось 2,25 миллиона жителей — вдвое меньше, чем до войны. Почти 55 процентов из них составляли женщины, каждый четвертый москвич —...
6 мая - день Георгия Победоносца. Почему его образ на гербе России?
06.05.2026 14:27 Аналитика
6 мая - день Георгия Победоносца. Почему его образ на гербе России?
Георгий Победоносец — один из немногих святых, чей образ вошел в государственную символику России. 6 мая — день его памяти. О том, как святой воин оказался на гербе и при чем здесь ленточка накануне 9 мая, — в материале. Когда отмечают День Георгия Победоносца и почему 6 мая — главная дата 6 мая 2026 года православная церковь совершает память великомученика Георгия Победоносца. Именно эта память стоит первой в церковном календаре на данную дату, и именно с ней 6 мая устойчиво связано в православной традиции. В 2026 году на этот же день приходится Преполовение Пятидесятницы — однако в народной и церковной памяти дата прежде всего ассоциируется с именем Георгия Победоносца. Георгий принадлежит к числу наиболее почитаемых христианских святых. Его образ давно вышел за рамки церковной жизни и стал частью исторической символики, воинской культуры и русской государственной традиции. Его именем...