05.04.2026 21:54
Новости.
Просмотров всего: 6157; сегодня: 318.

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?

Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?

Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?

Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

Какие техники усложняют попытки извлечения модели через API (model extraction)?

Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?

Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?

Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Тематические сайты: Безопасность, Информтехнологии, связь, Интернет, Инфраструктура, Искусственный интеллект
Сайты субъектов РФ: Москва, Московская область
Сайты федеральных округов РФ: Центральный федеральный округ
Сайты стран: Россия
Сайты объединений стран: БРИКС (BRICS)

Ньюсмейкер: UDV Group — 59 публикаций
Сайт: udv.group

Интересно:

Как пропавший без вести солдат РККА стал героем Сопротивления Бельгии
19.04.2026 12:11 Персоны
Как пропавший без вести солдат РККА стал героем Сопротивления Бельгии
В братской Бельгии, в тихом городке Труа Пон, на могиле, увенчанной знакомой каждому советскому человеку пятиконечной звездой, покоится верный сын Родины. Камень хранит надпись на французском и русском: здесь похоронен русский партизан Иван Кульков, трагически погибший 9 декабря 1943 года при выполнении боевого задания. Его короткая, но ослепительно яркая жизнь — это повесть о мужестве, несгибаемой воле и интернациональной солидарности, скреплённой кровью в общей борьбе против фашизма. Иван Александрович Кульков родился в 1923 году в крестьянской семье в селе Дубовый Умет Куйбышевской области. Замечательный юноша, воспитанный Советской властью, он со школьной скамьи мечтал о подвиге во имя светлого будущего. Когда грянула Великая Отечественная война, он, как и тысячи его сверстников, без раздумий встал на защиту Социалистического Отечества. В марте 1942 года он был призван в ряды...
11.04.2026 16:35 Новости
ООО МПКМ запустило раздел с портфолио систем внешнего армирования
ООО «МПКМ» представило на своем сайте новый раздел, посвященный объектам, на которые в разные годы поставлялись системы внешнего армирования и сопутствующие материалы для усиления строительных конструкций. Новый проект стал не просто витриной выполненных поставок, а полноценной референс-базой, которая систематизирует многолетний опыт компании и показывает, как технологии композитного усиления применяются в самых разных условиях — от жилых домов и заводов до объектов энергетики, метрополитена и культурного наследия. Сейчас в открытой базе уже опубликованы сведения о 218 объектах и сферах применения в 104 городах. Работа над проектом потребовала значительного объема аналитики и восстановления архива: компания собрала и перепроверила данные по контрагентам, накладным, направлениям применения материалов и затем связала их с конкретными объектами, типами зданий, городами и отраслями. По...
10.04.2026 23:36 Новости
Выбраны лучшие бренды для подработки в ритейле
Цифровая платформа гибкой занятости Ventra Go! раскрыла результаты премии Ventra Go! Retail Awards. Сервис публикует рейтинг уже второй год подряд. Награда отмечает достижения ритейл-брендов в построении эффективной и уважительной культуры работы с гибким персоналом. Как были выявлены победители премии На платформе Ventra Go! зарегистрировано 2 млн+ исполнителей, которые каждый день выходят на подработку в 300+ брендов.  После завершения каждого задания исполнители могут поставить «звезды» – оценки и написать комментарий. В рамках Премии 2026 были проанализированы 610 000 оценок и 397 000+ отзывов и комментариев исполнителей, что втрое больше, чем в 2025 году. Были изучены отзывы исполнителей, которые ежедневно берут подработку в 25 000+ торговых точках. Лидеры были отфильтрованы по рейтингу — так появился шорт-лист из 12 брендов, чьи сильные стороны высоко оценили временные...
Punkt E примет участие в Natmall Expo 2026
09.04.2026 18:15 Мероприятия
Punkt E примет участие в Natmall Expo 2026
14–16 апреля 2026 года крупнейшая частная сеть зарядных станций для электромобилей в России Punkt E примет участие в 22-й выставке по развитию коммерческой недвижимости и масштабированию ритейла, точек питания, индустрии развлечений и сферы услуг Natmall Expo 2026, которая пройдет в «Крокус Экспо», Москва. Форум традиционно собирает экспертов отрасли для обсуждения актуальных тенденций, перспектив развития и внедрения новых технологий в сегменте коммерческой недвижимости. Участники смогут обменяться опытом и найти оптимальные решения для повышения эффективности своих объектов. На стенде Punkt E (B19) будут представлены решения по зарядной инфраструктуре, позволяющие повысить уровень комфорта клиентов и привлечь дополнительный трафик для ресторанов, торговых и офисных центров, а также других объектов коммерческой недвижимости. 14 апреля в 16:30 пройдет выступление...
Женская мода от Елены Мишаковой: полоска плюс горох
05.04.2026 19:24 Интервью, мнения
Женская мода от Елены Мишаковой: полоска плюс горох
Новая коллекция Misha’Le «Манифест свободы»: Полоска, горох и монохром в смелом оверсайз-виде Елены Мишаковой. В мире моды, где тренды мелькают как летние бабочки, Елена Мишакова, основательница бренда Misha’Le, всегда выбирает путь не просто следования, а переосмысления. Её новая коллекция «Манифест свободы» — это манифест свободы и смелости: оверсайз-силуэты, где классические принты полоска и горох оживают в креативных двухцветных сочетаниях светлых и тёмных оттенков, а монохром добавляет глубины и элегантности. “Раньше я любила осень в белом, чёрном и красном, — делится Елена. — Но весна требует свежести, и я решила поиграть с контрастами, чтобы каждая модель стала холстом для ярких образов”. Креативность полоски: от морской униформы к модному бунту. Полоска в одежде — это не просто узор, а история бунта и элегантности. Её путь начался в XVII веке во Франции, когда полосатые...