Москва создает собственное «госозеро» данных для обучения ИИ
Москва решила создать собственную ИС для сбора обезличенных данных в целях обучения ИИ, хотя в стране уже принят закон о создании общегосударственного «госозера». Столица обещает делиться информацией с бизнесом, но пока не ясно, на каких условиях.
Московское «госозеро»
Москва планирует создание своего регионального «озера» данных и уже разрабатывает информационную систему формирования региональных составов данных (ИС ФРСД), пишет Forbes со ссылкой на заместителя руководителя департамента информтехнологий (ДИТ) Москвы Владислава Шишмарева.
Предполагается, что оператором системы для сбора и обезличивания личной информации жителей столицы, обрабатываемой госорганами и подведомственными правительству Москвы организациями, станет ДИТ Москвы (Департамент информационных технологий). Доступ к данным будет предоставляться не только государственным, но и частным организациям.
«Обезличенные данные предполагается использовать для обучения алгоритмов искусственного интеллекта (ИИ), и их применение в других целях не предусмотрено», — подчеркнули представители ДИТ.
Какие данные будет собирать ИС
По информации Ассоциации больших данных (АБД), система правительства Москвы предполагает сбор только данных государственных органов и подведомственных организаций: «Это, с одной стороны, позволяет ускорить формирование информационной системы, с другой — снижает риски раскрытия чувствительной информации, поскольку региональные данные, как правило, не содержат защищаемые законом тайны (например, тайну связи и банковскую тайну)».
«Похоже на то, что Москве интереснее поработать над обменом обезличенной информацией с бизнесом, в том числе получить данные, которые обычно не попадают в периметр московских сервисов. Какие именно это данные, можно только гадать: например, платежные данные, чеки, которые можно получить от банков, магазинов или маркетплейсов», — прокомментировал генеральный директор Института исследований интернета Карен Казарян.
Закон о федеральном «госозере» данных (поправки к закону «О персональных данных») был принят восьмого августа 2024 г. Он гласит, что отдельная госинформсистема будет также пополняться данными бизнеса о сотрудниках и клиентах, получаемыми на безвозмездной основе. В середине декабря 2024 г. глава Минцифры Максут Шадаев упоминал, что развитие «госозера» данных начнется со сбора геотреков (информация о перемещениях россиян и гостей страны, подключившихся к местным операторам сотовой связи).
Будет ли польза для бизнеса?
«Предоставление доступа к таким данным участникам рынка позволит привлечь их компетенции в области создания продуктов и сервисов на больших данных. Это будет способствовать повышению качества и доступности услуг для граждан, включая бытовые услуги малого и среднего бизнеса», — считают в АБД.
Москва, как заявлено на официальном сайте города, является «одним из мировых флагманов по внедрению технологий искусственного интеллекта». В городе реализуется более 90 ИИ-проектов — чат-боты и голосовые помощники, системы интеллектуального контроля за строительством и благоустройством, компьютерное зрение в здравоохранении, рекомендательные сервисы и др..
Польза для бизнеса от создания столичного «озера» данных будет зависеть от того, на каких условиях он получит дата-сеты и сможет ли воспользоваться результатами их обработки, полагает эксперт по защите персональных данных и соучредитель Regional Privacy Professionals Association (RPPA) Алексей Мунтян. Он обратил внимание на то, что из российского «госозера» выгружать ничего нельзя, даже результаты анализа информации. Как сообщили CNews в феврале 2025 г. представители Минцифры, «доступ к наборам данных будет происходить исключительно в рамках закрытого контура платформы, а “вынести” их из нее будет невозможно».