Что не так с перезапуском национального портала открытых данных РФ?

Министерство экономического развития 15 июля повторно запустило национальный портал открытых данных data.gov.ru. Он был закрыт в начале 2023 года для переноса на платформу «Гостех» и модернизирован. На момент открытия на новой версии портала было около 5000 наборов данных, более 1000 зарегистрированных государственных и муниципальных ведомств, организаций и учреждений. Основатель и технический директор поисковой системы по данным Dateno Иван Бегтин рассуждает о том, почему не стоит поддаваться магии цифр и официальных анонсов.

Открытые данные в мире развиваются в трех направлениях:

  1. Открытость государства – публикация информации для повышения доверия граждан.
  2. Современная технологическая инфраструктура – доступность данных для бизнеса и разработчиков.
  3. Открытый доступ – публикация всех видов научных результатов в открытом доступе.

В России портал data.gov.ru изначально создавался как инструмент открытости государства, но сейчас не отвечает ни одной из этих целей.

В отличие от зарубежных аналогов (Франция, США, Сингапур), российский портал не предоставляет удобных API и массивных датасетов для бизнеса. При этом в России есть успешные примеры: ФНС, Казначейство и Минфин публикуют структурированные данные, востребованные рынком.

Спрос на данные для обучения нейросетей растет, но на data.gov.ru их нет. Многие российские организации размещают датасеты на Hugging Face и Kaggle, игнорируя государственный портал.

Реальные цифры

  • 80% наборов данных содержат менее 100 строк.
  • 84% данных опубликованы до 2019 года.
  • Общий объем информации – всего 100 МБ (для сравнения: старая версия хранила 14 ГБ).

Вывод

Перезапущенный data.gov.ru не выполняет свою основную функцию – быть полезным для граждан, бизнеса или науки. Его исчезновение никто не заметит, что говорит о провале проекта. Вместо реальной работы с данными портал остается формальностью, не соответствующей современным требованиям.

Источник: Forbes, Иван Бегтин.

Изображение для превью новости предоставлено Freepik.