Подборка порталов с открытыми или общедоступными данными для машинного обучения

Большие международные порталы

  • Kaggle — крупнейший по числу наборов данных каталог на виртуальной платформе по анализу данных, машинному обучению и искусственному интеллекту Kaggle.
  • Hagging Face — не такой большой количественно, но хорошо структурированный каталог на платформе Hagging Face.
  • Registry of Open Data on AWS — данные большого объёма в специальном каталоге открытых данных расположенных на платформе Amazon AWS.
  • Azure Open Datasets — данные особенно большого объёма на платформе Azure, также открытые.
  • OpenML Datasets — большое количество данных, каталог на платформе OpenML.
  • UCL Machine learning repository — академический репозиторий данных для машинного обучения.
  • DagsHub — большая подборка наборов данных и библиотека для Python для работы с ними.
  • Papers With Code — наборы данных, привязанные к «публикациям с кодом», чаще ссылки на другие порталы с данными.
  • Andaconda Datasets — программные пакеты для Python (Anaconda) для доступа ко многим наборам данных, включающие наборы данных.

Японские порталы
ABCI Datasets — научные наборы данных для машинного обучения.

Корейские порталы
AI Hub — портал данных для ИИ в Южной Корее, большая часть данных требует регистрации и разрешения на использование.

Российские порталы

MosMed datasets — подборка наборов открытых данных для машинного обучения в области медицины.

Подборка подготовлена Ivan Begtin

Изображение для превью новости предоставлено Freepik

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Достигнут лимит времени. Пожалуйста, введите CAPTCHA снова.