Идентификаторы данных

Для того чтобы поделиться данными или процитировать набор данных, необходим публичный постоянный уникальный идентификатор.
Существует множество схем общедоступных идентификаторов:

ARK (Archival Resource Key) – URL с дополнительными функциями, позволяющими запрашивать описательные и архивные метаданные и распознавать определенные типы отношений между идентификаторами. ARK используются библиотеками, архивами и музеями.

DOI (Digital Object Identifier) – идентификатор, который становится действительным при встраивании в URL-адрес. DOI очень популярны в издании академических журналов. Они доступны на странице http://dx.doi.org. Часто DOI представлен как ссылка, например, https://doi.org/10.1109/5.771073. DOI всегда будет указывать (ссылаться) на текущее местоположение объекта. DOI похож на URL, но, в отличие от URL, DOI приведет вас к правильному объекту, даже если объект перемещен. Большинство репозиториев назначат DOI загруженным данным.

Handle – идентификатор, который становится действительным при встраивании в URL-адрес.

InChI (IUPAC International Chemical Identifier) – незапатентованный идентификатор химических веществ, который может использоваться в печатных и электронных источниках данных, что позволяет упростить компоновку разнообразных компиляций данных (https://iupac.org/who-we-are/divisions/division-details/inchi/). Несколько сайтов предоставляют возможность генерировать InChIs:

  • cactus.nci.nih.gov/chemical/structure. Этот сервис работает как распознаватель для различных идентификаторов химической структуры и позволяет преобразовать данный идентификатор структуры в другое представление или идентификатор структуры.
  • www.chemspider.com/inchi.asmx. Сервисы предоставляют методы для управления строками InChI и InChIKey, включая преобразование в формат файла MOL и из него, проверку достоверности идентификаторов InChI, поиск ChemSpider с использованием входов InChI и т. д.
  • www.acdlabs.com/download/chemsk.html. Свободно доступная программа построения чертежей ACS/ Labs ChemSketch включает в себя средство для создания InChIs для чертежей.

LSID (Life Science Identifiers) – идентификатор биологических ресурсов, включая названия видов, понятия, случаи, гены или белки, объекты данных, которые кодируют информацию о них. Как и другие URN, он становится применимым при встраивании в URL-адрес.

PURL (Постоянный унифицированный указатель ресурсов) – URL, который всегда перенаправляется через имя хоста (часто purl.org).

URL (Uniform Resource Locator) – «адрес» веб-контента. Это своего рода URI (Uniform Resource Identifier), который начинается с «http: //» и состоит из строки символов, используемых для идентификации или названия ресурса в интернете. Такая идентификация позволяет взаимодействовать с представлениями ресурса по сети, как правило, в World Wide Web, используя протокол HTTP. Правильное перенаправление URL-адресов может сделать URL-адреса такими же постоянными, как и любой идентификатор.