Действительно ли использование практик открытой науки менее распространено среди статей, ассоциированных с недобросовестными исследователями, в частности, «paper mills» («бумажными мельницами», сфабрикованными исследованиями)? Этим вопросом задались основатель проекта Cassyni, глава Clear Skies Ltd. и владелец консалтингового агентства Strategies for Open Science (Stratos).
Исследуя корпус статей PLOS, авторы использовали:
• базу показателей открытого доступа PLOS Open Science Indicators версии 10 (OSI), включающую метрики по размещению программного кода, цитированию авторских протоколов, предварительной регистрации исследований и публикации препринтов, в совокупности с использованием нового подхода, основанного на искусственном интеллекте, разработанного совместно с командой PLOS и сообществом открытого доступа. Этот метод позволил более точно различать распространение новых наборов данных и повторное использование существующих данных для исключения сфабрикованных статей, использующих ранее созданные датасеты;
• данные платформы Cassyni для определения выступлений на конференциях и иных мероприятиях, связанных с опубликованными статьями, путем агрегирования записей презентаций из университетов, веб-сайтов конференций и других проверенных академических источников. Подход заключался в подборе совпадений с высоким уровнем связи между метаданными статьи (название, авторы, дата публикации) и деталями выступления. Такой способ впервые позволил количественно оценивать активность презентаций как масштабируемый компонент редакционной оценки. Авторы проверяли, связано ли меньшее количество представленных статей с активностью «paper mills»;
• систему оценки рисков «Papermill Alarm» от компании Clear Skies. Она сочетает алгоритмы ИИ с сетевым анализом, оценивая риск отзыва статьи из-за фальсификации.
Основные выводы, полученные авторами:
• выступления и доклады связаны почти исключительно с легитимными статьями;
• онлайн-доступ к новым данным примерно вдвое чаще встречается в добросовестных работах, чем в сфабрикованных;
• открытые научные практики функционируют как честные сигналы готовности исследователя к публичной критике.
Авторы делают особый акцент на том, что полученные результаты являются корреляционными — вполне вероятно, что существуют другие переменные, лучше объясняющие найденные зависимости. К примеру, статьи из определенных стран могут иметь повышенный риск фальсификации исследований и одновременно традиционно низкую практику распространения данных, так что страна происхождения автора может объяснить значительную долю ассоциаций между деятельностью фальсификаторов и использованием открытых научных практик. Данные коварианты авторы обещают рассмотреть позднее в готовящемся препринте по итогам исследования.
В эпоху, когда деятельность фальсификаторов становится всё более сложной и изобретательной, трудно воспроизводимые в массовом порядке сигналы, такие как разумное разделение данных, цитирование протоколов, предварительная регистрация и публичные презентации, предоставляют ценную дополнительную информацию для сортировки и приоритизации статей, даже если сами по себе они недостаточны.
Оригинальная публикация: Preliminary Evidence Linking Open Science to Research Integrity / Tim Vines, Ben Kaube, Adam Day, Kristen Ratan // The Scholarly Kitchen. — Jan 28, 2026.
Изображение для превью новости предоставлено Freepik.