OpenAlex — это открытая база научной литературы. Она получила свое название в честь Александрийской библиотеки, одной из крупнейших библиотек древности. Этот ресурс содержит более 250 миллионов записей о публикациях из 230 тысяч источников.
Первоначально Open Alex основывалась на данных из Microsoft Academic Graph. Эта платформа открытого поиска научных материалов позволяла не только собрать информацию, но и предлагала способы ее визуализации, чем выгодно отличалась от Google Scholar.
Сегодня Open Alex стала агрегатором научной литературы из многочисленных открытых баз данных: ресурс аккумулирует метаданные CrossRef, Pubmed, arXiv, Zenodo и сведения о полнотекстовых статьях в открытом доступе из UnPaywall.
Как работает OpenAlex?
Как и в случае с Google Scholar, этот ресурс вынужден жертвовать селективностью ради широкого охвата данных.
Лишь недавно у OpenAlex появился привычный пользователю интерфейс с возможностью поиска на человеческом языке. Раньше, чтобы получить информацию, нужно было уметь программировать на Python и R.
Платформа дает возможность персонализации, хотя это не обязательно.
В базе можно найти следующие виды научной информации:
1) Публикации, в том числе статьи и препринты, диссертации и книги.
Помимо сведений о самих работах показана связь с другими статьями через перекрестное цитирование. Также предлагаются недавние похожие публикации.
О публикации можно узнать:
- название и DOI;
- базы данных, в которых индексируется эта работа;
- авторы, их аффилиации и идентификаторы;
- язык, дата и год публикации, тип работы, статус доступа;
- издатель или репозиторий: где можно получить открытый доступ к тексту статьи;
- библиографическое описание;
- количество цитирований, в том числе с разбивкой по годам;
- список всех работ, цитирующих эту статью;
- ключевые слова.
2) Авторы. О них можно узнать:
- варианты написания имени;
- идентификаторы (OpenAlex, Scopus, ORCID, и др.)
- аффилиации;
- общее количество публикаций и цитирований;
- разбивка сведений о публикациях по годам: сколько статей опубликовано в конкретный год и сколько раз их цитировали;
- импакт-фактор, индекс Хирша, i-10 индекс;
- список всех работ этого автора;
- понятия, связанные с работами автора.
3) Ресурсы, на которых размещена работа: журналы, репозитории, материалы конференций. О них можно узнать:
- сокращенное и альтернативные названия;
- идентификатор OpenAlex, ISSN-L или ISSN;
- страну издания;
- стоимость обработки статьи в данном источнике (берется из DOAJ);
- общее количество ссылок на публикации журнала;
- разбивка по годам за последние 10 лет: сколько новых работ опубликовано и сколько раз они цитировались;
- стартовая страница для навигации;
- список всех публикаций этого ресурса;
- импакт-фактор журнала, индекс Хирша и i—10 индекс;
- понятия, связанные с источником;
- тип доступа.
3) Университеты, научные институты и исследовательские лаборатории, с которыми аффилированы авторы. О них можно получить следующую информацию:
- название учреждения и альтернативные названия, в том числе на разных языках;
- идентификатор OpenAlex и все известные внешние идентификаторы;
- страна, регион, город;
- связанные учреждения и тип связи;
- URL-адрес домашней страницы;
- количество цитирований работ этой организации, в том числе с разбивкой по годам ;
- список всех работ, связанных с организацией;
- импакт-фактор, индекс Хирша, i-10 индекс организации;
- понятия, наиболее часто применяемые к публикациям этого учреждения.
4) Темы, закрепленные за публикациями. Они имеют четыре уровня иерархии: собственно тема, подраздел, область и домен.
Например:
тема — искусственный интеллект в медицине
подраздел — медицинская информатика
область — медицина
домен — науки о здоровье
5) Издатели. О них можно узнать:
- основное название и список альтернативных названий, в том числе на разных языках;
- идентификатор OpenAlex и все известные внешние идентификаторы;
- страна, в которой находится издательство;
- список всех ресурсов, опубликованных издателем;
- общее количество работ и цитирований, связанных с издателем, в том числе с разбивкой по годам;
- импакт-фактор, индекс Хирша, i-10 индекс издателя.
6) Сведения о спонсорах из Crossref, Wikidata и ROR. О них можно получить следующую информацию:
- основное и альтернативные названия;
- краткое описание;
- страна спонсора;
- идентификатор OpenAlex и все известные внешние идентификаторы (Crossref, DOI, ROR);
- URL-адрес главной страницы спонсора;
- количество грантов, связанных с этим спонсором;
- количество работ, связанных со спонсором, в том числе с разбивкой по годам и количество цитирований каждой из них;
- количество публикаций, цитирующих работу, которую финансирует спонсор;
- импакт-фактор, индекс Хирша, i-10 индекс спонсора.
Авторов, учреждения и публикации можно фильтровать и группировать по континентам и странам.
Преимущества и недостатки OpenAlex
- Бесплатно можно сделать до 100 000 запросов в день. OpenAlex Premium позволяет делать неограниченное количество запросов.
- Все полученные данные можно скачивать и распространять неограниченно.
- Охват источников в OpenAlex значительно шире, чем в базах Scopus и Web of Science, но отбор менее тщательный.