10.14489/vkit.2021.10.pp.032-039 |
DOI: 10.14489/vkit.2021.10.pp.032-039 Тихонов Н. И. Аннотация. Процедуры визуализации коллекций научных публикаций используются для лучшего понимания наборов данных и формирования некоторых оценок. При построении таких визуализаций могут использоваться различные методы анализа текстовых коллекций. В статье рассмотрены методы анализа Paper2vec и Cite2vec, в которых использована информация о цитировании и получены векторные представления документов. В целях демонстрации работы методов описаны процедуры визуализации. Ключевые слова: визуализация коллекций документов; векторное представление документов; сети цитирования; контексты цитирования.
Tikhonov N. I. Abstract. Collections of scientific publications are growing rapidly. Scientists have access to portals containing a large number of documents. Such a large amount of data is difficult to investigate. Methods of document visualization are used to reduce labor costs, search for necessary and similar documents, evaluate the scientific contribution of certain publications and reveal hidden links between documents. The methods of document visualization can be based on various models of document representation. In recent years, word embedding methods for natural language processing have become extremely popular. Following them, methods for analyzing text collections began to appear to obtain vector representations of documents. Although there are many document analyzing systems, new methods can give new understandings of collections, have better performance for analyzing large collections of documents, or find new relationships between documents. This article discusses two methods Paper2vec and Cite2vec that get vector representations of documents using citation information. The text provides a brief description of the considered methods for analyzing collections of scientific publications, describes experiments with these methods, including the visualization of the results of the methods and a description of the problems that arise. Keywords: Visualization of document collections; Vector representation of documents; Citation networks; Citation contexts.
РусН. И. Тихонов (Новосибирский национальный исследовательский государственный университет, Новосибирск, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngN. I. Tikhonov (Novosibirsk State University, Novosibirsk, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Апанович З. В. Эволюция методов визуализации коллекций научных публикаций // Электронные библиотеки. 2018. Т. 21, № 1. C. 2 – 42. Eng1. Apanovich Z. V. (2018). Evolution of methods of visualization of collections of scientific publications. Elektronnye biblioteki, Vol. 21, (1), pp. 2 – 42. [in Russian language]
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 450 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2021.10.pp.032-039 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 450 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2021.10.pp.032-039 and fill out the
.
|