10.14489/vkit.2015.04.pp.045-049 |
DOI: 10.14489/vkit.2015.04.pp.045-049 Камаев В. А., Мельников М. П., Воробкалов П. Н. Аннотация. Рассмотрена проблема обнаружения взаимодействий лекарственных средств, аргументирована ее актуальность. Исследована возможность применения методов обработки естественного языка для поиска таких взаимодействий, для этого выделены основные направления современных исследований в данной области. Составлен корпус текстов аннотаций статей для проверки методов автоматического поиска взаимодействий лекарственных средств. Предложен быстрый метод классификации с исполь-зованием частоты слова – обратной частоты документа. Проведена экспериментальная проверка метода. Установлено, что с помощью предложенного метода достигнуто сравнительно высокое значение точности и полноты при низких вычислительных затратах. Ключевые слова: поиск информации; взаимодействие лекарственных средств; машинное обучение.
Kamaev V. A., Melnikov M. P., Vorobkalov P. N. Abstract. Detection of drug-drug interactions (DDIs) is an important theoretical and practical challenge. DDIs information can help doctors make right decisions. Search of such interactions is a time-consuming task which requires work of high qualified specialists. Use of natural lan-guage processing for text mining of scientific articles can solve the problem of DDI databases actuality. There are databases containing large amount of biomedical articles, therefore computational performance of classification method used for identification is a valuable factor. The main purpose of the research is to find an approach of fast retrieval of drug-drug interactions information from large databases of biomedical texts. In this article, we investigate up-do-date research works in the area of natural language processing for detection of DDIs. Many of investigated methods are computationally intensive and require feasible time to perform on large text corpuses. Using different sources of information, we created a text corpus containing positive and negative examples of articles. We propose a fast text mining approach to DDI articles classification using term frequency-inverse document frequency (TF-IDF) statistic. TF-IDF is a numerical statistic that is intended to reflect how important a word is to a document in a corpus. To implement and test the classification algorithm, we’ve developed the text classification system. As a result, our approach is able to achieve relatively height precision recall values in DDI articles classification while still keeping short run-time. After all we consider possible approaches to improve the developed algorithm, which can help increase its precision and recall. After these improvements the software realization of the algorithm may be used by experts in DDI area to search new DDI evidences in scientific articles. Keywords: Information retrieval; Drug-drug interaction; Machine learning.
РусВ. А. Камаев, М. П. Мельников, П. Н. Воробкалов (Волгоградский государственный технический университет) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngV. A. Kamaev, M. P. Melnikov, P. N. Vorobkalov (Volgograd State Technical University) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Facts & Comparisons® eAnswers (Online). URL: http://www.factsandcomparisons.com/facts-comparisons-online/ (дата обращения: 04. 02. 2015). Eng1. Facts & Comparisons® eAnswers (Online). Available at: http://www.factsandcomparisons.com/facts-comparisons-online/ (Accessed: 04. 02. 2015).
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа статьи заполните форму: {jform=1,doi=10.14489/vkit.2015.04.pp.045-049} . EngThis article is available in electronic format (PDF). The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please fill out the form below: {jform=2,doi=10.14489/vkit.2015.04.pp.045-049}
. .
|