DOI: 10.14489/vkit.2015.010.pp.044-049
Потемкин А. В. МОНИТОРИНГ ПОТОКОВ РАСПРОСТРАНЕНИЯ СООБЩЕНИЙ В ГЛОБАЛЬНЫХ ИНФОРМАЦИОННЫХ СЕТЯХ ИНТЕРНЕТ (с. 44-49)
Аннотация. Предложен новый подход к анализу информационных потоков в сети Интернет, основанный на определении структуры распространения сообщений в потоке, учитывающей хронологию их появления, подобие текстов сообщений между собой и характеристики источников. С помощью алгоритма поиска в глубину определяют компоненты слабой связности, анализ кото-рых позволяет найти изменения информации в сообщениях. Применение данного подхода снижает размерность задачи анализа информационного потока.
Ключевые слова: информационный поток; структура распространения информации; средства массовой информации; нечеткий дубликат.
Potemkin A. V. MONITOR THE FLOW OF DISSEMINATION MESSAGES ON GLOBAL INFORMATION NETWORKS INTERNET (pp. 44-49)
Abstract. The Internet is a complex system, affecting society. Large volume, highspeed transmission of information is determined by the need to automate processing. To reduce the dimension of the problem of information analysis in the Internet an approach based on thematic infor-mation flows is used. The scientific literature shows the methods of analysis of thematic information flows based on their intensity or the presence of citation. These approaches do not allow to determine the change information on a variety of sources. Citation analysis determines only a part of the relationships between messages. A new approach to the analysis of information flows on the Internet is given, based on the determination of the structure of the dissemination of messages in the flow, taking into account the chronology of their appearance, similarity of text messages between them and the characteristics of the sources. The structure of the information flow is a weighted directed graph which nodes are the messages, edges - relationships between them. The edge weight depends on the similarity measure of messages text and values of the time interval between their appearances. The direction of communication is determined using the chronology of a message. On the basis of the scientific literature the threshold of similarity of texts of news reports, which are near-duplicate, is substantiated. The structure of the dissemination messages is the base for determination of the connected components, using depth-first search algorithm. The study showed that the use of this approach makes it possible to define more precisely the relationship between messages of the thematic information flows. The analysis of the connected components allows the search for information changes in the messages. The use of this approach also reduces the dimension of the information flow analysis problem.
Keywords: Information flow; Information dissemination structure; Mass media; Near duplicate document.
А. В. Потемкин (Академия Федеральной службы охраны Российской Федерации, г. Орел) E-mail:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
A. V. Potemkin (Academy of Federal Security Service of the Russian Federation, Orel) E-mail:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
1. Интернет в России: динамика проникновения. Осень 2014 [Электронный ресурс] // ФОМ. 2014. 29 декабря. URL: http://fom.ru/SMI-i-internet/11889 (дата обращения: 14.05.2015). 2. Доверие российским СМИ [Электронный ре-сурс] // ФОМ. 2015. 30 апреля. URL: http://fom.ru/SMI-i-internet/12140. (дата обращения: 14.05.2015). 3. Актуальные проблемы информационного противоборства в социотехнических системах / Еременко В. Т. и др. Орел: Изд-во Госун-та – УНПК, 2014. 292 с. 4. Методы решения задач распределения информационных потоков в сетях передачи данных предприятия на основе резервирования ресурсов / Афонин С. И. и др. // Информационные системы и технологии. 2012. № 1. С. 78 – 84. 5. Дорофеев Н. В., Кузичкин О. Р., Еременко В. Т. Обработка информации геодинамического мониторинга на основе данных географических информационно-аналити¬ческих систем // Вестник компьютерных и информационных технологий. 2015. № 3. С. 9 − 15. 6. Система формирования знаний в среде Интернет / В. И. Аверченков и др. Брянск: БГТУ, 2008. 181 с. 7. Ландэ Д. В. Моделирование динамики информа-ционных потоков // Фундаментальные исследования. 2012. № 6(3). C. 652 − 654. 8. Додонов А. Г., Ландэ Д. В. Методика аналитического исследования динамики событий на основе мониторинга веб-ресурсов сети Интернет // Информационные технологии и безопасность: основы обеспечения информационной безопасности: материалы Междунар. науч. конф. ИТБ-2014/ИПРИ НАН Украины. Киев, 2014. С. 3 – 17. 9. Додонов А. Г., Ландэ Д. В. Моделирование и анализ тематических информационных потоков // Информационное противодействие угрозам терроризма. 2013. № 20. C. 52 – 59. 10. Экспериментальное исследование методов выявления нечетких дубликатов научных публикаций / Н. В. Дербенев и др. // Машинное обучение и анализ данных. 2014. Т. 1, № 7. С. 875 – 884. 11. Зеленков, Ю. Г., Сегалович И. В. Сравнитель-ный анализ методов определения нечетких дубликатов для Web-документов // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: тр. 9-й Всерос. науч. конф. Переславль-Залесский: Изд-во ИПС РАН, 2007. С. 166 – 174. 12. Косинов Д. И. Использование статистической информации при выявлении схожих документов // Интернет-математика 2007: сб. работ участников конкурса науч. проектов по информационному поиску / под ред. П. И. Браславского. Екатеринбург: Изд-во Урал. ун-та, 2007. С. 84 – 90. 13. Выявление нечетких дубликатов при автоматическом формировании тематических коллекций документов на основе Web-публикаций / Ю. А. Загорулько и др. // Вестник Новосибирского гос. ун-та. Сер.: Информационные технологии. 2013. Т. 11, № 4. С. 59 – 70. 14. Цыганов Н. Л., Циканин М. А. Исследование методов поиска дубликатов веб-документов с учетом запроса пользователя // Интернет-математика 2007: сб. работ участников конкурса науч. проектов по информационному поиску / под ред. П. И. Браславского. Екатеринбург: Изд-во Урал. ун-та, 2007. С. 211 – 222. 15. Tarjan R. Depth First Search and Linear Graph Algorithms // SIAM Journal on Computing. 1972. V. 1, № 2. P. 146 – 160.
1. Internet in Russia: dynamics of penetration. As of autumn 2014. Public opinion Fund. 29 December 2014. Available at: http://fom.ru/SMI-i-internet/11889 (Accessed: 14.05.2015). 2. Trust for Russian media. Public opinion Fund. 30 April 2015. Available at: http://fom.ru/SMI-i-internet/12140. (Accessed: 14.05.2015). 3. Eremenko V. T. et al. (2014). Actual problems of information warfare in socio technical systems. Orel: Izdatel'stvo Gosuniversiteta – UNPK. 4. Afonin S. I. et al. (2012). Problem-solving methods of distribution of information flows in data network of the enterprise based on resource reservation. Informatsionnye sistemy i tekhnologii. (1), pp. 78-84. 5. Dorofeev N. V., Kuzichkin O. R., Eremenko V. T. (2015). Information processing of the geodynamic monitoring data-based geographic information-analytical systems. Vestnik komp'iuternykh i informatsionnykh tekhnologii. (3), pp. 9-15. doi: 10.14489/vkit.2015.03.pp.009-015 6. Averchenkov V. I. et al. (2008). The system of for-mation of knowledge in the Internet environment: monograph. Briansk: BGTU. 7. Lande D. V. (2012). Modeling the dynamics of information flows. Fundamental'nye issledovaniia. 6(3), pp. 652- 654. 8. Dodonov A. G., Lande D. V. (2014). Methodology of analytical study of the dynamics of event-based monitoring web resources on the Internet. Information technology and security: fundamentals of information security: proceedings of the International scientific conference ITB-2014 IPRI NAN of Ukraine. Kiev, pp. 3-17. 9. Dodonov A. G., Lande D. V. (2013). Modeling and analysis of thematic information flows. Informatsionnoe protivodeistvie ugrozam terrorizma, (20), pp. 52-59. 10. Derbenev N. V. et al. (2014). Experimental study of methods of identification of fuzzy duplicates of scientific publications. Mashinnoe obuchenie i analiz dannykh, Vol. 1, (7), pp. 875-884. 11. Zelenkov, Iu. G., Segalovich I. V. (2007). Comparative analysis of methods for determination of fuzzy duplicates of the Web documents. Digital libraries: prospective methods and technology, digital collection: proceedings of the 9th All-Russian scientific conference. City of Pereslavl'-Zalesskii: Izdatel'stvo IPS RAN, pp. 166-174. 12. Braslavskii P. I. (Ed.), Kosinov D. I. (2007). Using statistical information in identifying similar documents. Internet- mathematics 2007: collection of works of participants of the research projects competition in information search. Ekaterinburg: Izdatel'stvo Ural'skogo universiteta, pp. 84-90. 13. Zagorul'ko Iu. A. et al. (2013). Identification of fuzzy duplicates in automatic generation of thematic collections of documents based on Web publications. Vestnik Novosibirskogo gosudarstvennogo universiteta. Seriia: Informatsionnye tekhnologii. 11(4), pp. 59-70. 14. Braslavskii P. I. (Ed.), Tsyganov N. L., Tsikanin M. A. Study of search methods of web documents duplicates based on the user request. Internet- mathematics 2007: collection of works of participants of the research projects competition in information search. Ekaterinburg: Izdatel'stvo Ural'skogo universiteta, pp. 211-222. 15. Tarjan R. (1972). Depth first search and linear graph algorithms. SIAM Journal on Computing, 1(2), pp. 146-160.
Статью можно приобрести в электронном виде (PDF формат).
Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.
После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.
Для заказа статьи заполните форму:
{jform=1,doi=10.14489/vkit.2015.010.pp.044-049}
.
This article is available in electronic format (PDF).
The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.
After depositing your payment on our bank account we send you file of the article by e-mail.
To order articles please fill out the form below:
{jform=2,doi=10.14489/vkit.2015.010.pp.044-049}
.
.
|