| Русский Русский | English English |
   
Главная
20 | 12 | 2024
10.14489/vkit.2020.11.pp.023-032

DOI: 10.14489/vkit.2020.11.pp.023-032

Бутенко Ю. И.
МОДЕЛЬ ТЕКСТА СТАНДАРТА ПРИ ИНФОРМАЦИОННОМ ПОИСКЕ В КОЛЛЕКЦИИ ДОКУМЕНТОВ НОРМАТИВНОЙ БАЗЫ
(с. 23-32)

Аннотация. Предложена модель текста стандарта для информационного поиска в коллекции документов нормативной базы. Обосновано, что стандартные средства информационного поиска в коллекции текстов стандартов малоэффективны из-за композиционных особенностей текстов и широкого употребления обобщенно-отвлеченной лексики. Показаны отличительные стилистические признаки текстов нормативной базы, проявляющиеся в композиционной структуре, логичности представления материала, компактности. Отмечено, что тексты стандартов имеют одинаковую для всех текстов данного класса структуру изложения материала, а также содержат ограниченный набор структурных элементов. Представлено описание особенностей структурной организации текстов стандарта, а также возможное содержание каждого из элементов структуры. Обосновано наличие значительного влияния композиционной структуры текста стандарта на информационный поиск. Представлена композиционная структура стандарта в нотациях Бекуса–Наура. Предложена модель текста стандарта в виде графа, вершины и ребра которого – полноценные структурные элементы стандарта, значимые как для содержания текста стандарта, так и для информационного поиска. Обосновано, что представление текста стандарта в виде графа дает возможость (благодаря подаче стандарта в виде конечного множества его составных частей) в процессе его компьютерного анализа определить тип структурного элемента и степень вложенности.

Ключевые слова:  стандарт; иерархически структурированный текст; модель; структурный элемент; информационный поиск.

 

Butenko Yu. I.
MODEL OF STANDARD FOR INFORMATION RETRIEVAL IN THE COLLECTION OF REGULATORY FRAMEWORK DOCUMENTS
(pp. 23-32)

Abstract. The article proposes a model of the standards’ texts for information retrieval in the collection of documents the regulatory framework. It is proved that the standard means of information retrieval in the collection texts of standards are ineffective due to the compositional features of the texts and the wide use of generalized and abstract vocabulary. Distinctive stylistic features of standards’ texts in normative base are shown in compositional structure, logic of material representation, compactness. It is noted that the standards’ texts have the same structure of material presentation for all texts of this class, and also contain a limited set of structural elements. The description of structural elements of standards is given. It is proved that the compositional structure of the standard’s text has a significant impact on the results of information retrieval in the collection of documents the regulatory framework. The compositional structure of the standard in the Backus-Naur notations is presented. It is developed the model of the standards’ text in the form of a graph, the vertices and edges of which are full-fledged structural elements of the standard, significant both for the content of the text as a whole, and in terms of information retrieval. It is proved that the presentation of the standard’s text in the form of a graph makes it possible in the process of computer analysis the standard’s text to determine the type of structural element, the degree of nesting, by submitting the standard in the form of a finite set of its components.

Keywords: Standard; Hierarchically structured text; Model; Structural element; Information retrieval.

Рус

Ю. И. Бутенко (Московский государственный технический университет имени Н.Э. Баумана, Москва, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  

Eng

Yu. I. Butenko (Bauman Moscow State Technical University, Moscow, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  

Рус

1. Лукашевич Н. В. Тезаурусы в задачах информационного поиска. М.: Изд-во МГУ, 2011. 512 с.
2. Маннинг К., Рагхаван Пр., Шютце Х. Введение в информационный поиск: пер. с англ. М.: Вильямс, 2014. 528 с.
3. Бутенко Ю. И., Семенова Е. Л. Влияние лингвистических особенностей текстов стандартов на информационный поиск // Филологические науки. Научные доклады высшей школы. 2019. № 6. С. 29 – 35. DOI: 10.20339/PhS.6-19.029
4. Kharchenko V., Sklyar V., Volkoviy A. Nuclear Power Plant Instrumentation and Control Systems for Safety and Security. IGI Global, 2014. Р. 146 – 177.
5. Липаев В. В. Человеческие факторы в программной инженерии: рекомендации и требования к профессиональной квалификации специалистов. М.: СИНТЕГ, 2009. 328 с.
6. Kharchenko V., Gordieiev O., Fedoseeva A. Profiling of Software Requirements for the Pharmaceutical Enterprise Manufacturing Execution System // Applications of Computational Intelligence in Biomedical Technology. 2016. V. 606. Р. 67 – 92.
7. Hovorushchenko T. Information Technology for Assurance of Veracity of Quality Information in the Software Requirements Specification // Conf. on Computer Science and Information Technologies. CSIT 2017: Advances Intelligent Systems and Computing II. 2017. V. 689. Р. 166 – 185.
8. Шостак И. В., Бутенко Ю. И. Категорная модель языка стандартов для автоматизации процесса формирования нормативного профиля при серти¬фикации программного обеспечения: сб. науч. тр. Военного института КНУ им. Т. Г. Шевченко. 2013. № 42. С. 63 – 68.
9. Скатов Д. С., Ерехинская Т. Н., Окатьев В. В. Модели и методы анализа иерархически структурированных текстов. Компьютерная лингвистика и интеллектуальные технологии: по матер. ежегодной Междунар. конф. «Диалог 2009» (Бекасово, 27 – 31 мая 2009 г.). М.: РГГУ, 2009. Вып. 8(15). С. 458 – 464.
10. Lalmas M., Reid J., Hertzum M. Information-seeking Behaviour in the Context of Structured Documents. 25th European Conference on IR Research ECIR 2003. April 14 – 16. Pisa. Italy, 2002. V. 2633. Р. 104 – 119.
11. Селиванова Е. А. Лингвистическая энциклопедия. Полтава: Довкiлля-К, 2010. 844 с.
12. Гальперин И. Р. Текст как объект лингвистического исследования. М.: Наука, 1981. 140 с.
13. Бутенко Ю. И. Онтологический подход к формированию нормативного профиля при сертификации программного обеспечения // Онтология проектирования. 2020. Т. 10, № 2(36). С. 190 – 200. DOI: 10.18287/2223-9537-2020-10-2-190-200
14. Kharchenko V., Gordieiev O., Fedoseeva A. Profiling of Software Requirements for the Pharmaceutical Enterprise Manufacturing Execution System // Studies in Computational Intelligence. 2015. V. 606. P. 67 – 92.
15. Нелюбин Л. Л. Перевод и прикладная лингвистика. М.: Высш. школа, 1983. 207 с.
16. Бондаренко М. Ф., Шабанов-Кушнаренко Ю. П. Мозгоподобные структуры: справ. пособ. Киев: Наукова думка, 2011. 262 с.
17. Ястребенецкий М. А. Управление старением критических систем // Радиоэлектронные и компьютерные системы. 2008. № 6. С. 114 – 121.

Eng

1. Lukashevich N. V. (2011). Thesauri in information retrieval problems. Moscow: Izdatel'stvo MGU. [in Russian language]
2. Manning K., Raghavan Pr., Shyuttse H. (2014). An introduction to information retrieval. Moscow: Vil'yams. [in Russian language]
3. Butenko Yu. I., Semenova E. L. (2019). Influence of linguistic features of standards texts on information retrieval. Filologicheskie nauki. Nauchnye doklady vysshey shkoly, (6), pp. 29 – 35. [in Russian language] DOI: 10.20339/PhS.6-19.029
4. Kharchenko V., Sklyar V., Volkoviy A. (2014). Nuclear Power Plant Instrumentation and Control Systems for Safety and Security. IGI Global, pp. 146 – 177.
5. Lipaev V. V. (2009). Human factors in software engineering: recommendations and requirements for professional qualifications of specialists. Moscow: SINTEG. [in Russian language]
6. Kharchenko V., Gordieiev O., Fedoseeva A. (2016). Profiling of Software Requirements for the Pharmaceutical Enterprise Manufacturing Execution System. Applications of Computational Intelligence in Biomedical Technology, pp. 67 – 92.
7. Hovorushchenko T. (2017). Information Technology for Assurance of Veracity of Quality Information in the Software Requirements Specification. Conference on Computer Science and Information Technologies. CSIT 2017: Advances Intelligent Systems and Computing II, Vol. 689, pp. 166 – 185.
8. Shostak I. V., Butenko Yu. I. (2013). A categorical model of the language of standards for automating the process of forming a normative profile for software certification: collection of scientific papers of the Military Institute of the KNU named after T. G. Shevchenko, 42, pp. 63 – 68. [in Russian language]
9. Skatov D. S., Erekhinskaya T. N., Okat'ev V. V. (2009). Models and methods for analyzing hierarchically structured texts. Computational linguistics and intelligent technologies: based on the materials of the annual International Conference "Dialog 2009", 15(8), pp. 458 – 464. Moscow: RGGU. [in Russian language]
10. Lalmas M., Reid J., Hertzum M. (2002). Information-seeking Behaviour in the Context of Structured Documents. 25th European Conference on IR Research ECIR, Vol. 2633, pp. 104 – 119. Pisa.
11. Selivanova E. A. (2010). Linguistic Encyclopedia. Poltava: Dovkillya-K. [in Russian language]
12. Gal'perin I. R. (1981). Text as an object of linguistic research. Moscow: Nauka. [in Russian language]
13. Butenko Yu. I. (2020). Ontological approach to the formation of a regulatory profile for software certification. Ontologiya proektirovaniya, Vol. 10, 36(2), pp. 190 – 200. [in Russian language] DOI: 10.18287/2223-9537-2020-10-2-190-200
14. Kharchenko V., Gordieiev O., Fedoseeva A. (2015). Profiling of Software Requirements for the Pharmaceutical Enterprise Manufacturing Execution System. Studies in Computational Intelligence, Vol. 606, pp. 67 – 92.
15. Nelyubin L. L. (1983). Translation and Applied Linguistics. Moscow: Vysshaya shkola. [in Russian language]
16. Bondarenko M. F., Shabanov-Kushnarenko Yu. P. (2011). Brain-Like structures: a schoolbook. Kiev: Naukova dumka. [in Russian language]
17. Yastrebenetskiy M. A. (2008). Aging management of critical systems. Radioelektronnye i komp'yuternye sistemy, (6), pp. 114 – 121. [in Russian language]

Рус

Статью можно приобрести в электронном виде (PDF формат).

Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.

После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.

Для заказа скопируйте doi статьи:

10.14489/vkit.2020.11.pp.023-032

и заполните  форму 

Отправляя форму вы даете согласие на обработку персональных данных.

.

 

Eng

This article  is available in electronic format (PDF).

The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.

After depositing your payment on our bank account we send you file of the article by e-mail.

To order articles please copy the article doi:

10.14489/vkit.2020.11.pp.023-032

and fill out the  form  

 

.

 

 

 
Rambler's Top100 Яндекс цитирования