10.14489/vkit.2021.05.pp.045-052 |
DOI: 10.14489/vkit.2021.05.pp.045-052 Ященков К. Г., Дымко К. С., Уханов Н. О., Хныкин А. В. Аннотация. Рассмотрена возможность использования методов анализа данных для поиска и исправления ошибок в выпускаемых метеорологами сообщениях. Предложен алгоритм обработки исходных данных (синтаксический и логический анализ) для предварительной очистки данных от шумов и определения ошибок формата для каждого типа сообщения. После предварительной подготовки методом классификации соотносится полученный набор характеристик сообщения с ранее обученной моделью для определения ошибочности текущей метеосводки и вывода соответствующего сообщения оператору в режиме реального времени. Продемонстрировано разработанное программное обеспечение, в котором реализован предложенный алгоритм, позволяющий повысить качество метеорологических прогнозов. Ключевые слова: обработка сообщений; лексический анализ; синтаксический анализ; регулярные выражения; дерево решений; метеоданные.
Yashchenkov K. G., Dymko K. S., Ukhanov N. O., Khnykin A. V. Abstract. The issues of using data analysis methods to find and correct errors in the reports issued by meteorologists are considered. The features of processing various types of meteorological messages are studied. The advantages and disadvantages of existing methods of classification of text information are considered. The classification methods are compared in order to identify the optimal method that will be used in the developed algorithm for analyzing meteorological messages. The prospects of using each of the methods in the developed algorithm are described. An algorithm for processing the source data is proposed, which consists in using syntactic and logical analysis to preclean the data from various kinds of noise and determine format errors for each type of message. After preliminary preparation the classification method correlates the received set of message characteristics with the previously trained model to determine the error of the current weather report and output the corresponding message to the operator in real time. The software tools used in the algorithm development and implementation processes are described. A complete description of the process of processing a meteorological message is presented from the moment when the message is entered in a text editor until the message is sent to the international weather message exchange service. The developed software is demonstrated, in which the proposed algorithm is implemented, which allows to improve the quality of messages and, as a result, the quality of meteorological forecasts. The results of the implementation of the new algorithm are described by comparing the number of messages containing various types of errors before the implementation of the algorithm and after the implementation. Keywords: Message processing; Lexical analysis; Syntactic analysis; Regular expressions; Decision tree; Weather data.
РусК. Г. Ященков, К. С. Дымко, Н. О. Уханов, А. В. Хныкин (Сибирский федеральный университет, Россия, Красноярск, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngK. G. Yashchenkov, K. S. Dymko, N. O. Ukhanov, A. V. Khnykin (Siberian Federal University, Krasnoyarsk, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Инструктивный материал по кодам METAR, SPECI, TAF – от 05.03.2015, № 115. М., 2015. 66 с. URL: metavia2.ru/help/instruction_METAR_SPECI_TAF.pdf (дата обращения: 15.12.2020) Eng1. Guidance material on METAR codes, SPECI, TAF, 115. (2015). Moscow. Available at: metavia2.ru/help/instruction_METAR_SPECI_TAF.pdf (Accessed: 15.12.2020). [in Russian language]
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 450 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2021.05.pp.045-052 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 450 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2021.05.pp.045-052 and fill out the