10.14489/vkit.2015.04.pp.014-018 |
DOI: 10.14489/vkit.2015.04.pp.014-018 Каратеев С. Л., Костромов Н. А., Бекетова И. В., Визильтер Ю. В. Аннотация. Предложен алгоритм комплексирования информации для коррекции ошибок распознавания при многократном считывании на различных кадрах видеосимвольных последовательностей, представляющих собой произвольный набор цифробуквенных знаков. Алгоритм не требует предварительных знаний о структуре, языке и содержании сообщения. Приведено описание алгоритма. Выполнена оценка характеристик алгоритма по результатам математического моделирования. Ключевые слова: распознавание символьной информации; коррекция ошибок; комплексирование информации; расстояние Левенштейна; N-граммы; генетический алгоритм.
Karateev S. L., Kostromov N. A., Beketova I. V., Vizilter Yu. V. Abstract. The algorithm for symbolic information fusion is proposed for error correction in automatic reading of alphanumeric character sequences recognized independently from a sequence of video frames. The algorithm requires no prior knowledge about the message struc-ture, language and content. The genetic algorithm is applied to synthesize best symbol sequences from initially recognized symbol sequences taken from video. The first generation of hypotheses is created using the crossover of N-grams derived directly from initially recognized sequences. The each next generation is obtained by crossing of best symbol sequence hypotheses from the previous generation. The fitness function is determined as a combination of Levenshtein distance and probabilistic assessment of generated sequences. The algorithm is stopped in two cases: if the best solution is not changed in next generation or if the given maximal number of generations is reached. The special version of information fusion algorithm is proposed for the case of word sequence (sentence) reading. The evaluation of algorithm performance based on mathematical modeling is presented. Keywords: Character recognition; Video processing; Error correction; Information fusion; Levenshtein distance; N-gramms; Genetic algorithm
РусС. Л. Каратеев, Н. А. Костромов, И. В. Бекетова, Ю. В. Визильтер (ФГУП «Государственный научно-исследовательский институт авиационных систем» ГНЦ РФ, Москва) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngS. L. Karateev, N. A. Kostromov, I. V. Beketova, Yu. V. Vizilter (State Research Institute of Aviation Systems State Scientific Center of Russian Federation, Moscow) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Ritika Mishra, Navjot Kaur. A Survey of Spelling Error Detection and Correction Techniques // International Journal of Computer Trends and Technology. 2013. V. 4, Is. 3. (372). Eng1. Ritika Mishra, Navjot Kaur. (2013). A survey of spelling error detection and correction techniques. International Journal of Computer Trends and Technology, 4(3).
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа статьи заполните форму: {jform=1,doi=10.14489/vkit.2015.04.pp.014-018} . EngThis article is available in electronic format (PDF). The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please fill out the form below: {jform=2,doi=10.14489/vkit.2015.04.pp.014-018}
. .
|