| Русский Русский | English English |
   
Главная Current Issue
20 | 05 | 2022
10.14489/vkit.2021.12.pp.003-012

DOI: 10.14489/vkit.2021.12.pp.003-012

Казанцев И. А., Классен Р. К.
УЛУЧШЕНИЕ АВТОМАТИЧЕСКОГО ПРЕТРАНСЛЯТОРА SQL-ЗАПРОСОВ К РЕГУЛЯРНОМУ ПЛАНУ
(с. 3-12)

Аннотация. Создан прототип автоматического претранслятора. Для повышения эффективности работы автоматического претранслятора предложен новый подход к разбору оригинального запроса SQL (Structured Query Language) и построению регулярного дерева. Новый подход заключается в создании специальных обработчиков для определенных SQL-конструкций. Поскольку регулярное дерево может быть построено различными способами для одного запроса, то для поиска более эффективного регулярного плана в претранслятор добавлены метаданные со схемой базы данных, размером полей и числом строк в отношениях. Учет таких параметров позволил уменьшить влияние сетевых передач на время выполнения за счет более уместного выбора размерности полей и выполнения операций СОЕДИНЕНИЯ с порядком отношений от меньшего к большему. Эффективность работы претранслятора подтверждена результатами экспериментальных исследований.

Ключевые слова:  язык структурированных запросов; синтаксическое дерево; инструмент генерации синтаксических анализаторов; Clusterix-подобные системы управления базами данных; регулярный план; претрансляция.

 

Kazantsev I. A., Klassen R. K.
IMPROVING THE AUTOMATIC PRETANSLATOR OF SQL-QUERIES TO A REGULAR PLAN
(pp. 3-12)

Abstract. We have created an automatic pretranslator prototype and proposing a new approach to improve the automatic pretranslator efficiency by parsing the original SQL (Structured Query Language) query and building a regular tree. The new approach is to create custom handlers for specific SQL constructs. The resulting handlers, instead of omitting some SQL constructs at the sorting and aggregation stage, allow them to be processed at the join stage. Joining operations, in contrast to sorting and aggregation operations, are performed in parallel on several nodes of the computing cluster, which significantly increases the productivity of processing a single query. You can additionally improve performance by reducing the amount of data transferred, due to a more accurate selection of the dimensions of DECIMAL fields and lowering the projection operations to the level of sorting and aggregation if lifting them increases the number of intermediate relation fields. A regular tree for a single request can be built in various ways. Finding the most effective regular plan pretranslator requires constructing many plans. A plan is selected from the set in which join operations are performed with the order of intermediate relations with sizes from smallest to largest. The experiments carried out have shown that the execution time of a stream of requests pretranslated by the pretranslator is not more than the execution time of a similar stream, pretranslated manually, which proves its effectiveness.

Keywords: Structured Query Language (SQL); Syntax tree; Syntax parser generation tool; Clusterix-like database management systems; Regular plan; Pretranslation.

Рус

И. А. Казанцев, Р. К. Классен (Казанский национальный исследовательский технический университет им. А. Н. Туполева – КАИ, Казань, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  

Eng

I. A. Kazantsev, R. K. Klassen (Kazan National Research Technical University named after A. N. Tupolev – KAI, Kazan, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  

Рус

1. A Visual Approach to Semantic Query Design Using a Web-Based Graphical Query Designer / P. R. Smart et al. // Intern. Conf. on Knowledge Engineering: Practice and Patterns // Lecture Notes in Computer Science. 2008. V. 5268. P. 275 – 291. DOI 10.1007/978-3-540-87696-0_25
2. Graphical and Command-Line Query Tools // In: Beginning SQL Server 2005 Express Database Applications. Apress. 2006. URL: https://doi.org/10.1007/978-1-4302-0108-3_2 (дата обращения: 09.06.2021)
3. Jeong C. Y., Kim Y. S., Ha Y. XML-OGL: UML-Based Graphical Web Query Language for XML Documents // Intern. Conf. on Computational Science and Its Applications – ICCSA 2004 // Lecture Notes in Computer Science. 2004. V. 3043. P. 337 – 344. URL: https://doi.org/10.1007/978-3-540-24707-4_42 (дата обращения: 09.06.2021)
4. TIOBE Index for November 2021. November Headline: PHP about to lose its top 10 position // TIOBE – The Software Quality Company. 2021. URL: https://www.tiobe.com/tiobe-index/ (дата обращения: 09.06.2021)
5. Классен Р. К., Казанцев И. А. Автоматическая претрансляция SQL-запросов к регулярному плану в Clusterix-подобных системах управления данных // Вестник компьютерных и информационных технологий. 2020. Т. 17, № 10. С. 11 – 20. doi: 10.14489/vkit.2020.10.pp.011-020
6. Raikhlin V. A., Klassen R. K. Clusterix-Like BigData DBMS // Data Science and Engineering. 2020. V. 5. P. 80 – 93. URL: https://doi.org/10.1007/s41019-020-00116-2 (дата обращения: 09.06.2021).
7. Raikhlin V. A. Simulation of Distributed Database Machines // Programming and Computer Software. 1996. V. 22, No. 2. Р. 68 – 74.
8. ISO/IEC 9075:1992. Information Technology – Database Language SQL (Proposed revised text of DIS 9075) // Digital Equipment Corporation Maynard, Massachusetts. July 30, 1992. URL: http://www.contrib.andrew.cmu.edu/~shadow/sql/sql1992.txt (дата обращения: 09.06.2021).
9. Райхлин В. А., Абрамов Е. В. К теории моделей синтеза кластеров баз данных // Вестник Казанского гос. техн. ун-та им. А. Н. Туполева. 2004. № 1. С. 44 – 49.
10. TPC BenchmarkTM H (Decision Support). Standard Specification. Revision 2.17.1. 136 р. URL: http://www.tpc.org/tpc_documents_current_versions/pdf/tpc-h_v2.17.1.pdf (дата обращения: 02.08.2021).
11. ANTLR: офиц. сайт. 2014. URL: https://www.antlr.org/ (дата обращения: 02.08.2021).
12. Казанцев И. А. Претранслятор SQL к регулярному плану для Clusterix-N. URL: https://github.com/NexoKazan/PreTran (дата обращения: 02.08.2021).

Eng

1. Smart P. R. et al. (2008). A Visual Approach to Semantic Query Design Using a Web-Based Graphical Query Designer. International Conference on Knowledge Engineering: Practice and Patterns. Lecture Notes in Computer Science, Vol. 5268, pp. 275 – 291. DOI 10.1007/978-3-540-87696-0_25
2. Graphical and Command-Line Query Tools. (2005). In: Beginning SQL Server 2005 Express Database Applications. Apress. Available at: https://doi.org/10.1007/978-1-4302-0108-3_2 (Accessed: 09.06.2021).
3. Jeong C. Y., Kim Y. S., Ha Y. (2004). XML-OGL: UML-Based Graphical Web Query Language for XML Documents. International Conference on Computational Science and Its Applications – ICCSA 2004. Lecture Notes in Computer Science, Vol. 3043, pp. 337 – 344. Available at: https://doi.org/10.1007/978-3-540-24707-4_42 (Accessed: 09.06.2021).
4. TIOBE Index for November 2021. November Headline: PHP about to lose its top 10 position. (2021). TIOBE – The Software Quality Company. Available at: https://www.tiobe.com/ tiobe-index/ (Accessed: 09.06.2021).
5. Klassen R. K., Kazantsev I. A. (2020). Automatic pre-translation of SQL queries to the regular schedule in Clusterix-like data management systems. Vestnik komp'yuternyh i informatsionnyh tekhnologiy, Vol. 17, (10), pp. 11 – 20. [in Russian language] DOI 10.14489/vkit.2020.10.pp.011-020
6. Raikhlin V. A., Klassen R. K. (2020). Clusterix-Like BigData DBMS. Data Science and Engineering, Vol. 5, pp. 80 – 93. Available at: https://doi.org/10.1007/s41019-020-00116-2 (Accessed: 09.06.2021).
7. Raikhlin V. A. (1996). Simulation of Distributed Data-base Machines. Programming and Computer Software, Vol. 22, (2), pp. 68 – 74.
8. Information Technology – Database Language SQL (Proposed revised text of DIS 9075). (1992). International Standard No. ISO/IEC 9075:1992. Massachusetts: Digital Equipment Corporation Maynard. Available at: http://www.contrib.andrew.cmu. edu/~shadow/sql/sql1992.txt (Accessed: 09.06.2021).
9. Rayhlin V. A., Abramov E. V. (2004). On the theory of models for the synthesis of database clusters. Vestnik Kazanskogo gosudarstvennogo tekhnicheskogo universiteta im. A. N. Tupoleva, (1), pp. 44 – 49. [in Russian language]
10. TPC BenchmarkTM H (Decision Support). Standard Spec-ification. Revision 2.17.1. Available at: http://www.tpc.org/tpc_documents_current_versions/pdf/tpc-h_v2.17.1.pdf (Accessed: 02.08.2021).
11. ANTLR. (2014). Available at: https://www.antlr.org/ (Accessed: 02.08.2021).
12. Kazantsev I. A. SQL to Regular Schedule Translator for Clusterix-N. Available at: https://github.com/NexoKazan/PreTran (Accessed: 02.08.2021). [in Russian language]

Рус

Статью можно приобрести в электронном виде (PDF формат).

Стоимость статьи 450 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.

После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.

Для заказа скопируйте doi статьи:

10.14489/vkit.2021.12.pp.003-012

и заполните  форму 

Отправляя форму вы даете согласие на обработку персональных данных.

.

 

Eng

This article  is available in electronic format (PDF).

The cost of a single article is 450 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.

After depositing your payment on our bank account we send you file of the article by e-mail.

To order articles please copy the article doi:

10.14489/vkit.2021.12.pp.003-012

and fill out the  form  

 

.

 

 

 
Search
Баннер
Журнал КОНТРОЛЬ. ДИАГНОСТИКА
Баннер
Баннер
Баннер
Баннер
Rambler's Top100 Яндекс цитирования