17 | 09 | 2019

DOI: 10.14489/vkit.2016.07.pp.034-040

Левин И. И., Пелипец А. В.
(c. 34-40)

Аннотация. Рассмотрено применение метода распараллеливания по итерациям на примере задач линейной алгебры, который позволяет существенно сократить число внешних каналов обмена – одних из наиболее критичных ресурсов реконфигурируемой вычислительной системы.

Ключевые слова:  реконфигурируемые вычислительные системы; программируемые логические интегральные схемы; информационный граф; линейная алгебра; распараллеливание по итерациям; вычислительный конвейер.


Levin I. I., Pelipets A. V.
(pp. 34-40)

Abstract. The problem of effective memory interaction is paid a lot of attention in the high performance computing domain, but discussions are usually based on the various data paralleling methods. The success of application of these methods depends on the number of algorithmic, software and hardware factors. Recent trends of hardware parallelism are as follows: multicore and multiprocessor gains, establishment of new or enhanced supercomputer topology. These conditions brought the need to adapt the existing algorithms to architecture changes. This manifests itself most in the linear algebra computations, which account for a significant share of supercomputer calculations. However, using these methods demonstrates poor performance on a multiprocessor computing, resulting in the tendency of annual real performance growth slowdown. This problem is attributable in large part to the high cost memory access, whose maximum speed is markedly lower than CPU speed. Generally, addressing the negative effects of performance disbalance is produced by the memory hierarchy design. This raises a problem of memory channel resource. The alternative to traditional multiprocessor architectures is FPGA-based reconfigurable computer systems (RCS). The memory channel resource problem is particularly relevant in FPGA, because a number of user input/output pins had dropped in subsequent generation. Using different data paralleling methods only compounds this problem. Considering the issue from the perspective of reconfigurable computer architectures allows you to get an idea of the computations arrangement using iteration-parallel method. It is important that the RCS-based implementation does not affect the original algorithm; user creates a computer architecture based on the information structure of the solving task. The article shows that application of this method is make it possible to reduce considerably the number of external data communication channel, which is one of the most reconfigurable computer system resource based on the linear algebra.

Keywords: Recjnfigurable computer system; Field-programmable gate arrays; Information graph; Linear algebra; Iteration-paralleling; Computing pipeline.


И. И. Левин, А. В. Пелипец (Научно-исследовательский институт многопроцессорных вычислительных систем им. акад. А. В. Каляева ЮФУ, Таганрог, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  


I. I. Levin, A. V. Pelipets (Acad. Kalyaev Scientific Research Institute of Multiprocessor Computer Systems of Southern Federal University, Taganrog, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  


1. Highlights from the Overall List [Электронный ресурс]. URL: http://www.top500.org/lists/2015/11/highlights/ (дата обращения: 16.04.2016).
2. Virtex-6 Family Overview. Xilinx, 2015. [Электронный ресурс]: офиц. сайт. URL: http://www.xilinx.com/ support/documentation/data_sheets/ds150.pdf (дата обращения: 16.05.2016).
3. 7 Series FPGAs Overview. Xilinx, 2015. [Электронный ресурс]: офиц. сайт. URL: http://www.xilinx.com/ support/documentation/data_sheets/ds180_7Series_Overview. pdf (дата обращения: 16.05.2016).
4. UltraScale Architecture and Product Overview. Xilinx, 2016. [Электронный ресурс]: офиц. сайт. URL: http://www.xilinx.com/support/documentation/data_sheets/ds890-ultrascale-overview.pdf (дата обращения: 16.05. 2016).
5. Реконфигурируемые мультиконвейерные вычислительные структуры / И.А. Каляев и др. Ростов н/Д: Изд-во ЮНЦ РАН, 2008. 393 с.
6. Решение задач с существенно-переменной интенсивностью потоков данных на реконфигурируемых вычислительных системах / И.И Левин и др. // Вестник компьютерных и информационных технологий. 2012. № 2. С. 49 – 56.
7. Высокопроизводительные реконфигурируемые вычислительные системы на основе ПЛИС VIRTEX-7 / И.И Левин и др. // Программная инженерия. 2014. № 6. С. 3 – 8.


1. Highlights from the overall list. Available at: http://www.top500.org/lists/2015/11/highlights/ (Accessed: 16.04.2016).
2. Virtex-6 family overview. (2015). Xilinx: official site. Available at: http://www.xilinx.com/support/ documentation/data_sheets/ds150.pdf (Accessed: 16.05.2016).
3. 7 Series FPGAs overview. (2015). Xilinx: official site. Available at: http://www.xilinx.com/ support/documentation/data_sheets/ds180_7Series_Overview. pdf (Accessed: 16.05.2016).
4. UltraScale architecture and product overview. (2016). Xilinx: official site. Available at: http://www.xilinx.com/support/documentation/data_sheets/ds 890-ultrascale-overview.pdf (Accessed: 16.05.2016).
5. Kaliaev I.A. et al. (2008). Reconfigurable multi pipeline computing structures. Rostov-on-Don: Izdatel'stvo IuNTs RAN. [in Russian language]
6. Levin I. I. (2012). Solving the tasks with considerably variable data flow density on reconfigurable computer systems. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (2), pp. 49-56. [in Russian language]
7. Levin I. I. et al. (2014). High reconfigurable computer system based on PLD VIRTEX-7. Programmnaia inzheneriia, (6), pp. 3-8. [in Russian language]


