10.14489/vkit.2025.01.pp.003-014 |
DOI: 10.14489/vkit.2025.01.pp.003-014 Гордеев Н. М., Сгибнев И. В., Вишняков Б. В. Аннотация. С ростом размеров и сложности нейросетевых моделей возникает потребность в оптимизации их работы. Исследован новый алгоритм прунинга U-Pruner, направленный на эффективное сжатие нейросетевых моделей при сохранении их высокой точности. Применяя традиционные методы прунинга, специалисты часто сталкиваются с трудностями в сохранении точности или с необходимостью увеличения вычислительных ресурсов. В алгоритме U-Pruner используется последовательный прунинг блоков нейронной сети с последующим дообучением лучших экземпляров модели. При этом малозначимые параметры удаляются без потери ключевой информации, обеспечивается оптимальный баланс между степенью сжатия и точностью модели. Эксперимент показал, что U-Pruner превосходит традиционные методы прунинга на таких архитектурах, как MobileNetV2 и ResNet34. При сжатии модели на 10, 50 и 80 % этот алгоритм сохраняет высокую точность и демонстрирует наилучшие результаты среди аналогов. Благодаря своей универсальности и эффективности U-Pruner может быть применен для решения широкого спектра задач компьютерного зрения, включая классификацию, регрессию, сегментацию и детектирование. Предлагаемый подход открывает новые возможности для оптимизации нейросетевых моделей, делая их более доступными для использования в условиях ограниченных вычислительных ресурсов. Ключевые слова: прунинг; сверточная нейронная сеть; классификация; регрессия; сегментация; детектирование.
Gordeev N. M., Sgibnev I. V., Vishniakov B. V. Abstract. With the increasing size and complexity of neural network models the optimization of their performance has become an increasingly relevant challenge. Traditional pruning methods often face difficulties in maintaining accuracy or require significant computational resources. In this paper, a new pruning algorithm, U-Pruner, is introduced, which is designed to efficiently compress neural network models while preserving their high accuracy. In U-Pruner, neural network blocks are sequentially pruned, followed by fine-tuning of the best instances of the model. This approach allows insignificant parameters to be removed without losing key information, ensuring that an optimal balance between compression ratio and model accuracy is achieved. Experimental results have shown that U-Pruner outperforms traditional pruning methods on architectures such as MobileNetV2 and ResNet34. When models are compressed by 10 %, 50 %, and 80 %, high accuracy is maintained by U-Pruner, demonstrating the best results among its peers. Notably, when ResNet34 is compressed by 80 %, a decrease in model accuracy of only 3 % is observed, which significantly surpasses the results of other methods. Due to its versatility and efficiency, U-Pruner can be applied to a wide range of computer vision tasks, including classification, regression, segmentation, and detection. New opportunities for optimizing neural network models are opened by the proposed approach, making them more accessible for use in resource-constrained environments. Keywords: Pruning; Convolutional neural network; Classification; Regression; Segmentation; Detection.
РусН. М. Гордеев, И. В. Сгибнев, Б. В. Вишняков (Федеральное автономное учреждение «Государственный научно-исследовательский институт авиационных систем», Москва, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngN. M. Gordeev, I. V. Sgibnev, B. V. Vishniakov (State Research Institute of Aviation Systems, Moscow, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Lee N., Ajanthan T., Torr P. H. S. Snip: Single-shot network pruning based on connection sensitivity //arXiv preprint arXiv:1810.02340. 2018. Eng1. Lee N., Ajanthan T., Torr P. H. S. Snip: Single-shot network pruning based on connection sensitivity. arXiv preprint arXiv:1810.02340. 2018.
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 700 руб. (в том числе НДС 20%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2025.01.pp.003-014 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 700 rubles. (including VAT 20%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2025.01.pp.003-014 and fill out the
.
|