12 | 03 | 2025

DOI: 10.14489/vkit.2020.12.pp.014-019

Шиловский Г. В., Юлкова В. М.
(с. 14-19)

Аннотация. Рассмотрена проблема совершенствования основного инструмента искусственного интеллекта – глубоких нейронных сетей. Обучение глубоких нейронных сетей с помощью наиболее часто применяемого алгоритма обратного распространения ошибки считается неправдоподобным с биологической точки зрения. Учитывая сегодняшний интерес к нейронным сетям и их многочисленным применениям, тематика статьи актуальна. Описана возможность повышения эффективности классификации объектов в задачах распознавания изображений с помощью относительно простых вариантов реализации нейронных сетей. Приведены исследования нейронных сетей с сетями с одним скрытым слоем и биологически правдоподобными правилами обучения, предпочтительно с использованием всплывших нейронов, на примере известного набора данных МNISТ. Для описания эффективности классификации приведены сравнения с помощью различных методов.

Ключевые слова:  неглубокие сети; сети с одним скрытым слоем; глубокое обучение; правила местного обучения; необучаемая функция обучения.


Shilovskii G. V., Yulkova V. M.
(pp. 14-19)

Abstract. Learning deep neural networks using the backpropagation algorithm is considered implausible from a biological point of view. Numerous recent publications offer sophisticated models for biologically plausible deep learning options that typically define success as achieving a test accuracy of around 98 % in the MNIST dataset. Here we examine how far we can go in the classification of numbers (MNIST) with biologically plausible rules for learning in a network with one hidden layer and one reading layer. The weights of the hidden layer are either fixed (random or random Gabor filters), or are trained by uncontrolled methods (analysis of main/independent components or sparse coding), which can be implemented in accordance with local training rules. The paper shows that high dimensionality of hidden layers is more important for high performance than global functions retrieved by PCA, ICA, or SC. Tests on the CIFAR10 object recognition problem lead to the same conclusion, indicating that this observation is not entirely problem specific. Unlike biologically plausible deep learning algorithms that are derived from the backpropagation algorithm approximations, we have focused here on shallow networks with only one hidden layer. Globally applied, randomly initialized filters with fixed weights/Gabor coefficients (RP/RGs) of large hidden layers result in better classification performance than training them with unsupervised methods such as principal/independent analysis (PCA/ICA) or sparse coding (SC). Therefore, the conclusion is that uncontrolled training does not lead to better performance than fixed random projections or Gabor filters for large hidden layers.

Keywords: Non-deep networks; Networks with one hidden layer; Deep learning; Local learning rules; Untrained learning function.


Г. В. Шиловский (Общество с ограниченной ответственностью «Эксперт-Центр», Архангельск, Россия)
В. М. Юлкова (Северный (Арктический) федеральный университет имени М. В. Ломоносова», Архангельск, Россия)



G. V. Shilovskii (Engineering Company Limited Liability Company "Expert-Center", Arkhangelsk, Russia)
V. M. Yulkova (Northern (Arctic) Federal University named after M. V. Lomonosov, Arkhangelsk, Russia)



