10.14489/vkit.2020.12.pp.014-019 |
DOI: 10.14489/vkit.2020.12.pp.014-019 Шиловский Г. В., Юлкова В. М. Аннотация. Рассмотрена проблема совершенствования основного инструмента искусственного интеллекта – глубоких нейронных сетей. Обучение глубоких нейронных сетей с помощью наиболее часто применяемого алгоритма обратного распространения ошибки считается неправдоподобным с биологической точки зрения. Учитывая сегодняшний интерес к нейронным сетям и их многочисленным применениям, тематика статьи актуальна. Описана возможность повышения эффективности классификации объектов в задачах распознавания изображений с помощью относительно простых вариантов реализации нейронных сетей. Приведены исследования нейронных сетей с сетями с одним скрытым слоем и биологически правдоподобными правилами обучения, предпочтительно с использованием всплывших нейронов, на примере известного набора данных МNISТ. Для описания эффективности классификации приведены сравнения с помощью различных методов. Ключевые слова: неглубокие сети; сети с одним скрытым слоем; глубокое обучение; правила местного обучения; необучаемая функция обучения.
Shilovskii G. V., Yulkova V. M. Abstract. Learning deep neural networks using the backpropagation algorithm is considered implausible from a biological point of view. Numerous recent publications offer sophisticated models for biologically plausible deep learning options that typically define success as achieving a test accuracy of around 98 % in the MNIST dataset. Here we examine how far we can go in the classification of numbers (MNIST) with biologically plausible rules for learning in a network with one hidden layer and one reading layer. The weights of the hidden layer are either fixed (random or random Gabor filters), or are trained by uncontrolled methods (analysis of main/independent components or sparse coding), which can be implemented in accordance with local training rules. The paper shows that high dimensionality of hidden layers is more important for high performance than global functions retrieved by PCA, ICA, or SC. Tests on the CIFAR10 object recognition problem lead to the same conclusion, indicating that this observation is not entirely problem specific. Unlike biologically plausible deep learning algorithms that are derived from the backpropagation algorithm approximations, we have focused here on shallow networks with only one hidden layer. Globally applied, randomly initialized filters with fixed weights/Gabor coefficients (RP/RGs) of large hidden layers result in better classification performance than training them with unsupervised methods such as principal/independent analysis (PCA/ICA) or sparse coding (SC). Therefore, the conclusion is that uncontrolled training does not lead to better performance than fixed random projections or Gabor filters for large hidden layers. Keywords: Non-deep networks; Networks with one hidden layer; Deep learning; Local learning rules; Untrained learning function.
РусГ. В. Шиловский (Общество с ограниченной ответственностью «Эксперт-Центр», Архангельск, Россия) E-mail:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
EngG. V. Shilovskii (Engineering Company Limited Liability Company “Expert-Center”, Arkhangelsk, Russia) E-mail:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. LeCun Y., Cortes C. The MNIST Database of Handwritten Digits [Электронный ресурс]. 1998. URL: http://yann.lecun.com/ exdb/mnist/ (дата обращения: 29.11.2020). Eng1. LeCun Y., Cortes C. (1998). The MNIST Data-base of Handwritten Digits. Available at: http://yann.lecun.com/exdb/mnist/ (Accessed: 29.11.2020)
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2020.12.pp.014-019 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2020.12.pp.014-019 and fill out the
.
|