Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна

В этом разделе для множеств непрерывных функций, замкнутых относительно любой нелинейной операции (а не только для колец), доказана обобщенная аппроксимационная теорема Стоуна. Это интерпретируется как утверждение о универсальных аппроксимационных возможностях произвольной нелинейности: с помощью линейных операций и каскадного соединения можно из произвольного нелинейного элемента получить устройство, вычисляющее любую непрерывную функцию с любой наперед заданной точностью.

Рассмотрим компактное пространство X и алгебру C(X) непрерывных функций на X с вещественными значениями.

Кроме аппроксимации функций многочленами и их обобщениями из колец функций, разделяющих точки, в последнее время все большее внимание уделяется приближению функций многих переменных с помощью линейных операций и суперпозиций функций одного переменного. Такое приближение осуществляется специальными формальными "устройствами" - нейронными сетями. Каждая сеть состоит из формальных нейронов. Нейрон получает на входе вектор сигналов x, вычисляет его скалярное произведение на вектор весов a и некоторую функцию одного переменного

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. Результат рассылается на входы других нейронов или передается на выход. Таким образом, нейронные сети вычисляют суперпозиции простых функций одного переменного и их линейных комбинаций.

Доказан ряд теорем [1.8, 1.9, 1.10] об аппроксимации непрерывных функций многих переменных нейронными сетями с использованием практически произвольной непрерывной функции одного переменного. В данном разделе мы покажем, что эта функция действительно может быть произвольной и докажем обобщенную теорему Стоуна, естественным образом охватывающую и классическую теорему Стоуна, и аппроксимацию функций многих переменных суперпозициями и линейными комбинациями функций одного переменного.

Чтобы получить требуемое обобщение, перейдем от рассмотрения колец функций к изучению их алгебр, замкнутых относительно некоторой нелинейной унарной операции.

Пусть

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

- линейное пространство, C(R) - пространство непрерывных функций на действительной оси R,

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

- нелинейная функция и для любого

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

выполнено

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

В этом случае будем говорить, что E замкнуто относительно нелинейной унарной операции f.

Очевидный пример: множество функций n переменных, которые можно точно представить, используя заданную функцию одного переменного и линейные функции, является линейным пространством, замкнутым относительно нелинейной унарной операции f.

Замечание. Линейное пространство

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

замкнуто относительно нелинейной операции f(x)=x2 тогда и только тогда, когда E является кольцом.

Действительно,

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

поэтому для линейного пространства

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

замкнутость относительно унарной операции f(x)=x2 равносильна замкнутости относительно произведения функций.

Согласно приведенному замечанию, теорема Стоуна может быть переформулирована так.

Пусть

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

- замкнутое линейное подпространство в C(X),

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, функции из E разделяют точки в X и E замкнуто относительно нелинейной унарной операции f(x)=x2. Тогда E=C(X) .

Наше обобщение теоремы Стоуна состоит в замене f(x)=x2 на произвольную нелинейную непрерывную функцию.

Теорема 1. Пусть

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

- замкнутое линейное подпространство в C(X),

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, функции из E разделяют точки в X и E замкнуто относительно нелинейной унарной операции

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. Тогда E=C(X) .

Доказательство. Рассмотрим множество всех таких

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, что

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, то есть для любого

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

выполнено:

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. Обозначим это множество PE. Оно обладает следующими свойствами:

PE - полугруппа относительно суперпозиции функций;
PE - замкнутое линейное подпространство в C(R) (в топологии равномерной сходимости на компактах);
$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$
и
$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$
.
PE включает хоть одну непрерывную нелинейную функцию.

Дальнейшее следует из теоремы 2, которая является, по существу, подготовительной теоремой о полугруппах функций.

В этом случае будем говорить, что E замкнуто относительно нелинейной унарной операции f.

Очевидный пример: множество функций n переменных, которые можно точно представить, используя заданную функцию одного переменного и линейные функции, является линейным пространством, замкнутым относительно нелинейной унарной операции f.

Замечание. Линейное пространство

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

поэтому для линейного пространства

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

- замкнутое линейное подпространство в C(X),

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

- замкнутое линейное подпространство в C(X),

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, функции из E разделяют точки в X и E замкнуто относительно нелинейной унарной операции

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. Тогда E=C(X) .

Доказательство. Рассмотрим множество всех таких

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, что

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, то есть для любого

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

выполнено:

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. Обозначим это множество PE. Оно обладает следующими свойствами:

PE - полугруппа относительно суперпозиции функций;
PE - замкнутое линейное подпространство в C(R) (в топологии равномерной сходимости на компактах);
$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$
и
$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$
.
PE включает хоть одну непрерывную нелинейную функцию.

Дальнейшее следует из теоремы 2, которая является, по существу, подготовительной теоремой о полугруппах функций.

Теорема 2. Пусть множество

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

удовлетворяет условиям 1-4. Тогда P=C(R).

Доказательство опирается на три леммы.

Лемма 1. В условиях теоремы 2 существует дважды непрерывно дифференцируемая функция

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, не являющаяся линейной.

Доказательство. Пусть

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, v(x)=0 при |x|>1,

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. Рассмотрим оператор осреднения

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

Для любого ?>0 выполнено:

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

.

Действительно,

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

для каждого фиксированного y ((т.к. константы принадлежат E и E замкнуто относительно линейных операций и суперпозиции функций).

Интеграл

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. принадлежит E, так как E является замкнутым линейным подпространством в C(R), а этот интеграл пределом конечных сумм.

Функция

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

принадлежит

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

так как

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

(напомним, что v – функция с компактным носителем).

Существует такое ?>0, что функция

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

не является линейной, поскольку

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

не является линейной, поскольку

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, пространство линейных функций замкнуто, а f не является линейной функцией. Таким образом, в предположениях леммы существует нелинейная функция

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, которую можно выбрать в виде

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

Лемма 2. Пусть в условиях теоремы 2 существует дважды непрерывно дифференцируемая функция

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

, не являющаяся линейной. Тогда функция q(x)=x2 принадлежит P.

Доказательство. Существует точка x0, для которой

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. Обозначим r(x)=2(g(x+x0)-g(x0)-xg'(x0))/g''(x0). Очевидно, что

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

. Поэтому

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

при

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

.

Поскольку P замкнуто, получаем: функция q(x)=x2принадлежит P.

Лемма 3. Пусть в условиях теоремы 2 функция q(x)=x2 принадлежит P. Тогда P является кольцом - для любых

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

их произведение

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

.

Доказательство. Действительно,

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

и, так как P замкнуто относительно суперпозиции и линейных операций, то

$Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна$

.

Доказательство теоремы 2 заканчивается обращением к классической теореме Вейерштрасса о приближении функций многочленами: из лемм 1-3 следует, что в условиях теоремы 2 P является кольцом и, в частности, содержит все многочлены (которые получаются из 1 и id с помощью умножения и линейных операций). По теореме Вейерштрасса отсюда следует, что P=C(R) .

Теоремы 1,2 можно трактовать как утверждения о универсальных аппроксимационных свойствах любой нелинейности: с помощью линейных операций и каскадного соединения можно из произвольных нелинейных элементов получить любой требуемый результат с любой наперед заданной точностью.

Содержание раздела