АППРОКСИМАЦИЯ ЗАКОНА РАСПРЕДЕЛЕНИЯ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Конкретное содержание обработки одномерных ЭД зависит от поставленных целей исследования. В простейшем случае достаточно определить первый момент распределения, например, среднее время обработки запросов к распределенной базе данных. В других случаях требуется установить вероятностно-временные характеристики распределения, например, оценить вероятность своевременной обработки запросов или вероятность безотказной работы системы в течение заданного периода времени. Для нахождения таких значений требуется знание закона распределения как наиболее полной характеристики соответствующей случайной величины.

В классической математической статистике предполагается известным вид закона распределения и производится оценка значений его параметров по результатам наблюдений. Но обычно заранее вид закона распределения неизвестен, а теоретические предположения не позволяют его однозначно установить. Обработка ЭД также не позволит точно вычислить истинный закон распределения показателя. В таком случае следует говорить только об аппроксимации (приближенном описании) реального закона некоторым другим, который не противоречит ЭД и в каком-то смысле похож на этот неизвестный истинный закон.

В соответствии с этими положениями постановка задачи аппроксимации закона распределения ЭД формулируется следующим образом.

Имеется выборка наблюдений (x1, x2, …, xn) за случайной величиной Х . Объем выборки п фиксирован.

Необходимо подобрать закон распределения (вид и параметры), который бы в статистическом смысле соответствовал имеющимся наблюдениям.

Ограничения: выборка представительная, ее объем достаточен для оценки параметров и проверки согласованности выбранного закона распределения и ЭД; плотность распределения унимодальная.

Наличие в функции плотности распределения нескольких мод может быть следствием различных причин, например существованием различных по длине маршрутов прохождения запросов в системе обработки. Выборку с несколькими модами разделяют на составные части так, чтобы каждая из них имела одну моду. В последнем случае функция распределения исходной выборки представляет собой взвешенную сумму соответствующих функций отдельных выборок:,

где s – количество выборок, выбранное исходя из требований унимодальности распределения; pi – вероятность принадлежности элемента выборки к выборке i; Fi(x) – функция распределения выборки i.

Решение поставленной задачи аппроксимации осуществляется на основе применения «типовых» распределений, специальных рядов или семейств универсальных распределений [3, 7, 8, 9, 12].

Дата добавления: 2017-10-04 ; просмотров: 309 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

poznayka.org

Линейная аппроксимация

При обработке экспериментальных данных часто возникает необходимость аппроксимировать их линейной функцией.

Аппроксимацией (приближением) функции f(x) называется нахождение такой функции ( аппроксимирующей функции ) g(x) , которая была бы близка заданной. Критерии близости функций могут быть различные.

В случае если приближение строится на дискретном наборе точек, аппроксимацию называют точечной или дискретной .

В случае если аппроксимация проводится на непрерывном множестве точек (отрезке), аппроксимация называется непрерывной или интегральной . Примером такой аппроксимации может служить разложение функции в ряд Тейлора, то есть замена некоторой функции степенным многочленом.

Наиболее часто встречающим видом точечной аппроксимации является интерполяция – нахождение промежуточных значений величины по имеющемуся дискретному набору известных значений.

Пусть задан дискретный набор точек, называемых узлами интерполяции , а также значения функции в этих точках. Требуется построить функцию g(x) , проходящую наиболее близко ко всем заданным узлам. Таким образом, критерием близости функции является g(xi)=yi .

В качестве функции g(x) обычно выбирается полином, который называют интерполяционным полиномом .

В случае если полином един для всей области интерполяции, говорят, что интерполяция глобальная .

В случае если между различными узлами полиномы различны, говорят о кусочной или локальной интерполяции.

Найдя интерполяционный полином, мы можем вычислить значения функции между узлами, а также определить значение функции даже за пределами заданного интервала (провести экстраполяцию ).

Аппроксимация линейной функцией

Любая линейная функция может быть записана уравнением

Аппроксимация заключается в отыскании коэффициентов a и b уравнения таких, чтобы все экспериментальные точки лежали наиболее близко к аппроксимирующей прямой.

С этой целью чаще всего используется метод наименьших квадратов (МНК), суть которого заключается в следующем: сумма квадратов отклонений значения точки от аппроксимирующей точки принимает минимальное значение:

Решение поставленной задачи сводится к нахождению экстремума указанной функции двух переменных. С этой целью находим частные производные функции функции по коэффициентам a и b и приравниваем их к нулю.

Решаем полученную систему уравнений

Определяем значения коэффициентов

Для вычисления коэффициентов необходимо найти следующие составляющие:

Тогда значения коэффициентов будут определены как

Пример реализации

Для примера реализации воспользуемся набором значений, полученных в соответствии с уравнением прямой

y = 8 · x — 3

Рассчитаем указанные коэффициенты по методу наименьших квадратов.
Результат сохраняем в форме двумерного массива, состоящего из 2 столбцов.
При следующем запуске программы добавим случайную составляющую к указанному набору значений и снова рассчитаем коэффициенты.

prog-cpp.ru

Законы и аппроксимации как этапы дедукции

Когда научная концепция «приведена в порядок», то очевидно, что в концептуальном отношении принципы предшествуют законам. После анализа природы резонно обратиться к статусу законов. Следует различать гипотетические (дедуктивные) и индуктивные законы. Рассмотрение экспериментальных фактов позволяет в процессе индукции выявить законы. Их называют экспериментальными законами. Но индукция не является экспериментом. Строго говоря, выявленные в процессе индукции законы следует называть индуктивными, а не экспериментальными положениями. Часто ученые рассуждают об универсальных законах. Универсальные физические и химические законы выражаются так называемым «универсальным условным утверждением». Самый простой его тип записывается следующим образом:

[1] (12.7)

Это выражение читается следующим образом: для любого х, если х обладает признаком Р, то он обладает также признаком Q. Закон выражает связь признаков всех возможныхх, в связи с чем используются символьные значки переменных (), i пробегает ряд целочисленных значений от 1 до п, где п – общее число х.

В записи законов всегда используется представление о классе элементов. Элементы образуют определенный класс, если они обладают хотя бы одним общим признаком. Это условие выполняется. Закон имеет дело с классами элементов, а не с произвольной выборкой из их числа. В случае отказа от рассмотрения классов элементов наука приобрела бы исключительно необычный вид. История ее развития недвусмысленно свидетельствует о целесообразности рассмотрения именно классов элементов. Но это обстоятельство определяет далеко не очевидный статус научных законов.

Выше рассмотрено представление об универсальном законе. Как выясняется, оно не во всем удовлетворительно. В науке при встрече с ранее не изученными законами, строго говоря, руководствуются не универсальными, а гипотетико-дедуктив- ными законами. Они считаются справедливыми лишь для изучаемых явлений. Вполне допускается, что результаты познания вынудят отказаться от гипотетических законов. Таким образом, на них накладываются определенные ограничения.

Длительное время ученые считали, что гипотетические законы проверяются (подтверждаются) в экспериментах. Многое разъяснилось после выступлений критического рационалиста К. Поппера, который не уставал подчеркивать, что гипотетический закон не удостоверяется, а фальсифицируется. Критика Поппера была направлена против неопозитивистов, в частности, Р. Карнапа. Под натиском Поппера им пришлось отступить. Но, как ни странно, известную ошибку допускали обе стороны. Дело в том, что устанавливается индуктивный закон, а гипотетико-дедуктивный закон вводится посредством операции абдукции. И Карнап, и Поппер не проводили четкого различения между дедуктивными и индуктивными законами. Гипотетический закон фальсифицируется экспериментом. По отношению же к индуктивному закону эксперимент является его условием.

Переходим к рассмотрению дедуктивного перехода от гипотетических законов к предсказываемым фактам. В этой связи особое значение приобретает операция аппроксимации, о которой пойдет речь ниже.

Выше отмечалось, что «развертка» теории выступает как трансдукция. Применительно к квантовой химии это означает, что недостаточно всего лишь записать уравнение (закон) Шрёдингера, его еще и необходимо решить. История развития квантовой химии показывает, что в связи с этим невозможно обойтись без аппроксимаций (от лат. approximare – приближаться). Под аппроксимацией в науке обычно понимают выражение каких-либо величин через другие, признающиеся более простыми. Допустим, что рассматриваются N электронов. В рассматриваемом случае имеется в виду, что следует упрощать JV-электронную волновую функцию (N – число электронов) таким образом, чтобы она стала вычислимой. Обычно это обстоятельство интерпретируется так: при N > 2 корректное описание электронной волновой функции невозможно, поэтому не остается ничего другого, как перейти к упрощениям, сохранить теоретическое целомудрие невозможно, по крайней мере, при современном уровне науки.

По мнению автора, такого рода аргументация неглубока. Действительно, если бы был бы известен так называемый безупречно корректный подход, то можно было бы содержательно характеризовать отход от него. Но поскольку он неизвестен, то следует воздержаться от характеристики его противоположности, некорректного подхода. Теоретически содержательные аппроксимации следует понимать не как упрощения, а в качестве необходимых этапов трансдукции. В этом контексте тема упрощений имеет вторичное значение. В поддержку этого вывода приведем такой аргумент.

Достаточно часто используемые аппроксимации прекрасно согласуются с экспериментальными данными. В таком случае исследователям нет никакой нужды настаивать на их некорректности. Впрочем, эта идиллия непременно нарушается, и тогда приходится вводить более утонченные аппроксимации. Как это следует понимать? Как продолжение научной трансдукции, которая предполагает рост научного знания. Таким образом, так как трансдукцию невозможно реализовать без аппроксимаций, то они выступают ее вполне легитимными чертами. Рост научного знания вынуждает пересмотреть актуальность не всех аппроксимаций, а лишь тех их них, состоятельность которых оказалась опровергнутой. Динамику научного знания очень часто истолковывают как череду нескончаемых заблуждений. В действительности же она выступает вереницей достижений. Рост научного знания обеспечивают не заблуждения, а достижения.

Итак, аппроксимации следует интерпретировать не иначе, как в контексте трансдукции. Не случайно аппроксимации, как правило, являются результатом исключительно самозабвенной работы исследователей.

Центральное место среди всех используемых в квантовой химии аппроксимаций занимает метод Хартри – Фока, поэтому имеет смысл обратиться к нему в первую очередь.

Исторический экскурс

Весьма показательна история развития метода Хартри – Фока. Э. Шрёдингер записал свое знаменитое уравнение в 1926 г. Уже на следующий год Д. Хартри предложил метод для его решения. В этом методе волновая функция многоэлектронного атома представляется в виде произведения волновых функций отдельных электронов, соответствующих их различным квантовым состояниям в атоме. Движение каждого электрона определяется полем, создаваемым всеми другими частицами, усредненным определенным образом и задаваемым некоторыми потенциалами. Замысел Хартри состоял в стремлении дать решение уравнения Шрёдингера ab initio, то есть исходя из основополагающих квантово-механических принципов. Значимость его теоретических новаций была осознана далеко не сразу. Случилось это лишь после того, как Дж. Слэтер показал, что метод Хартри облекает в теоретическую форму вариационный принцип: одноэлектронные волновые функции выбираются из условия минимума средней энергии. В 1930 г. В. А. Фок усовершенствовал метод Хартри, придав волновым функциям форму симметрии, обеспечивающей выполнение принципа Паули, то есть он учел наличие у электронов спинов. В результате Фок увязал рассматриваемый метод с теорией групп. В 1935 г. Хартри сумел придать своему методу вид, пригодный для математических расчетов. Но их действенность выявилась лишь в начале 1950-х гг., после появления электронно-вычислительных машин. Таким образом, лишь через четверть века после первоначальной разработки метода Хартри – Фока выявилась его эффективность.

Электронное уравнение Шрёдингера для молекулярных систем часто разрешается в соответствии с так называемым методом валентных связей. В этом случае волновая функция молекулы выражается через волновые функции составляющих ее атомов. Каждой валентной связи отвечает не одноэлектронная, а двухэлектронная функция:

(12.8)

где X – пространственная, а σ – спиновая волновая функция, цифры 1 и 2 относятся к двум электронам.

При описании молекулярных систем, как правило, используются линейные комбинации волновых функций нескольких валентных связей. Коэффициенты в линейной комбинации определяют вариационным методом из условия минимума энергии.

Метод Хартри – Фока часто сопрягается с теорией возмущений, в рамках которой используется представление о невозмущенном, , и возмущенном, , гамильтониане. В качестве возмущения рассматривается разность между ними, а из поправок, зависящих от этой разности, учитываются лишь поправки низших порядков. Этого достаточно для получения результатов, совместимых с экспериментальными данными.

В теории молекулярных образований, содержащих многоэлектронные атомы, центральное место занимает метод функционала плотности. Основная цель теории функционала плотности состоит в замене многоэлектронной волновой функции электронной плотностью. Это ведет к существенному упрощению задачи, поскольку многоэлектронная волновая функция зависит от 3N переменных – по 3 пространственные координаты на каждый из N электронов, в то время как плотность является функцией всего лишь трех пространственных координат. Но этот метод корректен лишь в случае достаточно равномерного распределения электронной плотности. Его несомненное достоинство состоит в возможности расчета молекулярных систем, состоящих из сотен, а порой и тысяч атомов. Разумеется, при этом не обходится без использования различных приближений.

Теорию функционала плотности всегда подозревали в отходе от идеалов квантовой химии. Благодаря исследованиям П. Хоэнберга и В. Кона в значительной степени показана беспочвенность этих подозрений. Теория функционала плотности восходит к работам Л. Томаса 1927 г. и Э. Ферми 1928 г., сумевших по концепту электронной плотности рассчитать энергию атома. Считалось, что их метод был превзойден методом Хартри – Фока. Но желание справиться с расчетом многоэлектронной системы вынуждало химиков возвращаться к идеям Томаса и Ферми. Их квантовый характер во многом разъясняет вторая теорема Хоэнберга – Кона (1964 г.), согласно которой энергия электронной подсистемы, записанная как функционал электронной плотности, имеет минимум, равный энергии основного состояния, то есть она представляет собой вариационный принцип квантовой механики. Как доказывается в упомянутой теореме, волновая функция основного состояния Ф0 является функционалом электронной плотности в основном состоянии . Таким образом, концепты волновой функции и электронной плотности тесно связаны друг с другом. Это особенно очевидно для основного состояния, но не только для него. Интересно, что увлечение методом функционала плотности имеет два пика, разделенные промежутком в три десятка лет (1960-е и 1990-е гг.). В обоих случаях они были связаны с развитием вычислительной техники.

Достаточно беглый обзор химических методов [2] , проведенный автором, показывает нетривиальное содержание различных путей осуществления трансдукции в квантовой химии. Η. Ф. Степанов и Ю. В. Новаковская вполне правомерно указывают на необходимость проявления «должного внимания к тому, какие именно методы и в каком именно приближении могут и должны быть использованы при решении той или иной конкретной задачи» [3] . Путь от основополагающих законов, в частности уравнения Шрёдингера, до непосредственного контакта с экспериментальными данными и труден, и тернист. Здесь концептуальные неожиданности поджидают исследователя на каждом шагу. Но, что крайне существенно, все шаги дедукции сопряжены друг с другом.

К сожалению, очень часто трансдукцию на стадии дедукции сводят к использованию приближенных методов, якобы не соответствующих исходной строгости теории. Это ошибочное мнение рассматривается далее на примере определенных интерпретаций проблемы аппроксимаций в квантовой химии.

Ученые спорят

В этой связи исключительно большой интерес представляет статья В. Островского «Навстречу философии аппроксимаций в “точных” теориях» [4] . Правильно замечая, что проблеме аппроксимаций не уделяется должного внимания в философской литературе, он заканчивает свою статью следующими четырьмя выводами, которые здесь приведем в сокращенном виде.

1. Недопустимо рассматривать аппроксимации в качестве слабых мест «точных» наук, они в ней повсеместны. Этот вывод не опровергается наличием неоправданных приближений.

2. Научно оправданные аппроксимации – это не низшее в теориях, а отражение характеристик ее природы. Иерархия аппроксимаций создает уникальный путь воссоздания научных образов качественного характера.

3. Они являются наиболее значимыми результатами научных исследований, которые должны рассматриваться в философии науки в первую очередь.

4. Так называемые количественные методы и качественные образы, которым мы обязаны аппроксимациям, дополняют друг друга в смысле принципа дополнительности Бора.

По мнению автора, теория аппроксимаций Островского достойна высокой оценки. Разумеется, она, как и любое другое научное положение, заслуживает критического рассмотрения.

Согласно точке зрения Островского, все основополагающие научные концепты являются аппроксимациями. В частности, само уравнение Шрёдингера выступает в качестве приближения, ибо в нем не учитываются релятивистские эффекты. Можно их учесть, но тогда выяснится, что не учли размеры частиц и т.д. Все принципы также являются аппроксимациями. По мнению автора, аппроксимации занимают в трансдукции вполне определенное место, а именно, их час наступает тогда, когда совершается переход от принципов и законов к предсказываемым переменным. Крайне важно выразить метаморфозы дедукции, ее концептуальные переключения.

Мир науки не сводится всего лишь к аппроксимациям. Любая теория проблематична, а потому она заслуживает быть поставленной под огонь научной критики. Но нет никаких оснований отождествлять проблематичность теории с наличием ступеней аппроксимации в трансдукции.

В данном месте имеет смысл подчеркнуть целесообразность различения аппроксимаций и приближений. Их обычно отождествляют. Но в таком случае затрудняется постижение концептуального содержания трансдукции. Оперируя приближениями, исследователь сознательно, например, преследуя дидактические цели, отказывается от наиболее развитой теории, которая, тем не менее, витает перед его взором. Приближения – это, как правило, упрощения, отказ от рассмотрения определенных сторон изучаемой реальности. Смысл же аппроксимаций состоит не в упрощениях, а в продолжении линии трансдукции, начатой предъявлением принципов и законов. Аппроксимации освобождают от заторов на линии трансдукции.

Это обстоятельство осознается лишь в последние годы. Ярким примером такого понимания является рассматриваемая теория В. Островского. Исторически же случилось так, что аппроксимации не отличали от приближений, их смысл истолковывался в буквальном соответствии с этимологией латинского слова approximare, означающего приближение. Но в соответствии с научным строем теории аппроксимация выступает не приближением к закону (уравнению), а разверткой его потенциала. Рост научного знания приводит к переоценке уже предпринятых в процессе трансдукции аппроксимаций, но это обстоятельство не должно вводить в заблуждение. Смысл аппроксимаций и приближений различен.

В. Островский очень точно характеризует природу аппроксимаций на примере рассмотрения смысла аппроксимации Борна – Оппенгеймера, рассмотрения вопроса о наличии форм у молекул и их движения по орбитам. Его линия рассуждений, которую он называет реалистической, состоит в непременном замыкании проводимых им рассуждений характеристикой фактического положения дел. Это правильный способ аргументации, ибо недопустимо прерывать трансдукцию уже на подступах к осмыслению экспериментальных результатов. В этой связи Островский относится критически к концепту теоретического (субъективного, или идеального) артефакта, который является всего лишь подспорьем в деятельности исследователя, не имеющего прямого отношения к химической реальности.

Аппроксимация Борна – Оппенгеймера учитывает различие масс ядер и электронов () и их скоростей (). Если оба условия выполняются, то ядра считаются фиксированными, расположенными друг от друга на определенном расстоянии. Но если не выполняется условие , например, применительно к некоторым возбужденным состояниям молекул, то упомянутое расстояние перестает быть признаком атомов и молекул. Островский доказывает, что введение представления о признаках атомов и молекул всегда связано с некоторыми аппроксимациями, но все они не имеют абсолютного характера, ибо если они не соответствуют химической реальности, то от них следует отказаться.

Исключительно большой интерес вызвало у ученых понятие квантовой орбиты. Некоторые методологи химической науки стали утверждать, что они не существуют [5] , а являются всего лишь математическими конструктами и, следовательно, не могут быть наблюдаемыми [6] . И в оценке вопроса о реальности квантовых орбит позиция Островского представляется весьма взвешенной. Он отмечает, что в рамках аппроксимации Хартри – Фока, согласно которой каждый отдельный электрон движется под воздействием усредненного поля, образуемого нуклонами и другими электронами, представление о квантовых орбитах не только уместно, но и неизбежно. Оно имеет физический смысл. Что же касается наблюдений орбит, то они также возможны, например, в энергетическом приближении. О признаках химической реальности можно судить не иначе, как на основании аппроксимаций. С другой стороны, научно оправданная аппроксимация в той или иной форме свидетельствует о чертах самой реальности.

По мнению Островского, философское осмысление темы аппроксимаций предполагает обращение к принципу дополнительности Н. Бора. «“Точные” количественные методы и вдохновленные интуицией аппроксимации образуют дополнительную пару в универсальном смысле дополнительных отношений, существующих, по Нильсу Бору, в обществе и природе. В этом двойственном отношении количественные методы представляют более объективную сторону природы, тогда как качественные, порожденные аппроксимациями образы, остаются на субъективной стороне интерпретации природы исследователями. Очень часто мы прогрессируем в науке благодаря развитию методов аппроксимации» [7] . Несколько ранее Островский объясняет вводимую им дополнительность следующим образом: чем «точнее» уравнения, тем меньше их объяснительная сила. И, наоборот, чем выше эвристический потенциал аппроксимаций, тем они менее «точные».

По мнению автора, обращение В. Островского в попытке создать теорию аппроксимаций к принципу дополнительности Бора является философской ошибкой. Количественные и качественные определения не находятся в дополнительном, в смысле Бора, отношении друг к другу. Проще всего это можно показать, рассмотрев любую химическую переменную, например, массу атома того или иного химического элемента тi. В данном случае т – качество, а его i-я величина является количеством, mi – некоторая мера. Здесь нет отношения, предполагаемого принципом Бора, согласно которому одно уменьшается, а другое, наоборот, увеличивается. Суть дела не меняется при переходе к уравнениям, ибо в них фигурируют все те же переменные. Чем точнее решения, тем актуальнее знания о химической реальности. В данном случае нет оснований брать слово точнее в кавычки. Островский же всегда не забывает ставить слова точная (например, наука), точное (в частности, решение) в кавычки. В этом проявляется его осторожность, ибо он отлично понимает, что имеющих химический смысл точных решений не добиться без аппроксимаций. Но, обратившись к принципу Бора, В. Островский, забыв о необходимости научной бдительности, сопоставляет точное, количественное (в кавычках) с качественным (без кавычек). Только в этом случае получается столь привлекательная для него дополнительность. Несостоятельна также попытка Островского прописать объективное в основном по ведомству количества, а субъективное по ведомству качества. Эта попытка декларативна, ибо категории субъективного и объективного рассматриваются вскользь, без должной аргументации.

Отмеченные недостатки теории аппроксимаций В. Островского не отменяют ее несомненные достоинства. В его интерпретации аппроксимации выступают как далеко не рядовые концепты научной теории. Этот вывод, безусловно, заслуживает внимания. Но согласно аргументации автора, если мы хотим понять аппроксимации в систематической форме, то их следует рассматривать в контексте трансдукции. Впрочем, остаются существенные трудности в понимании внутреннего механизма трансдукции, в том числе и применительно к аппроксимациям. По мнению автора, ее следует понимать как разновидность вероятностно-игровой стратегии.

Заслуживает рассмотрения еще одна интерпретация аппроксимаций, а именно в качестве характеристики ограниченных возможностей познания. По мнению знаменитого американского физика и космолога Дж. Хартла, наше познание имеет пределы троякого рода: а) различие между наблюдаемым и предсказываемым (имеется в виду, что наблюдать мы можем очень сложные явления, а предсказывать относительно простые, ибо законы просты), б) невозможность обеспечить желаемый объем расчетов, в) ограниченные возможности познания теорий посредством индукции и их проверки [8] .

Отталкиваясь от идей Хартла, итальянский химик А. Тонтини стремится установить пределы химического познания, обращая особое внимание на невозможность синтезировать желаемую химическую субстанцию [9] . По мнению автора, и Хартл, и Тонтини не обращают должного внимания на одну крайне существенную тонкость. Так называемые ограничительные теоремы указывают не на границы возможностей наших познавательных способностей, а на устройство изучаемой реальности. Соотношение неопределенностей Гейзенберга характеризует сам химический мир, а не наши познавательные способности. Прогресс познания свидетельствует о его неограниченных возможностях. Ни в физике, ни в химии не указаны такие явления, познание которых недоступно человеку. Дилемма «мир сложензаконы просты» представляет собой не научное, а умозрительное противопоставление. На основе научного материала допустимо лишь сделать вывод, что сложный мир познается посредством научных законов, а само познание лишено каких- либо границ. Познание имеет незаконченный характер, это верно, но отсюда не следует вывод, что оно бессильно перед чем- либо. Аппроксимации выражают особенности изучаемых явлений, а не наше бессилие перед их сложностью.

Выводы

1. Законы и аппроксимации являются этапами дедукции в составе трансдукции.

2. Смысл аппроксимации состоит в обеспечении дедукции.

studme.org

Аппроксимация закон

Олейникова Светлана Александровна

доктор технических наук

доцент, Воронежский государственный технический университет

394026, Россия, г. Воронеж, Московский проспект, 14

Oleinikova Svetlana Aleksandrovna

Doctor of Technical Science

Associate Professor, Department of Automated and Computing Systems, Voronezh State Technical University

394026, Russia, g. Voronezh, Moskovskii prospekt, 14

Предметом исследования в данной работе является плотность распределения случайной величины, представляющей собой сумму конечного числа бета-величин, каждая из которых распределена в своем интервале со своими параметрами. Данный закон является широко распространенным в теории вероятностей и математической статистике, поскольку с его помощью могут быть описано достаточно большое число случайных явлений, в случае если значения соответствующей непрерывной случайной величины сосредоточены в определенном интервале. Поскольку искомая сумма бета величин не может быть выражена ни одним из известных законов, возникает задача об оценке ее плотности распределения. Целью работы является нахождение такой аппроксимации для плотности распределения суммы бета-величин, которая отличалась бы наименьшей погрешностью. Для достижения поставленной цели был проведен вычислительный эксперимент, в результате которого для заданного числа бета величин осуществлялось сравнение численного значения плотности распределения с аппроксимацией искомой плотности. В качестве аппроксимаций использовались нормальное и бета распределения. В результате экспериментального анализа были получены результаты, свидетельствующие о целесообразности аппроксимации искомого закона распределения законом бета. В качестве одной из областей применения полученных результатов рассмотрена задача управления проектами со случайной длительностью, где ключевую роль играет оценка времени выполнения проекта, который, в силу специфики предметной области, может быть описан с помощью суммы бета-величин.
Ключевые слова: случайная величина, бета-распределение, плотность распределения, нормальный закон распределения, сумма случайных величин, вычислительный эксперимент, рекурсивный алгоритм, аппроксимация, погрешность, PERT

Дата направления в редакцию:

The subject of the research in this paper is the probability density function (PDF) of the random variable, which is the sum of a finite number of beta values. This law is widespread in the theory of probability and mathematical statistics, because using it can be described by a sufficiently large number of random events, if the value of the corresponding continuous random variable concentrated in a certain range. Since the required sum of beta values can not be expressed by any of the known laws, there is the problem of estimating its density distribution. The aim is to find such approximation for the PDF of the sum of beta-values that would have the least error. To achieve this goal computational experiment was conducted, in which for a given number of beta values the numerical value of the PDF with the approximation of the desired density were compared. As the approximations it were used the normal and the beta distributions. As a conclusion of the experimental analysis the results, indicating the appropriateness the approximation of the desired law with the help of the beta distribution, were obtained. As one of the fields of application of the results the project management problem with the random durations of works is considered. Here, the key issue is the evaluation of project implementation time, which, because of the specific subject area, can be described by the sum of the beta values.

random value, beta distribution, density function, normal distribution, the sum of random variables, computational experiment, recursive algorithm, approximation, error, PERT

Рассматривается задача оценки закона распределения суммы бета-величин. Это универсальный закон, с помощью которого можно описать большинство случайных явлений с непрерывным законом распределения. В частности, в подавляющем числе случаев исследования случайных явлений, которые могут быть описаны одномодальными непрерывными случайными величинами, лежащими в определенном диапазоне значений, такую величину можно аппроксимировать законом бета. В связи с этим задача отыскания закона распределения суммы бета-величин не только носит научный характер, но и представляет определенный практический интерес. При этом, в отличие от большинства законов распределения, закон бета не обладает уникальными свойствами, позволяющими аналитически описать искомую сумму. Более того, специфика данного закона такова, что извлечение кратного определенного интеграла, необходимого при определении плотности суммы случайных величин, крайне затруднительно, и результат представляет собой достаточно громоздкое выражение уже при n=2, причем с увеличением числа слагаемых сложность конечного выражения повышается многократно. В связи с этим, возникает задача аппроксимации плотности распределения суммы бета-величин с минимальной погрешностью.

В данной работе представлен подход к нахождению аппроксимации для искомого закона путем вычислительного эксперимента, позволяющего для каждого конкретного случая сравнить погрешность, получаемую путем оценки интересующей плотности с помощью наиболее подходящих законов: нормального и бета. В результате сделан вывод о целесообразности оценки суммы бета-величин с помощью бета-распределения.

В общем случае закон бета определяется плотностью, заданной в интервале [0,1] следующим образом [2, 5] :

Однако, практический интерес представляют, как правило, бета-величины, определенные в произвольном интервале [a,b]. В первую очередь это связано с тем, что круг практических задач в данном случае гораздо шире, а, в во-вторых, при нахождении решения для более общего случая, получить результат для частного случая, который будет определяться случайной величиной (1), не будет представлять никакой трудности. Поэтому в дальнейшем будем рассматривать случайные величины, определенные на произвольном интервале. В этом случае задачу можно сформулировать следующим образом.

Рассматривается задача оценки закона распределения случайной величины, представляющей собой сумму случайных величин `xi_(i) ,` i=1,…,n, каждая из которых распределена по закону бета в интервале [a i ,b i ] с параметрами p i и q i. Плотность распределения отдельных слагаемых будет определяться по формуле:

Частично задача поиска закона суммы бета величин уже была решена ранее. В частности, в [4] были получены формулы, позволяющие оценить сумму двух бета величин, каждая из которых определена с помощью (1). В [9] предложен подход к поиску сумму двух случайных величин с законом распределения (2).

Однако, в общем случае исходная задача не решена. Это связано в первую очередь со спецификой формулы (2), не позволяющей получить компактные и удобные для использования формулы при нахождении плотности от суммы случайных величин. Действительно, для двух величин `xi_1` и `xi_2` искомая плотность будет определяться следующим образом:

В случае сложения n случайных величин получается кратный интеграл. При этом для данной задачи возникают сложности, связанные со спецификой бета-распределения. В частности, уже для n=2 использование формулы (3) приводит к весьма громоздкому результату, который определяется через гипергеометрические функции [1] . Повторное взятие интеграла от полученной плотности, которое необходимо делать уже при n=3 и выше, крайне затруднительно. При этом не исключены погрешности, которые неизбежно возникнут при округлении и расчете столь сложного выражения. В связи с этим возникает необходимость в поиске аппроксимации для формулы (3), позволяющей применять известные формулы с минимальной погрешностью.

Для анализа специфики искомой плотности распределения был проведен эксперимент, позволяющий собрать статистические сведения о случайной величине, представляющей собой сумму наперед заданного числа случайных величин, имеющих распределение бета с заданными параметрами. Более подробно постановка эксперимента была описана в [6] . Варьируя параметрами отдельных бета-величин, а также их количеством, в результате большого числа проведенных опытов пришли к следующим выводам.

1. Если отдельные случайные величины, входящие в сумму, имеют симметричные плотности, то гистограмма итогового распределения имеет вид, близкий к нормальному. Также близки к нормальному закону оценки числовых характеристик итоговой величины (математическое ожидание, дисперсия, асимметрия и эксцесс).

2. Если отдельные случайные величины асимметричны (как с положительной, так и с отрицательной асимметрией), но суммарная асимметрия равна 0, то с точки зрения графического представления и числовых характеристик полученный закон распределения также близок к нормальному.

3. В остальных случаях искомый закон визуально близок к закону бета. В частности, сумма пяти асимметричных случайных величин представлена на рисунке 1.

Рисунок 1 — Сумма пяти одинаково асимметричных случайных величин

Таким образом, на основании проведенного эксперимента можно выдвинуть гипотезу о возможной аппроксимации плотности суммы бета-величин нормальным или бета распределением.

Для подтверждения данной гипотезы и выбора единственного закона для аппроксимации проведем следующий эксперимент. Задав количество случайных величин, имеющих бета-распределение, а также их параметры, найдем численное значение искомой плотности и сравним его с плотностью соответствующего нормального или бета-расределения. Для этого потребуется:

1) разработать алгоритм, позволяющий численно оценить плотность суммы бета-величин;

2) при заданных параметрах и количестве исходных величин определить параметры итогового распределения в предположении о нормальном или бета распределении;

3) определить погрешность аппроксимации нормальным распределением или распределением бета.

Рассмотрим данные задачи более подробно. Численный алгоритм отыскания плотности суммы бета-величин основан на рекурсии. Сумму n произвольных случайных величин можно определить следующим образом:

`eta_(n)=xi_(1)+. +xi_(n)=eta_(n-1)+xi_(n)` , (4)

Аналогичным образом можно описать плотность распределения случайной величины `eta_(n-1)` :

`eta_(n-1)=xi_(1)+. +xi_(n-1)=eta_(n-2)+xi_(n-1)` , (6)

Продолжая аналогичные рассуждения и используя формулу (3), получим:

`f_(eta_(n))(x)=int_-prop^prop(f_(xi_(n-1))(x-x_(n-1))*int_-prop^prop(f_(xi_(n-2))(x_(n-1)-x_(n-2)). int_-prop^propf_(xi_(2))(x_(2)-x_(1))dx_(1). )dx_(n-2))dx_(n-1). (7)`

Более подробно эти рассуждения, а также специфика определения плотности для величин, имеющих распределение бета, приведены в [11] .

Параметры итогового закона распределения определяются, исходя из предположения о независимости случайных величин. В этом случае математическое ожидание и дисперсия их суммы будут определяться по формулам:

Для нормального закона параметры а и `sigma` будут непосредственно определяться по формулам (8) и (9). Для бета распределения предварительно необходимо рассчитать нижнюю и верхнюю границу. Их можно определить следующим образом: ` `

Здесь ai и bi – границы интервалов отдельных слагаемых. Далее составим систему уравнений, включающих в себя формулы для математического ожидания и дисперсии бета-величины:

Здесь `xi` — случайная величина, описывающая искомую сумму. Ее математическое ожидание и дисперсия определяются формулами (8) и (9); параметры a и b — формулами (10) и (11). Решив систему (12) относительно параметров p и q, будем иметь:

Далее необходимо численно оценить погрешность аппроксимации плотности суммы случайных величин, имеющих распределение бета, нормальным законом и законом бета. Для этого воспользуемся формулой:

Здесь `hatf(x)` — аппроксимация суммы бета-величин; `f_(eta)(x)` — закон распределения суммы бета-величин.

Будем последовательно менять параметры отдельных бета-величин для оценки погрешностей. В частности, будет представлять интерес следующие вопросы:

1) насколько быстро сумма бета-величин сходится к нормальному распределению, и возможна ли оценка суммы другим законом, который будет иметь минимальную погрешность относительно истинного закона распределения суммы бета-величин;

2) насколько сильно увеличивается погрешность при увеличении асимметрии составляющих бета-величин;

3) как будет изменяться погрешность в случае, если интервалы распределения бета-величин сделать различными.

Общую схему алгоритма эксперимента для каждых отдельных значений параметров бета-величин, можно представить следующим образом (рисунок 2).

Рисунок 2 — Общая схема алгоритма эксперимента

— PogBeta – погрешность, возникающая из-за аппроксимации итогового закона бета-распределением в интервале [ti,ti+1];

— PogNorm — погрешность, возникающая из-за аппроксимации итогового закона нормальным распределением в интервале [ti,ti+1];

— ItogBeta – итоговое значение погрешности, возникающей из-за аппроксимации итогового распределения законом бета;

— ItogNorm – итоговое значение погрешности, возникающей из-за аппроксимации итогового распределения нормальным законом.

Проанализируем результаты эксперимента, описанного ранее.

Динамика уменьшения погрешностей при увеличении числа слагаемых представлена ни рисунке 3. По оси абсцисс приведено число слагаемых, а по оси ординат – величина погрешности. Здесь и далее ряд «Норм» показывает изменение прогрешности нормальным распределением, ряд «Бета» — бета — распределением.

Рисунок 3 — Уменьшение погрешностей при уменьшении числа слагаемых

Как видно из данного рисунка, для двух слагаемых погрешность аппроксимации законом бета примерно в 4 раза ниже, чем погрешность аппроксимации нормальным законом распределения. Очевидно, что при увеличении слагаемых погрешность аппроксимации нормальным законом уменьшается гораздо быстрее, чем законом бета. Можно также предположить, что при очень большом числе слагаемых аппроксимация нормальным законом будет иметь меньшую погрешность, чем аппроксимация бета-распределением. Однако, с учетом значения величины погрешности в этом случае можно делать вывод, что с точки зрения числа слагаемых бета-распределение является предпочтительным.

На рисунке 4 представлена динамика изменения погрешностей при увеличении асимметрии случайных величин. Без ограничения общности, параметр p всех исходных бета-величин, был зафиксирован со значением 2, а по оси абсцисс представлена динамика изменения параметра q+1. По оси ординат на графиках представлена погрешность аппроксимации. Результаты эксперимента с другими значениями параметров в целом аналогичны.

В данном случае также очевидна предпочтительность аппроксимации суммы бета-величин бета-распределением.

Рисунок 4 — Изменение погрешностей аппроксимаций при увеличении асимметрии величин

Далее анализировалось изменение погрешностей при изменении размаха исходных бета-величин. На рисунке 5 приведены результаты измерения погрешности для суммы четырех бета-величин, три из которых распределены в интервале [0,1] , а размах четвертой последовательно увеличивается (он отложен по оси абсцисс).

Рисунок 5 — Изменение погрешностей при изменении интервалов распределения случайных величин

На основании графических иллюстраций, приведенных на рисунках 3-5, а также с учетом данных, полученных в результате эксперимента, можно сделать вывод о целесообразности использования бета – распределения для аппроксимации суммы бета-величин.

Как показали полученные результаты, в 98% случаев погрешность при аппроксимации исследуемой величины законом бета будет ниже, чем, при аппроксимации нормальным распределении. Средняя величина погрешности аппроксимации бета будет зависеть в первую очередь от ширины интервалов, на которых распределено каждое слагаемое. При этом от симметричности случайных величин, а также от количества слагаемых данная оценка (в отличие от нормального закона) зависит крайне незначительно.

Одной из областей применения полученных результатов является задача управления проектами. Проект представляет собой совокупность взаимно-зависимых последовательно-параллельных работ со случайной длительностью обслуживания. В этом случае длительность проекта будет представлять собой случайную величину. Очевидно, что оценка закона распределения данной величины представляет интерес не только на этапах планирования, но и при анализе возможных ситуаций, связанных с несвоевременным завершением всех работ. С учетом того, что запаздывание проекта может привести к самым разнообразным неблагоприятным ситуациям, в том числе, штрафам, оценка закона распределения случайной величины, описывающей длительность проекта, представляется крайне важной практической задачей.

В настоящее время для такой оценки используется метод PERT [2, 3] . Согласно его предположениям, длительность проекта представляет собой нормально распределенную случайную величину `eta` с параметрами:

`a=sum_(i=1)^k Meta_(i)` , (16)

`sigma=sqrt(sum_(i=1)^k D eta_(i))` . (17)

Здесь k — количество работ, стояших на критическом пути проекта; `eta_(1)` . `eta_(k)` — длитлеьности этих работ.

Рассмотрим корректировку метода PERT с учетом полученных результатов. В данном случае будем предполагать, что длительность проекта распределена по закону бета с параметрами (13) и (14).

Примерим полученные результаты на практике. Рассмотрим проект, заданный сетевым графиком, представленным на рисунке 6.

Рисунок 6 — Пример сетевого графика

Здесь ребрами графа обозначены работы, весами ребер обозначены номера работ; вершины в квадратах – события, означающие начало или окончание работ. Пусть работы заданы длительностями, приведенными в таблице 1.

Таблица 1 — Временные характеристики работ проекта

e-notabene.ru

Это интересно:

  • Водительские удостоверения иностранных граждан в рф Водительское удостоверение иностранного гражданина в России: действие, использование, обмен Главный документ любого водителя — это права. В России водительское удостоверение (ВУ) — это документ установленного образца в виде […]
  • Производные основные правила Найти производную: алгоритм и примеры решений Операция отыскания производной называется дифференцированием. В результате решения задач об отыскании производных у самых простых (и не очень простых) функций по определению производной […]
  • Кнопка возврата на сайте Веб-дизайн и поисковая оптимизация Вебдизайн с jQuery - это очень просто! • Фотогалерея jQuery - просто и красиво! • Фотогалерея jQuery со слайд-шоу • Фотогалерея для интернет магазина • Фотогалерея prettyPhoto • Фотогалерея […]
  • Налог на имущество организаций сроки оплаты Сроки уплаты налога на имущество организаций в 2017-2018 годах Сроки уплаты налога на имущество организаций определяют региональные законодательные органы. Рубрика «Уплата налога на имущество организаций» призвана помочь вам […]
  • Налог на прибыль организации нк рф ставки Ст. 284 НК РФ (2017): вопросы и ответы Отправить на почту Ст. 284 НК РФ: официальный текст Ст. 284 НК РФ: вопросы и ответы Ст. 284 НК РФ определяет ставки налога на прибыль. В статье мы ответим на основные вопросы по «прибыльным» […]
  • Приказ на должность бригадира Приказ на должность бригадира Приказ о назначении на должность входит в проект приказов по личному составу. Он является основным документом, который определяет служебное положение сотрудников организации. Приказ о назначении служит […]