28 оценка значимости уравнения регрессии и значимости коэффициентов уравнения регрессии

Оценка значимости уравнения регрессии. Коэффициент детерминации

Проверить значимость уравнения регрессии — значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

Проверка значимости уравнения регрессии производится на основе дисперсионного анализа.

В математической статистике дисперсионный анализ рассмотрен как самостоятельный инструмент (метод) статистического анализа.

Здесь же он применяется как вспомогательное средство для изучения качества регрессионной модели.

Согласно основной идее дисперсионного анализа (см., § 2.9)

где Q — общая сумма квадратов отклонений зависимой переменной от средней, a Qr и Qe соответственно сумма квадратов, обусловленная регрессией, и остаточная сумма квадратов, характеризующая влияние неучтенных факторов 1 .

Убедимся в том, что пропущенное в (3.41) третье слагаемое

/=1 [1] [2]

(с учетом соотношения (3.31)).

Схема дисперсионного анализа имеет вид, представленный в табл. 3.3.

Число степеней свободы

Средние квадраты и s (табл. 3.3) представляют собой несмещенные оценки дисперсий зависимой переменной, обусловленных соответственно регрессий или объясняющей переменной X и воздействием неучтенных случайных факторов и ошибок; т — число оцениваемых параметров уравнения регрессии; п — число наблюдений.

Замечание. При расчете общей суммы квадратов Q полезно иметь в виду, что

  • (Формула (3.42) следует из разложения
  • ?? = Х(У/ )=’Zy? +пу с учетом (3.8).)

При отсутствии линейной зависимости между зависимой и объясняющими(ей) переменными случайные величины s r = Qr /( т

О и s 1= Qe/(n—m) имеют /^-распределение соответственно с т— 1 и п

т степенями свободы, а их отношение — ^-распределение с теми же степенями свободы (см. § 2.3). Поэтому уравнение регрессии значимо на уровне а, если фактически наблюдаемое значение статистики

где Fa.*,.*2 — табличное значение /’-критерия Фишера—

Снедекора, определенное на уровне значимости а при к=т

и ki=n—m степенях свободы.

Учитывая смысл величин si и $ 2 , можно сказать, что значение F показывает, в какой мере регрессия лучше оценивает значение зависимой переменной по сравнению с ее средней.

В случае линейной парной регрессии т = 2, и уравнение регрессии значимо на уровне а, если

Следует отметить, что значимость уравнения парной линейной регрессии может быть проведена и другим способом, если оценить значимость коэффициента регрессии Ь, который, как отмечено в § 3.4. имеет /-распределение Стьюдента с к—п—2 степенями свободы.

Уравнение парной линейной регрессии или коэффициент регрессии Ь значимы на уровне а (иначе — гипотеза #о о равенстве параметра Pi нулю, т. е. Я0: Pi=0, отвергается), если фактически наблюдаемое значение статистики (3.37)

больше критического (по абсолютной величине), т. е.

Можно показать, что для парной линейной модели оба способа проверки значимости с использованием F- и /-критериев равносильны, ибо эти критерии связаны соотношением F= / 2 .

В ряде прикладных задач требуется оценить значимость коэффициента корреляции г (§ 3.3). При этом исходят из того, что

при отсутствии корреляционной связи статистика / — —=-

имеет /-распределение Стьюдента с п — 2 степенями свободы.

Коэффициент корреляции г значим на уровне а (иначе — гипотеза Я0 о равенстве генерального коэффициента корреляции р нулю, т. е. Но: р=0, отвергается), если

где /|_а;„_2— табличное значение /-критерия Стьюдента, определенное на уровне значимости а при числе степеней свободы п— 2.

Легко показать, что получаемые значения /-критерия для проверки гипотез р=0 по (3.45) и р=0 по (3.46) одинаковы.

По данным табл. 3.1 оценить на уровне а=0,05 значимость уравнения регрессии У по X

Решение. 1-й способ. Выше, в примерах 3.1, 3.2 были 10 10

найдены: ? У,- = 68, = 49(3.

Вычислим необходимые суммы квадратов по формулам (3.40), (3.42):

По таблице /^распределения (табл. IV приложений) /o.o5;i;8 = 4,20. Так как />/Ь,о5;1;8> то Уравнение регрессии значимо.

2-й способ. Учитывая, что />i = l,016, ^(jc, -х) = 24,40,

s 2 = 1,049 (см. пример 3.3, табл. 3.2), по формуле (3.45)

По таблицам /-распределения (табл. II приложений) /0 95:8 = 2,31. Так как / > /Ь,95;8> то коэффициент регрессии Ь9 а значит, и уравнение парной линейной регрессии Кпо X значимы. ? Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии, (или, как [3]

говорят, мерой качества подгонки регрессионной модели к наблюденным значениям уд, характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации, определяемый по формуле

Величина R 2 показывает, какая часть (доля) вариации зависимой переменной обусловлена вариацией объясняющей переменной.

Так как 0 2 2 к единице, тем лучше регрессия аппроксимирует эмпирические данные, тем теснее наблюдения примыкают к линии регрессии. Если R 2 = 1, то эмпирические точки (х,, уд лежат на линии регрессии (см. рис. 3.3) и между переменными Y и X существует линейная функциональная зависимость. Если R 2 = 0, то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных, и линия регрессии параллельна оси абсцисс (см. рис. 3.4).

Заметим, что коэффициент R 2 имеет смысл рассматривать только при наличии свободного члена в уравнении регрессии, так как лишь в этом случае, как уже отмечалось, верно равенство (3.41), а следовательно, и (3.47).

Если известен коэффициент детерминации /? 2 , то критерий значимости (3.43) уравнения регрессии или самого коэффициента детерминации может быть записан в виде

В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, т. е. R 2 = r 2 . Действительно, учитывая (3.12), (3.17),

По данным табл. 3.1 найти коэффициент детерминации и пояснить его смысл.

Решение. В примере 3.4 было получено Qr =25,21, 0= 33,6.

По формуле (3.47) R 2 =^- = ^^- = 0,750. (Коэффициент

детерминации можно было вычислить и иначе, если учесть, что в примере 3.2 был вычислен коэффициент корреляции /-0,866. Тогда Д 2 =Я=0,866 2 =0,750.)

Это означает, что вариация зависимой переменной У — сменной добычи угля на одного рабочего — на 75,0% объясняется изменчивостью объясняющей переменной X — мощностью пласта. ?

Пример нахождения статистической значимости коэффициентов регрессии

Числитель в этой формуле может быть рассчитан через коэффициент детерминации и общую дисперсию признака-результата: .
Для параметра a критерий проверки гипотезы о незначимом отличии его от нуля имеет вид:
,
где — оценка параметра регрессии, полученная по наблюдаемым данным;
μa – стандартная ошибка параметра a.
Для линейного парного уравнения регрессии:
.
Для проверки гипотезы о незначимом отличии от нуля коэффициента линейной парной корреляции в генеральной совокупности используют следующий критерий:
, где ryx — оценка коэффициента корреляции, полученная по наблюдаемым данным; mr – стандартная ошибка коэффициента корреляции ryx.
Для линейного парного уравнения регрессии:
.
В парной линейной регрессии между наблюдаемыми значениями критериев существует взаимосвязь: t ( b =0) = t (r=0).

Пример №1 . Уравнение имеет вид y=ax+b
1. Параметры уравнения регрессии.
Средние значения

Коэффициент детерминации
R 2 = 0.73 2 = 0.54, т.е. в 54% случаев изменения х приводят к изменению y . Другими словами — точность подбора уравнения регрессии — средняя.

xyx 2y 2x ∙ yy(x)(y-y cp ) 2(y-y(x)) 2(x-x p ) 2
691244761153768556128.48491.3620.11367.36
8313368891768911039141.4173.3670.5626.69
9214684642131613432149.70.0313.7114.69
9715394092340914841154.3246.691.7378.03
8813877441904412144146.0166.6964.210.03
9315986492528114787150.63164.6970.1323.36
7414554762102510730133.11.36141.68200.69
7915262412310412008137.7134.03204.2184.03
105168110252822417640161.7476.6939.74283.36
9915498012371615246156.1661.364.67117.36
8512772251612910795143.25367.36263.9110.03
9415588362402514570151.5578.0311.9134.03
105817549452025833815578817541961.67906.571239.67
2. Оценка параметров уравнения регрессии
Значимость коэффициента корреляции

По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (10;0.05) = 1.812
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически — значим.

Анализ точности определения оценок коэффициентов регрессии

S a = 0.2704
Доверительные интервалы для зависимой переменной

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 88,16
(128.06;163.97)
Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) t-статистика

Статистическая значимость коэффициента регрессии a подтверждается (3.41>1.812).

Статистическая значимость коэффициента регрессии b подтверждается (2.7>1.812).
Доверительный интервал для коэффициентов уравнения регрессии
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими (tтабл=1.812):
(a — tтабл·S a; a + tтабл·Sa)
(0.4325;1.4126)
(b — tтабл·S b; b + tтабл·Sb)
(21.3389;108.3164)
2) F-статистики

Fkp = 4.96
Поскольку F > Fkp, то коэффициент детерминации статистически значим.

Пример №2 . По территориям региона приводятся данные за 199Х г.;

Номер регионаСреднедушевой прожиточный минимум в день одного трудоспособного, руб., хСреднедневная заработная плата, руб., у
178133
282148
387134
479154
589162
6106195
767139
888158
973152
1087162
1176159
12115173
Требуется:
1. Построить линейное уравнение парной регрессии у от х.
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции.
4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х , составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

Решение находим с помощью калькулятора.
Использование графического метода .
Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс — индивидуальные значения факторного признака X.
Совокупность точек результативного и факторного признаков называется полем корреляции.
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Здесь ε — случайная ошибка (отклонение, возмущение).
Причины существования случайной ошибки:
1. Невключение в регрессионную модель значимых объясняющих переменных;
2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
3. Неправильное описание структуры модели;
4. Неправильная функциональная спецификация;
5. Ошибки измерения.
Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
1) по наблюдениям xi и yi можно получить только оценки параметров α и β
2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Для оценки параметров α и β — используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
Для наших данных система уравнений имеет вид
12a+1027b=1869
1027a+89907b=161808
Из первого уравнения выражаем а и подставим во второе уравнение. Получаем b = 0.92, a = 76.98
Уравнение регрессии: y = 0.92 x + 76.98

1. Параметры уравнения регрессии.
Выборочные средние.

Коэффициент корреляции
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 0 – прямая связь, иначе — обратная). В нашем примере связь прямая.
Коэффициент эластичности.
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.
Для этих целей вычисляются коэффициенты эластичности и бета — коэффициенты. Коэффициент эластичности находится по формуле:

Он показывает, на сколько процентов в среднем изменяется результативный признак у при изменении факторного признака х на 1%. Он не учитывает степень колеблемости факторов.
Коэффициент эластичности меньше 1. Следовательно, при изменении среднедушевого прожиточного минимума в день на 1%, среднедневная заработная плата изменится менее чем на 1%. Другими словами — влияние среднедушевого прожиточного минимума Х на среднедневную заработную плату Y не существенно.
Бета – коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:

Т.е. увеличение x на величину среднеквадратического отклонения этого показателя приведет к увеличению средней среднедневной заработной платы Y на 0.721 среднеквадратичного отклонения этого показателя.
1.4. Ошибка аппроксимации.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.

Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.
Коэффициент детерминации.
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R 2 = 0.72 2 = 0.5199, т.е. в 51.99 % случаев изменения среднедушевого прожиточного минимума х приводят к изменению среднедневной заработной платы y. Другими словами — точность подбора уравнения регрессии — средняя. Остальные 48.01% изменения среднедневной заработной платы Y объясняются факторами, не учтенными в модели.

xyx 2y 2x·yy(x)(y i — y ) 2(y-y(x)) 2(x i — x ) 2|y-y x |:y
7813360841768910374148,77517,56248,757,510,1186
8214867242190412136152,4560,0619,8212,840,0301
8713475691795611658157,05473,06531,482,010,172
7915462412371612166149,693,0618,5743,340,028
8916279212624414418158,8939,069,6411,670,0192
106195112363802520670174,541540,56418,52416,840,1049
671394489193219313138,65280,560,1258345,340,0026
8815877442496413904157,975,060,00075,840,0002
7315253292310411096144,1714,0661,34158,340,0515
8716275692624414094157,0539,0624,462,010,0305
7615957762528112084146,9310,56145,791,840,0759
115173132252992919895182,83297,5696,55865,340,0568
102718698990729437716180818693280,251574,922012,920,6902
2. Оценка параметров уравнения регрессии.
2.1. Значимость коэффициента корреляции.

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=10 находим tкрит:
tкрит = (10;0.05) = 1.812
где m = 1 — количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически — значим.
В парной линейной регрессии t 2 r = t 2 b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

2.3. Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:

S 2 y = 157.4922 — необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

12.5496 — стандартная ошибка оценки (стандартная ошибка регрессии).
S a — стандартное отклонение случайной величины a.

Sb — стандартное отклонение случайной величины b.

2.4. Доверительные интервалы для зависимой переменной.
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения.
Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.
Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.
(a + bxp ± ε)
где
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X p = 94

(76.98 + 0.92*94 ± 7.8288)
(155.67;171.33)
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.
2.5. Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
1) t-статистика. Критерий Стьюдента.
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.
tкрит = (10;0.05) = 1.812

Поскольку 3.2906 > 1.812, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Поскольку 3.1793 > 1.812, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(b — tкрит Sb; b + tкрит Sb)
(0.9204 — 1.812·0.2797; 0.9204 + 1.812·0.2797)
(0.4136;1.4273)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a-ta)
(76.9765 — 1.812·24.2116; 76.9765 + 1.812·24.2116)
(33.1051;120.8478)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
2) F-статистики. Критерий Фишера.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R 2 =0 на уровне значимости α.
2. Далее определяют фактическое значение F-критерия:

где m=1 для парной регрессии.
3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=10, Fkp = 4.96
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим (Найденная оценка уравнения регрессии статистически надежна).

Оценка значимости коэффициентов уравнения регрессии

Оценку значимости коэффициентов уравнения регрессии при равномерном дублировании опытов в каждой строке плана производят с помощью критерия Стьюдента. Для этого определяют доверительный интервал

Если абсолютное значение рассматриваемого выборочного коэффициента будет равно или превысит доверительный интервал

то коэффициент Ц считается значимым. При Ab; >|bj| коэффициент является незначимым, и его вместе с фактором, при котором он находится, не следует вводить в уравнение регрессии.

Здесь А — уровень значимости; f — число степеней свободы средней дисперсии опыта (дисперсии воспроизводимости)

t(Af ^ — табличное значение критерия Стьюдента при А уровне значимости f степенями свободы средней дисперсии опыта (приложение 1.3),

— среднеквадратичная ошибка в определении выборочных коэффициентов уравнения регрессии,

дисперсия оценок выборочных коэффициентов уравнения регрессии,

— средняя дисперсия опыта (дисперсия воспроизводимости, дисперсия исследуемого параметра) при равномерном дублировании опытов.

При использовании планов без дублирования в каждой строке плана оценку значимости коэффициентов при повторении опытов в центре факторного пространства производят по критерию Стью- дента следующим образом.

Значения критерия Стьюдента

Число степеней свободы fv

Уровни значимости а

Число степеней свободы fy

Уровни значимости а

Значение критерии Фишера для уровней значимости 0,05 (верхняя строка) и 0,01 (нижняя строка)

  • 161
  • 4052
  • 200
  • 4999
  • 216
  • 5403
  • 225
  • 5625
  • 230
  • 5764
  • 234
  • 5859
  • 237
  • 5928
  • 239
  • 5981
  • 241
  • 6022
  • 242
  • 6056
  • 244
  • 6082
  • 246
  • 6169
  • 248
  • 6208
  • 249
  • 6234
  • 18,51
  • 98,49
  • 19.00
  • 99.01
  • 19.16
  • 99.17
  • 19.25
  • 99.25
  • 19.30
  • 90.30
  • 19.33
  • 99.33
  • 19,36
  • 99,94
  • 19,37
  • 99,36
  • 19.38
  • 99.38
  • 19,30
  • 99,40
  • 19.41
  • 99.42
  • 19.43
  • 99.44
  • 19.44
  • 99.45
  • 19.45
  • 99.46
  • 10,19
  • 31,12
  • 9,55
  • 30,81
  • 9,28
  • 29,46
  • 9,12
  • 28,71
  • 9,01
  • 28,24
  • 8,94
  • 27,91
  • 8,88
  • 27,67
  • 8,84
  • 27,29
  • 8,87
  • 27,34
  • 8,77
  • 27,23
  • 8,74
  • 27,05
  • 8,69
  • 26,83
  • 8,66
  • 26,69
  • 8,64
  • 26,60
  • 7,71
  • 21,20
  • 6,59
  • 18,00
  • 6,59
  • 16,69
  • 6,39
  • 15,98
  • 6,26
  • 15,52
  • 6,16
  • 15,51
  • 6,09
  • 14,98
  • 6,04
  • 14,80
  • 6,06
  • 14,66
  • 5,95
  • 14,54
  • 5,91
  • 14,37
  • 5,84
  • 14,15
  • 5,80
  • 14,02
  • 5,77
  • 13,93
  • 6,61
  • 16,26
  • 5,79
  • 13,27
  • 5,41
  • 12,06
  • 5,19
  • 11,39
  • 5,05
  • 10,97
  • 4,95
  • 10,67
  • 4,88
  • 10,45
  • 4,82
  • 10,27
  • 4,78
  • 10,15
  • 4,74
  • 10,05
  • 4,68
  • 9,89
  • 4,60
  • 9,68
  • 4,56
  • 9,55
  • 4,53
  • 9,47
  • 5,99
  • 13,74
  • 5,14
  • 10,92
  • 4,76
  • 9,98
  • 4,53
  • 9,15
  • 4,39
  • 8,75
  • 4,28
  • 8,47
  • 4,21
  • 8,26
  • 4,15
  • 8,10
  • 4,10
  • 7,98
  • 4,06
  • 7,87
  • 4,00
  • 7,72
  • 3,92
  • 7,52
  • 3,87
  • 7,39
  • 3,84
  • 7,31
  • 6,59
  • 12,25
  • 4,74
  • 9,55
  • 4,35
  • 8,45
  • 4,12
  • 7,85
  • 3,98
  • 7,46
  • 3,87
  • 7,19
  • 3,79
  • 7,00
  • 3,73
  • 6,84
  • 3,68
  • 6,71
  • 3,63
  • 6,62
  • 3,57
  • 6,47
  • 3,49
  • 6,27
  • 3,44
  • 6,15
  • 3,41
  • 6,07
  • 5,32
  • 11,26
  • 4,46
  • 6,65
  • 4,07
  • 7,59
  • 3,84
  • 7,01
  • 5,69
  • 9,66
  • 3,58
  • 6,37
  • 3,50
  • 6,19
  • 3,44
  • 6,06
  • 3,39
  • 5,91
  • 3,04
  • 5,02
  • 3,26
  • 5,67
  • 3,20
  • 5,46
  • 3,15
  • 5,36
  • 3,12
  • 5,289
  • 5,12
  • 10,56
  • 4,26
  • 8,02
  • 3,86
  • 6,99
  • 3,63
  • 6,42
  • 3,46
  • 6,06
  • 3,37
  • 5,80
  • 3,29
  • 5,62
  • 5,28
  • 5,47
  • 3,18
  • 5,35
  • 3,13
  • 5,26
  • 3,07
  • 5,11
  • 2.98
  • 4.98
  • 2,93
  • 4,80
  • 2,90
  • 4,37
  • 4,96
  • 10,04
  • 4,10
  • 7,56
  • 3,71
  • 6,55
  • 3,48
  • 5,99
  • 1,02
  • 4,95
  • 2,97
  • 4,85
  • 2,91
  • 4,71
  • 2,82
  • 4,52
  • 2,77
  • 4,41
  • 2,74
  • 4,33
  • 4,54
  • 8,08
  • 3,68
  • 6,36
  • 3,29
  • 5,42
  • 3,06
  • 4,89
  • 2,90
  • 4,56
  • 2,79
  • 4,32
  • 2,70
  • 4,14
  • 2,64
  • 4,00
  • 2,59
  • 3,89
  • 2,55
  • 3,80
  • 2,48
  • 3,67
  • 2,39
  • 3,48
  • 2,33
  • 3,36
  • 2.29
  • 3.29
  • 4,35
  • 8,10
  • 3,49
  • 5,85
  • 3,10
  • 4,94
  • 2,87
  • 4,43
  • 2,71
  • 4,10
  • 2,60
  • 3,87
  • 2,52
  • 3,71
  • 2,45
  • 3,56
  • 2,40
  • 3,45
  • 2,35
  • 3,37
  • 2,18
  • 3,05
  • 2,12
  • 2,94
  • 2,08
  • 2,86
  • 4,16
  • 7,56
  • 3,92
  • 5,39
  • 2,92
  • 4,51
  • 2,69
  • 4,02
  • 2,53
  • 3,70
  • 2,42
  • 3,47
  • 2,34
  • 3„30
  • 2,27
  • 3,17
  • 2,21
  • 3,06
  • 2,16
  • 2,98
  • 2,09
  • 2,84
  • 1,99
  • 2,66
  • 1,93
  • 2,55
  • 1,89
  • 2,47
  • 4,03
  • 5,06
  • 3,18
  • 5,06
  • 2,79
  • 4,20
  • 2,56
  • 3,72
  • 2.40
  • 3.41
  • 2,29
  • 3,18
  • 2,20
  • 3,02
  • 2,13
  • 2,88
  • 2,07
  • 2,78
  • 2,02
  • 2,70
  • 1,95
  • 2,56
  • 1,85
  • 2,39
  • 1,78
  • 2,26
  • 1,74
  • 2,18

Расчет средней дисперсии опыта в этом случае проводят по формуле:

где т0 — число повторений опытов в центе факторного пространства; Уор — результат опыта при т0 повторении; У0 — среднеарифметическое значение из всех опытов, проведенных в центре факторного пространства; fyo — число степеней свободы средней дисперсии опыта

Но так как количество независимых опытов в центе факторного пространства равно no = 1, то

Дисперсия оценок выборочных коэффициентов уравнения регрессии будет равна:

В итоге с учетом формул (1.26, 1.27) можно определить все элементы, входящие в формулу (18) для расчета доверительного интервала АЬ;.

Затем из соотношения (1.19) определяют значимость каждого выборочного коэффициента. Результаты расчета и оценки значимости выборочных коэффициентов уравнения регрессии вносят в табл. 1.11.

Пример. При проведении исследований с применением ПФЭ типа 2 3 в каждой строке плана проводилось по одному опыту, но в центре факторного пространства опыты были повторены четыре раза.

В табл. 1.12 в качестве примера приведены исходные данные для расчета дисперсии S 2 yo на основе опытов, выполненных на нулевом уровне факторов по план-матрице, приведенной в табл. 1.9.

Результаты расчета и оценки значимости выборочных коэффициентов

Выборочный коэффициент значим (+), незначим (-)

Расчет средней дисперсии опыта S 2 yo будет проводиться по формуле (1.24), в которой fyo для данного случая равно

Опыты дублированы в центре эксперимента то раз (то = 4), по которым была определена одна константа У0. Таким образом,

Исходные данные для расчета дисперсии

(число 0,01 взято из колонки 4 табл. 1.12).

Дисперсию оценок выборочных коэффициентов рассчитывали по формуле (1.27) S 2 b; = 0,0033 -s- 4 = 0,0008. Отсюда S 2 bj = 0,028. Учитывая, что число степеней свободы средней дисперсии опыта равна трем; по приложению 1.4 определяем t(0,05; 3) = 3,18. Отсюда доверительный интервал равен ДЬ = 3,18 0,28 = 0,089. Коэффициенты, абсолютные значения которых превышают доверительный интервал, будут в соответствии с соотношением (1.19) значимыми.

Пример. Для линейной модели, приведенной в таблице 1.11. критерий Стьюдента при 5% уровне значимости, с числом степеней свободы fy = 4(2 — 1) = 4 будет равен t(0,05; 4) = 2,7764. Зная, что S 2 yu = = 1,56, по формуле (1.23) определяем S 2 y = 0,39, по формуле (1.22) рассчитываем S 2 b; = 0,39-^8 = 0,0487 (здесь п = 4 и т = 2), а по формуле (1.21) определяем Sbi = 70,0487 =0,221.

В итоге при п = 4 доверительный интервал (см. формулу (1.18) будет равен Abj = 2,7764 • 0,221 = 0,6136. Сопоставляя коэффициенты b0,b,,b2 с доверительным интервалом, можно видеть, что |Ь()| = |20| > 0,6136; |b, | = |5| > 0,6136; |b21 = |2| > 0,6136. Таким образом, все вышеуказанные коэффициенты являются значимыми и должны войти в уравнение регрессии. Однако коэффициент Ь12 является незначимым, так как |b12| = |0,5| 2 , может привести к уравнениям регрессии вида:

Любой выборочный коэффициент уравнения регрессии, кроме Ьо может оказаться незначимым.

Незначимые коэффициенты должны быть оценены, исходя из существа изучаемого метода обработки, так как незначимость коэффициента может определяться малым интервалом варьирования изучаемого фактора, но не отсутствием его влияния на функцию отклика.


источники:

http://math.semestr.ru/corel/prim3.php

http://studref.com/477226/tehnika/otsenka_znachimosti_koeffitsientov_uravneniya_regressii