Эмпирическое корреляционное отношение определяется по формуле. Эмпирическое корреляционное отношение рассчитывается по формуле

3. Эмпирическое корреляционное отношение рассчитывается по формуле

Межгрупповая дисперсия, характеризующая величину из квадрат отклонения групповых средних от общего среднего результативного признака.

Общая дисперсия, показывающая среднюю величину из квадратов отклонений значения результативного признака от их среднего уровня.

Построим таблицу для вычисления общей дисперсии (см. табл.8)

Таблица 8

Таблица данных для определения общей дисперсии

N,п/п Расходы на продукты питания
1 21 441
2 16 256
3 26,1 681,21
4 28 784
5 26 676
6 22,5 506,25
7 27,6 761,76
8 35 1225
9 23,9 571,21
10 22,5 506,25
11 15 225
12 25,2 635,04
13 29 841
14 21,4 457,96
15 24,9 620,01
16 24,8 615,04
17 16 256
18 23,6 556,96
19 27,2 739,84
20 35 1225
21 17 289
22 23,8 566,44
23 22,6 510,76
24 25 625
25 27 729
26 30 900
27 35 1225
28 25,4 645,16
29 27,2 739,84
30 26,3 691,69
Всего 750 19502,42

Общая дисперсия результативного признака вычисляется по формуле:

=

Межгрупповая дисперсия вычисляется по формуле:

Построим вспомогательную таблицу для вычисления данных (см. табл.9)


Таблица 9

Таблица данных для расчета межгрупповой дисперсии

Номер группы Количество домохозяйств, шт Расходы на продукты питания, тыс.руб
Всего В среднем на одно домохозяйство
f
1 28-40 3 48 16 -9 81 243
2 40-52 5 105 21 -4 16 80
3 52-64 12 300 25 0 0 0
4 64-76 6 165 27,5 2,5 6,25 37,5
5 76-88 4 132 33 8 64 256
Всего 30 750 616,5

Вывод: связь между факторами весьма тесная, т.к. принимает значения от 0,9 до 0,99.

Коэффициент детерминации – это квадрат эмпирического корреляционного отношения. Следовательно,

(81,9%)

Вывод: выпуск продукции на данных предприятиях на 81,9% зависит от фондоотдачи и на 18,1 % от других факторов.

Задание 3

По результатам выполнения задания 1 с вероятностью 0,9543 определите:

1. Ошибку выборки среднего валового дохода на одного члена домохозяйства в год и границы, в которых будет он находиться в генеральной совокупности.

2. Ошибку выборки доли домохозяйств с уровнем валового дохода менее 52 тыс руб. и более млн. руб. и границы, в которых будет находиться генеральная доля.

1. Ошибка выборки для средней определяем по формуле:

, где

дисперсия выборочной совокупности;

n- численность выборки;

t- коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной вероятности. В данном случае при Р=0,954 значение t=2.

N-число единиц в генеральной совокупности, N=6000 шт.

Рассчитаем дисперсию. Данные представим в виде таблицы (см. табл.11).

Таблица 11

Данные для расчета дисперсии уровня фондоотдачи

Номер группы Группировка домохозяйств по валовому доходу Количество домохозяйств, шт
f
1 28-40 3 34 -25,1 630,01 1890,03
2 40-52 5 46 -13,1 171,61 858,05
3 52-64 12 58 -1,1 1,21 14,52
4 64-76 6 70 10,9 118,81 712,86
5 76-88 4 82 22,9 524,41 2097,64
Всего 30 5573,1

Корреляционный анализ предполагает измерение тесноты связи с помощью коэффициента корреляции и корреляционного отношения. При линейной форме зависимости силу связи оценивает коэффициент корреляции Пирсона :

Коэффициент корреляции изменяется в пределах от (– 1) до (+ 1), (– 1 r 1).

Отрицательный знак показателя свидетельствует об обратной связи, положительный – о прямой связи. Чем ближе значение показателя к единице, по модулю, тем связь сильнее, чем ближе к нулю, тем связь слабее.

Для измерения силы связи при любой форме зависимости, как линейной, так и нелинейной, а также для оценки множественной связи применяют теоретическое корреляционное отношение (индекс корреляции). В основе его расчета лежит правило сложения дисперсии:

где общая дисперсия – отражает вариацию результативного признака за счет всех действующих на него факторов;

или

факторная дисперсия , отражает вариацию результативного признака за счет фактора (х) .

остаточная дисперсия , отражает вариацию результативного признака за счет всех факторов, кроме фактора (х) ;

Теоретическое корреляционное отношение – это корень квадратный из отношения факторной дисперсии к общей дисперсии:

Подкоренное выражение – коэффициент детерминации :

показывает долю вариации результативного признака, обусловленную влиянием факторного признака, в общей вариации. Чем эта доля выше, тем связь между признаками сильнее.

Теоретическое корреляционное отношение изменяется от 0 до 1 (0 R 1) .Чем значение показателя ближе к единице, тем связь сильнее.

Для оценки тесноты связи можно воспользоваться шкалой Чеддока :

Основная тенденция развития и методы ее выявления

Каждый ряд динамики имеет свою тенденцию развития, т.е. общее направление к росту, снижению или стабилизации уровня явления с течением времени. Степень выраженности этой тенденции зависит от влияния постоянных, периодических (сезонных) и случайных факторов на уровни ряда динамики. Поэтому следует говорить не просто о тенденции развития, а об основной тенденции.

Основной тенденцией развития (трендом) называется плавное и устойчивое изменение уровня явления во времени, свободное от периодических и случайных колебаний .

Для выявления тренда ряды динамики подвергаются обработке методами укрупнения интервалов, скользящей средней, аналитического выравнивания.

Метод укрупнения интервалов основан на укрупнении периодов времени, к которым относятся уровни ряда динамики. Для этого исходные данные объединяются, т.е. суммируются или усредняются за более продолжительные интервалы времени, пока общая тенденция развития не станет достаточно отчетливой. Например, дневные данные о производстве продукции объединяются в декадные, месячные в квартальные, годовые в многолетние. Достоинство метода в его простоте. Недостаток в том, что сглаженный ряд существенно короче исходного.

Метод скользящей средней состоит в том, что на основе исходных данных рассчитываются подвижные средние из определенного числа сначала первых по счету уровней ряда, затем из такого же числа уровней, начиная со второго, с третьего и т.д. Средняя величина как бы скользит по динамическому ряду, передвигаясь на один интервал. В скользящих средних сглаживаются случайные колебания.

Схема расчета 3-х уровневой скользящей средней величины

Интервал времени

(номер по порядку)

Фактические уровни ряда динамики

у i

Скользящие средние

у ск

у 1

у 2

у 3

у 4

у ск3

у 5

у ск4

у 6

Сглаженный ряд динамики короче исходного на величину (l – 1) , если укрупнение производится по нечетному числу уровней, где l – длина периода укрупнения. Например, если l = 3, то выровненный ряд на 2 уровня короче. Таким образом сглаженный ряд не на много короче исходного.

Метод аналитического выравнивания заключается в замене фактических уровней ряда динамики их теоретическими значениями, вычисленными на основе уравнения тренда:

Расчет параметров уравнения производится методом наименьших квадратов:

где у – фактические уровни;у ti – соответствующие им во времени выровненные (расчетные) уровни.

Если развитие осуществляется в арифметической прогрессии (с равными цепными абсолютными приростами), то для выравнивания используют линейную функцию :

Если наблюдается динамика в геометрической прогрессии, (с равными цепными темпами роста), то необходимо использовать показательную функцию :

у t = а 0 а 1 t .

Если развитие происходит с равными темпами прироста, используется степенная функция , например второго порядка (парабола):

у t = а 0 + а 1 t + а 2 t 2 .

Критерием правильности выбора уравнения тренда служит ошибка аппроксимации . Она представляет собой среднее квадратическое отклонение фактических уровней ряда динамики от теоретических:

Оптимальным считается уравнение с наименьшей ошибкой аппроксимации.

Рассмотрим «технику» выравнивания ряда динамики по линейной функции :


где а 0 , а 1 – параметры уравнения прямой; t – показатели времени (как правило, порядковый номер периода или момента времени).

Параметры прямой а 0 и а 1 , удовлетворяющие методу наименьших квадратов, находят решением следующей системы нормальных уравнений:

где n – число уровней ряда динамики; параметр а 1 соответствует среднему абсолютному приросту.

Для упрощения расчета показателям времени
можно придать такие значения, при которых
, тогда

Для этого в рядах с нечетным числом уровней за начало отсчета времени принимают центральный интервал, где t приравнивают к нулю. По обе стороны от нуля располагают соответственно ряды отрицательных и положительных натуральных чисел, например:

Интервал времени

(номер по порядку)

t i

При четном числе уровней отсчет ведется от двух центральных интервалов, в которых t приравнено к (-1) и (+1) соответственно, а по обе стороны располагаются ряды отрицательных и положительных нечетных чисел, например:

Интервал времени

(номер по порядку)

t i

Схема расчета параметров линейного уравнения

Интервалы времени

Уровни ряда динамики

у i

t i

i t 2

у i t i

у ti

На основе исчисленного уравнения тренда можно производить экстраполяцию – нахождение вероятностных (прогнозируемых) уровней за пределами исходного ряда динамики.

Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Эмпирическое корреляционное среднее варьирует от 0 до 1.

Находят эмпирическое корреляционное отношение обычно в следующих типах задач:

  • 1) когда по двум рядам данным X и Y необходимо произвести аналитическую группировку
  • 2) группировка уже произведена, необходимо проверить правило сложения дисперсий
  • 3) по двум рядам данным X и Y необходимо найти уравнение регрессии и оценить его значимость

Формула дисперсии альтернативного признака

Исходя из изложенного выше, можно вывести формулу нахождения дисперсии альтернативного признака, если нам известна процентная доля такого признака в общем объеме выборки.

Изначально мы предполагаем, что признак принимает только два значения.

Таким образом, сумма доли элементов, в которых элементы статистического ряда имеют значение признака "нет" и элементов ряда, которые имеют значение признака "да" - равно единице.

Для нахождения среднего значения ряда, подставим значения альтернативных признаков (0 и 1) в формулу нахождения среднего взвешенного значения статистического ряда. Откуда, совершенно очевидно, в знаменателе будет единица, а в числителе - процентное значение элементов "1". То есть ровно процентное значение элементов с признаком "1". (Формула 2)

Формула дисперсии - это средневзвешенное значение квадратов отклонений каждого значения ряда данных. (Формула 3)

Поскольку в нашем ряду данные имеют только два типа значений - "0" и "1", то формула нахождения дисперсии для ряда, имеющего альтернативный признак сводится к Формуле 4. Пояснение. поскольку мы только что вывели, что среднее значение выборки равно р (Формула 2), то значение квадрата разности значения (0/1) и среднего значения, согласно Формулы 1, будет в первом случае (1-p)2 , а во втором случае (1-q)2 , теперь, применив следствие из первой формулы: q = 1 - p, p = 1- q . Получим p2 и q2 . Соответственно, доля значений "0" и "1" равна p и q, в результате в числителе и получается q2 p и p2 q. Сумма долей признаков значений "0" и "1" согласно Формуле 1 равна 1. В итоге Формула 4 и принимает значение pq, которое и будет равно значению дисперсии альтернативного признака. Исходя из найденного значения величины дисперсии альтернативного признака, найдем среднеквадратичное отклонение (Формула 5). Поставив значение из Формулы 1 в Формулу 5, получим формулу среднеквадратичного отклонения для дисперсии ряда с альтернативным признаком.

Эмпирическое корреляционное отношение

Теснота или сила связи между двумя признаками может быть измерена показателем, называемым эмпирическим корреляционным отношением. Этот показатель назван эмпирическим, поскольку он может быть рассчитан на основе обычной группировки по факторному и результативному признаку, то есть на основе корреляционной таблицы. Эмпирическое корреляционное отношение получается из правила сложения дисперсий, согласно которому , где - общая дисперсия; - межгрупповая дисперсия; - внутригрупповая (средняя из частных) дисперсия. Межгрупповая дисперсия является мерой колеблемости, обусловленной факторным признаком. Средняя из частных дисперсий является мерой колеблемости, обусловленной всеми остальными(кроме факторного) признаками. Тогда отношение выражает долю колеблемости, возникающей за счет факторного признака, в общей колеблемости. Квадратный корень из этого отношения и называется эмпирическим корреляционным отношением: .

Отсюда следует правило, что чем больше межгрупповая дисперсия, тем сильнее факторный признак влияет на вариации результативного признака. Составляющие отношения дисперсий вычисляются по данным корреляционной таблицы по следующим формулам:

; ,

где - частные средние; - общая средняя; - итоги по признаку ; - итоги по признаку ; - число наблюдений. То же соотношение сохраняется и для условных значений , полученных числовым преобразованием .

Само отношение дисперсий (подкоренное выражение) называется коэффициентом детерминации (оно равно также квадрату эмпирического корреляционного отношения). Эмпирическое корреляционное отношение изменяется в широких пределах (от 0 до 1). Если оно равно нулю, значит факторный признак на корреляционный не влияет. Если =1, значит, результативный признак полностью зависит от факторного. Если же эмпирическое корреляционное отношение представляет дробь, близкую единице, то говорят о тесной связи между факторным и результативным признаками. Если эта дробь мала (близка нулю), то говорят о слабой связи между ними.

Эмпирическое корреляционное отношение

Теснота или сила связи между двумя признаками может быть измерена показателем, называемым эмпирическим корреляционным отношением. Этот показатель назван эмпирическим, поскольку он может быть рассчитан на основе обычной группировки по факторному и результативному признаку, то есть на основе корреляционной таблицы. Эмпирическое корреляционное отношение получается из правила сложения дисперсий, согласно которому , где
- общая дисперсия;
- межгрупповая дисперсия;
- внутригрупповая (средняя из частных) дисперсия. Межгрупповая дисперсия является мерой колеблемости, обусловленной факторным признаком. Средняя из частных дисперсий является мерой колеблемости, обусловленной всеми остальными(кроме факторного) признаками. Тогда отношение выражает долю колеблемости, возникающей за счет факторного признака, в общей колеблемости. Квадратный корень из этого отношения и называется эмпирическим корреляционным отношением:
.

Отсюда следует правило, что чем больше межгрупповая дисперсия, тем сильнее факторный признак влияет на вариации результативного признака. Составляющие отношения дисперсий вычисляются по данным корреляционной таблицы по следующим формулам:

;
,

где - частные средние; - общая средняя; - итоги по признаку ; - итоги по признаку ;
- число наблюдений. То же соотношение сохраняется и для условных значений
, полученных числовым преобразованием .

Само отношение дисперсий (подкоренное выражение) называется коэффициентом детерминации (оно равно также квадрату эмпирического корреляционного отношения). Эмпирическое корреляционное отношение изменяется в широких пределах (от 0 до 1). Если оно равно нулю, значит факторный признак на корреляционный не влияет. Если =1, значит, результативный признак полностью зависит от факторного. Если же эмпирическое корреляционное отношение представляет дробь, близкую единице, то говорят о тесной связи между факторным и результативным признаками. Если эта дробь мала (близка нулю), то говорят о слабой связи между ними.

Коэффициент линейной корреляции и индекс корреляции

Мерой тесноты связи между двумя статистически связанными признаками служит коэффициент линейной корреляции или просто коэффициент корреляции. Он имеет тот же смысл, что и эмпирическое корреляционное отношение, но может принимать как положительное, так и отрицательное значение. Коэффициент корреляции имеет строгое математическое выражение для линейной связи. Положительное значение будет указывать на прямую связь между признаками, отрицательное – на обратную.

Парный коэффициент корреляции в случае линейной формы связи вычисляют по формуле

,

а его выборочное значение – по формуле

При малом числе наблюдений выборочный коэффициент корреляции удобно вычислять по следующей формуле:

Величина коэффициента корреляции изменяется в интервале
.

При
между двумя переменными существует функциональная связь, при
- прямая функциональная связь. Если
, то значение Х и У в выборке некоррелированы; в случае, если система случайных величин
имеет двумерное нормальное распределение, то величины Х и У будут и независимыми.

Если коэффициент корреляции находится в интервале
, то между величинами Х и У существует обратная корреляционная связь. Это находит подтверждение и при визуальном анализе исходной информации. В этом случае отклонение величины У от среднего значения взяты с обратным знаком.

Если каждая пара значений величин Х и У чаще всего одновременно оказывается выше (ниже) соответствующих средних значений, то между величинами существует прямая корреляционная связь и коэффициент корреляции находится в интервале
.

Если же отклонение величины Х от среднего значения одинаково часто вызывают отклонения величины У вниз от среднего значения и при этом отклонения оказываются все время различными, то можно предполагать, что значение коэффициента корреляции стремится к нулю.

Следует отметить, что значение коэффициента корреляции не зависит от единиц измерения и выбора начала отсчета. Это означает, что если переменные Х и У уменьшить (увеличить) в К раз либо на одно и то же число С, то коэффициент корреляции не изменится.

Для упрощения расчетов меры тесноты корреляционной связи часто применяется индекс корреляционной связи, который определяется по следующим формулам:

,
,

где
- остаточная дисперсия, характеризующая вариацию результативного признака под влиянием прочих неучтенных факторов.

Множественная корреляция

Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование. Показатель тесноты связи между результативным и двумя или более факторными признаками называется множественным или совокупным коэффициентом корреляции и обозначается R. Совокупный коэффициент предполагает наличие линейной связи между каждой парой признаков, которая может быть выражена при помощи парных коэффициентов корреляции. Если находится совокупная мера тесноты связи между результативным признаком () и двумя факторными признаками( и ), то расчет совокупного коэффициента корреляции ведется по формуле:

,

Где подстрочные знаки обозначают, между какими признаками изучается парная связь.

В формулах расчетов парных коэффициентов корреляции изменяются лишь символы, обозначающие тот или иной фактор. Так, если коэффициент корреляции между и вычисляется по формуле , то коэффициент корреляции между и вычисляется: ; между и - так:

Расчетная часть

Задание 31

    Имеются следующие данные по десяти предприятиям за отчетный период:

Таблица 2

Предприятия

Среднегодовая стоимость основных производственных фондов, млн. руб.

Выпуск продукции, млн. руб.

Для изучения связи между размером среднегодовой стоимости основных производственных фондов и выпуском продукции вычислите линейное уравнение связи.

2. По приведенным данным: а) вычислите: линейный коэффициент корреляции; б) проверьте правильность выбора формы связи, исчислив индекс корреляции.

    С помощью табличного процессора Microsoft Excel построим рабочую таблицу:

Таблица 3

Расчет сумм для вычисления параметров уравнения прямой

239,74 *1236 = 539,1 распределения вероятностей... экономического анализа , решаемые на основе регрессионных экономических моделей. Рассмотрим у – результативный признак, а х – факторные признаки. Методы корреляционно -регрессионного анализа ...

  • Программа дисциплины «Компьютерные методы анализа социологических данных» (Введение в математическую статистику и анализ данных) Для направления 040200. 68 "Социология"

    Программа дисциплины

    Применения. 11 3 2 6 Дисперсионный анализ 9 2 2 5 Парный и множественный регрессионный анализ 9 2 2 5 Свойства коэффициентов... пользователя SPSS 11.0 Сиськов В.И. Корреляционный анализ в экономических исследованиях . М. 1975. Эддоус М., Стэнсфилд...

  • Г. Л. Савицкая анализ хозяйственной деятельности предприятия

    Документ

    Передового опыта, новейшие методы экономических исследований . Анализ должен быть комплексным. Комплексность исследо... на уровень среднечасовой выработки корреляционно -регрессионный анализ . В многофакторную корреляционную модель среднечасовой выра­ботки...

  • 
    Top