логин: пароль: ЗарегистрироватьсяЗабыли пароль?

Вопросы и ответы по статистике вопросы 20 -24

Вопрос №20
Показатели тесноты связи: корреляционное отношение, линейный коэффициент корреляции.
Связь между количественными признаками измеряется через их вариацию.
Измерить связь между двумя коррелируемыми величинами – значит определить, насколько вариация результативного признака обусловлена вариацией факторного признака.
Основные показатели:
1. корреляционное отношение
2. линейный коэффициент корреляции

Эмпирическое корреляционное отношение

Здесь и соответственно межгрупповая и общая дисперсии результативного признака.

и
Где,
m – Число групп по факторному признаку x
k – Число групп по результативному признаку y
— среднее значение результативного признака по группам
— общее среднее значение результативного признака
— индивидуальные значения результативного признака
= — частота в j-й группе x
= — частота в i-й группе y.

Теоретическое корреляционное отношение
Основное отличие, что при подсчёте теоретического корреляционного отношения
Используется факторная дисперсия она отражает влияние на вариацию результативного признака всех остальных факторов (кроме x).

Линейный коэффициент корреляции

Средняя величина из произведений нормированных отклонений для x и y.
Он применим лишь в случае линейной зависимости между признаками.

Вопрос № 21
Проверка параметров линейного уравнения регрессии и коэффициента корреляции на значимость
Для того чтобы оценить значимость самого r надо рассчитать среднюю квадратическую ошибку коэффициента корреляции.
Оценка значимости основана на отношении r с средней квадратической ошибкой:
— коэффициент доверия

Обычно при большом n, если коэффициент корреляции r превышает свою среднюю ошибку больше чем в три раза (т.е. >3)
Он считается значимым, а связь считается реальной.

Если n<30, то применяется другая формула:
Проверка параметров линейного уравнения регрессии
Уравнение линейной зависимости выглядит:
Расчёт ошибок параметров a0 и a1x основан на использовании остаточной дисперсии,
Характеризующее расхождение между эмпирическими и теоритическими значениями результативного признака.
Средняя ошибка параметра a0:
А средняя ошибка параметра a1, т.е. коэффициент регрессии:
Где,
Значимость параметра проверяется путём сопоставления его значения со средней ошибкой. Обозначим это соотношение как t:
Тогда,

При большом числе наблюдений (n>30)
Параметр ai считается значимым если >3

Если наблюдений меньше 30(n<30), фактическое t сопоставляется с табличным t-критерием Стьюдента и если tфакт > tтабл, то параметр считается значимым.

Вопрос №22
Ранговые коэффициенты корреляции.

Это коэффициенты Спирмэна ( и Кендела ( )
Ранг – это порядковый номер, присваиваемый каждому индивидуальному значению x и y (отдельно) в ранжированном ряду.

Для расчёта коэффициента Спирмэна значения признаков x и y нумеруют (отдельно) в порядке возрастания от 1 до n, т.е. им присваивают определённый ранг (Nx и Ny)-
Порядковый номер в ранжированном ряду. Затем для каждой пары рангов находят их разность ( обозначается как d= Nx-Ny), и квадраты этой разности суммируют.

Коэффициент корреляции рангов Спирмэна

Где d – разность рангов x и y
n – число наблюдаемых пар значений x и y
коэффициент корреляции рангов Спирмэна может принимать значение от -1 до +1

когда ранги двух признаков полностью совпадают, т.е. каждое значение Nx=Ny,
то Соответственно, =1, что характеризует максимальная тесная прямая связь.

Коэффициент корреляции рангов Кендэла

P – сумма знаков «+»
Q – сумма знаков «-»
Их подсчёт производится так:
Мы смотрим как меняется Ny, т.к Nx уже упорядочен, поэтому считаем сколько значений
Осталось больше предыдущего, это кол-во идёт в «+», а всё что меньше после предыдущего идут в «-».

S=P+Q

— если не повторяются отдельные значения признака (x и y)
— если одинаковые значения x и y
где,

Вопрос № 23
Изменение тесноты связи качественных признаков
Существует четыре показателя:
1. коэффициент Ассоциации
2. коэффициент контингенции
3. коэффициент Пирсона
4. коэффициент Чупрова
первые два коэффициента могут применяться только для «четырёхклеточных» таблиц
последние два – для таблиц любой размерности.

Для таблицы «четырёх полей», частоты которых можно обозначить за a,b,c,d
Коэффициент ассоциации выражается формулой:
Недостаток:
Если хотя бы в одной из четырёх клеток отсутствует частота (=0),
коэффициент ассоциации всегда будет равен 1 по модулю, тем самым
будет преувеличена мера действительной связи

Чтобы избежать этого, предлагается другой показатель –
Коэффициент контингенции:

Коэффициент контингенции по значению всегда меньше коэффициента ассоциации

Связь считается достаточно значительной и подтвержденной,
Если или

Коэффициент Пирсона и коэффициент Чупрова:

Где,
и — соответственно эмпирические и теоретические частоты по группам
n – число единиц наблюдения
и — соответственно число строк и граф в таблице.
Вопрос № 24
Ряды динамики. Виды рядов динамики.

Ряд динамики

Ряд динамики представляет собой числовые значения определённого статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).
Числовые значения того или иного статистического показателя, составляющие ряд динамики, называют уровнями ряда и обозначают через y.
Основная задача изучения ряда выявить основную тенденцию (тренд) в изменении
Уровней ряда.

Виды рядов динамики
Они бывают трёх видов:
1. Абсолютных величин
2. Средних величин
3. Относительных величин

На основе абсолютных величин образуются ряды динамики средних и относительных величин, поэтому ряды абсолютных величин рассматриваются, как исходные,
Средних и относительных величин – как производные.
Ряд динамики средних величин показывает:
Среднюю урожайность, средний доход на душу населения и т.д.

Ряды относительных величин могут характеризовать:
Темпы роста, удельного веса и т.д.

Уровни рядов могут относиться динамики могут относиться к определенным моментам времени(датам) или же периодам ( интервалам).
В связи с этим в статистике различают моментные и интервальные ряды динамики.

Моментным называется ряд,
Уровни которого характеризуют
Значение показателя( явления)
По состоянию на определённый момент
Времени(дату).

Интервальным называется ряд,
уровни которого характеризуют
значение показателя, достигнутое
за определённый период(интервал)
времени

Комментарии (4):

Комментарий удален
Комментарий удален
Комментарий удален
Комментарий удален
Для того, чтобы оставить свой комментарий Вам необходимо авторизоваться.