логин: пароль: ЗарегистрироватьсяЗабыли пароль?

Вопросы и ответы по статистике вопросы 5-8

Вопрос №5.
Графическое изображение вариационных рядов.

Графически вариационный ряд можно изобразить, как и любой ряд значений аргумента и функции, используя прямоугольную систему координат и строя точки с координатами (x1,m1), (x2,m2), …. (xn,mn). Если затем последовательно соединить полученные точки отрезками прямой, а из первой и последней точки опустить перпендикуляры на ось х, получим замкнутую фигуру в виде многоугольника, которая называется полигоном и графически представляет распределение совокупности по признаку х. Полигон чаще используется для дискретных вариационных рядов.

Интервальный вариационный ряд изображают в виде гистограммы. Для интервального ряда с равными интервалами на оси х откладывают отрезки, равные длине интервала. На этих отрезках, как на основаниях, строят прямоугольники, высота которых пропорциональна частоте или частости. Для интервального ряда с неравными интервалами на оси ординат откладывают плотности распределения, так как в этом случае именно плотность дает представление о заполненности каждого интервала.
Площадь всей гистограммы численно равна сумме частот, или численности единиц в совокупности (если на оси ординат отложить частоты).

Любой вариационный ряд можно представить графически в виде кривой накопленных частот (или частостей). При этом на оси х откладывают варианты или верхние границы интервалов, а на оси у – соответствующие накопленные частоты (или частости). Полученные точки соединяют для непрерывного признака плавной кривой, которая называется кумулятивной кривой, или кумулятой. Если значения х (варианты) откладывать на оси у, а накопленные частоты (или частости) на оси х, то построенная на них кумулятивная кривая называется огивой.

Иногда при исследовании вариационных рядов нас интересует параллельное изменение нарастающих долей единиц совокупности и нарастающих долей значений признака в общем объеме. Такая задача возникает при изучении концентрации какого-либо признака в тех или иных группах совокупности. В этих случаях для анализа концентрации строят так называемую кривую Лоренца. По оси абсцисс откладываются накопленные частости, характеризующие распределение единиц совокупности (pi), по оси ординат – кумулятивные доли значений признака в общем объеме (qi).
Вопрос №6.
Обобщающие характеристики вариационного ряда.
В результате сводки данных статистического наблюдения получают различные показатели, одни из которых характеризуют совокупность в целом, другие – отдельные ее части.
Под статистическим показателем понимается обобщающая количественная характеристика изучаемого объекта или его свойства.
Именно на этапе статистической сводки от индивидуальных значений признаков у отдельных единиц совокупности путем суммирования переходят к показателям совокупности, которые называются обобщающими.
В зависимости от методов расчета обобщающие показатели могут быть абсолютными, относительными или средними величинами.

Абсолютные обобщающие показатели – это число единиц по совокупности в целом или по ее отдельным группам, которое получают в результате суммирования зарегистрированных значений признаков первичного статистического материала. Данные показатели могут быть получены и расчетным путем на основе других показателей (например, прирост банковских вкладов населения за период определяется как разность вкладов на конец и начало периода).
Абсолютные величины как обобщающие показатели характеризуют либо численность совокупности (численность экономически активного населения, количество предприятий различных форм собственности и т.д.), либо объем признаков совокупности (размер инвестиций, затраты на рабочую силу и т.д.).
Любая абсолютная величина всегда имеет свою единицу измерения, присущую тем или иным явлениям.

Анализируя статистические данные, необходимо сопоставлять явления во времени и пространстве, исследовать закономерности их изменения и развития, изучать структуру совокупностей. С помощью абсолютных величин эти задачи невыполнимы, в этом случае необходимо использовать относительные величины. Относительная величина представляет собой результат деления (сравнения) двух величин. В числителе дроби стоит величина, которую сравнивают, в знаменателе – величина, с которой сравнивают. Последняя называется базой (или основанием) сравнения. Используется это, например, для сравнения численности населения городов Москвы и Питера.

Относительные величины структуры показывают удельный вес каждой группы в общей численности совокупности. Их получают путем деления численности каждой группы, входящей в совокупность, а численность всей совокупности. Относительные величины структуры дают возможность сопоставлять структуры одной и той же совокупности в различные моменты времени. Такое сопоставление позволяет делать выводы о тенденциях и закономерностях структурных изменений во времени. Пример – изменение удельного веса городского населения России в определенный период.

Относительные величины динамики – это результат сопоставления уровней одного и того же явления, относящихся к различным периодам или моментам времени. Пример – сопоставление объема добычи нефти в России в определенный период. При определении относительных показателей динамики важно обеспечить сопоставимость показателей, которые участвуют в расчете. Несопоставимость может возникнуть по многим причинам: меняется методология расчета показателей или степени охвата совокупности, показатели относятся к периодам разной продолжительности и т.д.

Относительные величины сравнения получают в результате сопоставления одноименных абсолютных показателей, относящихся к разным совокупностям. Пример – сравнение размера основных фондов пищевой промышленности 2х регионов по состоянию на определенную дату.

Относительные величины интенсивности получают, сопоставляя разноименные признаки одной совокупности, а также объекты 2х связанных между собой совокупностей. Пример – коэффициент рождаемости.

Относительные величины координации – получают как соотношение между частями одного целого. Пример – соотношения числа мужчин и женщин, отношение занятых и незанятых.

Вопрос 7. Средние величины: средняя арифметическая, мода и медиана.
Для характеристики центра распределения применяются показатели, получившие название средних величин.
Средняя величина – это обобщающая характеристика множества индивидуальных значений некоторого количественного признака.
В статистике используются различные виды (формы) средних величин. Наиболее часто применяются следующие средние величины:
— средняя арифметическая
— средняя гармоническая
— средняя геометрическая
— средняя квадратическая
Указанные средние величины могут быть вычислены, либо когда каждый вариант в данной совокупности встречается только один раз, при этом средняя называется простой или невзвешенной, либо когда варианты повторяются различное число раз, при этом число повторений вариантов называется частотой или статистическим весом, а средняя, вычисленная с учетом весов, — средней взвешенной.
Все указанные средние величины можно рассчитать по формулам средней степенной:
а) если имеются только варианты — по формуле средней степенной порядка z
б) если имеются варианты и частоты f1, f2, …, fn – по формуле средней степенной взвешенной
Где — средняя степенная
z – показатель степени, позволяющий определить вид средней
xi – вариант
fi – частота, или статистический вес, варианта.

Средняя арифметическая – самый распространенный вид средней величины. Следует отметить, что если вид средней величины не указывается, подразумевается средняя арифметическая.
Средняя арифметическая получается при подстановке в формулу степенной средней значения z = 1
Средняя арифметическая простая рассчитывается по формуле
А средняя арифметическая взвешенная – по формуле
Средняя арифметическая обладает рядом свойств.
1. средняя арифметическая постоянной величины а равна этой же постоянной величине
2. сумма отклонений значений вариантов от средней равна нулю:
(если частоты равны единице)
(если частоты различны)
3. если из всех вариантов xi вычесть постоянную величину х0 и на основе разностей
(xi – x0 = x’i) вычислить среднюю ’, то она будет меньше средней исходного ряда на эту постоянную величину. Поэтому, чтобы получить среднюю из исходных вариантов, необходимо к средней ’ прибавить ту же постоянную величину х0:
= ’ + х0
4. если все варианты xi разделить на постоянную величину h и из частных (xi/h = x’i) вычислить среднюю, то она будет меньше средней исходного ряда в h раз. Для того чтобы получить среднюю из исходных вариантов, нужно среднюю ’ умножить на эту постоянную величину h:
= ’h

Упрощенная формула расчета средней арифметической:
= ’h + х0
Средняя арифметическая – это всегда обобщающая количественная характеристика варьирующего признака совокупности.

Вычисление средней гармонической.
Кроме средней арифметической в статистике используется и средняя гармоническая, как простая, так и взвешенная, где Vi – веса для обратных значений xi.

Мода.
Важнейшей характеристикой центра распределения, кроме средней арифметической, является мода.
Мода – это значение признака, которое чаще всего встречается в вариационном ряду. Во многих случаях эта величина наиболее характерна для ряда рпспределения и вокруг нее концентрируется большая часть вариантов. При изменении распределения в его концах мода не меняется, т.е. она обладает определенной устойчивостью к вариации признака. Поэтому моду наиболее удобно применять при изучении рядов с неопределенными границами.
Для дискретного ряда мода находится непосредственно по определению.
Для интервального ряда с равными интервалами сначала определяется модальный интервал xk-1-xk, которому соответствует максимальная частота mk или частость wk. Значение моды внутри модального интервала определяется по интерполяционной формуле:
Где xk-1 – нижняя граница модального интервала
hk – длина модального интервала
mk-1, mk, mk+1 – частота интервала, соответственно предшествующего модальному, модального и следующего за модальным.
Для ряда с неравными интервалами модальный интервал определяется по наибольшей плотности распределения. Строго говоря, мода – это значение признака, которому соответствует максимальная плотность распределения. Поэтому в формуле моды частот mk-1, mk, mk+1 следует взять плотности распределения yk-1, yk, yk+1.

Медиана
В статистическом анализе часто применяют структурные, или порядковые, средние, например медиану.
В отличие от средней арифметической, на которую оказывают влияние все значения xi, структурные средние не зависят от крайних значений признака.
Медианой называют такое значение признака, которое приходится на середину ранжированного ряда. Таким образом, в ранжированном ряду распределения одна половина ряда имеет значения признака больше медианы, другая – меньше медианы.
В дискретном ряду медиана находится непосредственно по определению на основе накопленных частот.
В случае интервального вариационного ряда медиану определяют в такой последовательности. Прежде всего находят медианный интервал. Для этой цели используют накопленные частоты (или частости). Соответственно номер медианы равен или
Точное нахождение медианы на данном интервале осуществляется по следующей интерполяционной формуле:
Где хк-1 – нижняя граница медианного интервала
hk – длина медианного интервала
Fk-1 – накопленная частота интервала, предшествующего медианному
mk – частота медианного интервала

Из определения медианы следует, что она не зависит от тех значений признака, которые расположены по обе стороны от нее. В связи с этим медиана является лучшей характеристикой центральной тенденции в тех случаях, когда концы распределений расплывчаты (например, границы крайних интервалов открыты) или в ряду распределения имеются чрезмерно большие или малые значения.
Значение медианы можно использовать, например, для установления официального прожиточного минимума или уровня бедности.

Вопрос 8. Показатели вариации. Правило сложения дисперсий.
В практическом анализе оценка рассеяния значений признака может оказаться не менее важной, чем определение средней.
Самая грубая оценка рассеяния, легко определяемая по данным вариационного ряда, может быть дана с помощью размаха вариации R = xmax – xmin, где наибольшее и наименьшее значение варьирующего признака.
Этот показатель представляет интерес в тех случаях, когда важно знать, какова амплитуда колебаний значений признака, например, каковы колебания цены на данный товар в течении недели или по разным регионам в данный отрезок времени.
Однако этот показатель не дает представления о характере вариационного ряда, расположении вариантов вокруг средней и может сильно меняться, если добавить или исключить крайние варианты (когда эти значения аномальны для данной совокупности). В этих случаях размах вариации дает скаженную амплитуду колебания против нормальных ее размеров. Поэтому следует очистить совокупность от аномальных наблюдений, прежде чем определять размах вариации.
Для оценки колеблемости значений признака относительно средней используются характеристики рассеяния. Они различаются выбранной формой средней и способами оценки отклонений от нее отдельных вариантов. К таким показателям относятся:
— среднее линейное отклонение
— дисперсия
— среднее квадратическое отклонение
— коэффициент вариации

Среднее линейное отклонение есть средняя арифметическая из абсолютных значений отклонений отдельных вариантов от их средней величины:

Для не сгруппированных данных
Для сгруппированных данных
Где xi– значение признака в дискретном ряду или середина интервала в интервальном распределении
mi — частота признака

Поскольку согласно свойству средней арифметической, то мерой вариации выступает не алгебраическая средняя из отклонений, а средний модуль отклонений. Он не зависит от случайных колебаний и учитывает всю сумму отклонений конкретных вариантов от средней. Среднее линейное отклонение выражено в тех же единицах измерения, что и варианты или их средняя. Оно дает абсолютную меру вариации.
Чтобы избежать равенства нулю суммы отклонений от средней, используют либо абсолютные значения отклонений, либо их четные степени, например квадраты. В последнем случае мера вариации называется дисперсией и обозначается D или:

Для не сгруппированных данных
Для сгруппированных данных

Исчисление дисперсии сопряжено с громоздкими расчетами, особенно если средняя величина выражена числом с несколькими десятичными знаками. Расчеты можно упростить, если использовать следующую модификацию формулы дисперсии:
Среднее квадратическое отклонение измеряется в тех же единицах, что и варьирующий признак, и исчисляется путем извлечения квадратного корня из дисперсии:
Для не сгруппированных данных
Для сгруппированных данных
Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные варианты признака от его среднего значения. Величина часто используется в качестве единицы измерения отклонений от средней арифметической. Отклонение, выраженное в, называется нормированным или стандартизированным.
Для оценки меры вариации и ее значимости пользуются также коэффициентом вариации V, который дает относительную оценку вариации и получается путем сопоставления среднего линейного или среднего квадратического отклонения со средним уровнем явления, а результат выражается в процентах.

Правило сложения дисперсий.
Общая дисперсия отражает вариацию признака за счет всех условий (факторов), действующих в данной совокупности.
Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия, которая исчисляется по отклонениям групповых средних от общей средней
Сложение:
Общая дисперсия равна сумме дисперсий внутригрупповой (средней из групповых дисперсий) и межгрупповой (дисперсии частных средних), т.е.
Таким образом, общая дисперсия складывается из двух слагаемых: первое измеряет вариацию внутри частей совокупности, а второе – вариацию между средними этих частей.

Комментарии (2):

Комментарий удален
Комментарий удален
Для того, чтобы оставить свой комментарий Вам необходимо авторизоваться.