6.1. МЕТОДИЧЕСКИЕ УКАЗАНИЯ
Средняя величина - это одна из форм статистических показателей.
В средней величине сглаживаются индивидуальные особенности отдельных единиц совокупности, однако проявляется главное , основное, типичное, что характеризует совокупность в целом.
Средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу качественно однородной совокупности в конкретных условиях места и времени.
Обобщающий показатель - это показатель, который характеризует совокупность в целом.
Однородная совокупность - это совокупность, единицы которой формируются под воздействием общих основных причин и условий развития, определяющих общий уровень данного признака, характерный для всей изучаемой совокупности.
Средняя величина, исчисленная по качественно неоднородной совокупности, фиктивная, огульная.
Обязательные условия расчета средних величин
- 1. Средняя величина должна исчисляться на основе:
- а) качественно однородной совокупности;
- б) массовых достоверных данных;
- в) сопоставимых данных (по территории, времени, единицам измерения, методике расчета и пр.).
- 2. Общая средняя величина обязательно должна дополняться другими средними величинами, исчисленными по отдельным группам, индивидуальными значениями осредняемого признака, средними других показателей.
Соблюдение этих условий позволит получить объективную характеристику явления и принять верное управленческое решение.
Например, в 2015 г. среднемесячная номинальная начисленная заработная плата в Российской Федерации в целом по экономике составляла 34 030 руб., в том числе 15 758 руб. в текстильном и швейном производстве (это самая низкая заработная плата), 81 605 руб. - в производстве кокса и нефтепродуктов (самая высокая заработная плата).
В экономической практике применяют различные виды средних величин, которые подразделяются на две группы: степенные средние и структурные средние.
Степенные средние:
- 1) средняя арифметическая;
- 2) средняя гармоническая;
- 3) средняя геометрическая;
- 4) средняя квадратическая;
- 5) средняя кубическая и др.
Структурные средние : мода; медиана; квартили; децили и др. (будут рассмотрены в главе 7).
Выбор конкретной формулы расчета средней величины зависит:
- 1) от смысловой формулы, т.е. сущности осредняемого признака, его содержания, взаимосвязи с итоговым (определяющим) показателем;
- 2) данных, которыми располагает исследователь;
- 3) степени вариации (колеблемости) осредняемого признака.
Итоговый (определяющий ) показатель - это показатель, величина
которого не изменится, если все индивидуальные значения признака (Xj) заменить средней величиной X.
Определяющий показатель находится либо в числителе, либо в знаменателе смысловой формулы.
Вопрос. Как составить смысловую формулу для расчета средней из ОВ?
Совет бывалого статистика. Смысловая (логическая) формула для расчета средней величины из относительных показателей совпадает
с формулой расчета самого относительного показателя.
Смысловая формула среднего процента брака совпадает с формулой расчета относительной величины структуры (удельного веса брака в общем объеме продукции):
Между степенными средними существует определенное количественное соотношение, которое называется правилом мажорантности:
Вопрос. Можно ли заменить одну формулу расчета средней величины другой и в каком случае?
Совет бывалого статистика. Если колеблемость признака небольшая,
если значения признака (Х|) близки друг к другу, то более сложную
среднюю величину можно заменить более простой.
Например, вместо средней геометрической использовать среднюю арифметическую.
В данной главе будет рассмотрено два вида средних величин: средняя арифметическая и средняя гармоническая.
Другие виды средних величин будут изучены в следующих главах практикума.
В таблице 6.1 представлены основные формулы расчета средней арифметической и средней гармонической величин.
Таблица 6.1
Расчет средней арифметической и средней гармонической
Вид средней величины |
Формула расчета |
Средняя арифметическая простая |
X - значение осредняемого признака у отдельных единиц совокупности; п - количество единиц в исследуемой совокупности или количество значений осредняемого признака. Используется, если:
|
Средняя арифметическая взвешенная |
/- количество единиц, обладающее данным значением осредняемого признака, вес, соизмеритель |
d - доля единиц, обладающая определенным значением осредняемого признака, вес |
Окончание
В практике экономических расчетов чаще всего используется средняя арифметическая величина.
В таблице 6.2 дана характеристика определенных свойств средней арифметической величины, которые широко используются для контроля и упрощения расчетов.
Таблица 6.2
Свойства средней арифметической величины
Свойство средней арифметической |
Формула |
1. Любая средняя величина не может быть меньше наименьшего значения осредняемого признака и больше наибольшего значения в совокупности |
|
2. Если каждое значение признака увеличить или уменьшить на одно и то же число, то средняя величина изменится соответственно |
|
3. Если каждое значение признака увеличить или уменьшить в одно и то же число раз, то средняя величина изменится соответственно |
|
4. Если веса всех вариантов умножить или разделить на одно и то же число, то средняя величина не изменится |
|
Следствие: при расчете средней в качестве весов можно использовать удельные веса |
|
5. Сумма отклонений отдельных вариантов от их средней равна нулю |
Расчет средней величины способом моментов
Свойства средней арифметической позволяют упростить расчеты средних величин особенно для дискретных вариационных рядов, а также для интервальных рядов с равными интервалами. Проиллюстрируем это на примере.
Таблица 6.3
Выработка рабочих, шт./чел. |
Середина интервала |
Количество рабочих, человек / |
х-х 0 , х 0 = 50 |
h ’ h = 20 |
|
80 и больше (80-100) |
|||||
Решение. В таблице 6.3 представлен интервальный вариационный ряд с равными интервалами. В качестве значения признака (х) примем середину каждого интервала (графа 1).
Условимся, что ширина открытого интервала будет равна ширине соседнего с ним закрытого интервала.
Рассчитаем среднюю выработку рабочих бригады обычным (не упрощенным) способом:
Расчеты представлены в графах 3, 4 табл. 6.3.
2. Рассчитаем условную среднюю (среднюю из преобразованных вариант):
Расчеты представлены в графе 5 табл. 6.3.
3. Перейдем от условной средней (х) к фактической (х), для чего в обратном порядке выполним операции, которые мы сделали с х
Результат совпадает с расчетом неупрощенным способом.
Совет бывалого статистика. Если вариационный ряд с равными интервалами, то графы 1 и 3 таблицы исчислять не требуется. Сразу после графы 2 (/-частот) заполняем графу х". По центру этой графы записываем 0. Середина этого интервала будет х 0 , а ширина интервала - h (табл. 6.4).
Таблица 6.4
Расчет средней выработки способом моментов
6.2. РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ
Задача 6.1. Рассчитайте среднюю месячную заработную плату рабочих предприятия в текущем году по данным табл. 6.5.
Решение. Расчет средней величины необходимо начинать с написания смысловой формулы.
Смысловая (.логическая ) формула средней заработной платы:
Алгоритм (формула расчета) средней заработной платы зависит от того, какие статистические данные есть в распоряжении исследователя.
Рассмотрим несколько вариантов.
I вариант. Если известно, что в текущем году фонд заработной платы рабочих предприятия за месяц составил 2804 тыс. руб., а работало на предприятии 72 человека, то среднюю заработную плату можно рассчитать, непосредственно подставив в смысловую формулу 6.2 известные нам данные о фонде заработной платы и численности рабочих:
Вывод. В текущем году рабочие предприятия получали в среднем в месяц 38,9 тыс. руб.
II вариант. Известны данные о заработной плате и численности рабочих по отдельным цехам предприятия (табл. 6.5).
Таблица 6.5
Фонд заработной платы и численность рабочих отдельных цехов предприятия за месяц
Решение. Смысловая (логическая) формула средней заработной платы не изменилась (формула 6.2). Однако ни числитель, ни знаменатель смысловой формулы нам непосредственно неизвестны, но их можно рассчитать, используя данные табл. 6.5.
Выберем условные обозначения (табл. 6.6).
Чтобы рассчитать числитель смысловой формулы - «Фонд заработной платы рабочих предприятия», необходимо по каждому цеху предприятия умножить заработную плату рабочих (X) на численность рабочих (/), а затем, получив фонд заработной платы по каждому цеху (Xf), сложить их значения, исчислив, таким образом, фонд заработной платы по предприятию в целом:
Итоги расчетов представим в табл. 6.6.
Таблица 6.6
Расчет средней заработной платы рабочих предприятия за месяц (средняя арифметическая взвешенная)
Тогда средняя заработная плата по предприятию (X) будет равна:
Расчет средней заработной платы произвели по формуле средней арифметической взвешенной.
Вопрос. С какой точностью следует исчислять среднюю величину?
Совет бывалого статистика. Степень точности расчета средней величины должна быть выше степени точности осредняемых показателей, особенно при их небольших значениях.
В нашем случае заработная плата по отдельным цехам предприятия исчислена с точностью до целого числа (32; 48; 39), а средняя заработная плата - с более высокой степенью точности, до десятой доли числа (38,9).
Вопрос. Можно ли проверить правильность расчета средней величины?
Совет бывалого статистика. Любая средняя величина должна быть больше минимального значения и меньше максимального значения осредняемого признака (свойство любой средней величины):
В нашем случае это требование соблюдается:
Следовательно, грубой ошибки в расчетах не допущено.
Вывод. В текущем году средняя заработная плата рабочих предприятия за месяц составила 38,9 тыс. руб. Самая высокая заработная плата была в цехе № 2 - 48 тыс. руб./чел., самая низкая - в цехе № 1 - 32 тыс. руб./чел.
Вопрос. По какой формуле нужно исчислять среднюю величину, если известен только знаменатель смысловой формулы, а числитель не известен, но его можно рассчитать?
Совет бывалого статистика. Если известен только знаменатель смысловой формулы, а числитель не известен, но его можно рассчитать, исчисление средней величины производят по формуле средней арифметической взвешенной:
III вариант. Известны данные о заработной плате и фонде заработной платы рабочих по отдельным цехам предприятия за месяц (табл. 6.7).
Таблица 6.7
Фонд заработной платы и численность рабочих отдельных цехов предприятия за месяц
Решение. Смысловая (логическая) формула средней заработной платы осталась прежней (6.2).
Однако ни числитель, ни знаменатель смысловой формулы нам непосредственно неизвестны. Но их можно рассчитать по данным табл. 6.7.
Чтобы рассчитать знаменатель смысловой формулы - «Численность рабочих предприятия», необходимо по каждому цеху разделить фонд заработной платы (М ) на численность рабочих (X) и полученные данные сложить:
Итоги расчетов представим в табл. 6.8.
Таблица 6.8
Расчет средней заработной платы рабочих предприятия за месяц (средняя гармоническая взвешенная)
Расчет произвели по формуле средней гармонической взвешенной.
Проверка:
Вопрос. По какой формуле необходимо исчислять среднюю величину, если известен только числитель смысловой формулы, а знаменатель не известен, но его можно рассчитать?
Совет бывалого статистика. Если известен только числитель смысловой формулы, а знаменатель не известен, но его можно рассчитать, исчисление средней производят по формуле средней гармонической взвешенной:
IV вариант. Возможен случай, когда не известны данные ни о фонде заработной платы, ни о численности рабочих и рассчитать их нельзя. Однако известна информация о заработной плате по каждому цеху предприятия, т.е. даны значения осредняемого признака (xj) (табл. 6.9).
Таблица 6.9
Заработная плата рабочих предприятия за месяц
Решение. В этом случае расчет средней заработной платы производят по формуле средней арифметической простой на основе данных о заработной плате (без учета сведений о численности рабочих):
Проверка:
Вопрос. Но какой формуле можно исчислить среднюю величину, если известны только значения осредняемого признака у отдельных единиц совокупности?
Совет бывалого статистика Если не известен ни числитель, ни знаменатель смысловой формулы, но известны значения осредняемого признака у отдельных единиц совокупности, расчет средней величины производят по формуле средней арифметической простой:
Как мы видим, заработная плата, исчисленная по формуле средней арифметической простой и средней арифметической взвешенной , количественно не совпадают:
Совет бывалого статистика. Средняя арифметическая взвешенная всегда дает более точный результат, чем средняя арифметическая простая, так как учитывает больше факторов, определяющих значение средней величины.
В нашем случае средняя арифметическая простая учитывает только разброс значений заработной платы в отдельных цехах, а средняя арифметическая взвешенная учитывает еще и количество рабочих, получающих каждое значение заработной платы.
Задача 6.2. В прошлом году билеты на концерты органной музыки можно было купить за 800, 1000 и 1200 руб. В текущем году цена билетов увеличилась на 100 руб.
Решение.
1. Рассчитаем среднюю цену на билеты в прошлом году.
Смысловая формула средней цены:
Так как нам не известен ни числитель, ни знаменатель смысловой формулы, но известны значения осредняемого признака (цены), можно воспользоваться только формулой средней арифметической простой".
Проверка:
Вывод. В прошлом году билеты на концерты органной музыки продавали в среднем по 967 руб./шт.
2. Рассчитаем среднюю цену на билеты в текущем году.
Проверка:
Для упрощения расчетов без потери их точности воспользуемся свойством средней величины (табл. 6.2, свойство 2):
Если в текущем году цены на все билеты повысили на 100 руб., то средняя цена в текущем году будет на 100 руб. больше прошлогодней средней цены:
Вывод. В текущем году билеты на концерты органной музыки будут продавать в среднем по 1067 руб./шт.
Совет бывалого статистика. Если каждое значение признака (X) увеличить (уменьшить) на одно и то же число, то значение средней величины увеличится (уменьшится) на то же число.
Задача 6.3. Рассчитайте среднюю цену билетов на концерты органной музыки, если известно, что в прошлом году 33% билетов продавали по цене 1200 руб., 57% - по 900 руб. и 10% - по 800 руб.
Решение. Нам не известен ни числитель, ни знаменатель смысловой формулы и рассчитать их по условию задачи нельзя:
Однако определить среднюю цену билетов можно, если воспользоваться свойством средней величины (табл. 6.2): если веса (J) всех значений признака (X ) умножить или разделить на одно и то же число, то средняя величина не изменится.
Следовательно,
Вывод. В прошлом году билеты на концерты органной музыки продавали в среднем по 989 руб./шт.
Объясните, почему средняя цена билетов в задачах 6.2 и 6.3 не совпадает.
Совет бывалого статистика. В качестве весов (/) можно использовать удельные веса . Средняя величина не изменится.
Рассчитаем среднюю величину в интервальном вариационном
Задача 6.4. По данным таблицы 6.10 рассчитайте среднюю выработку рабочих бригады за смену, указав вид средней величины.
Таблица 6.10
Распределение рабочих бригады по выработке
Решение. Для расчета средней выработки рабочих бригады за смену воспользуемся смысловой формулой:
По условию задачи нам известен знаменатель смысловой формулы (численность рабочих бригады), а числитель (выпуск продукции рабочими бригады за смену) - нет, но его можно найти, перемножив по каждой группе выработку рабочих на количество рабочих. Следовательно, необходимо применять формулу средней арифметической взвешенной:
Однако данные о выработке рабочих представлены в виде интервалов, т.е. мы не знаем конкретно, сколько единиц продукции выработал каждый рабочий. Нам известно только, что каждый рабочий первой группы выпустил менее 10 изделий, второй - от 10 до 16 изделий и т.д. Какое же значение брать в качестве значения выработки из каждого интервала?
Совет бывалого статистика. Если данные представлены в виде интервального ряда, то в качестве значения признака (X) принимаем середину каждого интервала.
Первый интервал «до 10» - открытый, так как не имеет нижней границы. Сначала «закроем» этот интервал, условно определив его нижнюю границу.
Вопрос. Как закрыть открытый интервал?
Совет бывалого статистика. Величина открытого интервала принимается равной величине соседнего с ним закрытого интервала.
Величина соседнего закрытого интервала «10-16» равна 6=16- 10, следовательно, нижняя граница первого интервала будет составлять 4 = 10 - 6. Значит, первый интервал: «4-10».
Последний интервал «22 и выше» также открытый. Он не имеет верхней границы. Величина соседнего с ним закрытого интервала равна 6 = 22 - 16, следовательно, верхняя граница открытого интервала будет составлять 22 + 6 = 28. Последний интервал: «22-28».
Оформим решение в табл. 6.11.
Середину интервала по каждой группе рассчитаем по формуле средней арифметической простой. Например, для первой группы (первого интервала):
Таблица 6.11
Расчет средней выработки рабочих по данным интервального
ряда
Выработка рабочих бригады за смену, шт. |
Численность рабочих, человек |
Средняя выработка по группе, шт. |
Выпуск продукции рабочими бригады за смену, шт. |
(4 + 10): 2 = 7 |
7 х-5 = 35 |
||
(10 + 16): 2 = 13 |
13^-18 = 234 |
||
Смысловая формула средней выработки:
Исходя из смысловой формулы и данных, которыми мы располагаем, расчет средней зарплаты произведем по формуле средней арифметической взвешенной:
Проверка:
Вывод. Рабочие бригады вырабатывали в среднем 16 изделий за смену.
6.3. ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
Умен и способен тот, кто спрашивает, когда сомневается в чем-нибудь.
Ли Шин-ин
Задание 6.1. Напишите логическую (смысловую) формулу для расчета следующих показателей:
- 1) средняя урожайность картофеля;
- 2) средний процент выполнения плана;
- 3) средняя зарплата одного рабочего;
- 4) средний процент продукции высшего сорта;
- 5) средняя себестоимость единицы продукции;
- 6) средняя цена товара;
- 7) средняя рентабельность.
Задание 6.2. Заполнив табл. 6.12, рассчитайте за каждый квартал текущего года средний процент бракованной продукции по трем бригадам в целом. Назовите вид средних величин, по которым производился расчет. Проанализируйте полученные результаты.
Таблица 6.12
Экономические показатели по трем бригадам сборочного
цеха
Бригада |
1 квартал |
II квартал |
||||
процент бракованной продукции |
выпуск продукции, |
процент бракованной продукции |
выпуск бракованной продукции, шт. |
|||
Задание 6.3. Заполнив табл. 6.13, рассчитайте за каждый месяц текущего года среднюю рентабельность по трем предприятиям фирмы в целом.
Проанализируйте полученные результаты. Аргументируйте выбор средних величин, по которым производился расчет.
Таблица 6.13
Экономические показатели по трем предприятиям фирмы «Орфей»
Задание 6.4. Имеются следующие данные по трем сельскохозяйственным предприятиям области в текущем году:
- 1. Рассчитайте среднюю урожайность в целом по трем предприятиям за каждое полугодие и год.
- 2. Изучите изменение средней урожайности во втором полугодии по сравнению с первым. Сделайте выводы.
- 3. Проанализируйте изменение структуры посевных площадей.
- 4. Расчеты оформите в таблице.
Задание 6.5. Известны следующие данные о продажах крупы населению района по трем магазинам фирмы за февраль текущего года:
Таблица 6.14
Цена и объем реализации крупы за февраль текущего года
Рассчитайте:
- 1) среднюю цену 1 кг крупы по фирме в целом. Обоснуйте выбор формулы расчета средней величины. Оформите расчеты в виде таблицы;
- 2) долю магазина № 1 в общем объеме проданной крупы по фирме в целом.
Сделайте вывод.
Задание 6.6. По данным табл. 6.15 рассчитайте средний процент сертифицированной продукции. Аргументируйте выбор формулы расчета средней величины.
Сделайте вывод о динамике качества продукции, если в прошлом периоде средний процент сертифицированной продукции составлял 70,9%.
Таблица 6.15
Данные о сертификации продукции фирмы «Квадрат»
Задание 6.7. По данным табл. 6.16 рассчитайте средний процент выполнения сменного задания рабочими бригады, в том числе способом моментов.
Таблица 6.16
Распределение рабочих бригады по проценту выполнения сменного задания
Расчеты оформите в таблице. Сделайте выводы.
Задание 6.8. Рассчитайте средний тарифный разряд рабочих бригады, если 20% рабочих имеют третий разряд, 40% - четвертый, 35% - пятый, остальные - шестой. Укажите вид средней величины, по которой производился расчет. Назовите свойство средней величины, которым вы воспользовались в ходе решения.
Как изменилась квалификация рабочих бригады, если в прошлом году средний тарифный разряд рабочих составил 5,1. Сделайте выводы.
Задание 6.9. Кафе «Огонек» планировало купить 50 кг мяса по 300 руб./кг и 80 кг - по 270 руб./кг. Однако поставщик поднял цены на мясо в 1,2 раза.
Рассчитайте, по какой цене в среднем был фактически куплен 1 кг мяса и какова была средняя плановая цена закупки.
Назовите вид средней величины, по которой производился расчет. Сделайте выводы.
Задание 6.10. В предыдущем году у 28% населения области годовой доход на каждого члена семьи составлял 180 тыс. руб., у 56% - 264 тыс. руб., у остальных - 588 тыс. руб.
Представьте данные в форме таблицы. Определите средний годовой душевой доход семьи по области в целом.
Укажите вид средней величины, по которой производился расчет. Сделайте вывод.
Задание 6.11. Рассчитайте среднюю прибыль на одну акцию по фирме в целом, если сумма прибыли по первому предприятию фирмы составила 168,0 тыс. руб., по второму - 228,8 тыс. руб., по третьему - 218,4 тыс. руб. Прибыль на одну акцию по предприятиям фирмы составила соответственно 6,0; 5,2; 3,9 руб.
Рассчитайте долю каждого предприятия в общей сумме прибыли фирмы.
Расчеты задачи оформите в таблице. Сделайте вывод.
Задание 6.12. По данным табл. 6.17 рассчитайте средний возраст рабочих организации, указав вид средней величины.
Таблица 6.17
Распределение рабочих ПАО «Рекорд» по возрасту
Изучите возрастную структуру рабочих организации, исчислив ОБ структуры.
Расчеты оформите в таблице. Сделайте выводы.
Задание 6.13. Рассчитайте среднюю трудоемкость изготовления единицы продукции по фирме в целом, если затраты времени на производство продукции по первому предприятию фирмы составили 276 тыс. чел.-час, по второму - 2016 тыс. чел.-час, по третьему - 3666 тыс. чел.-час. Трудоемкость изделия по предприятиям фирмы составила соответственно 4,6; 11,2; 9,4 час/шт.
Укажите вид средней величины, по которой производился расчет.
Рассчитайте долю каждого предприятия в общих затратах времени на производство продукции фирмы. Укажите вид исчисленной ОБ.
Расчеты оформите в таблице. Сделайте вывод.
Задание 6.14. В России в 22 клубах Континентальной хоккейной лиги (КХЛ) 101 иностранец, в том числе: 14 - из Канады, 11 - из США, 76 - из Европы. В 14 клубах российской волейбольной суперлиги 17 иностранцев. В 10 клубах баскетбольной единой лиги ВТБ 53 иностранца. В российской футбольной премьер-лиге 16 клубов, в которых 131 иностранец. В российской суперлиге по хоккею с мячом 13 команд и всего 6 иностранцев. Примечание: все команды - мужские.
Рассчитайте: 1) среднее количество легионеров в клубах России; 2) структуру легионеров в КХЛ по признаку страны. Начертите структурную диаграмму. Сделайте выводы.
Задание 6.15. Известны следующие данные о торгово-производственной деятельности кафе «Ромашка» за сентябрь текущего года:
Рассчитайте:
- 1) по какой цене в среднем кафе «Ромашка» покупало товар в сентябре? Укажите вид исчисленной средней величины;
- 2) долю (удельный вес) каждой партии товара в общем объеме поступлений за месяц (в %). Оцените ритмичность поступлений товара.
- 3) на сколько рублей и процентов увеличилась средняя цена закупки товара, если в октябре товар покупали в среднем за 127,81 руб./шт.?
Сделайте выводы.
- Вывод. Каждый рабочий бригады вырабатывал в среднем 48 единиц продукции за смену. В дальнейших вычислениях средней выработки упрощенным способом воспользуемся свойствами средней арифметической величины. 1. В расчетах в качестве значения осредняемого признака (х) возьмем преобразованные варианты(х): где xq и h - любые числа. Совет бывалого статистика. Самого большого упрощения можно добиться, если в качестве х0 принять середину центрального интервала(х0 = 50), а в качестве h - ширину интервала (h = 20).
В целях анализа и получения статистических выводов по результатом сводки и группировки исчисляют обобщающие показатели – средние и относительные величины.
Задача средних величин – охарактеризовать все единицы статистической совокупности одним значением признака.
Средними величинами характеризуются качественные показатели предпринимательской деятельности: издержки обращения, прибыль, рентабельность и др.
Средняя величина – это обобщающая характеристика единиц совокупности по какому–либо варьирующему признаку.
Средние величины позволяют сравнивать уровни одного и того же признака в различных совокупностях и находить причины этих расхождений.
В анализе изучаемых явлений роль средних величин огромна. Английский экономист В. Петти (1623-1687 гг.) широко использовал средние величины. В. Петти хотел использовать средние величины в качестве меры стоимости расходов на среднее дневное пропитание одного работника. Устойчивость средней величины – это отражение закономерности изучаемых процессов. Он считал что информацию можно преобразовать, даже если нет достаточного объема исходных данных.
Применял средние и относительные величины английский ученый Г. Кинг (1648-1712) при анализе данных о населении Англии.
Теоретические разработки бельгийского статистика А. Кетле (1796-1874 гг.) основаны на противоречивости природы социальных явлений – высокоустойчивых в массе, но сугубо индивидуальных.
Согласно А. Кетле постоянные причины действуют одинаково на каждое изучаемое явление и делают эти явления похожими друг на друга, создают общие для всех них закономерности.
Следствием учения А. Кетле явилось выделение средних величин в качестве основного приема статистического анализа. Он говорил, что статистические средние величины представляют собой не категорию объективной действительности.
А. Кетле выразил взгляды на среднюю величину в своей теории среднего человека. Средний человек – это человек, обладающий всеми качествами в среднем размере (средняя смертность или рождаемость, средний рост и вес, средняя быстрота бега, средняя наклонность к браку и самоубийству, к добрым делам и т. д.). Для А. Кетле средний человек – это идеал человека. Несостоятельность теории среднего человека А. Кетле была доказана в русской статистической литературе в конце XIX-XX вв.
Известный русский статистик Ю. Э. Янсон (1835-1893 гг.) писал, что А. Кетле предполагает существование в природе типа среднего человека как чего–то данного, от которого жизнь отклонила средних людей данного общества и данного времени, а это приводит его к совершенно механическому взгляду и на законы движения социальной жизни: движение – это постепенное возрастание средних свойств человека, постепенное восстановление типа; следовательно, такое нивелирование всех проявлений жизни социального тела, за которым всякое поступательное движение прекращается.
Сущность данной теории нашла свое дальнейшее развитие в работах ряда теоретиков статистики как теория истинных величин. У А. Кетле были последователи – немецкий экономист и статистик В. Лексис (1837-1914 гг.), перенесший теорию истинных величин на экономические явления общественной жизни. Его теория известна под названием теория устойчивости. Другая разновидность идеалистической теории средних величин основана на философии
Ее основатель – английский статистик А. Боули (1869– 1957гг.) – один из самых видных теоретиков новейшего времени в области теории средних величин. Его концепция средних величин изложена в книге «Элементы статистики».
А. Боули рассматривает средние величины лишь с количественной стороны, тем самым отрывает количество от качества. Определяя значение средних величин (или «их функцию»), А. Боули выдвигает махистский принцип мышления. А. Боули писал, что функция средних величин должна выражать сложную группу
с помощью немногих простых чисел. Статистические данные должны быть упрощены, сгруппированы и приведены к средним Эти взгляды: разделяли Р. Фишер (1890-1968 гг.), Дж. Юл (1871 – 1951 гг.), Фредерик С. Миллс (1892 г) и др.
В 30-е гг. XX в. и последующие годы средняя величина рассматривается как социально значимая характеристика, информативность которой зависит от однородности данных.
Виднейшие представители итальянской школы Р. Бенини (1862-1956 гг.) и К. Джини (1884-1965 гг.), считая статистику отраслью логики, расширили область применения статистической индукции, но познавательные принципы логики и статистики они связывали с природой изучаемых явлений, следуя традициям социологической трактовки статистики.
В работах К. Маркса и В. И. Ленина средним величинам отводится особая роль.
К. Маркс утверждал, что в средней величине погашаются индивидуальные отклонения от общего уровня и средний уровень становится обобщающей характеристикой массового явления Такой характеристикой массового явления средняя величина становится лишь при условии, если взято значительное число единиц и эти единицы качественно однородны. Маркс писал, чтобы находимая средняя величина была средней «…многих различных индивидуальных величин одного и того же вида».
Средняя величина приобретает особую значимость в условиях рыночной экономики. Она помогает определить необходимое и общее, тенденцию закономерности экономического развития непосредственно через единичное и случайное.
Средние величины являются обобщающими показателями, в которых находят выражение действие общих условий, закономерность изучаемого явления.
Статистические средние величины рассчитываются на основе массовых данных статистически правильно организованного массового наблюдения. Если статистическая средняя рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений), то она будет объективной.
Средняя величина абстрактна, так как характеризует значение абстрактной единицы.
От разнообразия признака у отдельных объектов абстрагируется средняя. Абстракция – ступень научного исследования. В средней величине осуществляется диалектическое единство отдельного и общего.
Средние величины должны применяться исходя из диалектического понимания категорий индивидуального и общего, единичного и массового.
Средняя отображает что–то общее, которое складывается в определенном единичном объекте.
Для выявления закономерностей в массовых общественных процессах средняя величина имеет большое значение.
Отклонение индивидуального от общего – проявление процесса развития.
В средней величине отражается характерный, типичный, реальный уровень изучаемых явлений. Задачей средних величин является характеристика этих уровней и их изменений во времени и пространстве.
Средний показатель – это обычное значение, потому что формируется в нормальных, естественных, общих условиях существования конкретного массового явления, рассматриваемого в целом.
Объективное свойство статистического процесса или явления отражает средняя величина.
Индивидуальные значения исследуемого статистического признака у каждой единицы совокупности различны. Средняя величина индивидуальных значений одного вида – продукт необходимости, который является результатом совокупного действия всех единиц совокупности, проявляющийся в массе повторяющихся случайностей.
Одни индивидуальные явления имеют признаки, которые существуют во всех явлениях, но в разных количествах – это рост или возраст человека. Другие признаки индивидуального явления, качественно различные в различных явлениях, т. е. имеются у одних и не наблюдаются у других (мужчина не станет женщиной). Средняя величина вычисляется для признаков качественно однородных и различных только количественно, которые присущи всем явлениям в данной совокупности.
Средняя величина является отражением значений изучаемого признака и измеряется в той же размерности, что и этот признак.
Теория диалектического материализма учит, что все в мире меняется, развивается. А также изменяются признаки, которые характеризуются средними величинами, а соответственно – и сами средние.
В жизни происходит непрерывный процесс создания чего–то нового. Носителем нового качества являются единичные объекты, далее количество этих объектов возрастает, и новое становится массовым, типичным.
Средняя величина характеризует изучаемую совокупность только по одному признаку. Для полного и всестороннего представления изучаемой совокупности по ряду определенных признаков необходимо располагать системой средних величин, которые могут описать явление с разных сторон.
2. Виды средних величин
В статистической обработке материала возникают различные задачи, которые необходимо решать, и поэтому в статистической практике используются различные средние величины. Математическая статистика использует различные средние, такие как: средняя арифметическая; средняя геометрическая; средняя гармоническая; средняя квадратическая.
Для того чтобы применить одну из вышеперечисленных видов средней, необходимо проанализировать изучаемую совокупность, определить материальное содержание изучаемого явления, все это делается на основе выводов, полученных из принципа осмысленности результатов при взвешивании или суммировании.
В изучении средних величин применяются следующие показатели и обозначения.
Признак, по которому находится средняя, называется осредняемым признаком и обозначается х; величина осредняемого признака у любой единицы статистической совокупности называют индивидуальным его значением, или вариантами, и обозначают как x 1 , х 2 , x 3 ,… х п ; частота – это повторяемость индивидуальных значений признака, обозначается буквой f.
Средняя арифметическая
Один из наиболее распространенных видов средней – средняя арифметическая, которая исчисляется тогда, когда объем ос–редняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.
Для вычисления средней арифметической величины сумму всех уровней признака делят на их число.
Если некоторые варианты встречаются несколько раз, то сумму уровней признака можно получить умножением каждого уровня на соответствующее число единиц совокупности с последующим сложением полученных произведений, исчисленная таким образом средняя арифметическая называется средней арифметической взвешенной.
Формула средней арифметической взвешенной выглядит следующим образом:
гдех i – варианты,
f i – частоты или веса.
Взвешенная средняя величина должна употребляться во всех случаях, когда варианты имеют различную численность.
Арифметическая средняя как бы распределяет поровну между отдельными объектами общую величину признака, в действительности варьирующуюся у каждого из них.
Вычисление средних величин производят по данным, сгруппированным в виде интервальных рядов распределения, когда варианты признака, из которых исчисляется средняя, представлены в виде интервалов (от – до).
Свойства средней арифметической:
1) средняя арифметическая суммы варьирующих величин равна сумме средних арифметических величин: Если х i = y i +z i , то
Данное свойство показывает в каких случаях можно суммировать средние величины.
2) алгебраическая сумма отклонений индивидуальных значений варьирующего признака от средней равна нулю, так как сумма отклонений в одну сторону погашается суммой отклонений в другую сторону:
Это правило демонстрирует, что средняя является равнодействующей.
3) если все варианты ряда увеличить или уменьшить на одно и тоже число?, то средняя увеличится или уменьшится на это же число?:
4) если все варианты ряда увеличить или уменьшить в А раз, то средняя также увеличится или уменьшится в А раз:
5) пятое свойство средней показывает нам, что она не зависит от размеров весов, но зависит от соотношения между ними. В качестве весов могут быть взяты не только относительные, но и абсолютные величины.
Если все частоты ряда разделить или умножить на одно и тоже число d, то средняя не изменится.
Средняя гармоническая. Для того чтобы определить среднюю арифметическую, необходимо иметь ряд вариантов и частот, т. е. значения х и f.
Допустим, известны индивидуальные значения признака х и произведения х/, а частоты f неизвестны, тогда, чтобы рассчитать среднюю, обозначим произведение = х/; откуда:
Средняя в этой форме называется средней гармонической взвешенной и обозначается х гарм. взв.
Соответственно, средняя гармоническая тождественна средней арифметической. Она применима, когда неизвестны действительные веса f , а известно произведение fх = z
Когда произведения fх одинаковы или равны единицы (m = 1) применяется средняя гармоническая простая, вычисляемая по формуле:
где х – отдельные варианты;
n – число.
Средняя геометрическая
Если имеется n коэффициентов роста, то формула среднего коэффициента:
Это формула средней геометрической.
Средняя геометрическая равна корню степени n из произведения коэффициентов роста, характеризующих отношение величины каждого последующего периода к величине предыдущего.
Если осреднению подлежат величины, выраженные в виде квадратных функций, применяется средняя квадратическая. Например, с помощью средней квадратической можно определить диаметры труб, колес и т. д.
Средняя квадратическая простая определяется путем извлечения квадратного корня из частного от деления суммы квадратов отдельных значений признака на их число.
Средняя квадратическая взвешенная равна:
3. Структурные средние величины. Мода и медиана
Для характеристики структуры статистической совокупности применяются показатели, которые называют структурными средними. К ним относятся мода и медиана.
Мода (М о ) – чаще всего встречающийся вариант. Модой называется значение признака, которое соответствует максимальной точке теоретической кривой распределений.
Мода представляет наиболее часто встречающееся или типичное значение.
Мода применяется в коммерческой практике для изучения покупательского спроса и регистрации цен.
В дискретном ряду мода – это варианта с наибольшей частотой. В интервальном вариационном ряду модой считают центральный вариант интервала, который имеет наибольшую частоту (частность).
В пределах интервала надо найти то значение признака, которое является модой.
где х о – нижняя граница модального интервала;
h – величина модального интервала;
f m – частота модального интервала;
f т -1 – частота интервала, предшествующего модальному;
f m +1 – частота интервала, следующего за модальным.
Мода зависит от величины групп, от точного положения границ групп.
Мода – число, которое в действительности встречается чаще всего (является величиной определенной), в практике имеет самое широкое применение (наиболее часто встречающийся тип покупателя).
Медиана (M e – это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая – большие.
Медиана – это элемент, который больше или равен и одновременно меньше или равен половине остальных элементов ряда распределения.
Свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.
Применение медианы позволяет получить более точные результаты, чем при использовании других форм средних.
Порядок нахождения медианы в интервальном вариационном ряду следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал:
где х ме – нижняя граница медианного интервала;
i Me – величина медианного интервала;
f/2 – полусумма частот ряда;
S Me -1 – сумма накопленных частот, предшествующих медианному интервалу;
f Me – частота медианного интервала.
Медиана делит численность ряда пополам, следовательно, она там, где накопленная частота составляет половину или больше половины всей суммы частот, а предыдущая (накопленная) частота меньше половины численности совокупности.
Лекция 5. Средние величины
Понятие средней величины в статистике
Средняя арифметическая и ее свойства
Другие виды степенных средних величин
Мода и медиана
Квартили и децили
Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.
Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.
Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления.
Средняя величина (в статистике) – обобщающий показатель, характеризующий типичный размер или уровень общественных явлений в расчете на единицу совокупности при прочих равных условиях.
С помощью метода средних решаются следующие основные задачи :
1. Характеристика уровня развития явлений.
2. Сравнение двух или нескольких уровней.
3. Изучение взаимосвязей социально - экономических явлений.
4. Анализ размещения социально-экономических явлений в пространстве.
Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.
При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения. Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.
Сущность средней в том и заключается, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием факторов основных. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.
Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак.
Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон.
Существуют различные средние:
Средняя арифметическая;
Средняя геометрическая;
Средняя гармоническая;
Средняя квадратическая;
Средняя хронологическая.
Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.
Существует 2 класса средних величин: и .
К структурным средним относятся мода и медиана , но наиболее часто применяются степенные средние различных видов.
Степенные средние величины
Степенные средние могут быть простыми и взвешенными .
Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:
Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:
Где X – значения отдельных статистических величин или середин группировочных интервалов;
m - показатель степени, от значения которого зависят следующие виды степенных средних величин
:
при m = -1 ;
при m = 0 ;
при m = 1 ;
при m = 2 ;
при m = 3 .
Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида, которые будут далее подробно рассмотрены.
Средняя арифметическая
Средняя арифметическая - это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:
Где X - значения величин, для которых необходимо рассчитать среднее значение; N - общее количество значений X (число единиц в изучаемой совокупности).
Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической простой: (3+4+4+5)/4 = 16/4 = 4.
Средняя арифметическая взвешенная имеет следующий вид:
Где f - количество величин с одинаковым значением X (частота).
Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической взвешенной: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.
Если значения X заданы в виде интервалов, то для расчетов используют середины интервалов X, которые определяются как полусумма верхней и нижней границ интервала. А если у интервала X отсутствует нижняя или верхняя граница (открытый интервал), то для ее нахождения применяют размах (разность между верхней и нижней границей) соседнего интервала X.
Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Тогда рассчитаем средний стаж работников по формуле средней арифметической взвешенной, приняв в качестве X середины интервалов стажа (2, 4 и 6 лет):
(2*10+4*20+6*5)/(10+20+5) = 3,71 года.
Средняя арифметическая применяется чаще всего, но бывают случаи, когда необходимо применение других видов средних величин. Рассмотрим такие случаи далее.
Средняя гармоническая
Средняя гармоническая применяется, когда исходные данные не содержат частот f по отдельным значениям X, а представлены как их произведение Xf. Обозначив Xf=w, выразим f=w/X, и, подставив эти обозначения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:
Таким образом, средняя гармоническая взвешенная применяется тогда, когда неизвестны частоты f, а известно w=Xf. В тех случаях, когда все w=1, то есть индивидуальные значения X встречаются по 1 разу, применяется формула средней гармонической простой:
Например, автомобиль ехал из пункта А в пункт Б со скоростью 90 км/ч, а обратно - со скоростью 110 км/ч. Для определения средней скорости применим формулу средней гармонической простой, так как в примере дано расстояние w 1 =w 2 (расстояние из пункта А в пункт Б такое, же как и из Б в А), которое равно произведению скорости (X) на время (f). Средняя скорость = (1+1)/(1/90+1/110) = 99 км/ч.
Средняя геометрическая
Средняя геометрическая применяется при определении средних относительных изменений, о чем сказано в теме Ряды динамики . Геометрическая средняя величина дает наиболее точный результат осреднения, если задача стоит в нахождении такого значения X, который был бы равноудален как от максимального, так и от минимального значения X.
Например, в период с 2005 по 2008 годы индекс инфляции в России составлял: в 2005 году - 1,109; в 2006 - 1,090; в 2007 - 1,119; в 2008 - 1,133. Так как индекс инфляции - это относительное изменение (индекс динамики), то рассчитывать среднее значение нужно по средней геометрической: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, то есть за период с 2005 по 2008 ежегодно цены росли в среднем на 11,26%. Ошибочный расчет по средней арифметической дал бы неверный результат 11,28%.
Средняя квадратическая
Средняя квадратическая применяется в тех случая, когда исходные значения X могут быть как положительными, так и отрицательными, например при расчете средних отклонений.
Главной сферой применения квадратической средней является измерение вариации значений X, о чем пойдет речь .
Средняя кубическая
Средняя кубическая применяется крайне редко, например, при расчете индексов нищеты населения для развивающихся стран (ИНН-1) и для развитых (ИНН-2), предложенных и рассчитываемых ООН.
Структурные средние величины
К наиболее часто используемым структурным средним относятся и .
Статистическая мода
Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности.
Если X задан дискретно , то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной (если моды две) или мультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности.
Например, на предприятии работает 16 человек: 4 из них - со стажем 1 год, 3 человека - со стажем 2 года, 5 - со стажем 3 года и 4 человека - со стажем 4 года. Таким образом, модальный стаж Мо=3 года, поскольку частота этого значения максимальна (f=5).
Если X задан равными интервалами , то сначала определяется модальный интервал как интервал с наибольшей частотой f. Внутри этого интервала находят условное значение моды по формуле:
Где Мо – мода;
Х НМо – нижняя граница модального интервала;
h Мо – размах модального интервала (разность между его верхней и нижней границей);
f Мо – частота модального интервала;
f Мо-1 – частота интервала, предшествующего модальному;
f Мо+1 – частота интервала, следующего за модальным.
Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Рассчитаем модальный стаж работы в модальном интервале от 3 до 5 лет: Мо = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (года).
Если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h.
Статистическая медиана
Статистическая медиана – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы.
Если X задан дискретно , то для определения медианы все значения нумеруются от 0 до N в порядке возрастания , тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1).
Например, имеются данные о возрасте студентов-заочников в группе из 10 человек - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 лет. Эти данные уже упорядочены по возрастанию, а их количество N=10 - четное, поэтому медиана будет находиться между X с номерами 0,5*10=5 и (0,5*10+1)=6, которым соответствуют значения X 5 =21 и X 6 =23, тогда медиана: Ме = (21+23)/2 = 22 (года).
Если X задан в виде равных интервалов , то сначала определяется медианный интервал (интервал, в котором заканчивается одна половина частот f и начинается другая половина), в котором находят условное значение медианы по формуле:
Где Ме – медиана;
Х НМе – нижняя граница медианного интервала;
h Ме – размах медианного интервала (разность между его верхней и нижней границей);
f Ме – частота медианного интервала;
f Ме-1 – сумма частот интервалов, предшествующих медианному.
В ранее рассмотренном примере при расчете модального стажа (на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет) рассчитаем медианный стаж. Половина общего числа работников составляет (10+20+5)/2 = 17,5 и находится в интервале от 3 до 5 лет, а в первом интервале до 3 лет - только 10 работников, а в первых двух - (10+20)=30, что больше 17,5, значит интервал от 3 до 5 лет - медианный. Внутри него определяем условное значение медианы: Ме = 3+2*(0,5*30-10)/20 = 3,5 (года).
Также как и в случае с модой, при определении медианы если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h.
Показатели вариации
Вариация - это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие показатели вариации : , , , , .
Размах вариации
Размах вариации – это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:
Недостатком показателя H является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности.
Cреднее линейное отклонение
Cреднее линейное отклонение - это средний модуль отклонений значений X от среднего арифметического значения. Его можно рассчитывать по формуле средней арифметической простой - получим :
Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. = 4. Рассчитаем среднее линейное отклонение простое: Л = (|3-4|+|4-4|+|4-4|+|5-4|)/4 = 0,5.
Если исходные данные X сгруппированы (имеются частоты f), то расчет среднего линейного отклонения выполняется по формуле средней арифметической взвешенной - получим :
Вернемся к примеру про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. = 4 и = 0,5. Рассчитаем среднее линейное отклонение взвешенное: Л = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.
Линейный коэффициент вариации
Линейный коэффициент вариации - это отношение среднего линейного отклонение к средней арифметической:
С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.
В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, линейный коэффициент вариации составит 0,5/4 = 0,125 или 12,5%.
Дисперсия
Дисперсия - это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой - получим дисперсию простую :
В уже знакомом нам примере про студента, который сдал 4 экзамена и получил оценки: 3, 4, 4 и 5, = 4. Тогда дисперсия простая Д = ((3-4) 2 +(4-4) 2 +(4-4) 2 +(5-4) 2)/4 = 0,5.
Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной - получим дисперсию взвешенную :
В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию взвешенную: Д = ((3-4) 2 *1+(4-4) 2 *2+(5-4) 2 *1)/4 = 0,5.
Если преобразовать формулу дисперсии (раскрыть скобки в числителе, почленно разделить на знаменатель и привести подобные), то можно получить еще одну формулу для ее расчета как разность средней квадратов и квадрата средней:
Еще проще можно найти среднее квадратическое отклонение , если предварительно рассчитана дисперсия, как корень квадратный из нее:
В примере про студента, в котором выше , найдем среднее квадратическое отклонение как корень квадратный из нее: .
Квадратический коэффициент вариации
Квадратический коэффициент вариации - это самый популярный относительный показатель вариации:
Критериальным значением квадратического коэффициента вариации V служит 0,333 или 33,3%, то есть если V меньше или равен 0,333 - вариация считает слабой, а если больше 0,333 - сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной , а средняя величина - нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности.
В примере про студента, в котором выше , найдем квадратический коэффициент вариации V = 0,707/4 = 0,177, что меньше критериального значения 0,333, значит вариация слабая и равна 17,7%.
Тема 4
Основные вопросы: 1. Абсолютные статистические величины.
2. Виды абсолютных статистических величин.
3. Относительные величины.
4. Виды относительных величин.
5. Средняя величина. Виды средних величин.
6. Средняя арифметическая.
7. Средняя гармоническая.
8. Средняя геометрическая.
9. Средняя квадратическая и средняя кубическая.
10. Структурные средние.
11. Соотношения между средней арифметической, медианой и модой в статистических распределениях.
1. Абсолютные статистические величины. Чтобы отразить размер, объем явлений в статистике применяются абсолютные величины. Абсолютная величина (А.В.) получается в результате сводки статистического материала. А.В. выражаются в различных единицах измерения – натуральных, стоимостных (денежных), условных, трудовых.
1) Натуральные единицы измерения характеризуют величину и размер изучаемых явлений. Они выражаются в метрах, тоннах, литрах и т.д. Натуральные единицы можно суммировать только по однородным продуктам, нельзя сложить тонны стали с метрами ткани.
2) Стоимостные единицы применяются для оценки в стоимостном выражении многих статистических показателей: размер розничного товарооборота, ВВП, доходы населения и т.д.
3) Условные. В ряде случаев не все виды однородной продукции можно суммировать. Нельзя суммировать мыло (т.к. оно имеет различный процент жирности), топливо (различную калорийность) и т.д. У.е.и. применяют для учета однородной продукции различных разновидностей. Например, консервы выпускают в банках разной емкости. Поэтому их считают в тысячах условных банок. За одну условную банку принят вес продукции нетто 400 гр.
4) Трудовые единицы измерения – человеко-часы, человеко-дни и т.п. Используются для измерения трудовых ресурсов, затрат труда.
2. Виды абсолютных статистических величин. По способу выражения:
1) Индивидуальные – А.В., характеризующие размеры признака у отдельных единиц совокупности (например, зарплата отдельного работника, размер посевной площади конкретного фермерского хозяйства). Они получаются непосредственно в процессе статистического наблюдения и фиксируются в первичных учетных документах.
2) Суммарные А.В. – выражают величину того или иного признака всех единиц изучаемой совокупности или отдельных ее групп и получаются в результате суммирования индивидуальных А.В. (зарплата по предприятию).
А.В. всегда являются именованными числами. Они выражаются в определенных единицах измерения (кг, шт., тонны, га, м и т.п.).
В практической деятельности при отсутствии необходимой информации абсолютные величины получают расчетным путем, например на основе балансовой увязки:
где – запас на начало периода; – поступление за период; – расход за период; – запас на конец периода.
Абсолютные статистические величины широко используют в анализе и прогнозировании состояния и развития явлений общественной жизни.
На основе А.В. исчисляют относительные величины.
3. Относительные величины (О.В.). Получаются в результате деления одной величины на другую. Числитель отношения – сравниваемая величина, ее называют текущей или отчетной величиной, знаменатель отношения называют базой сравнения или основанием сравнения.
Если база сравнения равна 100, то О.В. выражена в (%), если база сравнения 1 000 – промилле (‰), 10 000 – в продецимилле (‰0).
Сопоставляемые величины могут быть одноименными и разноименными. Если сравнивают одноименные величины, то их выражают в коэффициентах, процентах, промилле. При сопоставлении разноименных величин наименования относительных величин образуется от наименований сравниваемых величин: плотность населения – чел./км 2 , урожайность – ц/га и т.д.
4. Виды относительных величин (показателей).
1) планового задания – ОППЗ;
2) выполнения плана – ОПВП;
3) динамики (ОПД);
4) структуры (d);
5) интенсивности и уровня развития;
6) координации (ОПК);
7) сравнения (ОПС).
1) ОППЗ – служит для планирования. Вычисляется отношением уровня, запланированного на предстоящий период (П), к уровню показателя, достигнутому в предыдущем периоде ():
2) ОПВП – служит для сравнения реально достигнутых результатов с намеченными ранее.
– достигнутый уровень в текущем периоде; – план на этот же период.
3) ОПД – характеризует изменение уровня какого-либо экономического явления во времени и получается делением уровня признака за определенный период или момент времени на уровень этого же показателя в предыдущий период или момент времени. По другому, их называют – темпом роста. Вычисляются в коэффициентах или %.
4) d – характеризуют состав изучаемой совокупности, доли, удельный вес элементов совокупности в общем итоге и представляют собой отношение части единиц совокупности () ко всей численности единиц совокупности ():
5) Интенсивности и уровня развития – характеризуют степень насыщенности или развития данного явления в определенной среде, являются именованными и могут выражаться в кратных отношениях, %, ‰ и др. формах.
6) ОПК – характеризует отношение частей изучаемой совокупности к одной из них, принятой за базу сравнения. Они показывают, во сколько раз одна часть совокупности больше другой, или сколько единиц одной части приходится на 1, 10, 100, 1000 единиц другой части. Эти относительные величины могут быть исчислены как по абсолютным показателям, так и по показателям структуры.
7) ОПС – характеризуют отношения одноименных абсолютных или относительных показателей, соответствующих одному и тому же периоду или моменту времени, но относящиеся к различным объектам или территориям.
5. Средняя величина. Виды средних величин.
Определение : Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчете на единицу качественно однородной совокупности.
Виды средних величин: 1) арифметическая;
2) гармоническая;
3) геометрическая;
4) квадратическая;
5) кубическая.
Все эти средние относятся к классу степенных средних и объединяются общей формулой (при различных значениях m ):
где – среднее значение исследуемого явления;
– показатель степени средней;
– текущее значение осредняемого признака;
– число признаков.
В зависимости от значения показателя степени m различают следующие виды степенных средних:
при – средняя гармоническая ;
при – средняя геометрическая ;
при – средняя арифметическая ;
при – средняя квадратическая ;
при – средняя кубическая .
При использовании одних и тех же данных, чем больше m, тем больше значение средней величины:
– правило мажорантности средних.
Вид средней выбирается в каждом случае путем конкретного анализа изучаемой совокупности, он определяется материальным содержанием изучаемого явления.
6. Средняя арифметическая.
а) Средняя арифметическая простая применяется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных ее единиц (наиболее распространенная).
Часто приходится исчислять среднюю по групповым средним или по средним отдельных частей совокупности (частным средним), т.е. среднюю из средних. Так, например, средняя продолжительность жизни граждан страны представляет собой среднее из средних продолжительностей жизни по отдельным регионам данной страны.
Среднее из средних величин вычисляется по следующей формуле, считая :
где – число единиц в каждой группе.
Свойства средних величин:
1. Если все индивидуальные значения признака уменьшить (увеличить) в раз, тогда среднее значение нового признака соответственно уменьшится (увеличится) в раз.
2. Если варианты осредняемого признака уменьшить (увеличить) на , то средняя арифметическая соответственно уменьшится (увеличится) на то же число .
3. Если веса всех усредняемых вариантов уменьшится (увеличится) в раз, то средняя арифметическая не изменится.
4. Сумма отклонений от средней равна нулю.
7. Средняя гармоническая. Применяется в тех случаях, когда не известны частоты по отдельным вариантам x совокупности, а представлено их произведение . Обозначим это произведение через , тогда получим формулу средней гармонической взвешенной:
является преобразованной формой и тождественна ей. Вместо всегда можно рассчитать , но для этого нужно определить веса отдельных значений признака, скрытые в весах средней гармонической.
В тех случаях, когда вес каждого варианта равен единице, применяется средняя гармоническая простая :
где – отдельные варианты обратного признака, встречающиеся по одному разу,
– число вариантов.
Если по двум частям совокупности (численности и ) даны средние гармонические, то общую среднюю гармоническую по всей совокупности можно представить как взвешенную гармоническую среднюю из групповых средних:
8. Средняя геометрическая. Применяется, когда индивидуальные значения признака характеризует средний коэффициент роста (представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики). Вычисляется по формуле:
– число вариантов; – знак произведения.
Наиболее широко применяется для определения средних темпов изменения в рядах динамики, а также в рядах распределения (рассмотрим ее применение позднее).
9. Средняя квадратическая и средняя кубическая.
– применяется для вычисления средней величины стороны n квадратных участков, диаметров труб и т.п.
Определение: Мода ()– значение случайной величины, встречающееся с наибольшей вероятностью в дискретном вариационном ряду – вариант, имеющий наибольшую частоту.
Широко используется при изучении покупательского спроса, регистрации цен и т.п.
Формула для вычисления:
где – нижняя граница модального интервала;
– частоты в модальном, предыдущем и следующем за модальным интервалом (соответственно).
Модальный интервал определяется по наибольшей частоте.
Определение: Медиана – варианта, которая находится в середине вариационного ряда.
Делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значением признака больше медианы.
Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда. Поэтому соотношение моды, медианы и средней арифметической позволяет оценить асимметрию ряда распределения.
Мода и медиана, как правило, являются дополнительными к средней характеристиками совокупности и используются в математической статистике для анализа формы рядов распределения.
Аналогично медиане вычисляются значения признака, делящие совокупность на четыре равные (по числу единиц) части – квартили, на пять – квинтили, на десять – децили, на сто – перцентили.