Реферат: Средние величины, применяемые в статистике. Сущность и значение средних величин в статистике

Реферат: Средние величины, применяемые в статистике. Сущность и значение средних величин в статистике
Реферат: Средние величины, применяемые в статистике. Сущность и значение средних величин в статистике

В данной главе описывается назначение средних величин, рассматриваются их основные виды и формы, методика расчета. При изучении представленного материала необходимо усвоить требования к построению средних величин, так как их соблюдение позволяет использовать эти величины как типические характеристики значений признака по совокупности однородных единиц.

Формы и виды средних величин

Средняя величина представляет собой обобщенную характеристику уровня значений признака, которая получена в расчете на единицу совокупности. В отличие от относительной величины, которая является мерой соотношения показателей, средняя величина служит мерой признака на единицу совокупности.

Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности.

Значения признака отдельных единиц совокупности колеблются в ту или иную сторону под влиянием множества факторов, среди которых могут быть существенные и случайные. Например, ставки процента по банковским ссудам определяются исходными для всех кредитных организаций факторами (уровень резервных требований и базовая ставка процента gо ссудам, предоставляемым коммерческим банкам центральным банком, и др.), а также особенностями каждой конкретной сделки в зависимости от риска, присущего данной ссуде, ее размера и срока погашения, издержек по оформлению ссуды и контролю за ее погашением и др.

В средней величине обобщаются индивидуальные значения признака и отражается влияние общих условий, наиболее характерных для данной совокупности в конкретных условиях места и времени. Сущность средней в том и заключается, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием факторов основных. Средняя величина будет отражать типичный уровень признака в данной совокупности единиц, когда она рассчитана по качественно однородной совокупности. В связи с этим метод средних используют в сочетании с методом группировок.

Средние величины, характеризующие совокупность в целом, называют общими, а средние, отражающие особенность группы или подгруппы, – групповыми.

Сочетание общих и групповых средних позволяет проводить сравнения во времени и пространстве, существенно расширяет границы статистического анализа. Например, при подведении итогов переписи 2002 г. было установлено, что для России, как и для большинства европейских стран, характерно старение населения. По сравнению с переписью 1989 г. средний возраст жителей страны увеличился на три года и составил 37,7 года, мужчин – 35,2 года, женщин – 40,0 лет (по данным 1989 г. эти показатели соответственно были 34,7, 31,9 и 37,2 лет). По данным Росстата, ожидаемая продолжительность жизни при рождении в 2011 г. мужчин – 63 года, женщин – 75,6 лет.

Каждая средняя отражает особенность изучаемой совокупности по какому-то одному признаку. Для принятия практических решений, как правило, необходима характеристика совокупности по нескольким признакам. В этом случае используют систему средних величин.

Например, для достижения должного уровня доходности операций при приемлемом уровне риска банковской деятельности средние ставки процента по выданным кредитам устанавливают с учетом средних ставок процента по депозитам и другим финансовым инструментам.

Форма, вид и методика расчета средней величины зависят от поставленной цели исследования, вида и взаимосвязи изучаемых признаков, а также от характера исходных данных. Средние величины делятся на две основные категории:

  • 1) степенные средние;
  • 2) структурные средние.

Формула средней определяется значением степени применяемой средней. С увеличением показателя степени k возрастает соответственно средняя величина.

Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.

Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.

Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления.

Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.

При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.

Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.

Средняя выработка отражает общее свойство всей совокупности.

Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак.

Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон.

Существуют различные средние:

    средняя арифметическая;

    средняя геометрическая;

    средняя гармоническая;

    средняя квадратическая;

    средняя хронологическая.

Рассмотрим некоторые виды средних, которые наиболее часто используются в статистике.

Средняя арифметическая

Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.

Отдельные значения признака называют вариантами и обозначают через х (); число единиц совокупности обозначают через n, среднее значение признака - через. Следовательно, средняя арифметическая простая равна:

По данным дискретного ряда распределения видно, что одни и те же значения признака (варианты) повторяются несколько раз. Так, варианта х встречается в совокупности 2 раза, а варианта х-16 раз и т.д.

Число одинаковых значений признака в рядах распределения называется частотой или весом и обозначается символом n.

Вычислим среднюю заработную плату одного рабочего в руб.:

Фонд заработной платы по каждой группе рабочих равен произведению варианты на частоту, а сумма этих произведений дает общий фонд заработной платы всех рабочих.

В соответствии с этим, расчеты можно представить в общем виде:

Полученная формула называется средней арифметической взвешенной.

Статистический материал в результате обработки может быть представлен не только в виде дискретных рядов распределения, но и в виде интервальных вариационных рядов с закрытыми или открытыми интервалами.

Исчисление средней по сгруппированным данным производится по формуле средней арифметической взвешенной:

В практике экономической статистики иногда приходится исчислять среднюю по групповым средним или по средним отдельных частей совокупности (частным средним). В таких случаях за варианты (х) принимаются групповые или частные средние, на основании которых исчисляется общая средняя как обычная средняя арифметическая взвешенная.

Основные свойства средней арифметической .

Средняя арифметическая обладает рядом свойств:

1. От уменьшения или увеличения частот каждого значения признака х в п раз величина средней арифметической не изменится.

Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится.

2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней:

3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних:

4. Если х = с, где с - постоянная величина, то
.

5. Сумма отклонений значений признака Х от средней арифметической х равна нулю:

Средняя гармоническая.

Наряду со средней арифметической, в статистике применяется средняя гармоническая величина, обратная средней арифметической из обратных значений признака. Как и средняя арифметическая, она может быть простой и взвешенной.

Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.

Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.

Для интервальных рядов распределения с равными интервалами мода определяется по формуле:

где
- начальное значение интервала, содержащего моду;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота интервала, следующего за модальным.

Медиана - это варианта, расположенная в середине вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда (упорядоченный ряд - это расположение единиц совокупности в возрастающем или убывающем порядке).

В статистике используют различные виды средних величин, которые делятся на два больших класса:

Степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);

Структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины – средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй – 7, третий – 4, четвертый – 10, пятый– 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для опреде-

ления средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек, возраст которых варьируется от 18 до 22 лет, где xi – варианты осредняемого признака, fi – частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины – средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как?fi, а время, затраченное на весь путь, – как? fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi – отдельные варианты; n – число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2

Виды степенных средних


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая – при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где – средняя величина; – индивидуальное значение; n – число единиц изучаемой совокупности; k – показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние – мода (Мо) и медиана (Ме).

Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; fm_ 1 – частота предшествующего интервала; fm+ 1 – частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; f – число членов ряда;

M-1 – сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили – на 10 равных частей. Квартилей насчитывается три, а децилей – девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

На этапе статистической обработки могут быть поставлены самые различные задачи исследования, для решения которых нужно выбрать соответствующую среднюю. При этом необходимо руководствоваться следующим правилом: величины, которые представляют собой числитель и знаменатель средней, должны быть логически связаны между собой.

  • степенные средние;
  • структурные средние.

Введем следующие условные обозначения:

Величины, для которых исчисляется средняя;

Средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений;

Частота (повторяемость индивидуальных значений признака).

Различные средние выводятся из общей формулы степенной средней:

(5.1)

при k = 1 - средняя арифметическая; k = -1 - средняя гармоническая; k = 0 - средняя геометрическая; k = -2 - средняя квадратическая.

Средние величины бывают простые и взвешенные.

Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность, в связи с чем каждый вариант приходится умножать на эту численность. Иными словами, «весами» выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту f называют статистическим весом или весом средней .

Известно, что сделки осуществлялись в течение 5 дней (5 сделок), количество проданных акций по курсу продаж распределилось следующим образом:

1 - 800 ак. - 1010 руб.

2 - 650 ак. - 990 руб.

3 - 700 ак. - 1015 руб.

4 - 550 ак. - 900 руб.

5 - 850 ак. - 1150 руб.

Исходным соотношением для определения среднего курса стоимости акций является отношение общей суммы сделок (ОСС) к количеству проданных акций (КПА):

ОСС = 1010 · 800 + 990 · 650 + 1015 · 700+900·550+1150·850= 3 634 500;

КПА = 800+650+700+550+850=3550.

В этом случае средний курс стоимости акций был равен:

Необходимо знать свойства арифметической средней, что очень важно как для ее использования, так и при ее расчете. Можно выделить три основных свойства, которые наиболее всего обусловили широкое применение арифметической средней в статистико-экономических расчетах.

Свойство первое (нулевое ): сумма положительных отклонений индивидуальных значений признака от его среднего значения равна сумме отрицательных отклонений. Это очень важное свойство, поскольку оно показывает, что любые отклонения (как с +, так и с -), вызванные случайными причинами, взаимно будут погашены.

Доказательство :

Свойство второе (минимальное ): сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа (а), т.е. есть число минимальное.

Доказательство.

Составим сумму квадратов отклонений от переменной а:

(5.4)

Чтобы найти экстремум этой функции, необходимо ее производную по а приравнять нулю:

Отсюда получаем:

(5.5)

Следовательно, экстремум суммы квадратов отклонений достигается при . Этот экстремум - минимум, так как функция не может иметь максимума.

Свойство третье : средняя арифметическая постоянной величины равна этой постоянной: при а = const.

Кроме этих трех важнейших свойств средней арифметической существуют так называемые расчетные свойства , которые постепенно теряют свою значимость в связи с использованием электронно-вычислительной техники:

  • если индивидуальное значение признака каждой единицы умножить или разделить на постоянное число, то средняя арифметическая увеличится или уменьшится во столько же раз;
  • средняя арифметическая не изменится, если вес (частоту) каждого значения признака разделить на постоянное число;
  • если индивидуальные значения признака каждой единицы уменьшить или увеличить на одну и ту же величину, то средняя арифметическая уменьшится или увеличится на ту же самую величину.

Средняя гармоническая . Эту среднюю называют обратной средней арифметической, поскольку эта величина используется при k = -1.

Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы. Ее формулу можно вывести из базовой формулы, подставив k = -1:

К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая - со скоростью 100 км/ч, вторая - 90 км/ч.

Применяя метод средней гармонической, мы вычисляем среднюю скорость:

В статистической практике чаще используется гармоническая взвешенная, формула которой имеет вид:

Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель.

Например, при расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам не известно количество реализованных единиц (речь идет о разных товарах), но известны суммы реализаций этих различных товаров.

Допустим, необходимо узнать среднюю цену реализованных товаров:

Получаем

Если здесь использовать формулу средней арифметической, то можно получить среднюю цену, которая будет нереальна:

Средняя геометрическая . Чаще всего средняя геометрическая находит свое применение при определении средних темпов роста (средних коэффициентов роста), когда индивидуальные значения признака представлены в виде относительных величин. Она используется также, если необходимо найти среднюю между минимальным и максимальным значениями признака (например, между 100 и 1000000). Существуют формулы для простой и взвешенной средней геометрической.

Для простой средней геометрической:

Для взвешенной средней геометрической:

Средняя квадратическая величина . Основной сферой ее применения является измерение вариации признака в совокупности (расчет среднего квадратического отклонения).

Формула простой средней квадратической:

Формула взвешенной средней квадратической:

(5.11)

В итоге можно сказать, что от правильного выбора вида средней величины в каждом конкретном случае зависит успешное решение задач статистического исследования.

Выбор средней предполагает такую последовательность:

а) установление обобщающего показателя совокупности;

б) определение для данного обобщающего показателя математического соотношения величин;

в) замена индивидуальных значений средними величинами;

г) расчет средней с помощью соответствующего уравнения.

Начиная рассуждать о средних величинах, чаще всего вспоминают, как заканчивали школу и поступали в учебное заведение. Тогда по аттестату рассчитывался средний балл: все оценки (и хорошие, и не очень) складывали, полученную сумму делили на их количество. Так вычисляется самый простой вид средней, которая называется средняя арифметическая простая. На практике в статистике применяются различные виды средних величин: арифметическая, гармоническая, геометрическая, квадратическая, структурные средние. Тот или иной их вид используется в зависимости от характера данных и целей исследования.

Средняя величина является наиболее распространенным статистическим показателем, с помощью которого дается обобщающая характеристика совокупности однотипных явлений по одному из варьирующих признаков. Она показывает уровень признака в расчете на единицу совокупности. С помощью средних величин проводится сравнение различных совокупностей по варьирующим признакам, изучаются закономерности развития явлений и процессов общественной жизни.

В статистике применяются два класса средних: степенные (аналитические) и структурные. Последние используются для характеристики структуры вариационного ряда и будут рассмотрены далее в гл. 8.

К группе степенных средних относят среднюю арифметическую, гармоническую, геометрическую, квадратическую. Индивидуальные формулы для их вычисления можно привести к виду, общему для всех степенных средних, а именно

где m - показатель степенной средней: при m = 1 получаем формулу для вычисления средней арифметической, при m = 0 - средней геометрической, m = -1 - средней гармонической, при m = 2 - средней квадратической;

x i - варианты (значения, которые принимает признак);

f i - частоты.

Главным условием, при котором можно использовать степенные средние в статистическом анализе, является однородность совокупности, которая не должна содержать исходных данных, резко различающихся по своему количественному значению (в литературе они носят название аномальных наблюдений).

Продемонстрируем важность этого условия на следующем примере.

Пример 6.1. Вычислим среднюю заработную плату сотрудников малого предприятия.

Таблица 6.1. Заработная плата работников
№ п/п Заработная плата, руб. № п/п Заработная плата, руб.
1 5 950 11 7 000
2 6 790 12 5 950
3 6 790 13 6 790
4 5 950 14 5 950
5 7 000 5 6 790
6 6 790 16 7 000
7 5 950 17 6 790
8 7 000 18 7 000
9 6 790 19 7 000
10 6 790 20 5 950

Для расчета среднего размера заработной платы необходимо просуммировать заработную плату, начисленную всем работникам предприятия (т.е. найти фонд заработной платы), и разделить на число работающих:


А теперь добавим в нашу совокупность всего лишь одного человека (директора этого предприятия), но с окладом в 50 000 руб. В таком случае вычисляемая средняя будет совсем другая:

Как видим, она превышает 7000 руб., т.д. она больше всех значений признака за исключением одного-единственного наблюдения.

Для того чтобы таких случаев не происходило на практике, и средняя не теряла бы своего смысла (в примере 6.1 она уже не выполняет роль обобщающей характеристики совокупности, которой должна быть), при расчете средней следует аномальные, резко выделяющиеся наблюдения либо исключить из анализа и тем самым сделать совокупность однородной, либо разбить совокупность на однородные группы и вычислить средние значения по каждой группе и анализировать не общую среднюю, а групповые средние значения.

6.1. Средняя арифметическая и ее свойства

Средняя арифметическая вычисляется либо как простая, либо как взвешенная величина.

При расчете средней заработной платы по данным таблицы примера 6.1 мы сложили все значения признака и поделили на их количество. Ход наших вычислений запишем в виде формулы средней арифметической простой

где х i - варианты (отдельные значения признака);

п - число единиц в совокупности.

Пример 6.2. Теперь сгруппируем наши данные из таблицы примера 6.1, т.д. построим дискретный вариационный ряд распределения работающих по уровню заработной платы. Результаты группировки представлены в таблице.

Запишем выражение для вычисления среднего уровня заработной платы в более компактной форме:

В примере 6.2 была применена формула средней арифметической взвешенной

где f i - частоты, показывающие, сколько раз встречается значение признака х i y единиц совокупности.

Расчет средней арифметической взвешенной удобно проводить в таблице, как это показано ниже (табл. 6.3):

Таблица 6.3. Расчет средней арифметической в дискретном ряду
Исходные данные Расчетный показатель
заработная плата, руб. численность работающих, чел. фонд заработной платы, руб.
x i f i x i f i
5 950 6 35 760
6 790 8 54 320
7 000 6 42 000
Итого 20 132 080

Следует отметить, что средняя арифметическая простая используется в тех случаях, когда данные не сгруппированы или сгруппированы, но все частоты равны между собой.

Часто результаты наблюдения представляют в виде интервального ряда распределения (см. таблицу в примере 6.4). Тогда при расчете средней в качестве x i берут середины интервалов. Если первый и последний интервалы открыты (не имеют одной из границ), то их условно "закрывают", принимая за величины данного интервала величину примыкающего интервала, т.д. первый закрывают исходя из величины второго, а последний - по величине предпоследнего.

Пример 6.3. По результатам выборочного обследования одной из групп населения рассчитаем размер среднедушевого денежного дохода.

В приведенной таблице середина первого интервала равна 500. Действительно, величина второго интервала - 1000 (2000-1000); тогда нижняя граница первого равна 0 (1000-1000), а его середина - 500. Аналогично поступаем с последним интервалом. За его середину принимаем 25 000: величина предпоследнего интервала 10 000 (20 000-10 000), тогда его верхняя граница - 30 000 (20 000 + 10 000), а середина, соответственно, - 25 000.

Таблица 6.4. Расчет средней арифметической в интервальном ряду
Среднедушевой денежный доход, руб. в месяц Численность населения к итогу, % f i Середины интервалов x i x i f i
До 1 000 4,1 500 2 050
1 000-2 000 8,6 1 500 12 900
2 000-4 000 12,9 3 000 38 700
4 000-6 000 13,0 5 000 65 000
6 000-8 000 10,5 7 000 73 500
8 000-10 000 27,8 9 000 250 200
10 000-20 000 12,7 15 000 190 500
20 000 и выше 10,4 25 000 260 000
Итого 100,0 - 892 850

Тогда среднедушевой размер месячного дохода составит