kouprianov (kouprianov) wrote,
kouprianov
kouprianov

Categories:

Крымский опрос ВЦИОМ: еще о половозрастной структуре.

Продолжаю ковыряться. Взял данные переписи. Вот -- половозрастная структура погодно:

ages_by_1yr_cohorts.census_vs_poll.3

А вот по возрастным когортам, использованным ВЦИОМ при обработке данных (выше на рисунке их границы показаны красным пунктиром):

ages_by_VTsIOM_cohorts.census_vs_poll.3</script>

Если взять за основу возрастные группы, использованные ВЦИОМ при обработке данных, и посмотреть на распределение респондентов по ним, то получится вот что:
Население в целом по возрастным группам, использованным ВЦИОМ.

> chisq.test(cr.age.i.census_vs_poll)

	Pearson's Chi-squared test

data:  cr.age.i.census_vs_poll
X-squared = 318.82, df = 4, p-value < 2.2e-16

> chisq.test(cr.age.i.census_vs_poll)$observed
          C    P
[1,] 166951  230
[2,] 366910  292
[3,] 318718  424
[4,] 479027 1093
[5,] 545509  986
> chisq.test(cr.age.i.census_vs_poll)$expected
            C        P
[1,] 166912.0 268.9813
[2,] 366611.2 590.7996
[3,] 318628.5 513.4748
[4,] 479347.5 772.4760
[5,] 545615.7 879.2682
> chisq.test(cr.age.i.census_vs_poll)$residuals
               C          P
[1,]  0.09541412  -2.376815
[2,]  0.49348870 -12.293059
[3,]  0.15851067  -3.948583
[4,] -0.46295132  11.532357
[5,] -0.14449415   3.599424

Мужчины по возрастным группам, использованным ВЦИОМ.

> chisq.test(cr.age.i.m.census_vs_poll)

	Pearson's Chi-squared test

data:  cr.age.i.m.census_vs_poll
X-squared = 80.813, df = 4, p-value < 2.2e-16

> chisq.test(cr.age.i.m.census_vs_poll)$observed
          C   P
[1,]  87567 124
[2,] 185367 135
[3,] 156932 176
[4,] 217384 338
[5,] 196080 324
> chisq.test(cr.age.i.m.census_vs_poll)$expected
             C        P
[1,]  87577.08 113.9199
[2,] 185261.01 240.9867
[3,] 156903.90 204.0999
[4,] 217439.16 282.8439
[5,] 196148.85 255.1496
> chisq.test(cr.age.i.m.census_vs_poll)$residuals
               C          P
[1,] -0.03406201  0.9444211
[2,]  0.24624047 -6.8273930
[3,]  0.07093949 -1.9669057
[4,] -0.11828362  3.2795938
[5,] -0.15545824  4.3103171


Женщины по возрастным группам, использованным ВЦИОМ:

> chisq.test(cr.age.i.f.census_vs_poll)

	Pearson's Chi-squared test

data:  cr.age.i.f.census_vs_poll
X-squared = 264.65, df = 4, p-value < 2.2e-16

> chisq.test(cr.age.i.f.census_vs_poll)$observed
          C   P
[1,]  79384 106
[2,] 181543 157
[3,] 161786 248
[4,] 261643 755
[5,] 349429 662
> chisq.test(cr.age.i.f.census_vs_poll)$expected
             C        P
[1,]  79342.03 147.9722
[2,] 181361.76 338.2381
[3,] 161732.37 301.6295
[4,] 261909.54 488.4590
[5,] 349439.30 651.7012
> chisq.test(cr.age.i.f.census_vs_poll)$residuals
               C          P
[1,]  0.14900813 -3.4504169
[2,]  0.42557553 -9.8545828
[3,]  0.13335366 -3.0879235
[4,] -0.52082084 12.0600734
[5,] -0.01742204  0.4034229


Как все это читать? Мы анализируем распределение по группам у всех (1), у мужчин (2) и у женщин (3). Везде отличия нашей выборки от данных по переписи наблюдаются на запредельных уровнях значимости (p-value -- вероятности того, что эти отличия могли быть обусловлены случайными причинами -- очень низкие). В каждой таблице сравниваются две колонки цифр -- C (Census -- перепись) и P (Poll -- опрос). Пять строчек в колонке соответствуют возрастным интервалам (см. рисунки выше). observed -- это наблюдаемые значения, expected -- теоретически ожидаемые (исходя из гипотезы о том, что в выборке ВЦИОМ возрастные группы населения представлены пропорционально), residuals -- оценка отскока наблюдаемого от теоретически ожидаемого, если больше двух по модулю, то вероятность того, что этот отскок обусловлен случайными причинами, достаточно мала, чтобы можно было считать его неслучайным (подробнее см. в статье Википедии про хихиквадрат или в других разумных источниках про него же).

Коротко говоря, выборка ВЦИОМ и население Крыма по переписи в отношении распределения по половозрастным группам не имеют между собой ничего общего...

UPD: По просьбе коллег, выкладываю с вертикальной осью, отградуированной в частотах:

ages_by_1yr_cohorts.census_vs_poll.3.freq

UPD2: По просьбе особо упрямых коллег -- в частотах и в одном масштабе по вертикальной оси:

ages_by_1yr_cohorts.census_vs_poll.3.freq.065

This entry was originally posted at http://kouprianov.dreamwidth.org/317685.html Comment wherever you wish.
Tags: крым
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 24 comments