Қисық сызық бірдей көрінгенімен, Коши мен Гауссидің таралуынан қандай айырмашылық бар?


жауап 1:

Коши кәдімгідей болмайды. Коши қандай болатындығы сіз қолданатын параметрлерге байланысты, бірақ ол қалыпты болып көрінбейді.

мысалы

set.seed (1234) # Кездейсоқ санның басталу мәнін орнатыңыз x1 <- rcauchy (1000, 0, 1) x2 <- rnorm (1000, орташа (x1), sd (x1)) diagram (тығыздық (x1)) diagram (тығыздық (x1)) (x2))

Бірдей көрінбеңіз. Ал x1 -178-ден 702-ге дейін, x2 -76-дан 71-ге дейін.


жауап 2:

Көріп отырғаныңыздай, екі қисық бір-біріне ұқсайды, олардың екеуі де бір «соққыға» ие және сіз одан әрі қарай таралады. Олар Кошидің тар шыңы бар және баяу таралатындығымен ерекшеленеді - қалыпты таралумен салыстырғанда шыңнан алшақ мәндерді алу мүмкіндігі көбірек. Математикалық тұрғыдан алғанда, бұл айырмашылық көптеген әртүрлі салдарға әкеледі - мысалы, Коши дәл анықталған орташа және таңдамалы үлгінің үлестірілмеуі, ол үшін «үлкен сандар заңы» қолданылмайды.


жауап 3:

Қисық сызық бірдей көрінгенімен, Коши мен Гауссидің таралуынан қандай айырмашылық бар?

Бетінде олар ұқсас көрінеді. Бірақ маған үлестірімнің тығыздық функциясының диаграммасын көрсетіп, бұл не Коши, не Гаусс екенін айтыңыз, мен оның қайсысын білемін (егер бұл шынымен солардың бірі болса). Кошидің құйрықтары әлдеқайда ұзын.

Егер бізде белгісіз параметрлері бар тарату тобы болса, біз бұл параметрлерді бағалаймыз.

  • Гаусстың таралуы екі параметрге ие, орташа және стандартты ауытқу. Оның орнына біз басқа параметрлерді пайдалана аламыз, мысалы, медианалық (орташа мәнге сәйкес келеді) және жартылай квартильді диапазон (шамамен)
  • 0.67450.6745
  • стандартты ауытқудан есе көп). Коши таралуының орташа мәні жоқ, бірақ медиан симметрияның орталығы болып табылады. Стандартты ауытқу да жоқ, бірақ медианадан квадраттық ауытқудың орташа мәні шексіз.

Сондықтан басты айырмашылық осы. Екі үлестірімнің параметрлерін медианалық және жартылай квартильді диапазон ретінде қарастыруға болады, бірақ Коши үшін орташа және стандартты ауытқуды қолдана алмаймыз, өйткені олар жоқ.

Тарату параметрлерін бағалау үшін үлгіні алуда біз орташа мәндер стандартты ауытқуы сияқты статистикалық мәліметтерді есептейміз. Бұл статистикада бөлу бар. Үлгінің статистикалық үлестірімі үлгінің таралуы деп аталады.

  • Егер популяцияның таралуы Гаусс болса (үлгінің үлестірілу түрі) болса, іріктеу орташа мәні де Гаусс болып табылады және стандартты ауытқуы анағұрлым аз болады, сондықтан үлкен іріктеу жай бақылаудан гөрі дәлірек бағаларды береді. Егер үлестіру Коши болса, үлгісі де Коши үлестіріміне ие, бірақ бастапқы үлестіріммен бірдей орташа және жартылай квартильді диапазон. Үлгінің орташа мәнін алудың артықшылығы жоқ.

Сондықтан бұл тағы бір айырмашылық. Гауссианнан алынған үлгінің орташа мәні (немесе орташа) бағалау үшін пайдалы; Коши үшін үлгінің орташа мәні медиананы бағалау үшін пайдасыз. Дәлірек бағалауды беретін медиананы қолданған дұрыс.

Ұқсас дәлелдер екі үлестірімнің біреуінің шашырауын бағалауға қолданылады (бірақ сіз оны анықтайсыз). Гаусстың таралуы үшін әдеттегі есептер Коши үлестірімі үшін жұмыс істемейді.

Нақты айырмашылық тығыздықтың математикалық формуласында жатыр. Стандартты түрде Гаусстың тығыздығы

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

және кошидің тығыздығы бар

1π(1+z2)\frac1{\pi(1+z^2)}

.

Екіге назар аударыңыз

zz

s әр түрлі. Бірінші жағдайда, стандартты ауытқу

11

екінші жағдайда жоғарғы квартиль

11

.

Бөлу функциясы (ықтималдығы

ZzZ\le z

) Гаусстың таралуы үшін дұрыс жабық формасы жоқ, бірақ Коши үшін

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

Егер сіз айырмашылықты көру үшін үлестірімдерді бірдей осьтерде сызғыңыз келсе, параметрлерді реттеуіңіз керек. Сондықтан мен төменгі және жоғарғы квартильдер болатындай етіп Гауссияны стандарттаймын

0.6745-0.6745

және

0.67450.6745

яғни стандартты ауытқуды бірдей етіп жасаңыз

1.48261.4826

және Коши үшін стандартты нысанды қолданыңыз. Диаграммалардағы аудандар бірдей болуы керек, сондықтан ортадағы биіктіктер тиісті түрде масштабталуы керек (

0.2690.269

үшін Гауссиан және

0.3180.318

Коши үшін - Коши ортасында үлкен және құйрықтарда жоғарырақ).