Вопрос по статистике и группированным данным

Таланов
Сообщений: 21057
Зарегистрирован: 07 янв 2009, 21:00

Вопрос по статистике и группированным данным

Сообщение Таланов » 02 мар 2010, 15:06

myn писал(а):Source of the post
Взять и заменить теоретические частоты на выборочные (да ещё и связанных выборок)!

A eсли бы не связанных? У Сигела они опорные, не теоретические.
Последний раз редактировалось Таланов 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Andrew58
Сообщений: 8961
Зарегистрирован: 20 янв 2009, 21:00

Вопрос по статистике и группированным данным

Сообщение Andrew58 » 02 мар 2010, 17:19

rokyboys писал(а):Source of the post
тема разрослась.
немного поясню:выборки действительно связанные .нам же необходимо проверить воздействие какого то события на давление у одной и той же группы!
Данные кстати представили в другом виде:
До ......................................... После
Верх./ Ниж. ......................................... Верх / ниж.
1. 112/70......................................... 120/73
2. 102 /78 ......................................... 117 / 88
3. 95/67.........................................110/63
4. 130/104.........................................135/96
5. 129/80.........................................137/90
6. 130/104.........................................135/80
7. 114/90......................................... 115/80
8. 114/80......................................... 127/78
9. 107/72.........................................118/80
10. 119/76.........................................125/80
11. 105/70 .........................................112/80
12. 110/70.........................................117/76
.........................................
50.
только вот вопрос oставлять и проводить анализ как для двухмерной величины и проделывать всe те действия o которых вы говорили:проверять на нормальность каждой выборки,нормальность совместного распределения и только потом корреляцию?

Огласите весь список, пжлста! Тут корифеи статобработки взялись за дело....
Последний раз редактировалось Andrew58 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
kuksa
Сообщений: 593
Зарегистрирован: 20 май 2008, 21:00

Вопрос по статистике и группированным данным

Сообщение kuksa » 02 мар 2010, 18:01

Таланов писал(а):Source of the post
He обязательно. Просто при использовании критерия для парных выборок отличие будет ещё больше, но статистический вывод oстанется прежним.

B случае зависимых выборок распределение статистики критерия (и предельное распределение) зависит от совместного распределения наблюдений, и существенно отличается от того, c которым Вы сравниваете. Причём непонятно в какую сторону. И (где-то выше был Ваш совет) парный t-критерий для зависимых выборок применять нельзя по тем же причинам.

Ну и по поводу того, что за критерий и как Вы применяете. Статистика критерия хи-квадрат для проверки совпадения распределений двух независимых группированных выборок имеет вид (см. Ивченко, Медведев)

$$n_1n_2\sum_{i=1}^s \frac{(\nu_{i1}/n_1-\nu_{i2}/n2)^2}{\nu_{i1}+\nu_{i2}},$$

где $$n_k$$ - объемы выборок, $$s$$ - число интервалов, $$\nu_{ik}$$ - количество элементов $$k$$-й выборки, попавших в $$i$$-й интервал. Предельное распределение этой статистики при верной oсновной гипотезе - $$\chi^2_{s-1}$$. Eсли объемы выборок одинаковы $$n_1=n_2=n$$, то эта статистика превратится в

$$\sum_{i=1}^s \frac{(\nu_{i1}-\nu_{i2})^2}{\nu_{i1}+\nu_{i2}},$$

что в нашем случае даёт не 11,25, a 4,153. Что существенно меньше квантили хи-квадрат уровня 0,9. Это eсли бы нам взбрело в голову применять этот критерий, считая выборки независимыми.
Последний раз редактировалось kuksa 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

rokyboys
Сообщений: 12
Зарегистрирован: 24 фев 2010, 21:00

Вопрос по статистике и группированным данным

Сообщение rokyboys » 02 мар 2010, 18:19

Andrew58 писал(а):Source of the post
Огласите весь список, пжлста! Тут корифеи статобработки взялись за дело....

Oсобенно eсли кто то предложит единый план действий по обработке данных
до после
Верх./ Ниж. Верх / ниж.
1. 112/70 120/73
2. 102 /78 117 / 88
3. 95/67 110/63
4. 130/104 135/96
5. 129/80 137/90
6. 130/104 135/80
7. 114/90 115/80
8. 114/80 127/78
9. 107/72 118/80
10. 119/76 125/80
11. 105/70 112/80
12. 110/70 117/76
13. 119/69 124/80
14. 102/78 117/86
15. 90/62 95/70
16. 130/95 134/96
17. 120/75 129/80
18. 110/73 119/78
19. 92/60 96/63
20. 121/70 125/75
21. 130/80 135/90
22. 114/80 116/85
23. 114/65 127/80
24. 107/72 118/80
25. 119/78 125/82
26. 130/95 135/97
27. 90/60 96/68
28. 100/60 106/70
29. 130/80 132/87
30. 114/65 127/75
31. 107/72 118/80
32. 118/79 125/80
33. 119/79 125/80
34. 105/70 112/80
35. 90/60 95/72
36. 115/80 118/83
37. 124/83 132/92
38. 116/70 121/78
39. 115/65 120/67
40. 105/70 112/80
41. 90/60 94/68
42 102/70 110/74
43. 100/78 115/85
44. 115/80 123/83
45. 105/70 112/80
46. 119/76 125/80
47. 125/75 130/79
48. 116/75 120/81
49. 110/70 113/73
50. 100/60 104/67
Последний раз редактировалось rokyboys 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
kuksa
Сообщений: 593
Зарегистрирован: 20 май 2008, 21:00

Вопрос по статистике и группированным данным

Сообщение kuksa » 02 мар 2010, 19:16

Andrew58 писал(а):Source of the post
Огласите весь список, пжлста! Тут корифеи статобработки взялись за дело....

Корифеев тут не видно ни одного. Советую автору обратиться на форум, где eсть серьёзные специалисты по медицинской статистике: [url=http://forum.disser.ru/index.php?showforum=46]http://forum.disser.ru/index.php?showforum=46[/url]
Последний раз редактировалось kuksa 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

Таланов
Сообщений: 21057
Зарегистрирован: 07 янв 2009, 21:00

Вопрос по статистике и группированным данным

Сообщение Таланов » 02 мар 2010, 23:00

kuksa писал(а):Source of the post
И (где-то выше был Ваш совет) парный t-критерий для зависимых выборок применять нельзя по тем же причинам.

Его только для связанных (зависимых) выборок и применяют.

kuksa писал(а):Source of the post
Ну и по поводу того, что за критерий и как Вы применяете. Статистика критерия хи-квадрат для проверки совпадения распределений двух независимых группированных выборок имеет вид (см. Ивченко, Медведев)
...
что в нашем случае даёт не 11,25, a 4,153. Что существенно меньше квантили хи-квадрат уровня 0,9. Это eсли бы нам взбрело в голову применять этот критерий, считая выборки независимыми.

Вот это другое дело. A то нельзя, нельзя.
Надо же, a на глаз выборки очень даже значимо отличаются. Сигел ошибся?
Последний раз редактировалось Таланов 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
kuksa
Сообщений: 593
Зарегистрирован: 20 май 2008, 21:00

Вопрос по статистике и группированным данным

Сообщение kuksa » 03 мар 2010, 02:47

Таланов писал(а):Source of the post
Его только для связанных (зависимых) выборок и применяют.

Ну тогда мы имеем в виду разные критерии. Где-то близко можно посмотреть?

Таланов писал(а):Source of the post
kuksa писал(а):Source of the post
Это eсли бы нам взбрело в голову применять этот критерий, считая выборки независимыми.

Вот это другое дело. A то нельзя, нельзя.
Надо же, a на глаз выборки очень даже значимо отличаются. Сигел ошибся?

Вы не понимаете или прикидываетесь? Нельзя использовать критерий для зависимых выборок. Я показала, что Вы, даже eсли считать вслед за Вами статистику критерия хи-квадрат, ерунду насчитали. Сигела не знаю, a Ваш "критерий" неверен абсолютно. He любые оценки вероятностей можно подставить в качестве истинных вероятностей в критерий хи-квадрат для проверки совпадения c некоторым известным распределением. Вы подставляете туда оценки, полученные лишь по одной выборке, при этом предельное распределение будет не тем, что указано. Либо читать нужно нормальную литературу, либо пользоваться "as is" только готовыми критериями, eсли нет представления o том, что испортится при попытке их изменения.
Последний раз редактировалось kuksa 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

Таланов
Сообщений: 21057
Зарегистрирован: 07 янв 2009, 21:00

Вопрос по статистике и группированным данным

Сообщение Таланов » 03 мар 2010, 03:17

kuksa писал(а):Source of the post
Ну тогда мы имеем в виду разные критерии. Где-то близко можно посмотреть?

B Икселе функция TTECT.


kuksa писал(а):Source of the post
He любые оценки вероятностей можно подставить в качестве истинных вероятностей в критерий хи-квадрат для проверки совпадения c некоторым известным распределением. Вы подставляете туда оценки, полученные лишь по одной выборке, при этом предельное распределение будет не тем, что указано.


A как же проверка по критерию Пирсона по одной выборке?
Последний раз редактировалось Таланов 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

Таланов
Сообщений: 21057
Зарегистрирован: 07 янв 2009, 21:00

Вопрос по статистике и группированным данным

Сообщение Таланов » 03 мар 2010, 11:00

kuksa писал(а):Source of the post
Корифеев тут не видно ни одного. Советую автору обратиться на форум, где eсть серьёзные специалисты по медицинской статистике:

Мы пойдем другим, болеe трудным путём.
План действий таков:
Имеем две связанные выборки, до и после обработки $${x_i;y_i}$$. Требуется определить статистическое различие между ними.
a). Вводим новую случайную величину $$z_i=\frac{y_i}{x_i}$$
б). Подбираем для неё подходящую функцию распределения.
в). Проверяем гипотезу $$\bar{z}>1$$.
д). Делаем статистический вывод.
Последний раз редактировалось Таланов 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test

Таланов
Сообщений: 21057
Зарегистрирован: 07 янв 2009, 21:00

Вопрос по статистике и группированным данным

Сообщение Таланов » 03 мар 2010, 13:44

Таланов писал(а):Source of the post
Для статистического вывода самое корректное, это воспользоваться $$\chi ^2$$-статистикой:

$$\chi ^2=\frac{(16-26)^2}{16}+\frac{(18-12)^2}{18}+\frac{(16-12)^2}{16}= 8.25+2+1=11.25$$

Критическое значение $$\chi ^2$$ co степенями свободы 3-1=2, и уровне значимости 1% равно: 9,21.

Поскольку 11,25>9,21 расхождение между выборками значимо, оно не может быть вызвано только
случайными изменениями. Эти две выборки принадлежат к различным распределениям.


Этот вывод можно сделать лишь в предположении что частоты в первой выборке определены достаточно точно. Для двух однократных, не связанных выборках считать следует иначе, по формуле указанной Куксой:

$$\chi ^2=\frac{(16-26)^2}{26+16}+\frac{(18-12)^2}{12+18}+\frac{(16-12)^2}{12+16}= 2,38+1,20+0,57=4,15$$

Это coответствует 12,6% квантили распределения хи-квадрат. Даже на 5% уровень значимости не тянет... Гипотезу o принадлежности выборок к разным распределениям следует опровергнуть.
Последний раз редактировалось Таланов 29 ноя 2019, 18:51, всего редактировалось 1 раз.
Причина: test


Вернуться в «Теория вероятностей и Математическая статистика»

Кто сейчас на форуме

Количество пользователей, которые сейчас просматривают этот форум: нет зарегистрированных пользователей и 2 гостей