Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Как определить репрезентативность выборки?

Софи Радивил Мудрец (14340), закрыт 2 года назад
Известно что вся совокупность составляет напр 10 млн чел. Из них отобрали первых крупных 100 групп, которые имеют определенные телефоны, напр:
айфон-5 11740 чел
самсунг-s5 11737 чел
нокиа-р8 11736 чел..
самсунг s10 - 11555 чел
...
Леново х - 129 чел


Общая выборка около 1,5 млн чел. Задача: понять какие телефоны чаще берут: айфоны, самсунги, нокиа или др.марки


Вопрос: является ли данная выборка репрезентативной, можно ли выведенную закономерность для 100 более крупных групп распростанить на всю совокупность?


Ведь нельзя сказать что больше всего айфонов, тк других групп немногочисленных и которые "неайфоны" может быть намного больше.
Лучший ответ
Игорь Семененко Мудрец (14767) 2 года назад
Несколько способов. Все зависит от целей и задач.
Самый простой, это взять выборку большую и меньшую. Например 1000 из 1 000 000 и 2000 из 1000 000, сравнить данные по средним и по стандартному отклонения. Если они равны, то для данного замера 1000 достаточно, ну и периодически делать большие выборки, для контроля. Это удобно для периодических оценках, для повторяемых измерений.
Если же оценка разовая, то тогда принимают некоторую гипотезу, об этой величине, и по выборке оценивают параметры модели и их соответствие выбранной гипотезе, есть несколько критериев. Чаще всего применяют нормальное распределение. Критерий Пирсона к примеру. В общем все начинают с построения модели, а там уже оценивают.
Софи РадивилМудрец (14340) 2 года назад
А если взять мой пример? Вот выборка 1,5 млн чел, а всего 10 млн. Совокупность. Может ли быть выборка 15% давай понятие о совокупности? Вроде бы самые большие группы, а всего составляют 15% от численности
Игорь СемененкоМудрец (14767) 2 года назад
Постойте модель распределения. Тут правда надо понять, какой критерий в модели выбрать за основу. В вашем примере за основу можно взять цену аппарата, и уже по ней делать выбор модели, а потом оценить ее. Скорее всего получится нормальная, но гарантии нет. Точнее так, если нормальная не получатся, значит не факт что выборка не репрезентативна. Но если получится, то она репрезентативна.
По сути на выбор того или иного аппарата влияет множество параметров, ключевой все же я думаю это цена, хотя понты или цвет тоже важны.
А раз их много, то оно должно подчинятся нормальному закону.
Тут просто нужно пробовать.
Остальные ответы
Похожие вопросы