2 тысячи записей — это херовая выборка, она СЛИШКОМ МАЛА. Я, конечно, понимаю, что опросить 2 тыщи человек Россстату тяжено, например, но тут — инфа УЖЕ в цифровом виде, только БЕРИ И СОРТИРУЙ. 200 тысяч записей — ещё куда бы ни шло, а так — даже на британских учёных не тянут "исследователи"
2000 сообщений * 5 секунд = 10 000 секунд, или три человекочаса чистого времени.
В твоем предложении чуть больше десяти человекодней :)))
Что касается "херовой" и "СЛИШКОМ МАЛОЙ" выборки — читаем методики выборок:
Рандомизация, или случайный отбор, используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза, можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек — это будет случайным отбором (Гудвин Дж., с. 147).
Комментарии
Открыть, прочитать, осмыслить, классифицировать = секунд пять, может, больше.
2000 сообщений * 5 секунд = 10 000 секунд, или три человекочаса чистого времени.
В твоем предложении чуть больше десяти человекодней :)))
Что касается "херовой" и "СЛИШКОМ МАЛОЙ" выборки — читаем методики выборок:
Рандомизация, или случайный отбор, используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза, можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек — это будет случайным отбором (Гудвин Дж., с. 147).