alkanaft Опубликовано 4 июня, 2013 · Жалоба да упёрлись, упёрлись...! вы серийно выпускаемые бытовые компьютеры с процом на 6 гигагерц видели? процы то есть, отморозки гонят с фреоном только в путь, это вот только не показатель -- показатель массовость наличия у каждой домохозяйки железки с заданной характеристикой. частота именно та характеристика, которая уже давно топчется на месте. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
wanderer_from Опубликовано 4 июня, 2013 · Жалоба Во-первых, коллеги! Хорош флудить не по делу!!! :) Мы тут не обсуждаем вай-фай роутеры и SSD. Мы тут собрались результаты исследования обсуждать! Во-вторых: Что-то меня смущают Ваше "жонглирование" цифрами. Ваше исследование предполагало изначально узнать мнение всех жителей России, возраст у которых от 0 до 100+ лет? У всех из них есть интернет? Ваше замечание по сути верное. Разумеется, генеральная совокупность несколько иная: сюда не входят бабушки/дедушки и грудные младенцы. Но дело в том, что статистически это уже не важно. На опрос отвечали, разумеется, люди, которым "не все равно". Это проблема стихийных опросов - если тематика опросника респондентов интересует/волнует - то ответы появляются. Если не интересны - то просто пропустят и пойдут серфить дальше. В данном случае мы имеем "среднюю температуру" тех, кому не все равно. Это огромный недостаток. Но это и достоинство исследования. Собрана база мнений о том какой провайдер "должен быть" и какой "не должен быть". Причем, с очень серьезной мотивацией - это либо очень недовольные, либо наоборот. Мнение людей, которым в"все равно" - на самом деле, никого не интересует. Они просто будут смотреть и принимать решения, по выводам, которые за них уже сделали "неравнодушные". Как-то так. Относительно жонглирования цифрами, могу только послать посоветовать почитать пару книжек по математической статистике и теории вероятности. Но если очень просто, то посмотрите на вот такой график: Источник тут. В общем, суть такова: при расчете математической вероятности наступления какого-либо события, имеет смысл количество измерений. В нашем случае - это количество заполненных анкет. Чем больше мы измеряем среду, в которой эти события происхордят, тем точнее наши данные. Обратите внимание, что по оси "Х" наступает некий момент, когда значение функции, стремясь к нулю, уже практически не меняет своего значения. Ну, т.е. какого-либо значения. И уже не имеет смысла ни количество измерений, ни размер совокупности. Так вот. После некоторого предела параметр "доверительный интервал ошибки" будет не сильно-то и зависеть от входных данных. Для генеральной совокупности он почти не будет изменяться при размере "от сотен тысяч". Т.е. практически не изменится - то ли это 100 тыс. человек, то ли 100 миллионов. Там стотысячные доли процента, которые в нашем случае роли не играют. Значение имеет параметр "количество измерений". Так вот, если мы померяем среду 1200 раз, то получим разбег в значениях 1,64% в обе стороны. Если мы померяем 1000 раз, то 1,86% Дальше - чем меньше измерений, тем разбег будет расти. Точно так же, как вы спрашивали, что будет, если "мы спросим одного человека из двух", то разбег будет 50%. Это же логично - вероятность 50% это "либо встречу динозавра, либо нет". Но если мы будем все время увеличивать количество измерений, то наступит момент, когда увеличение будет бессмысленным - мы будем тратить ресурсы на измерения, а разбег доверительного интервала все равно будет оставаться в пределах 1-2%. Самым точным будет измерение ВСЕХ людей. Но это же невозможно - посмотрите хотя бы на явку на президентские выборы. И это при колоссальных затратах на организацию мероприятия. Именно по этому практически все социологические исследования опрашивают примерно 1600 человек. Не только в России, прошу заметить. Просто это то количество измерений, при котором можно будет с достаточной степенью вероятности оветить на заданный вопрос. Например, если мы провели голосование "да или нет", на которое ответило 1000 человек из генеральной совокупности 150 тыс., и на вопрос ответило "да" - 86% народу, то мы с вероятностью 95% (доверительная вероятность) получим, что спросив любого из генеральной совокупности, он ответит "да" в 86% случаев плюс-минус 3,09 процента. Для принятия некоторых решений этого более чем достаточно. Если генеральную совокупность увеличить в тысячу раз, то вот эти самые "плюс-минус 3,09%" вырастут всего на одну сотую - до "плюс-минус 3,1%". Дальше можете поиграть с калькулятором, которых в Сети дофига разных. В общем, я решил, что в отчет вставлю небольшую главу про математику и теорию вероятности исследования, с припиской, что если вы понимаете что такое "доверительный интервал", то можно не читать. :) Спасибо. Други, вы лучше вот мне на какой вопрос ответте. Нужно ли в отчет включить полный набор "сырых данных", предварительно убрав из него всю инфу личного характера, включая имена? Или это будет ненужным и бессмысленным? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
snvoronkov Опубликовано 4 июня, 2013 · Жалоба Во-первых, коллеги! Хорош флудить не по делу!!! :) Мы тут не обсуждаем вай-фай роутеры и SSD. Мы тут собрались результаты исследования обсуждать! Вобщем-то все началось с обсуждения возможных причин неудовлетворенности старшего ценового сегмента... С технической точки зрения. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
leiden Опубликовано 4 июня, 2013 · Жалоба Проблема измерений наступает в тот момент, когда интересующий нас вопрос сложен и многофакторен. Ну например - когда мы можем добраться до него только четвертым вопросом по маршруту "да-да-нет-да". Если мы опрашиваем всего 1200 человек - то достоверность первого "да" конечно высока. А вот дальше она падает стремительным домкратом. В общем - "общие" панели позволяют делать только "общие" выводы. Кому интересно - немного про это сказано вот в этой презентации: http://events.yandex.ru/events/yac/m/talks/830/ Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Kirya Опубликовано 4 июня, 2013 · Жалоба Проблема измерений наступает в тот момент, когда интересующий нас вопрос сложен и многофакторен. Ну например - когда мы можем добраться до него только четвертым вопросом по маршруту "да-да-нет-да". Если мы опрашиваем всего 1200 человек - то достоверность первого "да" конечно высока. А вот дальше она падает стремительным домкратом. В общем - "общие" панели позволяют делать только "общие" выводы. Кому интересно - немного про это сказано вот в этой презентации: http://events.yandex...ac/m/talks/830/ Сформулировано супер ! И главное понятно даже не математику. А то я уж начал расписывать пост о том, почему нельзя слепо верить доверительному интервалу в опросах при выборке по материалу, не подпадающему под нормальное распределение... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
wanderer_from Опубликовано 4 июня, 2013 · Жалоба если бы вы хоть чуть-чуть знали теорию вероятности, то знали бы, что у несвязанных событий вероятности тоже не связаны. Их нельзя ни складывать, ни умножать. Пример: подбрасываем монетку пять раз и выпадает четыре раза решка. Какова вероятность того, что в шестой бросок выпадет решка? Между вопросами в опроснике НЕТ никакой прямой связи, кроме тех, по которым я определяю насколько адекватен человек, отвечающий на них. Посмотрите на таблички с методом Кано, кстати. Там взаимоисключающе отвечает 5-10 человек из тысячи. Это, кстати, показатель, что большинство отвечало честно и вдумчиво. На открытый и необязательный вопрос о конкретной цене за оказываемые услуги ответило 98%. Адекватно. Это совсем не означает, что на этот вопрос оказало влияние нескольких предыдущих. Ступенчатых вопросов у меня не было вообще - гугл-формы это делать умеют, но я не пользовался. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NN----NN Опубликовано 4 июня, 2013 (изменено) · Жалоба Ваше замечание по сути верное. Разумеется, генеральная совокупность несколько иная: сюда не входят бабушки/дедушки и грудные младенцы. Но дело в том, что статистически это уже не важно. В статье Вы при этом пишите "Статистические параметры результатов следующие: для генеральной совокупности исследования в 133,8 млн. человек (РФ без СКФО), 1285 анкет дают при доверительной вероятности 95% доверительный интервал ошибки для оценочной шкалы "десять баллов" ± 1,64%." Тут вроде всё население поголовно. Если размер генеральной совокупности всё-таки другой, то: 1. зачем в статье писать про 133 млн и 2. это должно повлиять на величину доверительного интервала? При чтении статей с Вашими расчетами всегда возникал вопрос: почему, независимо от того, что вы анализируете, у вас берётся нормальное распределение? Такое же вопрос видимо возник и у Kirya И ещё: я соглашусь, что выборка может давать такой же результат как генеральная совокупность, если она схожа по параметрам с этой генеральной совокупностью. И тут нестыковка с Вашими последними подсчетами: количество женщин (не берём разные возрастные группы) грубо говоря чуть больше 50% населения, а в вашей выборке этого нет. Вы как-то корректируете или это "считается неважным"? А если брать в разрезе регионы, то нужно ещё тщательней подходить к этим различиям. Разве нет? Изменено 4 июня, 2013 пользователем NN----NN Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Kirya Опубликовано 4 июня, 2013 (изменено) · Жалоба если бы вы хоть чуть-чуть знали теорию вероятности, то знали бы, что у несвязанных событий вероятности тоже не связаны. Их нельзя ни складывать, ни умножать. Пример: подбрасываем монетку пять раз и выпадает четыре раза решка. Какова вероятность того, что в шестой бросок выпадет решка? А теперь приведи выше сказанное тобой к твоему исследованию. Если б ты хоть чуть-чуть имел практику применения теории вероятности, то ты бы понимал, что считать доверительный интервал кол-ва анкет просто исходя из кол-ва населения всей страны нельзя. Его нужно считать отдельно для каждого оператора исходя из размеров его абон базы. Распределение абонентов по операторам уже является ненормальным в математическом смысле этого термина, иначе б у нас в РТ было 80% абонентов ШПД России. Вывод: делишь исследование на общую, значимую для всех, и конкретные части по провайдерам. Между вопросами в опроснике НЕТ никакой прямой связи, кроме тех, по которым я определяю насколько адекватен человек, отвечающий на них. Посмотрите на таблички с методом Кано, кстати. Там взаимоисключающе отвечает 5-10 человек из тысячи. Это, кстати, показатель, что большинство отвечало честно и вдумчиво. На открытый и необязательный вопрос о конкретной цене за оказываемые услуги ответило 98%. Адекватно. Это совсем не означает, что на этот вопрос оказало влияние нескольких предыдущих. Ступенчатых вопросов у меня не было вообще - гугл-формы это делать умеют, но я не пользовался. Ты же сам объясняешь, почему вброс анкет на woman.ru дал неожиданный отклик: "У меня МЛ/муж выбирал провайдера". Это оно и есть, о чём говорит Серёга. Вывод: наоборот выделяешь целевую аудиторию, которая принимает решение о выборе провайдера. Изменено 4 июня, 2013 пользователем Kirya Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NN----NN Опубликовано 4 июня, 2013 (изменено) · Жалоба Вот в том-то и моя претензии к автору. Ведь гипотеза о нормальности распределения изучаемых данных не подтверждена? Или ответ в "Между вопросами в опроснике НЕТ никакой прямой связи, кроме тех, по которым я определяю насколько адекватен человек, отвечающий на них."? :) Я конечно давно со статистикой не связывался, но что-то не уверен, что Вы правы... Изменено 4 июня, 2013 пользователем NN----NN Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Kirya Опубликовано 4 июня, 2013 · Жалоба При чтении статей с Вашими расчетами всегда возникал вопрос: почему, независимо от того, что вы анализируете, у вас берётся нормальное распределение? Такое же вопрос видимо возник и у Kirya А это стандартная ошибка социологов, маркетологов и экономистов. Только вот социологи обычно её обходят тем, что изучают вопросы, которые интересны всему населению ограниченному по географическому признаку, а это уже всё-таки нормальное распределение, зато маркетоиды и экономисты обычно влетают в эту ошибку со всего размаха. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NN----NN Опубликовано 4 июня, 2013 (изменено) · Жалоба Именно по этому практически все социологические исследования опрашивают примерно 1600 человек. Пришлось набрать (текст из книги "Практика исследования рынков" И.Березин): "Репрезентативная выборка, представляющая всё население России, должна состоять из 3600-9000 человек и 180 групп (2 пола, 3 возраста, 2 образовательных уровня, 3 доходных группы, 5 типов поселений). Точность полученного результата будет в пределах +- 3%." Глава "Массовый опрос". P.S. И давайте без "посылания". Или Вы можете объяснить/убедить или нет. Изменено 4 июня, 2013 пользователем NN----NN Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
leiden Опубликовано 4 июня, 2013 · Жалоба В общем ответ на мой вопрос - классический пример того, почему результаты опросов на панелях (причем даже на "нормализованных" панелях - в отличие например от того, который обсуждаем) как правило при внимательном изучении нифига продуктологу/маркетологу сказать не могут :). Тот, кто делает опрос не понимает того, кто пытается добыть информацию :) Например в данном случае меня. P.S. Вопросы не связаны :) А вот выделяемые группы (с которыми и по которым потом работать маркетингу) как раз оными вопросами ограничены. Как вы думаете - каков доверительный интервал у группы, которая ограничивается конкретными ответами (или диапазонами ответов) на 4 вопроса? А на 10? :) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
wanderer_from Опубликовано 4 июня, 2013 · Жалоба В статье Вы при этом пишите "Статистические параметры результатов следующие: для генеральной совокупности исследования в 133,8 млн. человек (РФ без СКФО), 1285 анкет дают при доверительной вероятности 95% доверительный интервал ошибки для оценочной шкалы "десять баллов" ± 1,64%." Тут вроде всё население поголовно. Эм… В общем. претензию понял. В каком-то смысле - вы правы. Буду более аккуратен в формулировках. Но по цифрам я не ошибаюсь, если не брать во внимание тысячные доли процентов, которые возникнут при расчетах на ЦА исследования. Это пользователи сети Интернет, разумеется, которых по некоторым оценкам примерно 40 млн в России. При чтении статей с Вашими расчетами всегда возникал вопрос: почему, независимо от того, что вы анализируете, у вас берётся нормальное распределение? Такое же вопрос видимо возник и у Kirya Еще раз. Доверительная вероятность - 95% Количество ответов на один из вопросов, по которым идет анализ - 10 (шкала). Следовательно, 10% вероятность того, что его ткнут не глядя. Если есть перекос в какую-то сторону - то это явление не случайно. Аналогично, для вопросов класса "да/нет", но тогда надо ставить 50% вероятность. Так вот. Если мы возьмем генеральную совокупность в 130 млн или в 40 млн., то ничего не изменится. Для разных вопросов будет разный интервал плюс-минус. Согласен. Пересчитаю и отражу в итоге. Но вероятность никак не изменится для серии вопросов по совокупности, ибо сколько бы вы не подкидывали монету - вероятность при каждом броске остается одинаковой в 50%. Она будет меняться только если мы будем считать серию с желанием получить вероятность одновременного выпадения трех орлов подряд. Но в опроснике такого не было. Каждый вопрос самостоятельный, без переходов в ступенях, и для всех демонстрировалась одна и та же анкета. И ещё: я соглашусь, что выборка может давать такой же результат как генеральная совокупность, если она схожа по параметрам с этой генеральной совокупностью. И тут нестыковка с Вашими последними подсчетами: количество женщин (не берём разные возрастные группы) грубо говоря чуть больше 50% населения, а в вашей выборке этого нет. Вы как-то корректируете или это "считается неважным"? А если брать в разрезе регионы, то нужно ещё тщательней подходить к этим различиям. Разве нет? Да. Я пояснил - это не баг. Это фича. Это один из результатов исследования - женщины просто меньше принимают решения по покупке услуг провайдера. Если у кого-то есть доступ к биллингам - посмотрите пожалуйста, какое количество женщин в процентном отношении указаны в договорах, если это возможно? Что-то мне подсказывает, что не более 20%. У меня получилось 11,75% хотя я изо всех сил вытягивал "показания" из них, покупая трафик. А теперь приведи выше сказанное тобой к твоему исследованию. Если б ты хоть чуть-чуть имел практику применения теории вероятности, то ты бы понимал, что считать доверительный интервал кол-ва анкет просто исходя из кол-ва населения всей страны нельзя. Его нужно считать отдельно для каждого оператора исходя из размеров его абон базы. Распределение абонентов по операторам уже является ненормальным в математическом смысле этого термина, иначе б у нас в РТ было 80% абонентов ШПД России. Вывод: делишь исследование на общую, значимую для всех, и конкретные части по провайдерам. Разумеется, я буду делить. Даже больше - у меня сейчас есть результаты только "для всех" и немного могу сказать про БИС, которые очень активно собирали анкеты. И я сейчас в замешательстве - убирать их данные из итога или нет. Думаю, что уберу. Тогда придется вычесть из результата около 280 анкет и точность упадет. Ведь гипотеза о нормальности распределения изучаемых данных не подтверждена? Считаю как раз. Пока действительно есть перекос, если брать демпрофиль населения России и респондентов у меня. Формулировка генеральной совокупности действительно не очень корректна. Исправлю. Только вот социологи обычно её обходят тем, что изучают вопросы, которые интересны всему населению ограниченному по географическому признаку, а это уже всё-таки нормальное распределение, я хочу обойти также, как и любой нормальный маркетолог - выделив из получившихся респондентов группу. Еще раз - генеральную совокупность я сформулировал неверно, ошибку признаю и пересчитываю. Затем мне и нужна данная дискуссия. Кстати, по географии-то как раз все нормально получается. Но разумеется, я не могу сказать, что конкретно будет в оперделенной локации, случайно ткнув пальцем на карту. Но для всей РФ "среднюю температуру" я померял. "Репрезентативная выборка, представляющая всё население России, должна состоять из 3600-9000 человек и 180 групп (2 пола, 3 возраста, 2 образовательных уровня, 3 доходных группы, 5 типов поселений). Точность полученного результата будет в пределах +- 3%." Ага. Читал. Дело в том, что есть еще один параметр, про который я упоминаю, но еще никто в него носом меня не ткнул, а надо :) Точность. Он же "доверительная вероятность". У меня взята 95%. Если брать 99% - то плюс-минус при 10 вариантах в моем случае (1000 респондентов) растет до 2,45% Кроме того, Березин пишет о "всей России", как о покупателе носков. В нашем случае, еще раз извиняюсь, речь идет о "пользователях сети", среди которых, собственно, опрос и проводился путем инернет-опроса. P.S. И давайте без "посылания". Или Вы можете объяснить/убедить или нет. Вы не обижайтесь. я наоборот благодарен, что показываете на ошибки, которые действительно есть. Но, черт побери, надоело отвечать на один и тот же вопрос: "твое исследование не точно, потому что ту не спросил всех". Да, не точно. Всех не спросил, потому что нет у меня таких ресурсов. Каждая анкета, кстати, мне обошлась примерно в сто рублей, кстати. Не учитывая стоимости моего собственного труда. Для всех: не бывает абсолютно точного инструмента исследования человеческих мыслей. Не бывает. Имеется множество инструментов, которые позволяют с некоторой точностью определить тенденции и определить "среднюю температуру". Что и было сделано. Точность сосчитаю и скажу - на это надо некоторое количество времени. В общем ответ на мой вопрос - классический пример того, почему результаты опросов на панелях (причем даже на "нормализованных" панелях - в отличие например от того, который обсуждаем) как правило при внимательном изучении нифига продуктологу/маркетологу сказать не могут :). Тот, кто делает опрос не понимает того, кто пытается добыть информацию :) Например в данном случае меня. Например, в данном случае вас я не считал. И не собирался. Но если возжелаете - посчитаю. За деньги. Цена вопроса - 19900 рублей по готовой методике и без учета затрат на сбор данных. Нужно что-то особенное - извольте, но ценник будет несколько иной. Кстати, я обращался к операторам с целью поучаствовать. БЕСПЛАТНО. И в статях, и даже отспамил на 1500 адресов из списка пров.наг.ру В результате откликнулось только 10 провов из которых реально работал только БИС. А знаете какое количество анкет я получил от остальных? Некоторые даже NDA подписали. Одну. Ее прислал собственно директор одного маленького прова на тыщщ пять абонентов. Подписал НДА и заполнил анкету, хотя была более чем подробная инструкция как и что делать с этой анкетой. P.S. Вопросы не связаны :) А вот выделяемые группы (с которыми и по которым потом работать маркетингу) как раз оными вопросами ограничены. Как вы думаете - каков доверительный интервал у группы, которая ограничивается конкретными ответами (или диапазонами ответов) на 4 вопроса? А на 10? :) Если вы внимательно читали, то учитываются. Кстати, раз вы такой умный :о) а расскажите каков доверительный интервал в случае ОТКРЫТОГО вопроса? Например, был открытый вопрос про то, каких провайдеров вы в принципе знали. Частота ответов (не пустых анкет) там 84%. Ну, и какая точность будет? И вот про то, что я теперь могу сказать об известности брендов, а так же причины, например, смены провайдера (частота ответов 54%) будет уже только за бапки. Должен же я как-то зарабатывать на следующий опрос. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NN----NN Опубликовано 4 июня, 2013 · Жалоба Кроме того, Березин пишет о "всей России", как о покупателе носков. В нашем случае, еще раз извиняюсь, речь идет о "пользователях сети", среди которых, собственно, опрос и проводился путем инернет-опроса. А моё возражение относилось только к вашему утверждению универсальных "1600 чел.". Да, Вы правы он приводит размер универсальной выборки, но ведь и она при этом не формируется по принципу "кто согласился ответить, тот мне и нужен" ;) Вы не обижайтесь. я наоборот благодарен, что показываете на ошибки, которые действительно есть. Но, черт побери, надоело отвечать на один и тот же вопрос: "твое исследование не точно, потому что ту не спросил всех". Да, не точно. Всех не спросил, потому что нет у меня таких ресурсов. ОК. Эмоции эмоциями, но Вы же видите/знаете кому отвечаете. Что касается трудностей, то Вы сами в это ввязались. Зачем-то это Вам было же нужно :) Повышают голос не всегда из-за "тупости" собеседника, но и при отсутствии аргументов и способности их донести до оппонента. А так, не ошибается только тот, кто ничего не делает. Разберётесь, пересчитаете и народ к вам потянется с мятыми купюрами по 9900. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
wanderer_from Опубликовано 4 июня, 2013 · Жалоба Пришлось набрать (текст из книги "Практика исследования рынков" И.Березин): Кстати! :) я тоже нашел сию книжку. я помнил такого аффтара, но как-то сразу не сообразил про кого речь идет. Это ж Игорь! В общем, у него несколько изданий этой книжки, где он достаточно часто меняет мнение :) В моем экземляре от 2007 года (на полке нашел) есть фраза: "Размер выборки практически не зависит от размера генеральной совокупности. Для многомиллионного мегаполиса и уездного города в 35 тыс. человек, для репрезентативной выборки с одинаковыми параметрами потребуется опросить одинаковое количество респондентов". Я об этом и хотел сказать - здесь уже не важно на 130 млн. я счтал или на 40 - результат ПОЧТИ одинаковый и различается на сотые-тысячные несущественные доли процента. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NN----NN Опубликовано 4 июня, 2013 (изменено) · Жалоба Я, видимо, старше Вас, у меня 2003 год издания :) "Размер выборки практически не зависит от размера генеральной совокупности. Для многомиллионного мегаполиса и уездного города в 35 тыс. человек, для репрезентативной выборки с одинаковыми параметрами потребуется опросить одинаковое количество респондентов" Он всё верно пишет :). Имеется в виду, что если мы говорим о генеральной совокупности, которую составляют жители, то репрезентативность выборки в определенных пределах сохраняется и в мегаполисе и в среднем городке. Но вряд ли можно говорить о репрезентативности опроса в деревне на 5 дворов или в городке, но в военном. Так как в этом случае неизбежно отклонение от параметров генеральной совокупности, а мы должны её соблюсти как бы в микромасштабе. Изменено 4 июня, 2013 пользователем NN----NN Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
wanderer_from Опубликовано 4 июня, 2013 · Жалоба Что касается трудностей, то Вы сами в это ввязались. Зачем-то это Вам было же нужно :) Мне это нужно потому, что я хочу разобраться и знать больше других. Проект был затеян не ради денег и славы, но ноуки для :) Повышают голос не всегда из-за "тупости" собеседника, но и при отсутствии аргументов и способности их донести до оппонента. Эммм… Я как бы и не повышал :) на форуме это трудно делать. Но вы пытаетесь подловить меня на некомпетентности и это раздражает. Допуски по выборке у меня считает гугл.докс автоматом при сведении таблиц, а я, зная, что разницы при генеральной совокупности в 100 тыс. и 100 млн. практически нет, вбил тупо 1 и шесть нулей. Исправлю и пересчитаю для вопросов в отдельности, где то возможно и необходимо. Для всех - у меня есть и соответствующее образование и опыт. Я изучал (не проходил, а именно изучал) социологию в вузе - в педах это обязательный предмет, а у нас было четыре семестра и довольно неплохой препод, которая потом в так называемую "свердловскую социологическую школу" входила. Плюс опыт работы на выборах, когда они еще были выборами, в начале 200-х - я ставил расчетную базу на выборах Собянина, например, губером Тюменской области и с ГАС "Выборы", кстати, знаком не понаслышке. За что имел невыезд как "носитель". Имеется в виду, что если мы говорим о генеральной совокупности, которую составляют жители, то репрезентативность выборки в определенных пределах сохраняется и в мегаполисе и в среднем городке. Но вряд ли можно говорить о репрезентативности опроса в деревне на 5 дворов или в городке, но в военном. Так как в этом случае неизбежно отклонение от параметров генеральной совокупности, а мы должны её соблюсти как бы в микромасштабе. Речь шла о параметрах вероятностных - доверительный интервал и точность. И для случайной выборки, а не стихийной. И когда нужно именно соблюсти реперезентативность по демографии. И даже если воспользоваться советом Березина, то еще нужна стата по конкретному населенному пункту чтоб демпараметры конкретного населенного пункта соблюсти. Ибо городки тоже разные бывают - например, военные, где хоть оббегайся, а найти две пары стройных женских ног не удастся :) В данном случае идет речь только об одном демпараметре - "пользователи интернет". Он соответствует главной ЦА интернет-провайдеров на 146% - все клиенты провайдеров пользователи интернет. И да, еще раз, я наверняка не смогу сказать что думают большинство женщин (пусть и пользователей интернетов) в Иваново. Но я могу сказать, что Ростелек имеет отрицательный NPS с достоверностью в плюс-минус три процента. А он у них самый отрицательный. И еще, я могу сказать, что наибольший индекс узнаваемости у Дом.ру. Больше чем у Ростелека, кстати. И даже ренкинг брендов построить с некоторой степенью достоверности. А по полному индексу и рейтинг тех самых ТОП10. Надо объяснять разницу между ренкингом и рейтингом? И он будет правильный на всю страну. Но не на отдельный Новосибирск, например, где, разумеется, данных слишком мало. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Kirya Опубликовано 4 июня, 2013 · Жалоба А теперь приведи выше сказанное тобой к твоему исследованию. Если б ты хоть чуть-чуть имел практику применения теории вероятности, то ты бы понимал, что считать доверительный интервал кол-ва анкет просто исходя из кол-ва населения всей страны нельзя. Его нужно считать отдельно для каждого оператора исходя из размеров его абон базы. Распределение абонентов по операторам уже является ненормальным в математическом смысле этого термина, иначе б у нас в РТ было 80% абонентов ШПД России. Вывод: делишь исследование на общую, значимую для всех, и конкретные части по провайдерам. Разумеется, я буду делить. Даже больше - у меня сейчас есть результаты только "для всех" и немного могу сказать про БИС, которые очень активно собирали анкеты. И я сейчас в замешательстве - убирать их данные из итога или нет. Думаю, что уберу. Тогда придется вычесть из результата около 280 анкет и точность упадет. Посчитай удовлетворённость скоростей и технологии ADSL с учётом БИС и без. Если данные сильно будут разнится - убирай, нет - значит выборка попала в Гауссиану. А вообще думаю, надо было тебе раньше намекнуть провайдерам какие именно вопросы ты будешь анализировать, не раскрывая методики. Отклика, думаю, среди ISP, было б на несколько порядков больше... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
wanderer_from Опубликовано 4 июня, 2013 · Жалоба Посчитай удовлетворённость скоростей и технологии ADSL с учётом БИС и без. Если данные сильно будут разнится - убирай, нет - значит выборка попала в Гауссиану. В пределах статпогрешности. Я больше скажу - у меня было три десятка таблиц (серий) с опросниками. Так вот. Серии, где было набрано больше 200 анкет (таких получилось четыре), имеют отклонение в те самые плюс-минус два процента по некоторым вопросам. Все не считал - посчитал "Сверхскорость" - ответ "Может быть" и "Смена провайдера" ответ "Давно пользуюсь одним". Анкета БИС имеет отклонение в 8,64% по смене прова, что странно, ибо он в меньшую (!!!) сторону. Разбираюсь с причинами, но классифицировать открытые вопросы - много ручной работы. Счас попробую воспользоваться твоим советом. Особенно, если ты разьяснишь логику - почему именно ДСЛ и сравнивать удовлетовроенность скоростью, а не облсуживанием, например? А вообще думаю, надо было тебе раньше намекнуть провайдерам какие именно вопросы ты будешь анализировать, не раскрывая методики. Отклика, думаю, среди ISP, было б на несколько порядков больше... Блджат! Четыре статьи, баннер на главной и спам в полторы тысячи адресов! Как еще намекать-то? Думаю, что проблема пока в том, что не видели результата и типа "опасаются". Очень надеюсь на осенний опрос, который точно будет, не смотря на пока убыточность проекта. Пока в России ничего подобного вообще не делали. Такшто - первым всегда трудно, да. Но мы не привыкли отступать!!! :) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
snark Опубликовано 4 июня, 2013 · Жалоба отспамил на 1500 адресов из списка пров.наг.ру В результате откликнулось только 10 провов Так это Вы из линкедина или как его там писали ("XYZ с nag.ru blah blah blah" точно не помню)? "С позволения Вашего Величества, я этого письма не писал читал" почти (с) Пишите сразу "прямая трансляция с wanderer_from@forum.nag.ru" - Вам все ответят :) Проект был затеян не ради денег Полный отчет будет доступен в shop.nag.ru по цене всего 9900 рублей. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NN----NN Опубликовано 4 июня, 2013 · Жалоба Эммм… Я как бы и не повышал :) на форуме это трудно делать. Этот момент уже проехали, меня устроил Ваш ответ ("Вы не обижайтесь..." и т.д.) Но вы пытаетесь подловить меня на некомпетентности и это раздражает. У меня это не получится, Вы знаете и делали больше ("есть и соответствующее образование и опыт"). Поэтому можно успокоиться. Но есть какие-то моменты, за которые "глаз цепляется" и я про них написал. Не пойму только: то "спасибо за уточнения/замечания", то оказывается "раздражает". Думаете кому-то будет приятно узнать, что тот отчёт, который они _купили_, содержит ошибки? Мне это нужно потому, что я хочу разобраться и знать больше других. Это ценно, поэтому я писал Вам только о самых спорных моментах, не придираясь к мелочам. В общем, удачи. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Kirya Опубликовано 4 июня, 2013 · Жалоба Особенно, если ты разьяснишь логику - почему именно ДСЛ и сравнивать удовлетовроенность скоростью, а не облсуживанием, например? Ну БИС же телефонисты. Это ж элементарно. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
wanderer_from Опубликовано 4 июня, 2013 · Жалоба Так это Вы из линкедина или как его там писали ("XYZ с nag.ru blah blah blah" точно не помню)? "С позволения Вашего Величества, я этого письма не писал читал" почти (с) Пишите сразу "прямая трансляция с wanderer_from@forum.nag.ru" - Вам все ответят :) С Линкедина точно не писал и не спамил. Спамил через МайлЧимп, где были ссылки, в т.ч. и на статьи. Ну, тут что сказать… Каюсь, грешен. Хотел "как лучше", далее по тексту. Про форумный ник - как-то да. Может уже под фамилией начать писать? Мимими. НО. Я вложил в эту работу ресурсов. Своих. В принципе, хотелось бы их как минимум окупить. Как максимум, получить больше ресурсов, чтобы хватило на следующее исследование. Как я понимаю, вы тоже не бесплатно работаете, а интернеты за денюжку продаете. Ну вот. Я тоже продаю. Будет прибыль - буду расширять практику и делать работу лучше, качественнее, точнее. Пока так. Если вы готовы полностью оплатить расходы плюс мою работу - я готов опубликовать отчет целиком бесплатно. Готовы? Думаете кому-то будет приятно узнать, что тот отчёт, который они _купили_, содержит ошибки? Я вообще, пусть и не всегда внимательный, но стараюсь ошибок избегать. Очень стараюсь. Ну БИС же телефонисты. Ну, ок. Посчитаю - докладусь :) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
leiden Опубликовано 4 июня, 2013 · Жалоба Во первых я не имею отношения к операторам связи на сегодня. Уже этак больше двух лет. Во-вторых - вопрос как раз к методике подсчета комплексных показателей (которые базируются на ответах на несколько вопросов). Если вы мне приведете методику расчета доверительных интервалов показателей комплексных формул на основании панелей - вы будете молодец. Если вы после этого рассчитаете доверительный интервал рассчитанных вами показателей (например того-же NPS) - вы будете дважды молодец. Пока у панелистов на моей памяти это ни разу не получилось. Я не к тому, что вы плохим делом занимаетесь. Я ровно к тому, чтобы ваша деятельность не стала для операторов связи ТНСом или Комскором для контента в интернете (а я с той стороны немного знаком). Проблема в том, что пока это был телевизор (устройство без логов и обратной связи) - эти ребята (ТНС и Комскор со всякими Гэллапами) успешно рулили. Но в Интернете они успешно обосрались. Ибо обратная связь есть в значительно более прикольных вариантах (хотя надо конечно не забывать смотреть на "генеральную совокупность"). Ах да - доверительный интервал вида плюс-минус 50% - это кажется примерно ноль полезной информации в показателе. Кажется так :) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
snark Опубликовано 5 июня, 2013 · Жалоба Может уже под фамилией начать писать? В статьях/письмах, думаю что стоит - людям будет проще сопоставить кто есть who. Я вложил в эту работу ресурсов. Своих. В принципе, хотелось бы их как минимум окупить. Как максимум, получить больше ресурсов, чтобы хватило на следующее исследование. Желание вернуть потраченные время и силы с помощью дензнаков более чем понятно. Не понятно зачем писать о том, что проект затевался как альтруистический, когда цена уже объявлена :) Если уберете из суммы один последний нолик доку купят хотя бы ради мат. помощи автору, IMHO. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...