Перейти к содержимому
Калькуляторы

Индекс НАГ: анатомия клиентов

да упёрлись, упёрлись...! вы серийно выпускаемые бытовые компьютеры с процом на 6 гигагерц видели? процы то есть, отморозки гонят с фреоном только в путь, это вот только не показатель -- показатель массовость наличия у каждой домохозяйки железки с заданной характеристикой. частота именно та характеристика, которая уже давно топчется на месте.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Во-первых, коллеги! Хорош флудить не по делу!!! :) Мы тут не обсуждаем вай-фай роутеры и SSD. Мы тут собрались результаты исследования обсуждать!

 

Во-вторых:

Что-то меня смущают Ваше "жонглирование" цифрами. Ваше исследование предполагало изначально узнать мнение всех жителей России, возраст у которых от 0 до 100+ лет? У всех из них есть интернет?

Ваше замечание по сути верное. Разумеется, генеральная совокупность несколько иная: сюда не входят бабушки/дедушки и грудные младенцы. Но дело в том, что статистически это уже не важно. На опрос отвечали, разумеется, люди, которым "не все равно". Это проблема стихийных опросов - если тематика опросника респондентов интересует/волнует - то ответы появляются. Если не интересны - то просто пропустят и пойдут серфить дальше. В данном случае мы имеем "среднюю температуру" тех, кому не все равно. Это огромный недостаток. Но это и достоинство исследования. Собрана база мнений о том какой провайдер "должен быть" и какой "не должен быть". Причем, с очень серьезной мотивацией - это либо очень недовольные, либо наоборот. Мнение людей, которым в"все равно" - на самом деле, никого не интересует. Они просто будут смотреть и принимать решения, по выводам, которые за них уже сделали "неравнодушные". Как-то так.

 

Относительно жонглирования цифрами, могу только послать посоветовать почитать пару книжек по математической статистике и теории вероятности. Но если очень просто, то посмотрите на вот такой график:

image158.gif

 

Источник тут.

 

В общем, суть такова: при расчете математической вероятности наступления какого-либо события, имеет смысл количество измерений. В нашем случае - это количество заполненных анкет. Чем больше мы измеряем среду, в которой эти события происхордят, тем точнее наши данные. Обратите внимание, что по оси "Х" наступает некий момент, когда значение функции, стремясь к нулю, уже практически не меняет своего значения. Ну, т.е. какого-либо значения. И уже не имеет смысла ни количество измерений, ни размер совокупности. Так вот. После некоторого предела параметр "доверительный интервал ошибки" будет не сильно-то и зависеть от входных данных. Для генеральной совокупности он почти не будет изменяться при размере "от сотен тысяч". Т.е. практически не изменится - то ли это 100 тыс. человек, то ли 100 миллионов. Там стотысячные доли процента, которые в нашем случае роли не играют.

 

Значение имеет параметр "количество измерений". Так вот, если мы померяем среду 1200 раз, то получим разбег в значениях 1,64% в обе стороны. Если мы померяем 1000 раз, то 1,86%

Дальше - чем меньше измерений, тем разбег будет расти. Точно так же, как вы спрашивали, что будет, если "мы спросим одного человека из двух", то разбег будет 50%. Это же логично - вероятность 50% это "либо встречу динозавра, либо нет". Но если мы будем все время увеличивать количество измерений, то наступит момент, когда увеличение будет бессмысленным - мы будем тратить ресурсы на измерения, а разбег доверительного интервала все равно будет оставаться в пределах 1-2%. Самым точным будет измерение ВСЕХ людей. Но это же невозможно - посмотрите хотя бы на явку на президентские выборы. И это при колоссальных затратах на организацию мероприятия.

 

Именно по этому практически все социологические исследования опрашивают примерно 1600 человек. Не только в России, прошу заметить. Просто это то количество измерений, при котором можно будет с достаточной степенью вероятности оветить на заданный вопрос. Например, если мы провели голосование "да или нет", на которое ответило 1000 человек из генеральной совокупности 150 тыс., и на вопрос ответило "да" - 86% народу, то мы с вероятностью 95% (доверительная вероятность) получим, что спросив любого из генеральной совокупности, он ответит "да" в 86% случаев плюс-минус 3,09 процента. Для принятия некоторых решений этого более чем достаточно. Если генеральную совокупность увеличить в тысячу раз, то вот эти самые "плюс-минус 3,09%" вырастут всего на одну сотую - до "плюс-минус 3,1%". Дальше можете поиграть с калькулятором, которых в Сети дофига разных.

 

В общем, я решил, что в отчет вставлю небольшую главу про математику и теорию вероятности исследования, с припиской, что если вы понимаете что такое "доверительный интервал", то можно не читать. :) Спасибо.

 

Други, вы лучше вот мне на какой вопрос ответте. Нужно ли в отчет включить полный набор "сырых данных", предварительно убрав из него всю инфу личного характера, включая имена? Или это будет ненужным и бессмысленным?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Во-первых, коллеги! Хорош флудить не по делу!!! :) Мы тут не обсуждаем вай-фай роутеры и SSD. Мы тут собрались результаты исследования обсуждать!

 

Вобщем-то все началось с обсуждения возможных причин неудовлетворенности старшего ценового сегмента... С технической точки зрения.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Проблема измерений наступает в тот момент, когда интересующий нас вопрос сложен и многофакторен. Ну например - когда мы можем добраться до него только четвертым вопросом по маршруту "да-да-нет-да". Если мы опрашиваем всего 1200 человек - то достоверность первого "да" конечно высока. А вот дальше она падает стремительным домкратом. В общем - "общие" панели позволяют делать только "общие" выводы. Кому интересно - немного про это сказано вот в этой презентации: http://events.yandex.ru/events/yac/m/talks/830/

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Проблема измерений наступает в тот момент, когда интересующий нас вопрос сложен и многофакторен. Ну например - когда мы можем добраться до него только четвертым вопросом по маршруту "да-да-нет-да". Если мы опрашиваем всего 1200 человек - то достоверность первого "да" конечно высока. А вот дальше она падает стремительным домкратом. В общем - "общие" панели позволяют делать только "общие" выводы. Кому интересно - немного про это сказано вот в этой презентации: http://events.yandex...ac/m/talks/830/

Сформулировано супер !

И главное понятно даже не математику.

А то я уж начал расписывать пост о том, почему нельзя слепо верить доверительному интервалу в опросах при выборке по материалу, не подпадающему под нормальное распределение...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

если бы вы хоть чуть-чуть знали теорию вероятности, то знали бы, что у несвязанных событий вероятности тоже не связаны. Их нельзя ни складывать, ни умножать. Пример: подбрасываем монетку пять раз и выпадает четыре раза решка. Какова вероятность того, что в шестой бросок выпадет решка?

 

Между вопросами в опроснике НЕТ никакой прямой связи, кроме тех, по которым я определяю насколько адекватен человек, отвечающий на них. Посмотрите на таблички с методом Кано, кстати. Там взаимоисключающе отвечает 5-10 человек из тысячи. Это, кстати, показатель, что большинство отвечало честно и вдумчиво. На открытый и необязательный вопрос о конкретной цене за оказываемые услуги ответило 98%. Адекватно. Это совсем не означает, что на этот вопрос оказало влияние нескольких предыдущих.

 

Ступенчатых вопросов у меня не было вообще - гугл-формы это делать умеют, но я не пользовался.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ваше замечание по сути верное. Разумеется, генеральная совокупность несколько иная: сюда не входят бабушки/дедушки и грудные младенцы. Но дело в том, что статистически это уже не важно.

В статье Вы при этом пишите "Статистические параметры результатов следующие: для генеральной совокупности исследования в 133,8 млн. человек (РФ без СКФО), 1285 анкет дают при доверительной вероятности 95% доверительный интервал ошибки для оценочной шкалы "десять баллов" ± 1,64%."

Тут вроде всё население поголовно.

 

Если размер генеральной совокупности всё-таки другой, то:

1. зачем в статье писать про 133 млн

и 2. это должно повлиять на величину доверительного интервала?

 

При чтении статей с Вашими расчетами всегда возникал вопрос: почему, независимо от того, что вы анализируете, у вас берётся нормальное распределение? Такое же вопрос видимо возник и у Kirya

 

И ещё: я соглашусь, что выборка может давать такой же результат как генеральная совокупность, если она схожа по параметрам с этой генеральной совокупностью. И тут нестыковка с Вашими последними подсчетами: количество женщин (не берём разные возрастные группы) грубо говоря чуть больше 50% населения, а в вашей выборке этого нет. Вы как-то корректируете или это "считается неважным"? А если брать в разрезе регионы, то нужно ещё тщательней подходить к этим различиям. Разве нет?

Изменено пользователем NN----NN

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

если бы вы хоть чуть-чуть знали теорию вероятности, то знали бы, что у несвязанных событий вероятности тоже не связаны. Их нельзя ни складывать, ни умножать. Пример: подбрасываем монетку пять раз и выпадает четыре раза решка. Какова вероятность того, что в шестой бросок выпадет решка?

А теперь приведи выше сказанное тобой к твоему исследованию.

Если б ты хоть чуть-чуть имел практику применения теории вероятности, то ты бы понимал, что считать доверительный интервал кол-ва анкет просто исходя из кол-ва населения всей страны нельзя.

Его нужно считать отдельно для каждого оператора исходя из размеров его абон базы.

Распределение абонентов по операторам уже является ненормальным в математическом смысле этого термина, иначе б у нас в РТ было 80% абонентов ШПД России.

 

Вывод: делишь исследование на общую, значимую для всех, и конкретные части по провайдерам.

 

Между вопросами в опроснике НЕТ никакой прямой связи, кроме тех, по которым я определяю насколько адекватен человек, отвечающий на них. Посмотрите на таблички с методом Кано, кстати. Там взаимоисключающе отвечает 5-10 человек из тысячи. Это, кстати, показатель, что большинство отвечало честно и вдумчиво. На открытый и необязательный вопрос о конкретной цене за оказываемые услуги ответило 98%. Адекватно. Это совсем не означает, что на этот вопрос оказало влияние нескольких предыдущих.

 

Ступенчатых вопросов у меня не было вообще - гугл-формы это делать умеют, но я не пользовался.

Ты же сам объясняешь, почему вброс анкет на woman.ru дал неожиданный отклик: "У меня МЛ/муж выбирал провайдера".

Это оно и есть, о чём говорит Серёга.

 

Вывод: наоборот выделяешь целевую аудиторию, которая принимает решение о выборе провайдера.

Изменено пользователем Kirya

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вот в том-то и моя претензии к автору.

Ведь гипотеза о нормальности распределения изучаемых данных не подтверждена?

 

Или ответ в "Между вопросами в опроснике НЕТ никакой прямой связи, кроме тех, по которым я определяю насколько адекватен человек, отвечающий на них."? :)

Я конечно давно со статистикой не связывался, но что-то не уверен, что Вы правы...

Изменено пользователем NN----NN

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

При чтении статей с Вашими расчетами всегда возникал вопрос: почему, независимо от того, что вы анализируете, у вас берётся нормальное распределение? Такое же вопрос видимо возник и у Kirya

А это стандартная ошибка социологов, маркетологов и экономистов.

Только вот социологи обычно её обходят тем, что изучают вопросы, которые интересны всему населению ограниченному по географическому признаку, а это уже всё-таки нормальное распределение,

зато маркетоиды и экономисты обычно влетают в эту ошибку со всего размаха.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Именно по этому практически все социологические исследования опрашивают примерно 1600 человек.

 

Пришлось набрать (текст из книги "Практика исследования рынков" И.Березин):

 

"Репрезентативная выборка, представляющая всё население России, должна состоять из 3600-9000 человек и 180 групп (2 пола, 3 возраста, 2 образовательных уровня, 3 доходных группы, 5 типов поселений). Точность полученного результата будет в пределах +- 3%."

Глава "Массовый опрос".

 

P.S. И давайте без "посылания". Или Вы можете объяснить/убедить или нет.

Изменено пользователем NN----NN

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В общем ответ на мой вопрос - классический пример того, почему результаты опросов на панелях (причем даже на "нормализованных" панелях - в отличие например от того, который обсуждаем) как правило при внимательном изучении нифига продуктологу/маркетологу сказать не могут :). Тот, кто делает опрос не понимает того, кто пытается добыть информацию :) Например в данном случае меня.

P.S. Вопросы не связаны :) А вот выделяемые группы (с которыми и по которым потом работать маркетингу) как раз оными вопросами ограничены. Как вы думаете - каков доверительный интервал у группы, которая ограничивается конкретными ответами (или диапазонами ответов) на 4 вопроса? А на 10? :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В статье Вы при этом пишите "Статистические параметры результатов следующие: для генеральной совокупности исследования в 133,8 млн. человек (РФ без СКФО), 1285 анкет дают при доверительной вероятности 95% доверительный интервал ошибки для оценочной шкалы "десять баллов" ± 1,64%."

Тут вроде всё население поголовно.

Эм… В общем. претензию понял. В каком-то смысле - вы правы. Буду более аккуратен в формулировках. Но по цифрам я не ошибаюсь, если не брать во внимание тысячные доли процентов, которые возникнут при расчетах на ЦА исследования. Это пользователи сети Интернет, разумеется, которых по некоторым оценкам примерно 40 млн в России.

 

При чтении статей с Вашими расчетами всегда возникал вопрос: почему, независимо от того, что вы анализируете, у вас берётся нормальное распределение? Такое же вопрос видимо возник и у Kirya

Еще раз.

Доверительная вероятность - 95%

Количество ответов на один из вопросов, по которым идет анализ - 10 (шкала). Следовательно, 10% вероятность того, что его ткнут не глядя. Если есть перекос в какую-то сторону - то это явление не случайно. Аналогично, для вопросов класса "да/нет", но тогда надо ставить 50% вероятность.

Так вот. Если мы возьмем генеральную совокупность в 130 млн или в 40 млн., то ничего не изменится.

 

Для разных вопросов будет разный интервал плюс-минус. Согласен. Пересчитаю и отражу в итоге.

 

Но вероятность никак не изменится для серии вопросов по совокупности, ибо сколько бы вы не подкидывали монету - вероятность при каждом броске остается одинаковой в 50%. Она будет меняться только если мы будем считать серию с желанием получить вероятность одновременного выпадения трех орлов подряд. Но в опроснике такого не было. Каждый вопрос самостоятельный, без переходов в ступенях, и для всех демонстрировалась одна и та же анкета.

 

И ещё: я соглашусь, что выборка может давать такой же результат как генеральная совокупность, если она схожа по параметрам с этой генеральной совокупностью. И тут нестыковка с Вашими последними подсчетами: количество женщин (не берём разные возрастные группы) грубо говоря чуть больше 50% населения, а в вашей выборке этого нет. Вы как-то корректируете или это "считается неважным"? А если брать в разрезе регионы, то нужно ещё тщательней подходить к этим различиям. Разве нет?

Да. Я пояснил - это не баг. Это фича. Это один из результатов исследования - женщины просто меньше принимают решения по покупке услуг провайдера. Если у кого-то есть доступ к биллингам - посмотрите пожалуйста, какое количество женщин в процентном отношении указаны в договорах, если это возможно? Что-то мне подсказывает, что не более 20%. У меня получилось 11,75% хотя я изо всех сил вытягивал "показания" из них, покупая трафик.

А теперь приведи выше сказанное тобой к твоему исследованию.

Если б ты хоть чуть-чуть имел практику применения теории вероятности, то ты бы понимал, что считать доверительный интервал кол-ва анкет просто исходя из кол-ва населения всей страны нельзя.

Его нужно считать отдельно для каждого оператора исходя из размеров его абон базы.

Распределение абонентов по операторам уже является ненормальным в математическом смысле этого термина, иначе б у нас в РТ было 80% абонентов ШПД России.

 

Вывод: делишь исследование на общую, значимую для всех, и конкретные части по провайдерам.

Разумеется, я буду делить. Даже больше - у меня сейчас есть результаты только "для всех" и немного могу сказать про БИС, которые очень активно собирали анкеты. И я сейчас в замешательстве - убирать их данные из итога или нет. Думаю, что уберу. Тогда придется вычесть из результата около 280 анкет и точность упадет.

Ведь гипотеза о нормальности распределения изучаемых данных не подтверждена?

Считаю как раз. Пока действительно есть перекос, если брать демпрофиль населения России и респондентов у меня. Формулировка генеральной совокупности действительно не очень корректна. Исправлю.

 

Только вот социологи обычно её обходят тем, что изучают вопросы, которые интересны всему населению ограниченному по географическому признаку, а это уже всё-таки нормальное распределение,

я хочу обойти также, как и любой нормальный маркетолог - выделив из получившихся респондентов группу. Еще раз - генеральную совокупность я сформулировал неверно, ошибку признаю и пересчитываю. Затем мне и нужна данная дискуссия.

 

Кстати, по географии-то как раз все нормально получается. Но разумеется, я не могу сказать, что конкретно будет в оперделенной локации, случайно ткнув пальцем на карту. Но для всей РФ "среднюю температуру" я померял.

 

"Репрезентативная выборка, представляющая всё население России, должна состоять из 3600-9000 человек и 180 групп (2 пола, 3 возраста, 2 образовательных уровня, 3 доходных группы, 5 типов поселений). Точность полученного результата будет в пределах +- 3%."

Ага. Читал. Дело в том, что есть еще один параметр, про который я упоминаю, но еще никто в него носом меня не ткнул, а надо :)

 

Точность. Он же "доверительная вероятность". У меня взята 95%. Если брать 99% - то плюс-минус при 10 вариантах в моем случае (1000 респондентов) растет до 2,45%

 

Кроме того, Березин пишет о "всей России", как о покупателе носков. В нашем случае, еще раз извиняюсь, речь идет о "пользователях сети", среди которых, собственно, опрос и проводился путем инернет-опроса.

 

P.S. И давайте без "посылания". Или Вы можете объяснить/убедить или нет.

Вы не обижайтесь. я наоборот благодарен, что показываете на ошибки, которые действительно есть. Но, черт побери, надоело отвечать на один и тот же вопрос: "твое исследование не точно, потому что ту не спросил всех". Да, не точно. Всех не спросил, потому что нет у меня таких ресурсов. Каждая анкета, кстати, мне обошлась примерно в сто рублей, кстати. Не учитывая стоимости моего собственного труда.

 

Для всех: не бывает абсолютно точного инструмента исследования человеческих мыслей. Не бывает. Имеется множество инструментов, которые позволяют с некоторой точностью определить тенденции и определить "среднюю температуру". Что и было сделано. Точность сосчитаю и скажу - на это надо некоторое количество времени.

 

В общем ответ на мой вопрос - классический пример того, почему результаты опросов на панелях (причем даже на "нормализованных" панелях - в отличие например от того, который обсуждаем) как правило при внимательном изучении нифига продуктологу/маркетологу сказать не могут :). Тот, кто делает опрос не понимает того, кто пытается добыть информацию :) Например в данном случае меня.

Например, в данном случае вас я не считал. И не собирался. Но если возжелаете - посчитаю. За деньги. Цена вопроса - 19900 рублей по готовой методике и без учета затрат на сбор данных. Нужно что-то особенное - извольте, но ценник будет несколько иной.

Кстати, я обращался к операторам с целью поучаствовать. БЕСПЛАТНО. И в статях, и даже отспамил на 1500 адресов из списка пров.наг.ру

В результате откликнулось только 10 провов из которых реально работал только БИС. А знаете какое количество анкет я получил от остальных? Некоторые даже NDA подписали. Одну. Ее прислал собственно директор одного маленького прова на тыщщ пять абонентов. Подписал НДА и заполнил анкету, хотя была более чем подробная инструкция как и что делать с этой анкетой.

 

 

P.S. Вопросы не связаны :) А вот выделяемые группы (с которыми и по которым потом работать маркетингу) как раз оными вопросами ограничены. Как вы думаете - каков доверительный интервал у группы, которая ограничивается конкретными ответами (или диапазонами ответов) на 4 вопроса? А на 10? :)

Если вы внимательно читали, то учитываются. Кстати, раз вы такой умный :о) а расскажите каков доверительный интервал в случае ОТКРЫТОГО вопроса? Например, был открытый вопрос про то, каких провайдеров вы в принципе знали. Частота ответов (не пустых анкет) там 84%. Ну, и какая точность будет?

 

И вот про то, что я теперь могу сказать об известности брендов, а так же причины, например, смены провайдера (частота ответов 54%) будет уже только за бапки. Должен же я как-то зарабатывать на следующий опрос.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Кроме того, Березин пишет о "всей России", как о покупателе носков. В нашем случае, еще раз извиняюсь, речь идет о "пользователях сети", среди которых, собственно, опрос и проводился путем инернет-опроса.

А моё возражение относилось только к вашему утверждению универсальных "1600 чел.".

Да, Вы правы он приводит размер универсальной выборки, но ведь и она при этом не формируется по принципу "кто согласился ответить, тот мне и нужен" ;)

 

Вы не обижайтесь. я наоборот благодарен, что показываете на ошибки, которые действительно есть. Но, черт побери, надоело отвечать на один и тот же вопрос: "твое исследование не точно, потому что ту не спросил всех". Да, не точно. Всех не спросил, потому что нет у меня таких ресурсов.

ОК. Эмоции эмоциями, но Вы же видите/знаете кому отвечаете.

Что касается трудностей, то Вы сами в это ввязались. Зачем-то это Вам было же нужно :)

Повышают голос не всегда из-за "тупости" собеседника, но и при отсутствии аргументов и способности их донести до оппонента.

 

А так, не ошибается только тот, кто ничего не делает.

Разберётесь, пересчитаете и народ к вам потянется с мятыми купюрами по 9900.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пришлось набрать (текст из книги "Практика исследования рынков" И.Березин):

Кстати! :) я тоже нашел сию книжку. я помнил такого аффтара, но как-то сразу не сообразил про кого речь идет. Это ж Игорь!

В общем, у него несколько изданий этой книжки, где он достаточно часто меняет мнение :)

В моем экземляре от 2007 года (на полке нашел) есть фраза: "Размер выборки практически не зависит от размера генеральной совокупности. Для многомиллионного мегаполиса и уездного города в 35 тыс. человек, для репрезентативной выборки с одинаковыми параметрами потребуется опросить одинаковое количество респондентов". Я об этом и хотел сказать - здесь уже не важно на 130 млн. я счтал или на 40 - результат ПОЧТИ одинаковый и различается на сотые-тысячные несущественные доли процента.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Я, видимо, старше Вас, у меня 2003 год издания :)

 

"Размер выборки практически не зависит от размера генеральной совокупности. Для многомиллионного мегаполиса и уездного города в 35 тыс. человек, для репрезентативной выборки с одинаковыми параметрами потребуется опросить одинаковое количество респондентов"

Он всё верно пишет :).

Имеется в виду, что если мы говорим о генеральной совокупности, которую составляют жители, то репрезентативность выборки в определенных пределах сохраняется и в мегаполисе и в среднем городке. Но вряд ли можно говорить о репрезентативности опроса в деревне на 5 дворов или в городке, но в военном. Так как в этом случае неизбежно отклонение от параметров генеральной совокупности, а мы должны её соблюсти как бы в микромасштабе.

Изменено пользователем NN----NN

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Что касается трудностей, то Вы сами в это ввязались. Зачем-то это Вам было же нужно :)

Мне это нужно потому, что я хочу разобраться и знать больше других. Проект был затеян не ради денег и славы, но ноуки для :)

 

Повышают голос не всегда из-за "тупости" собеседника, но и при отсутствии аргументов и способности их донести до оппонента.

Эммм… Я как бы и не повышал :) на форуме это трудно делать. Но вы пытаетесь подловить меня на некомпетентности и это раздражает. Допуски по выборке у меня считает гугл.докс автоматом при сведении таблиц, а я, зная, что разницы при генеральной совокупности в 100 тыс. и 100 млн. практически нет, вбил тупо 1 и шесть нулей. Исправлю и пересчитаю для вопросов в отдельности, где то возможно и необходимо.

 

Для всех - у меня есть и соответствующее образование и опыт. Я изучал (не проходил, а именно изучал) социологию в вузе - в педах это обязательный предмет, а у нас было четыре семестра и довольно неплохой препод, которая потом в так называемую "свердловскую социологическую школу" входила. Плюс опыт работы на выборах, когда они еще были выборами, в начале 200-х - я ставил расчетную базу на выборах Собянина, например, губером Тюменской области и с ГАС "Выборы", кстати, знаком не понаслышке. За что имел невыезд как "носитель".

 

Имеется в виду, что если мы говорим о генеральной совокупности, которую составляют жители, то репрезентативность выборки в определенных пределах сохраняется и в мегаполисе и в среднем городке. Но вряд ли можно говорить о репрезентативности опроса в деревне на 5 дворов или в городке, но в военном. Так как в этом случае неизбежно отклонение от параметров генеральной совокупности, а мы должны её соблюсти как бы в микромасштабе.

Речь шла о параметрах вероятностных - доверительный интервал и точность. И для случайной выборки, а не стихийной. И когда нужно именно соблюсти реперезентативность по демографии. И даже если воспользоваться советом Березина, то еще нужна стата по конкретному населенному пункту чтоб демпараметры конкретного населенного пункта соблюсти. Ибо городки тоже разные бывают - например, военные, где хоть оббегайся, а найти две пары стройных женских ног не удастся :)

 

В данном случае идет речь только об одном демпараметре - "пользователи интернет". Он соответствует главной ЦА интернет-провайдеров на 146% - все клиенты провайдеров пользователи интернет. И да, еще раз, я наверняка не смогу сказать что думают большинство женщин (пусть и пользователей интернетов) в Иваново. Но я могу сказать, что Ростелек имеет отрицательный NPS с достоверностью в плюс-минус три процента. А он у них самый отрицательный. И еще, я могу сказать, что наибольший индекс узнаваемости у Дом.ру. Больше чем у Ростелека, кстати. И даже ренкинг брендов построить с некоторой степенью достоверности. А по полному индексу и рейтинг тех самых ТОП10. Надо объяснять разницу между ренкингом и рейтингом?

 

И он будет правильный на всю страну. Но не на отдельный Новосибирск, например, где, разумеется, данных слишком мало.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А теперь приведи выше сказанное тобой к твоему исследованию.

Если б ты хоть чуть-чуть имел практику применения теории вероятности, то ты бы понимал, что считать доверительный интервал кол-ва анкет просто исходя из кол-ва населения всей страны нельзя.

Его нужно считать отдельно для каждого оператора исходя из размеров его абон базы.

Распределение абонентов по операторам уже является ненормальным в математическом смысле этого термина, иначе б у нас в РТ было 80% абонентов ШПД России.

 

Вывод: делишь исследование на общую, значимую для всех, и конкретные части по провайдерам.

Разумеется, я буду делить. Даже больше - у меня сейчас есть результаты только "для всех" и немного могу сказать про БИС, которые очень активно собирали анкеты. И я сейчас в замешательстве - убирать их данные из итога или нет. Думаю, что уберу. Тогда придется вычесть из результата около 280 анкет и точность упадет.

Посчитай удовлетворённость скоростей и технологии ADSL с учётом БИС и без.

Если данные сильно будут разнится - убирай, нет - значит выборка попала в Гауссиану.

 

А вообще думаю, надо было тебе раньше намекнуть провайдерам какие именно вопросы ты будешь анализировать, не раскрывая методики.

Отклика, думаю, среди ISP, было б на несколько порядков больше...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Посчитай удовлетворённость скоростей и технологии ADSL с учётом БИС и без.

Если данные сильно будут разнится - убирай, нет - значит выборка попала в Гауссиану.

В пределах статпогрешности. Я больше скажу - у меня было три десятка таблиц (серий) с опросниками. Так вот. Серии, где было набрано больше 200 анкет (таких получилось четыре), имеют отклонение в те самые плюс-минус два процента по некоторым вопросам. Все не считал - посчитал "Сверхскорость" - ответ "Может быть" и "Смена провайдера" ответ "Давно пользуюсь одним". Анкета БИС имеет отклонение в 8,64% по смене прова, что странно, ибо он в меньшую (!!!) сторону. Разбираюсь с причинами, но классифицировать открытые вопросы - много ручной работы. Счас попробую воспользоваться твоим советом. Особенно, если ты разьяснишь логику - почему именно ДСЛ и сравнивать удовлетовроенность скоростью, а не облсуживанием, например?

 

А вообще думаю, надо было тебе раньше намекнуть провайдерам какие именно вопросы ты будешь анализировать, не раскрывая методики.

Отклика, думаю, среди ISP, было б на несколько порядков больше...

Блджат! Четыре статьи, баннер на главной и спам в полторы тысячи адресов! Как еще намекать-то? Думаю, что проблема пока в том, что не видели результата и типа "опасаются". Очень надеюсь на осенний опрос, который точно будет, не смотря на пока убыточность проекта.

Пока в России ничего подобного вообще не делали. Такшто - первым всегда трудно, да. Но мы не привыкли отступать!!! :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

отспамил на 1500 адресов из списка пров.наг.ру

В результате откликнулось только 10 провов

 

Так это Вы из линкедина или как его там писали ("XYZ с nag.ru blah blah blah" точно не помню)?

"С позволения Вашего Величества, я этого письма не писал читал" почти (с)

Пишите сразу "прямая трансляция с wanderer_from@forum.nag.ru" - Вам все ответят :)

 

 

Проект был затеян не ради денег

Полный отчет будет доступен в shop.nag.ru по цене всего 9900 рублей.

18b72faa98b6t.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Эммм… Я как бы и не повышал :) на форуме это трудно делать.

Этот момент уже проехали, меня устроил Ваш ответ ("Вы не обижайтесь..." и т.д.)

 

Но вы пытаетесь подловить меня на некомпетентности и это раздражает.

У меня это не получится, Вы знаете и делали больше ("есть и соответствующее образование и опыт"). Поэтому можно успокоиться. Но есть какие-то моменты, за которые "глаз цепляется" и я про них написал.

 

Не пойму только: то "спасибо за уточнения/замечания", то оказывается "раздражает".

Думаете кому-то будет приятно узнать, что тот отчёт, который они _купили_, содержит ошибки?

 

Мне это нужно потому, что я хочу разобраться и знать больше других.

Это ценно, поэтому я писал Вам только о самых спорных моментах, не придираясь к мелочам.

 

В общем, удачи.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Особенно, если ты разьяснишь логику - почему именно ДСЛ и сравнивать удовлетовроенность скоростью, а не облсуживанием, например?

Ну БИС же телефонисты.

Это ж элементарно.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Так это Вы из линкедина или как его там писали ("XYZ с nag.ru blah blah blah" точно не помню)?

"С позволения Вашего Величества, я этого письма не писал читал" почти (с)

Пишите сразу "прямая трансляция с wanderer_from@forum.nag.ru" - Вам все ответят :)

С Линкедина точно не писал и не спамил. Спамил через МайлЧимп, где были ссылки, в т.ч. и на статьи. Ну, тут что сказать… Каюсь, грешен. Хотел "как лучше", далее по тексту. Про форумный ник - как-то да. Может уже под фамилией начать писать?

 

18b72faa98b6t.jpg

Мимими. НО.

Я вложил в эту работу ресурсов. Своих. В принципе, хотелось бы их как минимум окупить. Как максимум, получить больше ресурсов, чтобы хватило на следующее исследование. Как я понимаю, вы тоже не бесплатно работаете, а интернеты за денюжку продаете. Ну вот. Я тоже продаю. Будет прибыль - буду расширять практику и делать работу лучше, качественнее, точнее. Пока так. Если вы готовы полностью оплатить расходы плюс мою работу - я готов опубликовать отчет целиком бесплатно. Готовы?

 

Думаете кому-то будет приятно узнать, что тот отчёт, который они _купили_, содержит ошибки?

Я вообще, пусть и не всегда внимательный, но стараюсь ошибок избегать. Очень стараюсь.

 

Ну БИС же телефонисты.

Ну, ок. Посчитаю - докладусь :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Во первых я не имею отношения к операторам связи на сегодня. Уже этак больше двух лет.

Во-вторых - вопрос как раз к методике подсчета комплексных показателей (которые базируются на ответах на несколько вопросов). Если вы мне приведете методику расчета доверительных интервалов показателей комплексных формул на основании панелей - вы будете молодец. Если вы после этого рассчитаете доверительный интервал рассчитанных вами показателей (например того-же NPS) - вы будете дважды молодец. Пока у панелистов на моей памяти это ни разу не получилось.

Я не к тому, что вы плохим делом занимаетесь. Я ровно к тому, чтобы ваша деятельность не стала для операторов связи ТНСом или Комскором для контента в интернете (а я с той стороны немного знаком).

Проблема в том, что пока это был телевизор (устройство без логов и обратной связи) - эти ребята (ТНС и Комскор со всякими Гэллапами) успешно рулили. Но в Интернете они успешно обосрались. Ибо обратная связь есть в значительно более прикольных вариантах (хотя надо конечно не забывать смотреть на "генеральную совокупность").

 

Ах да - доверительный интервал вида плюс-минус 50% - это кажется примерно ноль полезной информации в показателе. Кажется так :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может уже под фамилией начать писать?

 

В статьях/письмах, думаю что стоит - людям будет проще сопоставить кто есть who.

 

 

Я вложил в эту работу ресурсов. Своих. В принципе, хотелось бы их как минимум окупить. Как максимум, получить больше ресурсов, чтобы хватило на следующее исследование.

 

Желание вернуть потраченные время и силы с помощью дензнаков более чем понятно. Не понятно зачем писать о том, что проект затевался как альтруистический, когда цена уже объявлена :)

Если уберете из суммы один последний нолик доку купят хотя бы ради мат. помощи автору, IMHO.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.