Як визначити обсяг вибірки

✅Формула вибірки – проста

Наведена нижче формула для розрахунку обсягу вибірки використовується в тих випадках, коли опитуваним (респондентам) задається тільки одне питання, на який існує тільки два варіанти відповіді. Наприклад, «Так» і «Ні»; «Користуюся» і «Не користуюся».

Звичайно, дану формулу можна застосовувати тільки при проведенні найпростіших досліджень. Якщо Вам потрібно визначити обсяг вибірки при проведенні більш масштабних досліджень, наприклад анкетування, то слід використовувати інші формули.

ПРОСТА ФОРМУЛА ДЛЯ РОЗРАХУНКУ ОБСЯГУ ВИБІРКИ

  • n – обсяг вибірки;
  • z – нормоване відхилення, яке визначається виходячи з обраного рівня довірливості. Цей показник характеризує можливість, ймовірність попадання відповідей в спеціальний – довірчий інтервал. На практиці рівень довірчості часто приймають за 95% або 99%. Тоді значення z будуть відповідно 1,96 і 2,58;
  • p – варіація для вибірки, в частках. По суті, p – це ймовірність того, що респонденти виберуть той чи інший варіант відповіді. Припустимо, якщо ми вважаємо, що чверть опитуваних виберуть відповідь «Так», то p дорівнюватиме 25%, тобто p = 0,25;
  • q = (1 – p);
  • e – допустима помилка, в частках.

ПРИКЛАД РОЗРАХУНКУ ОБСЯГУ ВИБІРКИ

Компанія планує провести соціологічне дослідження з метою виявити частку осіб, що палять в населенні міста. Для цього співробітники компанії будуть задавати перехожим одне питання: «Ви курите?». Можливих варіантів відповіді, таким чином, тільки два: «Так» і «Ні».

Обсяг вибірки в цьому випадку розраховується наступним чином. Рівень довіри приймається за 95%, тоді нормоване відхилення z = 1,96. Варіацію приймаємо за 50%, тобто умовно вважаємо, що половина респондентів може відповісти на питання про те, чи курять вони – «Так». Тоді p = 0,5. Звідси знаходимо q = 1 – p = 1 – 0,5 = 0,5. Допустиму похибку вибірки приймаємо за 10%, тобто e = 0,1.

Підставляємо ці дані в формулу і вважаємо:

Отримуємо обсяг вибірки n = 96 осіб.

ОБЛАСТЬ ЗАСТОСУВАННЯ ЦІЄЇ ФОРМУЛИ

При проведенні простих досліджень, коли потрібно отримати відповідь за все на одне просте запитання. При цьому шкала відповідей, як правило, дихотомічного характеру. Тобто пропонуються (або маються на увазі) варіанти відповідей на кшталт «Так» – «Ні», «Чорне» – «Біле», і т.д.

ОСОБЛИВОСТІ ЦІЄЇ ФОРМУЛИ РОЗРАХУНКУ ОБСЯГУ ВИБІРКИ

  • перед тим, як розраховувати обсяг вибірки в даному випадку бажано попередньо провести якісний аналіз досліджуваної генеральної сукупності. Зокрема встановити ступінь схожості, близькості досліджуваних одиниць сукупності в частині їх соціальних, демографічних, географічних, інших характеристик. Також корисно провести пілотне, розвідувальне дослідження, щоб встановити приблизну величину p;
  • потрібно мати на увазі, що максимальна мінливість (варіація відповідей) відповідає значенню p = 50%, оскільки тоді q = 50% і p * q = 0,5 * 0,5 = 0,25. Це найгірший випадок, всі інші значення p дадуть мінливість меншого розміру (наприклад, при p = 80%, p * q = 0,8 * 0,2 = 0,16; а при p = 10%, p * q = 0, 1 * 0,9 = 0,09). Втім, даний показник впливає на обсяг вибірки не дуже сильно.

Обчислення обсягу вибірки

За результатами досліджень із урахуванням оцінок точності параметрів загальний обсяг вибіркової сукупності не повинен перевищувати 20 % обсягу генеральної сукупності.

Відсоток відбору з основної підсукупності розраховують за різницею максимально допустимого загального обсягу вибірки СОМП і суми обсягів вибірок із інших підсукупностей.

Передусім обсяг вибірки для основної підсукупності підприємств поділяється на дві частини: 90% – для розподілення за стратами на основі визначеного розміщення, 10% – “резерв”. “Резерв” -це кількість одиниць вибірки, які використовуються для коригування розмірів вибіркових страт. Ця процедура необхідна для упорядкування кількості підприємств у стратах вибірки, що пов’язано передусім із високим відсотком неотримання відповідей у ході вибіркового обстеження, що для малочисленої страти є суттєвим при поширенні її даних на генеральну сукупність.

Принцип розподілу обсягу вибірки за стратами залежить від виду відбору, який застосовується для формування вибіркової сукупності. Найбільш оптимальним для отримання надійних результатів на національному рівні є розміщення Неймана, за якого обсяг вибірки у страті обчислюється за формулою

де п. – обсяг вибірки зі страти /?; N. – кількість одиниць у страті А; о. – середньоквадратичне відхилення обсягу реалізованої продукції в страті Л.

У деяких випадках формула дає пк > Ик. Тоді розмір вибірки у страті Ь дорівнює розміру сукупності у страті Л: пь = N.. Обсяг вибірки, що вивільняється, у таких випадках додається до обсягу вибірки зі страт, у яких пи Л/”Л, після чого процедура обчислення обсягів вибірки за стратами за оптимальним розміщенням Неймана проводиться повторно.

Після застосування оптимального розміщення Неймана відбувається розподілення “резерву” у ручний спосіб.

Розмір вибірки в страті коригується на відсоток невідповідей (за результатами попередньо проведеного обстеження), а саме збільшується (зменшується) за високого (низького) значення відсотка невідповідей.

Розмір вибіркових страт коригується залежно від статистичних характеристик, а саме збільшується (зменшується) в стратах із високим (низьким) показником варіації за незмінного загального розміру вибіркової сукупності.

Для кожної групи за видом економічної діяльності та локально-регіональної групи у вибірці необхідно дотримуватися наступного співвідношення між вагами страт залежно від групування за кількістю найманих працівників:

де w., w? wy w4 – вага підприємств, відповідно, у першій, другій, третій і четвертій групах малих підприємств за кількістю найманих працівників.

Відбір одиниць для безпосереднього обстеження

Вибіркова сукупність формується з кожної вищевказаної складової основи вибірки окремо.

Формування вибіркової сукупності починається з визначення кроку відбору та початку відбору (перший елемент відбору). Крок відбору – це результат ділення обсягу генеральної сукупності на обсяг вибірки (для кожної страти): step = N/n.

Для розрахунку першого елементу відбору спочатку розраховують змінну к як добуток кроку відбору на випадкове число. Випадкове число визначається за допомогою генератора випадкових чисел і набуває значення від 0 до 1:

Перший елемент відбору визначається відповідно до змінної к: якщо ця змінна більша або дорівнює одиниці, то вона буде вказувати на перший елемент відбору, якщо ця змінна менша за одиницю, то перший елемент відбору визначається додаванням до цієї змінної кроку відбору:

Перед початком відбору виконується впорядкування елементів страти за територіальною ознакою, а для основної підсукупності -і за обсягом реалізованої продукції.

Нетипові підприємства, малі страти та підприємства з окремими попередньо визначеними видами економічної діяльності обстежують повністю.

Опрацювання та аналіз результатів

Після того, як первинні дані зібрані, їх опрацьовують та аналізують. Основними етапами опрацювання та аналізу даних є такі:

  • 1) редагування даних;
  • 2) врахування невідповідей;
  • 3) розповсюдження даних;
  • 4) оцінювання надійності результатів.

Європейська практика гарантування якості статистичних продуктів, у тому числі результатів вибіркових обстежень підприємств, передбачає складання стандартних звітів з якості. Такі звіти мають уніфіковану структуру, чітко визначений набір критеріїв якості та їх індикаторів і характеристик.

Стандартні звіти з якості розробляють з метою забезпечення порівняння якості даних різних статистичних спостережень, відслідковування якості даних у динаміці, а також міжнародних порівнянь. Інформація про якість статистичних даних потрібна користувачам для розуміння ними переваг та обмежень щодо використання даних, а також для того, щоб вони могли правильно їх інтерпретувати. Інформування користувачів про якість даних є важливим елементом взаємовигідних стосунків статистики і суспільства, яке в ній зацікавлене.

Євростат рекомендує застосовувати такі критерії якості статистичної продукції:

  • 1) відповідність/релевантість;
  • 2) точність/надійність;
  • 3) своєчасність;
  • 4) пунктуальність;
  • 5) доступність і зрозумілість/ясність;
  • 6) послідовність/порівняльність;
  • 7) зіставність/узгодженість.

Відповідно до методологічного документа Євростату “Визначення якості ЄСС”, останніх п’яти принципів Кодексу норм Європейської статистики та “Принципів діяльності органів державної статистики України”, які були розроблені та затверджені наказом Держкомстату від 14.06.2010 № 216, критерії якості об’єднані у п’ять компонент якості (табл. 3.11).

При описуванні компонентів якості використовуються як індикатори якості, які є кількісними показниками, так і словесні описи (характеристики якості).

З метою надання користувачам інформації про якість результатів річного структурного вибіркового обстеження малих підприємств з 2008 року в Україні здійснюють підготовку звітів з якості даних річного вибіркового структурного обстеження малих підприємств. їх зміст і структуру з урахуванням європейських стандартів та досвіду в Україні визначають відповідні Методологічні положення, затверджені Держстатом України у 2010 році. Ознайомитися зі звітами користувачі можуть засобами інтернету за адресою офіційного сайту Держстату України.

Таблиця 3.11 Індикатори якості статистичних продуктів, рекомендовані Євростатом для відображення у звітах з якості

Як визначити обсяг вибірки

Розрахуйте розмір вибірки на основі розміру сукупності, рівня довіри та похибки.

Калькулятор розміру вибірки

Зміст

Що таке визначення розміру вибірки?

Кількість відповідей, отриманих в результаті опитування, називається розміром вибірки. Оскільки вашою думкою та поведінкою цікавиться лише невеликий відсоток цільової групи, це називається «вибіркою». Одним із способів вибірки є використання «випадкових вибірок», де респонденти випадковим чином відбираються з усієї сукупності.

Розуміння розмірів вибірки

Це ключові терміни, які допоможуть вам розрахувати розмір вибірки.

Чисельність населення – це загальна кількість людей, які проживають у популяції, яку ви хочете вивчати. Якби ви взяли випадкову вибірку з населення США, ваше населення становило б приблизно 317 мільйонів. Чисельність населення також визначається кількістю співробітників у вашій компанії, якщо ви її опитуєте.

Допустима помилка: це відсоток, який вказує, наскільки ймовірно, що результати опитування точно відображатимуть погляди всього населення. Чим нижча похибка, тим ближче до отримання точної відповіді з певним рівнем впевненості.

Рівень впевненості вибірки (або впевненості): це відсоток того, наскільки ви впевнені, що сукупність вибере відповідь у межах заданого діапазону. Наприклад, рівень довіри 95% означає, що ви можете бути впевнені на 95%, що результати знаходяться між числами xy.

Чи важливо мати статистично значущий розмір вибірки?

Основне правило полягає в тому, що чим більший розмір вибірки, зі статистики, тим більша значущість ваших результатів. Це означає, що шансів на збіг обставин менше.

Ви можете задатися питанням, чи важливий статистично значущий розмір вибірки. Це індивідуальна ситуація. Навіть якщо ви не маєте достатньо великої вибірки, щоб представити всю сукупність, вибірка опитування все одно може надати цінну інформацію. Відгуки клієнтів можна використовувати незалежно від того, чи є у вас статистично значущий розмір вибірки. Ви можете отримати цінну інформацію від клієнтів, прислухаючись до їхніх думок.

Однак експерти мають бути обережними, щоб вибрати вибірку правильного розміру для представлення сукупності.

Parmis – це автор контенту, який захоплюється написанням та створенням нових речей. Вона також дуже цікавиться технікою і любить вивчати нове.

Related Post

Як близько від леп можна будувати будинокЯк близько від леп можна будувати будинок

Зміст:1 Чи можна будувати поблизу проводів леп будівництво своїми руками2 Відстань від проводів ПЛ, опор ЛЕП до будинку, житлових будинків, дороги, газопроводу3 Чи шкідливо жити під лепу3.1 Чим шкідливі високовольтні

Хто продюсер шаманаХто продюсер шамана

Зміст:1 Кто продюсер певца под псевдонимом “Шаман”?2 Биография певца Шамана2.1 Раннее детство2.2 Проект «Фактор А» в жизни актера2.3 Роль программы «Голос» в жизни артиста2.4 Сольная карьера2.5 Личная жизнь2.6 Интересные факты

Скільки у вас грошей англійськоюСкільки у вас грошей англійською

Головна відмінність полягає в тому, що ці три конструкції використовуються з різними іменниками. Якщо іменник вказує на об'єкт, який можна порахувати (countable noun), тоді використовуємо «many». Якщо йдеться про незлічуваний