Próbkowanie odnosi się do aktu wyboru określonej liczby wpisów z dużego zbioru danych do dalszej analizy. Badania biznesowe często generują ogromne ilości danych, szczególnie w badaniach rynkowych, takich jak dane demograficzne. Techniki pobierania próbek w badaniach biznesowych pozwalają badaczom pracować z łatwiejszym do zarządzania podzestawem danych, które według nich trafnie odzwierciedlają trendy w większej kolekcji.
Badania podstawowe
Firmy uzyskują dane badawcze, z których pobierają próbki na dwa różne sposoby. Pierwsze, pierwotne badania obejmują wykopywanie danych ze źródeł. Ankiety są najpopularniejszą formą badań pierwotnych, przeprowadzanych osobiście, przez telefon, Internet lub w dowolny inny sposób. Wyniki badań pierwotnych są zastrzeżone, co oznacza, że żadna inna firma nie ma dostępu do wyników badań pierwotnych, chyba że zostaną one wyraźnie przyznane przez naukowca lub udostępnione publicznie.
Badania wtórne
Kiedy wyniki pierwotnych badań są dzielone z innymi badaczami, inni naukowcy przeprowadzają badania wtórne. Drugorzędne badania zasadniczo opierają się na wysiłkach innych, którzy poświęcili czas na kompilację dużych zbiorów istotnych i wartościowych danych. Wyszukiwanie średnich dochodów z Bureau of Labor Statistics jest przykładem badań wtórnych. Ponieważ biuro przeprowadziło już rozległe pomiary i gromadzenie danych, inni badacze biznesowi mogą wykorzystać te dane przy niewielkim lub zerowym koszcie.
Losowe pobieranie próbek
Losowe pobieranie próbek polega na losowym wybraniu pewnej liczby pozycji danych, a następnie wykorzystaniu próbki do dalszej analizy. Losowe pobieranie próbek może być skuteczną techniką przy analizowaniu dość jednorodnych zbiorów danych. Wyobraź sobie firmę, która chce określić odsetek osób, u których w określonym stanie zdiagnozowano chorobowo otyłość. Zamiast pracować z zestawem danych obejmującym kilka milionów wpisów, firma mogła rozsądnie przeanalizować losową próbkę kilkuset wpisów, aby uzyskać liczbę zbliżoną do statystyk całego zbioru danych.
Próbkowanie w N-tym Imieniu
Próbkowanie z użyciem n-tej nazwy, określane również jako systematyczne pobieranie próbek, jest podobne do losowego próbkowania, z tym że zmniejsza wpływ arbitralnego doboru danych. Systematyczne pobieranie próbek obejmuje wybranie każdego n-tego wpisu danych w celu włączenia do próbki. Jeśli dysponowałeś zbiorem danych wynoszącym milion odpowiedzi ankietowych, możesz na przykład wybrać co tysięczny wpis, który ma zostać uwzględniony w próbce, co da Ci łatwiejszą do opanowania próbkę tysiąca wpisów.
Kontrolowane pobieranie próbek
Kontrolowane pobieranie próbek pobiera wysoce specyficzne próbki z dość niejednorodnego zestawu danych. Kontrolowane pobieranie próbek jest najcenniejsze przy przeprowadzaniu badań wtórnych, ponieważ badania pierwotne mogą być zaprojektowane tak, aby w razie potrzeby kierować je tylko do określonych respondentów.
Wyobraź sobie firmę, która kupuje duży zestaw danych zawierający informacje na temat wieku respondentów, ich pochodzenia etnicznego, wykształcenia i poziomu dochodów. Jeśli firma chciała określić średni poziom dochodów dla określonej grupy wiekowej, przed obliczeniem kwoty dochodu firma może zbudować próbkę składającą się wyłącznie z pozycji, które spełniają określone kryteria wiekowe.