1/21
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
|---|
No study sessions yet.
Sampling methods
Probability sampling
Non-probability sampling
Definition Probability sampling
Mỗi phần tử trong tổng thể đều có xác suất biết trước và khác 0 để được chọn
Types of Probability sampling
Simple Random Sampling
Systematic Sampling
Stratified Random Sampling
Cluster Sampling
Simple Random Sampling
Each item is chosen completely at random, without dividing the population first
VD: Out of 50 items, number them 1-50 and randomly pick 5 items
Systematic Sampling
Select every nth item from the population list
VD: Out of 50 items, pick every 10th item -> 10th, 20th, 30th, 40th, 50th
Stratified Random Sampling
The population is divided into subgroups (strata) based on certain characteristic
and random samples are taken from each stratum (tầng)
VD: Divide 10,000 shares by sector, then randomly select shares from each sector to form a portfolio
Cluster Sampling
The population is divided into cluster (each cluster is like a small version of the whole population),
and some clusters are randomly selected as a whole
VD: To study average income in VN, divide the country into cities and collect data from one or a few cities only
Definition Non-probability sampling
Không biết xác suất để mỗi phần tử được chọn; dựa vào sự thuận tiện hoặc phán đoán
Types of Non-probability sampling
Convenience Sampling
Judgment Sampling
Convenience Sampling
The sample is chosen based on ease of access or availability of data.
It is not random, so the sampling error is usually higher
VD: Trong các giai đoạn nghiên cứu ban đầu hoặc khi có giới hạn thời gian hoặc chi phí, convenience sampling được sử dụng vì nhanh chóng và không tốn kém
Judgment Sampling
The researcher selects observations intentionally from a larger dataset based on experience, knowledge, or judgment about which data are most useful (không chọn random)
VD: một NNC nghiên cứ về tuân thủ kế toán, có thể dựa trên kinh nghiệm, chọn phân tích các tỷ lệ tài chính cụ thể trong đó việc không tuân thủ có nhiều khả năng xuất hiện nhiều nhất
Definition Sampling error
The difference between a sample statistic (like sample mean, variance, or standard deviation) and the true population parameter
Formula Sampling error
Sampling error of the mean = X ngang - mju
X ngang: sample mean mju: population mean
VD: If the true population mean income is $50,000, and the sample mean from a survey is $48,000
-> Sampling error = 48,000 - 50,000 = -2,000
Sampling distribution
Là phân phối xác suất của một chỉ số thống kê (mean, variance,..) khi ta lấy nhiều mẫu random cùng kích thước từ một population
Hiểu đơn giản: Nếu bạn lấy nhiều mẫu khác nhau từ cùng một nhóm người, rồi mean mỗi mẫu, thì phân phối của các mean đó chính là sampling distribution
Central limit theorem
Standard error of the sample mean
Definition Resampling
Là pp lấy mẫu lặp lại từ dữ liệu gốc để ước lượng các tham số của population (parameters) bằng cách mô phỏng nhiều mẫu khác nhau
Các pp phổ biến Resampling
Boostrap
Jackknife
Boostrap
Lấy mẫu ngẫu nhiên có hoàn lại (with replacement) từ dữ liệu gốc để ước lượng sai số chuẩn, khoảng tin cậy,...
Jackknife
Lần lượt loại bỏ từng quan sát trong mẫu gốc để đánh giá ảnh hưởng của từng phần tử và ước lượng độ lệch (bias) hoặc variance
Pros and Cons Resampling methods
Pros
- Đơn giản, dễ thực hiện
- Mô phỏng tốt các đặc điểm thống kê của population qua thông việc lấy mẫu từ dữ liệu quan sát, giúp ước lượng như đang lấy mẫu từ population
Cons
- Chỉ cung cấp ước lượng thống kê, không cho kết quả chính xác tuyệt đối
Standard deviation of the sample mean in resampling