5.-Trac-nghiem-gia-thuyet-thong-ke-gia-thuyet-khong
ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH - KHOA DƯỢC
Giảng viên: ThS. Nguyễn Đức Tùng
Email: ndtung@ump.edu.vn
NỘI DUNG
MỞ ĐẦU
CƠ SỞ LÝ THUYẾT
GIỚI THIỆU SƠ VỀ PHẦN MỀM
ÁP DỤNG THỰC TẾ & KINH NGHIỆM
TÓM TẮT
1. MỞ ĐẦU
Trắc nghiệm giả thuyết thống kê là một phương pháp được sử dụng để kiểm tra các giả thuyết về dữ liệu.
Phần mềm hỗ trợ việc thực hiện các trắc nghiệm này sẽ giúp người dùng phân tích và đưa ra quyết định dựa trên các kết quả thu được.
Câu hỏi và giả thuyết nghiên cứu
MM TOPIC, NARROWER, FOCUS
Vai trò của thống kê trong nghiên cứu khoa học:
Đối tượng: Thu phí - KTC
2. CƠ SỞ LÝ THUYẾT
Giới thiệu về thống kê
Suy luận và Mô tả
Suy luận thống kê là quá trình lấy lập luận từ dữ liệu mẫu để tổng quát hóa cho dân số lớn hơn.
Nó gồm hai loại chính:
1. Suy luận mô hình hoá: Tạo ra các mô hình để trình bày mối quan hệ giữa các biến. Mô hình có thể là tuyến tính hoặc phi tuyến tính, tùy thuộc vào cách dữ liệu tương tác với nhau. Mô hình hoá giúp dự đoán và giải thích các hiện tượng dựa trên các thông số đã được đo lường. 2. Suy luận kiểm định giả thuyết: Là phương pháp dùng để kiểm tra các giả thuyết về mối quan hệ giữa các biến.
Nó bao gồm việc thiết lập giả thuyết không (H0) và giả thuyết thay thế (H1), và tiến hành các kiểm định thống kê hoặc thống kê nghiệm để xác định xem có đủ bằng chứng nhằm bác bỏ H0 hay không.
Quá trình mô tả dữ liệu bao gồm việc tóm tắt và trình bày các thông tin một cách rõ ràng và dễ hiể, giúp người nghiên cứu có cái nhìn tổng thể về dữ liệu:
- **Biểu đồ và đồ thị**: Sử dụng các đồ thị như biểu đồ cột, biểu đồ tròn, hoặc biểu đồ phân tán để trực quan hóa mối quan hệ giữa các biến.
- **Thống kê mô tả**: Bao gồm các thống kê như trung bình, trung vị, độ lệch chuẩn, và các phần trăm, để tóm tắt tính chất của dữ liệu.
- **Xác định xu hướng và mẫu**: Suy luận dựa trên dữ liệu phải đặt trong bối cảnh cụ thể, chỉ ra các xu hướng hoặc mẫu có thể hỗ trợ trong việc đưa ra quyết định về cách thức thực hiện nghiên cứu trong tương lai.
Giới thiệu về phân tích thống kê
Khái niệm cần biết:
Dữ liệu và kiểu dữ liệu
Biến
Giả thuyết không (H0)
Phân phối chuẩn
Độ tin cậy và giá trị p
Dữ liệu và kiểu dữ liệu
Dữ liệu:
Định danh (Nominal), Định tính (Qualitative), Định lượng (Quantitative)
Liên tục (Continuous), Rời rạc (Discrete), Nhị giá (Binary)
Biến:
Biến độc lập (Independent variable)
Biến phụ thuộc (Dependent variable)
Ví dụ về biến trong nghiên cứu:
Ảnh hưởng của công thức lên viên nén thành phẩm
Giả thuyết không (H0)
Giả thuyết mặc định giữa hai hoặc nhiều biến, đề cập đến không khác biệt.
**Giả thuyết 1 biến (One-Sample Hypothesis)**: - Được sử dụng để kiểm tra xem giá trị trung bình của một biến đơn lẻ có khác biệt so với giá trị dự kiến hay không. - Ví dụ: Kiểm tra xem điểm trung bình của một lớp học có đạt yêu cầu tối thiểu hay không.
**Giả thuyết nhiều biến (Multivariate Hypothesis)**: - Được sử dụng để kiểm tra mối quan hệ giữa hai hoặc nhiều biến độc lập và phụ thuộc. - Ví dụ: Xem xét ảnh hưởng của nhiều yếu tố như độ tuổi, giới tính và trình độ học vấn đến sự lựa chọn nghề nghiệp.
Giả thuyết không (H0): Không có sự khác biệt hoặc mối liên hệ nào giữa các biến đã đề xuất.
Kết quả nghiên cứu có thể bác bỏ hoặc chấp nhận H0. Khi thực hiện phân tích thống kê, việc bác bỏ hay chấp nhận giả thuyết không (H0) phụ thuộc vào giá trị p so với mức ý nghĩa α:
**Bác bỏ H0**: Khi giá trị p < = α, điều này cho thấy có đủ bằng chứng để chứng minh rằng có sự khác biệt có ý nghĩa thống kê giữa các biến.
**Chấp nhận H0**: Khi giá trị p > α, điều này cho thấy không có đủ bằng chứng để bác bỏ H0, và giả thuyết không vẫn có thể được chấp nhận. Việc lựa chọn mức α thường được đặt ở mức 0,05, tuy nhiên, có thể thay đổi tùy vào ngữ cảnh nghiên cứu. → Kết quả không khác biệt, có ý nghĩa thống kê có thể được giải thích là không đủ bằng chứng để khẳng định sự tồn tại của một mối quan hệ giữa các biến, và do đó, giả thuyết không (H0) vẫn giữ nguyên.
Phân phối chuẩn (normal distribution)
Đối xứng, hình chuông; thông số: trung bình và độ lệch chuẩn.
Độ tin cậy và giá trị p
Độ tin cậy: Mức độ chắc chắn trong conclusion. Cần được đề ra trước khi tiến hành nghiên cứu và duy trì trong suốt nghiên cứu.
Giá trị p: Xác suất nghiên cứu của mẫu khi giả thuyết không H0 đúng.
Giá trị p > α: không khác biệt có ý nghĩa.
Mức ý nghĩa α = 1 - độ tin cậy
Giá trị p càng nhỏ càng tốt;
Có ý nghĩa thống kê đồng nghĩa với có ý nghĩa thực tế;
Nhầm lẫn kết quả nghiên cứu và độ tin cậy;
Các bước thực hiện phân tích thống kê:
Xác định câu hỏi nghiên cứu
Lấy mẫu nghiên cứu
**Phương pháp lấy mẫu**: Là quy trình chọn ra một tập hợp các cá thể hoặc đơn vị nghiên cứu từ một quần thể lớn hơn. - **Mục tiêu**: Để đưa ra các kết luận về toàn bộ quần thể dựa trên phân tích các mẫu. - **Các loại phương pháp lấy mẫu**:
**Lấy mẫu ngẫu nhiên**: Mọi cá thể trong quần thể đều có cơ hội được chọn như nhau.
**Lấy mẫu định nghĩa trước**: Chọn theo tiêu chí nhất định như tuổi, giới tính, hoặc bệnh lý.
**Lấy mẫu phân tầng**: Chia quần thể thành các tầng, từ đó lấy mẫu ngẫu nhiên trong từng tầng.
**Lấy mẫu cụm**: Chọn các nhóm (cụm) cá thể thay vì chọn từng cá thể.
- **Ưu điểm**: Giúp tăng tính đại diện và độ chính xác cho kết quả nghiên cứu.
- **Nhược điểm**: Có thể gặp khó khăn trong việc triển khai và tổ chức, đặc biệt đối với quần thể lớn.
Đặt giả thuyết nghiên cứu
Đặt giả thuyết thống kê
Phân tích thống kê
- Phép thống kê để tìm giá trị p:
- Kiểm định t (t-test):
- Dùng để so sánh trung bình của hai nhóm.
- Kiểm định ANOVA:
- Dùng để so sánh trung bình của ba nhóm trở lên.
- Kiểm định Chi-square:
- Dùng để đánh giá mối quan hệ giữa hai biến danh định.
- Kiểm định hồi quy:
- Dùng để xem mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập, từ đó tính toán p-value.
- Kiểm định Mann-Whitney U:
- Dùng cho dữ liệu không phân phối chuẩn để so sánh trung bình của hai nhóm.
- Phân tích hồi quy logistic:
- Dùng cho dữ liệu nhị phân để kiểm tra mối liên hệ giữa biến phụ thuộc nhị phân và một hoặc nhiều biến độc lập.
Biến định tính - định tính: dùng Chi bình phương (Mẫu lớn, xác định một giá trị thống kê dựa trên sự khác biệt giữa tần số quan sát và tần số kỳ vọng), Fisher’s exact test (mẫu nhỏ hoặc khi các tần số quan sát thấp, xác suất chính xác của việc quan sát các tần số trong bảng)
Biến định tính - định lượng: t-test, ANOVA 1 yếu tố
Biến định lượng - định lượng: tương quan - hồi quy
Biện luận kết quả
- Giá trị p cung cấp thông tin về xác suất nghiên cứu của mẫu, giả thuyết không H0 là đúng.
- Nếu giá trị p < α (thông thường là 0,05), có đủ bằng chứng để bác bỏ giả thuyết không H0.
- Nếu giá trị p > α, không có đủ bằng chứng để bác bỏ giả thuyết không H0, và giả thuyết không vẫn có thể được chấp nhận.
- Giá trị p không đo lường sự khác biệt thực tiễn hoặc ý nghĩa của kết quả, chỉ là công cụ để kiểm tra giả thuyết thống kê.
3. GIỚI THIỆU SƠ VỀ PHẦN MỀM
Các phần mềm phân tích thống kê phổ biến
Minitab, IBM SPSS, R
Bộ dữ liệu ví dụ
Biến đầu vào: Giới tính (nam/nữ), Mức độ bệnh (nặng/nhẹ)
Đánh giá: Mối liên hệ giữa giới tính và mức độ bệnh.
Tuyên bố độ tin cậy: Kết quả phân tích có ý nghĩa thống kê khi p < 0,05.
4. ÁP DỤNG THỰC TẾ & KINH NGHIỆM
Kinh nghiệm khi nghiên cứu:
Đề cập độ tin cậy trong phương pháp.
Xác định biến và kiểu dữ liệu trước khi phân tích.
5. TÓM TẮT
Cơ sở lý thuyết
Các khái niệm liên quan tới nghiên cứu và thống kê, độ tin cậy và giá trị p.
Nắm vững cách phân tích thống kê.