Ví dụ thực tế Kiểm định và giả định (Test Presumption) trong xưởng sản xuất thiết bị điện tử
Mục tiêu:
Một công ty sản xuất mạch in PCB muốn kiểm tra độ dày lớp mạ thiếc có đúng tiêu chuẩn không (tiêu chuẩn là 20µm).
Bước 1.Xác định giả thuyết:
H₀ (Giả thuyết gốc): Độ dày trung bình lớp thiếc = 20 µm
H₁ (Giả thuyết thay thế): Độ dày trung bình ≠ 20 µm (có sai lệch)
Dữ liệu thực tế:
Lấy mẫu ngẫu nhiên: n = 10 tấm mạch
Kết quả đo độ dày (µm):
19.6, 20.1, 19.9, 20.3, 20.4, 19.7, 20.0, 19.8, 20.2, 19.9
Trung bình mẫu: x̄ = 20.0 µm
Độ lệch chuẩn mẫu: s = 0.24 µm
Bước 2.Chọn mức ý nghĩa (α):
α = 0.05 (mức ý nghĩa 5%)
n = 10 → bậc tự do df = 9
Tại sao n = 10 → df = 9?
Khi bạn lấy mẫu n = 10 để ước lượng trung bình và độ lệch chuẩn mẫu, bạn mất đi 1 bậc tự do vì bạn đã dùng 1 thông tin để tính trung bình mẫu (x̄).
Công thức tính bậc tự do khi kiểm định trung bình là:
Giải thích đơn giản:
Giả sử bạn có 10 con số. Khi bạn biết trung bình, thì chỉ cần biết 9 số đầu tiên, số thứ 10 sẽ tự động bị ràng buộc bởi tổng đã biết (vì trung bình = tổng/n).
Vậy là bạn chỉ còn "tự do" chọn 9 số, số cuối cùng không tự do nữa → df = n - 1
Bước 3.Lựa chọn phương pháp kiểm định:
Bước 4: Tính giá trị t (t-stat)
→ t = 0
Tra bảng t (t-crit)
df = 9, α = 0.05 (2 phía) → t = ±2.262
Bảng phân bố t thường được chia ra làm 2 loại:
Kiểm định hai phía (Two-tailed test): thường dùng khi bạn muốn kiểm xem giá trị có khác biệt hay không (≠).
Dùng khi:
Bạn không chắc liệu sự khác biệt là theo chiều hướng nào (lớn hơn hay nhỏ hơn).
Ví dụ:
“Lương trung bình năm nay khác năm ngoái” (không nói là cao hơn hay thấp hơn).
“Thuốc mới có hiệu quả khác biệt so với thuốc cũ” (chưa rõ là hiệu quả hơn hay kém hơn).
Kiểm định một phía (One-tailed test): dùng khi bạn muốn kiểm tra giá trị lớn hơn hoặc nhỏ hơn .
Dùng khi:
Bạn chắc chắn sự khác biệt là theo chiều hướng hoặc là lớn hơn hoặc nhỏ hơn.
Ví dụ:
“Lương trung bình năm nay chắc chắn khác năm ngoái” (chắc chắn là cao hơn).
“Thuốc mới có chắc chắn hiệu quả khác biệt so với thuốc cũ” (chắc chắn là cao hơn).
Bước 5.Tính p-value:
Khi bạn tính p-value, bạn đang tìm xác suất nhận được t-statistic (hoặc giá trị t) bằng hoặc lớn hơn giá trị t đã tính toán (theo giá trị tuyệt đối của t) dưới giả thuyết không (H₀). p-value cho bạn một con số giúp bạn quyết định có bác bỏ H₀ hay không.
Cách tính p-value cụ thể cho ví dụ của bạn như sau:
Tính p-value từ phân phối t với giá trị t = 0 và bậc tự do df = 9. Ta có thể sử dụng công thức phân phối t hoặc tra bảng t để xác định p-value.
Sử dụng hàm TDIST trong Excel
Giả sử bạn có t-statistic là 0 và bậc tự do là 9 (n = 10 → df = 9), bạn có thể tính p-value bằng cách sử dụng công thức TDIST.
Cách sử dụng TDIST:
Công thức tổng quát của TDIST là:
Trong đó:
x: Là giá trị t-statistic.
degrees_freedom: Là bậc tự do (df).
tails: Số phía của kiểm định. Với kiểm định hai phía (two-tailed test), bạn sử dụng 2.
Cách tính trong trường hợp của bạn:
t-statistic = 0.
degrees_freedom = 9.
tails = 2 (vì bạn đang làm kiểm định hai phía).
Công thức trong Excel:
Trong trường hợp này p-value sẽ là 1
0 Nhận xét