Hệ số p

Submitted by DATATI on
Share/Subscribe/Save

Trong các bài viết về so sánh hôm trước, tôi có hay đề cập đến hệ số p. Bài viết này xin được giải thích tóm gọn về hệ số này. Ở đây tôi không diễn giải chi tiết về cách tính và các vấn đề lý thuyết xoay quanh mà chỉ giải thích nó về mặt ứng dụng để người dùng SPSS hay các ứng dụng thống kê khác có thể hiểu và đọc được các kết quả khi có hệ số này đi kèm.

Hệ số p (p value) là viết tắt của chữ probablity. Đây là hệ số dùng để chỉ mức độ khác nhau giữa các nhóm đối tượng trong tính toán thống kê. Đối với Khoa học Xã hội, một biến nào đó của hai nhóm được gọi là khác nhau khi sự khác nhau này đúng với ít nhất 95% số trường hợp được so sánh. Điều này cũng có nghĩa là so sánh thống kê trong Khoa học Xã hội chỉ cho phép sai số ở mức cao nhất là 5% (tức p<=0.05). Ví dụ cụ thể như sau:

Tôi muốn so sánh kết quả thi cuối kỳ môn tiếng Anh của học sinh lớp 10 giữa Trường A và Trường B trong cùng một thành phố. Như vậy tôi tổng hợp tất cả điểm thi môn tiếng Anh của tất cả học sinh lớp 10 giữa hai trường và đem ra so sánh. Tôi thấy điểm trung bình của học sinh Trường A là 7.0 và điểm trung bình của học sinh Trường B là 7.5. Như vậy, học sinh Trường A có điểm trung bình thấp hơn học sinh ở Trường B. Theo đó thì học sinh Trường A dường như có điểm số thấp hơn học sinh trường B. Tuy nhiên, mức độ chính xác của kết luận này đến đâu thì tôi chưa biết. Vì thế, tôi nhìn vào hệ số p.

  1. Nếu p = 0.20, có nghĩa là 80% học sinh Trường A thấp điểm hơn học sinh Trường B. Vậy nếu kết luận rằng học sinh Trường A thấp điểm hơn học sinh Trường B thì mức độ sai số là 20%.
  2. Nếu p = 0.10, có nghĩa là 90% học sinh Trường A thấp điểm hơn học sinh Trường B. Vậy nếu kết luận rằng học sinh Trường A thấp điểm hơn học sinh Trường B thì mức độ sai số là 10%.
  3. Nếu p = 0.05, có nghĩa là 95% học sinh Trường A thấp điểm hơn học sinh Trường B. Vậy nếu kết luận rằng học sinh Trường A thấp điểm hơn học sinh Trường B thì mức độ sai số là 5%.
  4. Nếu p = 0.01, có nghĩa là 99% học sinh Trường A thấp điểm hơn học sinh Trường B. Vậy nếu kết luận rằng học sinh Trường A thấp điểm hơn học sinh Trường B thì mức độ sai số là 1%.

Quay lại qui ước về mức độ sai số cho phép trong Khoa học Xã hội là 5% trở xuống (p<=0.05), vậy đối với trường hợp (1) và (2) ở trên, tôi phải kết luận rằng điểm của học sinh giữa hai trường là không khác nhau (vì mức độ sai số vược mức cho phép). Còn đối với trường hợp (3) và (4) thì tôi kết luận rằng điểm số của học sinh giữa hai trường là khác nhau (statistically significant difference) và trong trường hợp này học sinh trường A đạt được điểm thấp hơn học sinh trường B (7.0 so với 7.5).

Author: 

Tin Dang