Cấu trúc dữ liệu để tính frequency

Submitted by DATATI on
Share/Subscribe/Save

Vừa rồi một bạn có trao đổi cách nhập liệu và SPSS/Excel như thế nào đối với loại câu hỏi có thứ tự ưu tiên để phục vụ việc phân tích, tôi trình bày lại nội dung này để làm rõ hơn vấn đề. Cụ thể câu hỏi trong bảng khảo sát như sau: Please number five factors in order of importance: (1) the most important, (2) much important, (3) important, (4) rather important, (5) the least important that you think may affect your mood the most when giving an oral presentation:  My oral proficiency during the course (F1)  Accuracy of my pronunciation (F2)  My personality (F3)  Professor’s personality (F4)  Professor’s response during my oral presentation (F5)  My classmates’ response during my oral presentation (F6)  The number of rehearsal (F7)  Classroom settings (seating and computers arrangement) (F8)  Audience familiarity (F9)  Handling of software (F10) Như vậy các đối tượng tham gia trả lời sẽ đánh các số từ 1-5 vào các factors tương ứng. Có thể thấy có 2 hướng phân tích với loại câu hỏi như vậy, tùy vào mục đích của người nghiên cứu. Hướng 1: Quan tâm đến số lượng những nhân tố được chọn và những nhân tố không được chọn. Với hướng này, có thể làm coding theo hướng có và không. Ví dụ 1 cho những nhân tố được chọn (không phân biệt chọn ở mức độ ưu tiên nào) và 0 cho những nhân tố không được chọn. Như vậy dataset sẽ có dạng như sau:

ID F1 F2 F3 F4 F5 F6 F...
Participant1 1 1 0 1 1 1 0
Participant2 0 1 0 1 1 1 1
...              

Điều này tương ứng với việc Participant 1 chọn 5 nhân tố có ảnh hưởng gồm F1,2,4,5,6 và Participant 2 chọn F2,4,5,6 và F... Sau đó ta sẽ thống kê frequency của giá trị 1 và giá trị 0 đối với từng nhân tố để biết được tỷ lệ số người cho rằng nhân tố đó có ảnh hưởng đến họ. Ví dụ như trong trường hợp có 2 participants như ở trên thì 100% người được hỏi cho rằng F2 có ảnh hưởng đến họ trong khi chỉ có 50% số người được hỏi cho rằng F1 có ảnh hưởng đến họ. Hướng 2: Quan tâm đến độ quan trong của từng nhân tố Với hướng này ta có thể coding như sau: Quan trọng nhất cho số 1, ít quan trọng nhất cho số 5 (hoặc ngược lại) và 0 cho những nhân tố không được chọn. Như thế dataset sẽ có dạng như sau:

ID F1 F2 F3 F4 F5 F6 F...
Participant1 1 2 3 0 5 4 0
Participant2 3 2 1 0 4 0 5
...              

Nhìn vào bảng dataset có thể thấy là Participant 1 đã chọn cái nhân tố theo độ quan trọng từ cao đến thấp như sau: F1-2-3-6-5. Các nhân tố còn lại như F4 và F... không được chọn. Sau đó ta tính frequency của các con số 0-5 ở từng nhân tố để biết được tỷ lệ quan trọng của nhân tố đó được đánh giá như thế nào. Cái này phải được tính trên tổng số người tham gia và có thể tóm gọn trong một bảng như sau: Tầm quan trọng của F1 trong suy nghĩ của participants như sau: Quan trọng nhất: ?% Quan trọng nhiều:?% ... Sau đó có thể đối chiếu so sánh từng mức độ quan trọng giữa các nhân tố với nhau.

Author: 

Tin Dang

Tag: