Việc tìm hiểu và thiết lập các dữ liệu dùng trong phân tích crosstab là điều cần thiết để xác định mối quan hệ giữa các biến phân loại và xác định số lượng biến quan sát giữa các biến định lượng hoặc định tính. Bài viết dưới đây sẽ giới thiệu chi tiết về các khái niệm liên quan đến crosstab, bên cạnh đó còn hướng dẫn chi tiết cách chạy crosstab trong spss cùng những ví dụ minh họa liên quan giúp bạn đọc dễ hình dung hơn, không còn mơ hồ về mục đích và phương pháp thực hiện.
Tần số (Frequencies) và phần trăm (Percentages) trong bảng số liệu chéo khi chạy crosstab in SPSS sẽ được hiển thị khi bạn lựa chọn các dạng biểu đồ cột (Bar charts) hay biểu đồ tròn (Pie charts) được tích hợp trong hộp thoại Charts như hình dưới đây.
Ví dụ chúng ta sẽ thực hiện phân tích thống kê tần số các biến định tính (giới tính, độ tuổi, học vấn, thời gian công tác) trong file dữ liệu SPSS như hình dưới đây.
Sau khi thực hiện các bước chạy crosstab in SPSS, ta có được kết quả hiển thị như bảng dưới đây.
Giải thích ý nghĩa của các giá trị trong bảng:
Kết luận: Ở biến giới tính, nữ giới khảo sát 118/190 người, chiếm 62,1%. Nam giới khảo sát 72/190 người, chiếm tỷ lệ 37,9%.
Tương tự, chúng ta sẽ có bảng thống kê tần số của 3 biến còn lại là độ tuổi, học vấn và thời gian công tác.
Crosstab và phân tích định tính cũng thường được sử dụng cùng nhau để đưa ra các kết luận về mối liên hệ giữa các biến định tính. Crosstab thường được sử dụng để tóm tắt và trực quan hóa dữ liệu, trong khi phân tích định tính được sử dụng để đánh giá mức độ mối liên hệ giữa các biến định tính. Để hiểu rõ hơn về vai trò trong phân tích dữ liệu, xem ngay Phân tích định tính là gì? Các phương pháp phân tích định tính chi tiết.
Trước khi bắt đầu tiến hành kiểm định crosstab in spss, bạn cần phải đảm bảo dữ liệu đáp ứng các yêu cầu sau đây:
Giả thuyết nghiên cứu của kiểm định crosstab on spss được quy định như sau:
Kết quả kiểm định được phát biểu như sau:
Trong phân tích hồi quy SPSS, nếu giữa các biến độc lập không có quan hệ tuyến tính với nhau được xem là vi phạm giả thuyết mô hình hồi quy tuyến tính cổ điển hay còn được gọi là đa cộng tuyến, người nghiên cứu cần biết được đa cộng tuyến là gì để đưa ra kết luận chính xác nhất.
Dữ liệu của bạn phải có ít nhất hai biến định tính (biểu thị bằng cột), các biến định tính phải có ít nhất từ hai nhóm để thiết lập dữ liệu theo hai cách dưới đây:
Dữ liệu dạng thô
Dữ liệu thô được biểu diễn dưới dạng bảng như hình minh họa, mỗi hàng đại diện cho một biến quan sát từ một chủ thể chỉ xuất hiện một lần trong tập dữ liệu.
Dữ liệu dạng tần số
Khi thực hiện kiểm định crosstab on SPSS, theo phát biểu sẽ có 2 giả thuyết như sau:
Để kết luận bác bỏ hay chấp nhận giả thuyết Ho, người nghiên cứu sẽ cần dựa vào giá trị P (p-value) theo 2 trường hợp như sau:
α (Mức ý nghĩa) thường sẽ được hiểu là 5% hoặc 0.05, trong các bài tập phân tích crosstab on SPSS đều cho giả thuyết này.
Liên quan đến α = 5% trong thống kê, nó được xem là hệ số tin cậy có sự liên quan đến khoảng tin cậy (Confidence Interval-CI) nhưng không giống nhau hoàn toàn vì CI là thuật ngữ dùng để ước lượng, đo lường sự không chắc chắn, có thể đưa ra bất kỳ con số xác suất nào, độ tin cậy phổ biến nhất sẽ nằm trong hai giá trị 95% hoặc 99%.
Crosstab có thể được sử dụng để tóm tắt và so sánh tần suất của các biến định tính được đo bằng thang đo Likert giữa các nhóm khác nhau. Vậy thang đo likert là gì? Phương pháp triển khai thang đo như thế nào thì kết quả chính xác hơn? Cùng tìm hiểu qua bài viết Thang Đo Likert và phương pháp triển khai và phân tích hiệu quả nhất
Khảo sát tập dữ liệu với 420 số liệu được quan sát từ việc mọi người có hút thuốc lá, kiểm tra mối liên hệ giữa biến giới tính có ảnh hưởng đến hành vi hút thuốc lá không bằng cách cách chạy crosstab trong SPSS, trong đó có 3 biến về hành vi hút thuốc, cụ thể:
Bên cạnh 2 mức giá trị của biến giới tính bao gồm: Nam (male) và nữ (female).
Giả thuyết nghiên cứu được xây dựng dựa trên 2 trường hợp của Ho và H1 đó là:
Quá trình thực hiện kiểm định crosstab on SPSS, sẽ bao gồm 6 bước như trên, cụ thể:
Kết quả sau khi chạy crosstab on spss sẽ có 3 bảng bao gồm: bảng Case Processing summary, bảng Crosstabulation và bảng Chi-Square Tests.
Qua kết quả phân tích được thể hiện trong 3 bảng trên, các giá trị cần sử dụng để kết luận gồm có:
Kết luận cuối cùng: Ta có Sig = 0,205 > 0,5, có nghĩa không có mối liên hệ giữa các biến và biến giới tính không ảnh hưởng đến hành vi hút thuốc.
Trong quá trình thực hiện phân tích crosstab SPSS, nếu cần tìm thêm nhiều tài liệu hướng dẫn, mời bạn xem ngay những bài viết tại Luận văn 1080.
Ngoài ra dù bạn là sinh viên hay người đã đi làm có nhu cầu cần sự hỗ trợ phân tích các bài nghiên cứu để đưa ra kết quả chính xác nhất, hãy liên hệ với dịch vụ nhận chạy eview từ A-Z mọi thứ liên quan đến phân tích định lượng tại đây của chúng tôi. Liên hệ ngay để được hướng dẫn chi tiết nhé.
Nếu như crosstab được sử dụng để phân tích tần suất của các biến định tính giữa các nhóm khác nhau thì kiểm định Hausman được sử dụng để so sánh hiệu quả giữa hai mô hình tuyến tính khác nhau. Dựa trên kết quả của cả hai phương pháp, nhà nghiên cứu có thể đưa ra kết luận chính xác và hợp lý về dữ liệu. Tìm hiểu ngay kiểm định Hausman trong dữ liệu mảng (Panel Data)
Bài viết trên đã cung cấp một số thông tin liên quan đến khái niệm crosstab là gì và biết được kiểm định crosstab SPSS được sử dụng để phân tích mối quan hệ trong các tệp dữ liệu có quy mô lớn như phân tích sự liên kết giữa các yếu tố trong thị trường hoặc các đặc điểm nhân khẩu học theo từng quốc gia,... Nhìn chung đây là một công cụ hỗ trợ đắc lực cho quá trình chúng ta nghiên cứu, các bạn sinh viên ngành kinh tế nên có sự tiếp xúc và làm quen sớm với các công cụ phân tích như thế này, sẽ giúp ích rất nhiều trong quá trình học tập và làm việc.
Tại sao giáo dục là quốc sách hàng đầu?
07/11/2024 | Nguyễn Tuyết Anh
Học viện Quản lý Giáo dục ở đâu?
05/11/2024 | Nguyễn Tuyết Anh