Trong quá trình phân tích dữ liệu, đặc biệt là những bộ dữ liệu không tuân theo phân phối chuẩn hoặc chứa nhiều giá trị ngoại lệ, kiểm định Kruskal Wallis trở thành lựa chọn tối ưu để so sánh sự khác biệt giữa nhiều nhóm độc lập. Đây là phương pháp phi tham số mạnh mẽ, thường được sử dụng thay thế cho One-way ANOVA khi điều kiện giả định không được đáp ứng. Với SPSS, bạn hoàn toàn có thể thực hiện kiểm định này một cách trực quan và chính xác thông qua vài thao tác đơn giản. Bài viết sau sẽ hướng dẫn bạn chi tiết cách chạy Kruskal-Wallis trong SPSS, cách đọc kết quả và diễn giải ý nghĩa thống kê một cách đúng chuẩn.
1. Kiểm định Kruskal-Wallis là gì?

Kiểm định kruskal-wallis là gì?
Kiểm định Kruskal-Wallis (Kruskal-Wallis H Test) là một kiểm định phi tham số dùng để xác định liệu có sự khác biệt có ý nghĩa thống kê giữa hai hay nhiều nhóm độc lập trên một biến phụ thuộc dạng thứ bậc hoặc liên tục. Đây là phương pháp thay thế phù hợp cho kiểm định One-way ANOVA khi dữ liệu không thỏa mãn các giả định cần thiết của ANOVA, đặc biệt là giả định phân phối chuẩn của biến phụ thuộc.
Vì là kiểm định phi tham số, Kruskal-Wallis hoạt động dựa trên việc xếp hạng giá trị của dữ liệu thay vì sử dụng giá trị thực tế. Điều này giúp kiểm định hoạt động hiệu quả trong những trường hợp dữ liệu bị lệch (skewed), có outliers hoặc sử dụng thang đo thứ bậc như Likert.
Mục đích chính của Kruskal-Wallis là kiểm tra xem ít nhất hai nhóm có sự khác biệt về phân phối hoặc trung vị hay không. Tuy nhiên, Kruskal-Wallis không cho biết nhóm nào khác nhóm nào, do đó khi kết quả có ý nghĩa thống kê (p < 0.05), bạn cần thực hiện thêm kiểm định hậu nghiệm để xác định cặp nhóm khác biệt.
>> Tham khảo thêm: Dịch vụ viết thuê luận văn kèm tư vấn chọn phương pháp nghiên cứu
2. Điều kiện và giả định áp dụng kiểm định Kruskal-Wallis

Điều kiện kiểm định kruskal-wallis
2.1. Biến phụ thuộc ở dạng ordinal hoặc continuous
- Có thể là dữ liệu thứ bậc: thang Likert (1–5, 1–7), mức độ đồng ý, mức độ hài lòng,…
- Hoặc dữ liệu liên tục nhưng không phân phối chuẩn.
- Không yêu cầu dữ liệu phải tuân theo phân phối chuẩn trong từng nhóm.
2.2. Biến độc lập gồm từ hai nhóm phân loại trở lên
- Là biến phân loại có hai hoặc nhiều nhóm độc lập.
- Ví dụ: giới tính (nam – nữ), nhóm điều trị (A – B – C), mức độ hoạt động thể chất (ít – thấp – trung bình – cao).
2.3. Các quan sát phải độc lập
- Một đối tượng chỉ thuộc một nhóm duy nhất.
- Không được có lặp lại dữ liệu của cùng đối tượng.
- Nếu dữ liệu đo lặp theo thời gian, cần dùng Friedman Test thay vì Kruskal-Wallis.
2.4. Các nhóm nên có phân phối tương tự nhau
- Nếu phân phối giữa các nhóm giống nhau, ta có thể so sánh median.
- Nếu phân phối khác nhau, ta chỉ được so sánh mean ranks để tránh diễn giải sai.
Kruskal-Wallis đặc biệt hữu ích khi dữ liệu không chuẩn, bị lệch, có ngoại lệ hoặc sử dụng thang đo ordinal – những trường hợp mà ANOVA không phù hợp.
>> Đọc thêm: Khám Phá Đường Cong Hồi Quy Đa Biến: Làm thế nào để khai thác tối đa các thông tin từ dữ liệu phức tạp?
3. Hướng dẫn thực hiện kiểm định Kruskal-Wallis trong SPSS
Để hiểu rõ hơn về cách thực hiện kiểm định Kruskal-Wallis trong SPSS, chúng ta cùng tìm hiểu qua một ví dụ cụ thể dưới đây.
Ví dụ: Một nghiên cứu được thực hiện nhằm xem xét thu nhập trung bình của người lao động có phụ thuộc vào ngành nghề hoạt động (nông nghiệp, công nghiệp, dịch vụ) hay không.
Dữ liệu được thu thập từ một nhóm người lao động thuộc ba lĩnh vực nêu trên. Mỗi người được ghi nhận các thông tin cơ bản như: tuổi, giới tính, dân tộc, số năm làm việc, số năm kinh nghiệm, lĩnh vực hoạt động, và thu nhập trung bình hằng năm.
Trong ví dụ này, kiểm định Kruskal-Wallis sẽ giúp trả lời câu hỏi: Có sự khác biệt có ý nghĩa thống kê về thu nhập giữa các ngành nghề hay không? Với các bước laabf lượt:
3.1. Chuẩn bị dữ liệu
Trước khi thực hiện kiểm định, cần đảm bảo dữ liệu đáp ứng các điều kiện sau:
- Dữ liệu phụ thuộc phải là dữ liệu thứ bậc (ordinal) hoặc dữ liệu định lượng nhưng không phân phối chuẩn.
- Số lượng nhóm phải từ hai trở lên.
- Các nhóm phải độc lập với nhau.
3.2. Nhập liệu
Sau khi chuẩn bị dữ liệu, ta tiến hành nhập dữ liệu vào SPSS thông qua giao diện Data Editor. Mỗi hàng đại diện cho một cá nhân tham gia khảo sát, mỗi cột tương ứng với một biến quan sát (ví dụ: ngành nghề, thu nhập trung bình, giới tính,…).
3.3. Thực hiện kiểm định Kruskal-Wallis trên SPSS
Trước khi tiến hành phân tích, cần đảm bảo dữ liệu được chuẩn bị chính xác để quá trình kiểm định diễn ra thuận lợi.
Bộ dữ liệu khảo sát bao gồm các biến: nơi sinh sống, độ tuổi, giới tính, dân tộc, tôn giáo, số năm làm việc, kinh nghiệm, lĩnh vực hoạt động và thu nhập trung bình.
Mục tiêu của kiểm định là xem xét sự khác biệt về thu nhập giữa các ngành nghề lao động. Ta đặt ra hai giả thuyết:
- H₀: Không có sự khác biệt về thu nhập giữa các ngành nghề.
- H₁: Có sự khác biệt về thu nhập giữa các ngành nghề.
Sau khi xác định giả thuyết, ta tiến hành thực hiện các bước phân tích trong SPSS

Bước 1
Bước 1: Kiểm tra sơ bộ dữ liệu bằng biểu đồ Histogram
- Trên thanh công cụ, chọn Graphs → Legacy Dialogs → Histogram.
- Trong hộp thoại hiện ra, kéo biến Earn (thu nhập) vào ô Variable rồi nhấn OK.
- Kết quả trả về sẽ là các biểu đồ thể hiện phân bố thu nhập của từng nhóm ngành nghề.

Thu được kết quả như ảnh
Kết quả quan sát:
- Ba biểu đồ đại diện cho ba ngành nghề có hình dáng tương đối giống nhau.
- Mức thu nhập cao tập trung ở hai nhóm công nghiệp và dịch vụ, dao động trong khoảng 20–40 triệu đồng/năm.
- Ngành nông nghiệp có mức thu nhập thấp hơn, phần lớn dưới 20 triệu đồng/năm.
- Mức thu nhập giảm dần theo ngành: dịch vụ → công nghiệp → nông nghiệp.
Bước 2: Tiến hành kiểm định Kruskal-Wallis
- Chọn Analyze → Nonparametric Tests → Legacy Dialogs → K Independent Samples…
- Màn hình hiển thị hộp thoại Test for Several Independent Samples.

Bước 2
Bước 3: Thiết lập biến và nhóm
- Kéo biến Earn (thu nhập) vào ô Test Variable List.
- Kéo biến Structure (ngành nghề) vào ô Grouping Variable.
- Nhấn Define Range, sau đó nhập giá trị Minimum và Maximum tương ứng với số nhóm ngành trong dữ liệu (ví dụ: 1 đến 3).
- Trong khung Test Type, chọn Kruskal-Wallis H rồi nhấn Continue.

Bước 3
Bước 4: Tùy chọn hiển thị thống kê
Chọn Options → Descriptive → Quartiles, rồi nhấn Continue để quay lại hộp thoại chính.

Bước 5
Bước 5: Thực hiện phân tích
Nhấn OK, SPSS sẽ trả về bảng kết quả Kruskal-Wallis.
4. Cách đọc kết quả kiểm định Kruskal-Wallis trong SPSS
Sau khi chạy kiểm định, SPSS hiển thị hai bảng quan trọng:
4.1. Bảng Ranks
Cho biết:
Mean Rank của từng nhóm → Dùng để quan sát xu hướng khác biệt giữa các nhóm.
Ví dụ: nhóm có Mean Rank cao hơn → giá trị quan sát chung cao hơn.
4.2. Bảng Test Statistics
Gồm các thông số chính:
Chi-Square
- Là thống kê kiểm định Kruskal-Wallis.
- Giá trị càng lớn → khác biệt giữa các nhóm càng rõ.
df (degrees of freedom)
df = số nhóm – 1
Ví dụ: 3 nhóm → df = 2.
Asymp. Sig (p-value)
Đây là giá trị quan trọng để kết luận.
- p < 0.05 → có sự khác biệt có ý nghĩa thống kê.
- p > 0.05 → không có bằng chứng cho thấy sự khác biệt.
Exact Sig (nếu hiển thị)
Cho biết mức độ tương thích của phân phối mô phỏng so với chi-square.
Thường ít sử dụng trong diễn giải chính.
Kết luận kết quả
Nếu p-value < 0.05 → kết luận rằng ít nhất một nhóm khác biệt so với các nhóm còn lại.
Tuy nhiên, vì Kruskal-Wallis là kiểm định tổng quát, ta cần chạy thêm:
Post hoc pairwise comparisons
(VD: Dunn-Bonferroni)
→ để biết nhóm nào khác nhóm nào.

Đánh giá kết quả kiểm định kruskal wallis
Quan sát bảng kết quả, ta nhận thấy:
- Ngành dịch vụ có mức thu nhập trung bình cao nhất.
- Tiếp đến là công nghiệp, và nông nghiệp có mức thu nhập thấp nhất.
- Giá trị Asymp. Sig < 0.05 cho thấy sự khác biệt này có ý nghĩa thống kê.
Như vậy, thu nhập trung bình của người lao động có sự khác biệt rõ rệt giữa ba ngành nghề.
Kiểm định Kruskal-Wallis là công cụ thống kê hữu ích giúp các nhà nghiên cứu đánh giá sự khác biệt giữa nhiều nhóm độc lập trong những bộ dữ liệu không đáp ứng các giả định của ANOVA. Hy vọng bài viết đã giúp bạn hiểu rõ bản chất, cách áp dụng và cách trình bày kết quả kiểm định Kruskal-Wallis một cách chính xác và hiệu quả trong nghiên cứu của mình.