Giải Mã Kiểm định Kruskal-Wallis: Công cụ không tham số cho phân tích dữ liệu!

Nguyễn Tuyết Anh 11/04/2023 Tài liệu phân tích định lượng
Giải Mã Kiểm định Kruskal-Wallis: Công cụ không tham số cho phân tích dữ liệu!
5/5 (3 đánh giá) 0 bình luận

Trong phương trình spss, trong số các kiểm định phổ biến được giới mộ điệu ưa dùng không thể bỏ qua kiểm định Kruskal-wallis với vô vàn những ưu điểm cùng cách xử lý số liệu vượt trội. Trong nội dung bài viết dưới đây, cùng Luận văn 1080 giải mã kiểm định Kruskal–wallis: Công cụ không tham số cho phân tích dữ liệu để biết cách ứng dụng vào công việc, nghiên cứu nhé! 

1. Giới thiệu về Kiểm định kruskal-wallis 

Kiểm định kruskal-wallis

1.1. Định nghĩa 

  • Kiểm định Kruskal-Wallis là một phương pháp kiểm định thống kê không tham số, được sử dụng để so sánh trung vị của ba hoặc nhiều nhóm độc lập với nhau. 
  • Phương pháp này được đặt tên theo tên của hai nhà thống kê người Mỹ là William Kruskal và W. Allen Wallis.

1.2. Ứng dụng

  • Kiểm định Kruskal-Wallis trong spss là một phương pháp rất hữu ích trong các nghiên cứu khoa học, đặc biệt là trong các nghiên cứu y tế và xã hội học.
  • Phương pháp này giúp cho các nhà nghiên cứu có thể kiểm tra sự khác biệt giữa các nhóm mà không cần phải tuân theo những giả định của phân phối chuẩn và phương sai bằng nhau giữa các nhóm.

1.3. Sự khác nhau giữa Kruskal-Wallis và ANOVA

Nội dung so sánh

Kruskal-Wallis

ANOVA

Đối tượng nghiên cứu

Kruskal-Wallis được sử dụng để so sánh giá trị trung vị của các nhóm dữ liệu khác nhau

ANOVA được sử dụng để so sánh giá trị trung bình của các nhóm dữ liệu khác nhau.

Tính chất dữ liệu

Kruskal-Wallis là một phương pháp phi tham số (non-parametric)

Sử dụng cho các trường hợp khi dữ liệu không tuân theo phân phối chuẩn hoặc khi không có sự đồng nhất về phương sai giữa các nhóm dữ liệu.

ANOVA là một phương pháp tham số (parametric) 

Sử dụng khi dữ liệu tuân theo phân phối chuẩn và có sự đồng nhất về phương sai giữa các nhóm dữ liệu.

Kiểm tra giả thuyết

giả thuyết không có sự khác biệt giữa các nhóm dữ liệu là giống nhau.

giả thuyết không có sự khác biệt giữa các nhóm dữ liệu là bằng nhau.

Phương pháp tính toán

dựa trên sự so sánh của các hạng (rank) của các giá trị dữ liệu giữa các nhóm

dựa trên tính toán các độ lệch của các giá trị dữ liệu so với giá trị trung bình của mỗi nhóm

Kiểm tra kết quả

kết quả kiểm định được đưa ra dưới dạng mức ý nghĩa thống kê (p-value), thường là so sánh với mức ý nghĩa 5% để kết luận. 

kết quả kiểm định được đưa ra dưới dạng F-statistics và p-value, và cũng thường được so sánh với mức ý nghĩa 5% để kết luận.

 

2. Điều kiện kiểm định kruskal-wallis

Điều kiện kiểm định kruskal-wallis

Dưới đây là các điều kiện để sử dụng kiểm định Kruskal-Wallis:

  • Loại dữ liệu:
    • Kiểm định Kruskal-Wallis áp dụng cho cả dữ liệu định tính và dữ liệu định lượng.
    • Dữ liệu định tính phải được chuyển đổi sang dạng số để có thể tính toán.
  • Độc lập:
    • Các mẫu thuộc các nhóm phải độc lập với nhau và được lấy mẫu ngẫu nhiên độc lập.
    • Các mẫu không được lấy theo cặp hoặc không được ghép cặp, mỗi mẫu chỉ thuộc về một nhóm.
  • Phân phối:
    • Phân phối của các nhóm đối với biến độc lập đối với từng nhóm phải không chuẩn.
    • Các nhóm không phải có cùng phân phối, không có sự khác biệt lớn giữa phương sai của các nhóm.
  • Tương quan:
    • Các mẫu được lấy độc lập và không có sự tương quan giữa chúng.

Nếu các điều kiện trên được đáp ứng, kiểm định Kruskal-Wallis có thể được sử dụng để kiểm tra sự khác biệt giữa các nhóm. Tuy nhiên, nếu các điều kiện không được đáp ứng, ta cần phải sử dụng các phương pháp khác để so sánh các nhóm, ví dụ như phân tích phương sai (ANOVA) hoặc các phương pháp thống kê phi tham số khác.

Nếu đã xem chi tiết các bước hướng dẫn mà bạn đọc vẫn thấy lo lắng trước khi bắt tay vào làm thì khảo ngay nhận chạy eview chuẩn xác từ Luận văn 1080. Đội ngũ xử lý số liệu giàu kinh nghiệm với mức giá vừa phải, xử lý mọi số liệu từ dễ đến khó chỉ trong thời gian ngắn chắc chắn sẽ giúp bạn hoàn thành xuất sắc mọi yêu cầu đề ra. 

3. Hướng dẫn thực hiện kiểm định Kruskal - Wallis trên SPSS

3.1. Chuẩn bị dữ liệu

  • Trước khi tiến hành kiểm định Kruskal-Wallis trên SPSS, bạn cần chuẩn bị dữ liệu cần phân tích. Dữ liệu này phải đáp ứng các yêu cầu cơ bản của kiểm định Kruskal-Wallis, bao gồm:
    • Dữ liệu phải là dữ liệu thứ bậc (ordinal data).
    • Số lượng các nhóm phải là hai hoặc nhiều hơn.
    • Các nhóm phải độc lập với nhau.

3.2. Nhập liệu

  • Sau khi chuẩn bị dữ liệu, bạn cần nhập dữ liệu vào phần mềm SPSS. Để nhập dữ liệu, bạn có thể sử dụng chức năng "Data Editor" của SPSS.

3.3. Chạy phân tích

Trước khi tiến hành chạy phân tích, ta phải phân tích dữ liệu chuẩn xác để quá trình tiến hành chạy được dễ dàng.

Dữ liệu khảo sát của phương trình bao gồm: nơi sinh sống, tuổi, dân tộc, tôn giáo, giới tính, số năm làm việc, số năm kinh nghiệm, lĩnh vực hoạt động, thu nhập trung bình,....

Dựa trên các biến dữ liệu này, chúng ta sẽ tiến hành kiểm tra xem sự khác nhau của ngành nghề lao động có tác động nhiều đến sự chênh lệch nguồn thu nhập. 

Xảy ra 2 giả thuyết bao gồm: 

  • H0: giá trị đại diện không tồn tại sự khác nhau về nguồn thu nhập giữa các ngành nghề lao động
  • H1: giá trị đại diện cho việc tồn tại sự khác nhau về nguồn thu nhập giữa các ngành nghề lao động

Để bắt tay vào chạy phân tích, ta lần lượt thực hiện các bước như sau:

Bước 1: Vào mục Graphs - chọn lệnh Legacy dialogs - Chọn Histogram. Màn hình sẽ hiện ra như ảnh dưới đây. 

Sau khi màn hình Histogram hiện ra, chọn Earn trong mục Variable và nhấn OK để tiến hành chạy biến.

Kiểm định kruskal-wallis

Kết quả sẽ cho ra như hình bên dưới

Kiểm định kruskal-wallis

Dựa vào bản đồ kết quả, ta có thể thu được các thông tin như sau:

  • 3 biểu đồ đại diện cho 3 lĩnh vực có hình dáng tương đối giống nhau
  • Mức thu nhập cao tập trung nhiều nhất ở hai ngành nghề công nghiệp và dịch vụ, với mức thu nhập trung bình dao động trong khoảng 20-40 triệu đồng/năm. 
  • Ở lĩnh vực nông nghiệp, trung bình thu nhập thấp hơn, chỉ từ 20 triệu đồng/năm trở xuống. Mức độ dao động trong khoảng 10 triệu đồng chiếm phần lớn.
  • Ngành nghề có mức độ thu nhập cao, ổn định trong nhiều tháng là dịch vụ. 
  • Thu nhập có xu hướng giảm dần theo ngành nghề. Đứng đầu là dịch vụ, tiếp theo là công nghiệp và sau cùng là nông nghiệp. 

Bước 2: Tiến hành kiểm định Kruskal - Wallis trên SPSS.

Nhấn chọn Analyze - chọn Nonparametric Tests - chọn Legacy Dialogs - Chọn K Independent Sample. Màn hình hiển thị giá trị như ảnh bên dưới.

Kiểm định kruskal-wallis

Bước 3: Ở cửa sổ hiển thị Tests for Several Independent Sample, lần lượt đưa các biến earn vào ô lệnh Test Variable List, biến Structure vào ô lệnh Grouping Variable. Sau cùng, thiết lập Define Groups như màn hình hiển thị bên dưới. 

Kiểm định kruskal-wallis

Tuy nhiên ở bước này, bạn cần lưu ý rằng: 

  • Thiết lập giá trị Minimum và Maximum dựa trên điểm chung của các biến. Ví dụ, trong 6 biến mà có 3 biến đại diện cho 3 khu vực có thu nhập nghèo nhất và 3 biến đại diện cho 3 khu vực có thu nhập giàu nhất thì chúng ta sẽ thiết lập được giá trị Minimum là 3 mà Maximum cũng là 3. 
  • Trong khung Test Type, lựa chọn đúng loại kiểm định là Kruskal-wallis H. 

Bước 4: Chọn lệnh Continue để màn hình quay về cửa sổ Tests for Several Independent Samples.

Bước 5: Sau đó, chọn lệnh Option - nhấn chọn Descriptive - nhấn chọn Quartiles trong mục Statistics hiển thị như màn hình bên dưới.

Kiểm định kruskal-wallis

Bước 6: Tiếp tục nhấn chọn Continue để quay về cửa sổ  Tests for Several Independent Samples ban đầu. 

Bước 7: Cuối cùng, nhấn OK để kết thúc nhập biến và tiến hành chạy kiểm định. 

3.4. Đánh giá kết quả

  • Sau khi hoàn thành phân tích, SPSS sẽ hiển thị kết quả phân tích Kruskal-Wallis. Bạn có thể đánh giá kết quả bằng cách xem giá trị của H-statistic, p-value và các giá trị thống kê mô tả khác được hiển thị trong bảng kết quả.
  • Ngoài ra, bạn cũng có thể sử dụng biểu đồ boxplot để trực quan hóa dữ liệu và giúp phân tích kết quả một cách dễ dàng hơn.

 

4. Đánh giá kết quả kiểm định Kruskal-Wallis và giải thích kết quả

Ta tiến hành đánh giá kết quả kiểm định Kruskal - Wallis trong spss dựa vào phân tích ý nghĩa thống kế và giải thích kết quả của 3 bảng kết quả dưới đây.

Kiểm định kruskal-wallis

Nhìn vào lần lượt bảng kết quả, chúng ta có thể dễ dàng thấy được 

  • Tổng thu nhập trung bình của ngành dịch vụ
  • Tổng thu nhập trung bình của ngành công nghiệp
  • Tổng thu nhập trung bình ngành nông nghiệp
  • Chỉ số bình phương các biến
  • Giá trị tự do 

Sau khi đã đọc được các giá trị hiển thị ở bảng kết quả cùng diễn giản đi kèm, ta có thể dễ dàng đưa ra đánh giá cuối cùng: Có tồn tại sự khác biệt trong thu nhập giữa 3 ngành nghề là dịch vụ, công nghiệp và nông nghiệp. 

Trong quá trình phân tích kết quả kiểm định, để dễ hiểu cho người đọc và dễ trình bày, thống kê các con số, người làm có thể chọn sử dụng biểu đồ đường hình S hoặc sử dụng biểu đồ boxplot chuyên biệt, giúp hạn chế tối đa thời gian cũng như tối ưu được hiệu quả. 

Trên đây là mọi thông tin về kiểm định Kruskal-wallis và hướng dẫn chi tiết các bước thực hiện kiểm định cũng như cách đọc kết quả chuẩn xác, giúp bạn ứng dụng vào phục vụ công việc, nghiên cứu.

Nguyễn Tuyết Anh Tôi là Nguyễn Tuyết Anh - Job title: Trưởng phòng nội dung - Company: Luanvan1080 Group. Kể từ khi còn bé tôi đã rất yêu thích sách vở, nên khi lớn lên tôi quyết định tâm làm nên những nội dung thật hay thật ý nghĩa. Luận văn 1080 có thâm niên hoạt động hơn 10 năm với đội ngũ chuyên gia giàu kinh nghiệm, trình độ chuyên môn cao cùng tinh thần làm việc trách nhiệm. Mọi thông tin cần tư vấn vui lòng liên hệ Website: luanvan1080.com/ - Hotline: 096.999.1080 Bạn hãy tham khảo website https://luanvan1080.com/ để rõ hơn công việc của tôi nhé !
Bình luận đánh giá
Đánh giá

Zalo: 096.999.1080