Chạy tương quan SPSS là một trong những bước quan trọng khi thực hiện phân tích định lượng. Nó giúp bạn trả lời các câu hỏi về mối quan hệ giữa các biến trong quá trình nghiên cứu. Cùng Luận văn 1080 tìm hiểu về cách chạy tương quan SPSS và các lý thuyết quan trọng trong phần nội dung dưới đây.
Hệ số tương quan Pearson (Pearson correlation coefficient) có ký hiệu r. Đây là số liệu thống kê, kiểm tra, đo lường mối liên hệ thống kê hoặc liên kết giữa các biến phụ thuộc với các biến liên tục.
Tương quan Pearson là một phương pháp đo lường tương quan giữa hai biến đại diện cho mối quan hệ tuyến tính giữa chúng. Nó được đặt tên theo nhà thống kê người Anh Karl Pearson, người đã phát triển phương pháp này vào cuối thế kỷ XIX và đầu thế kỷ XX.
Cách tính hệ số tương quan r: Cho hai biến số x và y từ n mẫu, ta có công thức tính hệ số tương quan r như sau:
Trong đó: N là số quan sát, mẫu; Sx và Sy là độ lệch chuẩn của từng biến X và Y
Một số đặc điểm của r
Giá trị của tương quan Pearson luôn nằm trong khoảng từ -1 đến 1.
Tương quan Pearson được tính bằng cách đo độ tương quan giữa hai biến liên tục, được biểu diễn bằng một hệ số tương quan r, có giá trị từ -1 đến 1.
Nếu giá trị r càng gần 1, thì mối quan hệ tuyến tính giữa hai biến càng mạnh;
Nếu giá trị r càng gần -1, thì mối quan hệ tuyến tính giữa hai biến càng yếu.
Nếu giá trị r bằng 0, thì không có mối quan hệ tuyến tính giữa hai biến.
Tương quan Pearson chỉ đo lường mối quan hệ tuyến tính giữa hai biến và không phải mối quan hệ phi tuyến tính (nonlinear relationship).
Tương quan Pearson yêu cầu các biến phải có phân phối chuẩn và không có ngoại lệ (outliers) đáng kể. Nếu một trong hai biến không có phân phối chuẩn hoặc có ngoại lệ đáng kể, thì kết quả của tương quan Pearson có thể không chính xác.
Tương quan Pearson không cho biết nguyên nhân của mối quan hệ giữa hai biến. Nó chỉ cho biết mức độ mối quan hệ tuyến tính giữa chúng.
Bạn cần lưu ý với những mối quan hệ gọi là tương quan giả. Có nghĩa là mặc dù hai biến định lượng có hệ số tương quan r rất cao nhưng thực tế chúng không có mối liên hệ gì. Bạn cần kiểm định lại mức độ phù hợp tổng thể của để xem lại giá trị r có ý nghĩa hay không.
Hệ số tương quan Pearson là thước đo mang tính đối xứng. Vì nếu bạn thay đổi vai trò của biến X và Y cho nhau thì kết quả vẫn không thay đổi.
Hệ số tương quan tuyến tính không có đơn vị đo lường, không bị ảnh hưởng bởi phép biến đổi tuyến tính như nhân, chia, cộng trừ.
1.2. Mục đích của hệ số tương quan person
Dưới đây là một số tác dụng của hệ số tương quan Pearson:
Đo lường mức độ mối quan hệ giữa hai biến: Hệ số tương quan Pearson đo lường mức độ tương quan giữa hai biến liên tục và thể hiện mối quan hệ tuyến tính giữa chúng.
Phát hiện mối quan hệ giữa hai biến: Hệ số tương quan Pearson giúp phát hiện mối quan hệ giữa hai biến. Nếu giá trị của hệ số là gần 1 hoặc -1, thì có mối quan hệ tuyến tính mạnh giữa hai biến. Nếu giá trị gần 0, thì không có mối quan hệ tuyến tính giữa hai biến.
Dự đoán giá trị của một biến từ giá trị của biến kia: Hệ số tương quan Pearson có thể được sử dụng để dự đoán giá trị của một biến từ giá trị của biến kia. Ví dụ: Nếu ta biết rằng có một mối quan hệ tuyến tính mạnh giữa chiều cao và cân nặng của một người, thì ta có thể dự đoán cân nặng của người đó từ chiều cao của họ.
Xác định mối quan hệ giữa các biến trong phân tích đa biến: Hệ số tương quan Pearson cũng được sử dụng trong phân tích đa biến để xác định mối quan hệ giữa các biến.
Phát hiện ngoại lệ (outliers): Hệ số tương quan Pearson có thể giúp phát hiện các điểm ngoại lệ (outliers) trong bộ dữ liệu. Nếu một điểm dữ liệu là ngoại lệ, nó có thể ảnh hưởng đến kết quả của hệ số tương quan Pearson.
=> Tóm lại, hệ số tương quan Pearson là một công cụ hữu ích trong việc phân tích và hiểu mối quan hệ giữa hai biến và có nhiều ứng dụng trong nhiều lĩnh vực khác nhau.
1.3. Ý nghĩa của hệ số tương quan r
Mỗi giá trị và mỗi biến tính hệ số tương quan r đều mang một ý nghĩa khác nhau và thể hiện chức năng của nó. Trong đó:
r = 0: Hai biến đã chọn không có quan hệ tương quan tuyến tính tuyệt đối.
r = 1 hoặc r = - 1: Hai biến trong hệ thống có quan hệ liên quan tuyến tính tuyệt đối.
r < 0: Hệ số tương quan âm, đồng nghĩa với việc giá trị hai biến phụ thuộc sẽ đối lập nhau. Khi giá trị biến x giảm thì giá trị của biến y tăng và ngược lại.
r > 0: hệ số tương quan dương. Điều này mang ý nghĩa giá trị 2 biến phụ thuộc nhau song hành nhau. Nếu giá trị biến x tăng thì y cũng tăng và ngược giá trị biến y tăng thì biến x cũng tăng.
Thêm vào đó, bạn cần lưu ý giá trị các biến dưới đây:
r nằm trong khoảng từ 0.05 đến ±1: Giữa các biến có mối quan hệ tương quan mạnh.
r nằm trong khoảng từ 0.3 đến ±0.49: Giữa các biến có mối quan hệ tương quan trung bình.
r dưới 0.29: Giữa các biến có mối quan hệ tương quan yếu.
Trên đồ thị Scatter, r = -1 thì dữ liệu các biến sẽ được phân bổ trên một đường thẳng với độ dốc âm. r = 1 thì dữ liệu sẽ được phân bổ trên một đường thẳng có độ dốc dương.
Hệ số tương quan Pearson r chỉ có ý nghĩa khi và chỉ khi mức ý nghĩa quan sát (sig.) nhỏ hơn 5%.
Để xác định mối quan hệ giữa các biến phân loại và xác định số lượng biến quan sát giữa các biến định lượng hoặc định tính trong phân tích số liệu thống kê, kiểm định crosstab sẽ là giải pháp tối ưu cho các bạn. Tuy nhiên làm thể nào để có thể thực hiện kiểm định crosstab một cách chính xác và hiệu quả. Trong bài viết này, Luận văn 1080 sẽ giúp bạn hiểu rõ tất tần tật về crosstab để bạn dễ hình dung hơn
1.3. Sự khác nhau giữa tương quan và hồi quy
Nhiều người sẽ đặt câu hỏi Phân tích tương quan và hồi quy có khác biệt nhau không? Chúng ta có thể lý giải bằng bảng so sánh dưới đây.
Nội dung so sánh
Tương quan
Hồi quy
Mục đích
Đo lường mối quan hệ giữa hai biến
Dự đoán giá trị của biến phụ thuộc
Loại biến
Hai biến số liên tục
Một biến số liên tục và một hoặc nhiều biến số độc lập
Biến phụ thuộc
Không có
Có
Biến độc lập
Có
Có
Mức độ quan hệ
-1 đến 1
-∞ đến +∞
Hướng quan hệ
Có thể là dương, âm hoặc không
Có thể là tuyến tính hoặc phi tuyến
Ứng dụng
Phân tích mối quan hệ
Dự đoán giá trị và phân tích ảnh hưởng của biến độc lập
Công thức tính
Hệ số tương quan Pearson
Hệ số hồi quy
Độ tin cậy của dự đoán
Không có
Có
Chạy tương quan SPSS và CFA là hai phương pháp được sử dụng để đánh giá mối quan hệ giữa các biến. Tuy nhiên, chúng phục vụ cho các mục đích khác nhau và thường được sử dụng cùng với các phương pháp và công cụ khác nhau để có cái nhìn toàn diện về dữ liệu. Để hiểu rõ hơn về cách CFA đo lường dựa trên các yếu tố ẩn, xem ngay bài viết của Luận văn 1080 để biết cách chạy CFA SPSS và đọc kết quả chính xác nhất
2. 2 bước thực hiện phân tích tương quan person
2.1. Chuẩn bị dữ liệu
Trước khi bắt đầu chạy tương quan SPSS thì thực hiện bước chuẩn bị dữ liệu nhằm đảm bảo các dữ liệu đã được nhập vào, có định dạng đúng cho từng biến.
Thêm vào đó, bạn có thể đánh số hiệu và hãy chắc rằng tất cả các biến đã được liệt kê trong SPSS.Trong trường hợp bạn không thực hiện công viên trên, bạn cần phải nhập dữ liệu hoặc sửa đổi dữ liệu để đáp ứng các yêu cầu này trước khi chạy tương quan trong SPSS.
Bạn có thể thực hiện theo các bước chuẩn bị dữ liệu trước khi chạy tương quan trong SPSS như sau:
Tạo một bảng tính mới trên SPSS.
Nhập dữ liệu vào bảng tính.
Đánh số hiệu biến cho các biến số của bạn.
Đảm bảo rằng tất cả các biến số đã được nhập dữ liệu đầy đủ và không có giá trị bị thiếu.
2.2. 3 bước chạy tương quan trên SPSS
Để tiến hành chạy tương quan SPSS, các bạn cần thực hiện theo 3 bước như sau:
Bước 1. Đầu tiên, để tính hệ số tương quan rcác bạn sử dụng lệnh Correlate > Bivariate… của menu Analyze. Bạn có thể xem hình bên dưới để biết cách dùng lệnh này.
Bước 2. Bạn sẽ bắt gặp hộp thoại mới, trong đó bao gồm yếu tố:
Các biến hiện có trong tài liệu của bạn trong khung danh sách biến nguồn. Bạn có thể chọn ít nhất hai biến để đưa vào khung Variables. Trong trường này chúng ta sẽ chọn biến “Height” và “Weight”, bạn chỉ cần click chọn 2 biến này. Sau đó, bạn sẽ thấy trên ô “Variables” sẽ xuất hiện 2 biến vừa chọn..
Trong phần Correlation Coefficients (hệ số tương quan), bạn cần chọn một trong các loại hệ số sau:
Pearson: Đây là hệ số được chọn mặc định. Bảng kết quả sẽ thể hiện một ma trận vuông chứa các hệ số tương quan. Đây là phần chúng ta sẽ chọn để thực hiện cách tính hệ số tương quan r.
Kendall’s tau-b: Đây cũng là hệ số tương quan hạng, được ước tính bằng cách tìm các cặp số (x, y) “song hành" với nhau.
Spearman: Spearman là thước đo phi tham số về tương quan hạng (sự phụ thuộc thống kê giữa thứ hạng của hai biến).
Trong phần Test of significance (kiểm định mức ý nghĩa), bạn có thể chọn một trong hai loại điểm định sau đây để bắt đầu chạy tương quan SPSS.
Two-tail: Kiểm định hai phía. Kiểm định này được dùng trong trường hợp chiều hướng của mối liên hệ tuyến tính không thể xác định trước được. Đây là loại kiểm định được chọn mặc định. Và trong phần thực hành cách tính hệ số tương quan r, chúng ta sẽ click chọn mục nafty.
One-tail: Kiểm định một phía. Loại kiểm định này được dùng khi bạn có thể xác định trước chiều hướng của mối liên hệ giữa hai biến trong phần phân tích.
Cuối cùng, chỉ cần ấn “OK” để chạy tương quan SPSS.
Bước 3. Sau khi ấn “OK”, một hộp thoại mới Correlation sẽ xuất hiện. Bạn có thể gọi là “ma trận tương quan” (Correlation matrix), nó sẽ thể hiện hệ số tương quan của các biến và bạn đã chọn. Trong đó:
Pearson Correlation: Hệ số tương quan r.
Sig. (2-tailed): Giá trị sig của kiểm định t đánh giá hệ số tương quan Pearson có ý nghĩa thống kê hay không.
N: Cỡ mẫu.
Hệ Số Tải Factor Loading là một trong những yếu tố quan trọng. Hệ số tải nhân tố chính là mối quan hệ giữa các biến quan sát với nhân tố trong bài nghiên cứu. Trong trường họp bạn chưa biết các bước hoàn chỉnh để tính toán hệ số tải nhân tố thì chúng tôi sẽ phân tích kỹ giúp bạn dễ hiểu factor loading là gì cùng các phương pháp tính toán chi tiết nhất
3. Đọc kết quả tương quan Pearson trong SPSS
Ở ô số 1 và 4 trong hình, bạn sẽ thấy “Pearson Correlation” là 1 cho thấy đây là mối tương quan hoàn hảo của 1 biến và chính nó. Số lượng các quan sát hợp lệ của cả 2 ô là N = 10.
Ở ô số 2 và 3 trong hình, bạn sẽ thấy rằng hệ số tương quan sẽ luôn có giá trị từ -1 đến 1. Và “Pearson Correlation” là 0.574 được đánh giá là ở mức độ tương quan khá nhưng kết quả không có ý nghĩa vì sig. = 0.083 (lớn hơn 0.05).
Với giá trị sig. = 0.083 thì ta thấy được không có sự tương quan giữa biến độc là và biến phụ thuộc trong dữ liệu trên.
Nhìn chung, tính hệ số tương quan rcho biết mức độ mạnh yếu của mối quan hệ giữa hai biến, còn p-value cho biết tính chất đáng kể của mối quan hệ đó.
Nếu p-value nhỏ hơn mức ý nghĩa được thiết lập trước (thường là 0.05), thì ta có thể kết luận rằng mối quan hệ giữa hai biến là đáng kể và ngược lại.
Có thể thấy, phân tích, chạy tương quan SPSS là việc không hề đơn giản. Nếu bạn cần dịch vụ hỗ trợ thì có thể liên hệ ngay với Luận văn 1080. Ngoài ra, Luận văn 1080 còn cung cấp nhiều dịch vụ xử lý số liệu trên SPSS khác như: Hồi quy đơn biến, đa biến, T-test, ANOVA, nhận chạy EView,... và bạn có thể tham khảo tại website Luận văn 1080
Bài viết đã giới thiệu đến bạn những nội dung quan trọng về chạy tương quan SPSS. Mong rằng bạn sẽ thực hành, áp dụng thành công. Nếu bạn gặp khó khăn nào trong quá trình phân tích tương quan hãy liên hệ ngay với Luận văn 1080 để được giải đáp mọi thắc.
Nguyễn Tuyết Anh
Tôi là Nguyễn Tuyết Anh - Job title: Trưởng phòng nội dung - Company: Luanvan1080 Group. Kể từ khi còn bé tôi đã rất yêu thích sách vở, nên khi lớn lên tôi quyết định tâm làm nên những nội dung thật hay thật ý nghĩa. Luận văn 1080 có thâm niên hoạt động hơn 10 năm với đội ngũ chuyên gia giàu kinh nghiệm, trình độ chuyên môn cao cùng tinh thần làm việc trách nhiệm. Mọi thông tin cần tư vấn vui lòng liên hệ Website: luanvan1080.com/ - Hotline: 096.999.1080
Bạn hãy tham khảo website https://luanvan1080.com/ để rõ hơn công việc của tôi nhé !