Correlation Coefficient là gì? Hệ số tương quan r là thước đo thống kê được nhiều người bởi tính chính xác và tính hiệu quả trong việc đưa ra kết quả nhanh chóng. Vậy hệ số pearson là gì? Công thức tính như thế nào? Có những tác động nào ảnh hưởng tới nó hay không? Tất cả thông tin mà bạn đang thắc mắc sẽ có trong bài viết mà Luận Văn 1080sẽ giới thiệu bên dưới!
Correlation Coefficient là gì? Correlation Coefficient được gọi là hệ số tương quan r, là một đại lượng thống kê được sử dụng để đo độ liên quan tuyến tính giữa hai biến số và có giá trị nằm trong khoảng từ -1 đến 1.
1.2. Ý nghĩa hệ số tương quan r
Mỗi giá trị và mỗi biến tính hệ số tương quan r đều mang một ý nghĩa khác nhau và thể hiện chức năng của nó. Trong đó:
Giá trị của r
Ý nghĩa hệ số tương quan r
r = 0
Hai biến đã chọn không có quan hệ tương quan tuyến tính tuyệt đối.
r = 1 hoặc r = - 1
Hai biến có quan hệ liên quan tuyến tính tuyệt đối.
r < 0
Hệ số tương quan âm, đồng nghĩa với việc giá trị hai biến sẽ đối lập nhau.
Khi giá trị biến x giảm thì giá trị của biến y tăng và ngược lại.
r > 0
Hệ số tương quan dương. Điều này mang ý nghĩa giá trị 2 biến phụ thuộc nhau song hành nhau.
Nếu giá trị biến x tăng thì y cũng tăng và ngược khi giá trị biến y tăng thì biến x cũng tăng.
1.3. Trường hợp sử dụng hệ số tương quan person
Hệ số tương quan pearson SPSS thường được sử dụng trong các nghiên cứu khoa học, kinh tế, y học và một số lĩnh vực khác. Nó sẽ giúp bạn trả lời cho các câu hỏi như:
Có mối quan hệ tương quan giữa doanh thu bán kem và nhiệt độ không?
Có mối quan hệ tương quan giữa năng suất, thu nhập và sự hài lòng công việc của nhân viên?
Hai biến nào có mối liên hệ chặt chẽ nhất giữa chiều cao, tuổi và cân nặng?
Khi sử dụng hệ số tương quan Pearson SPSS, cần lưu ý rằng nó chỉ đo mối tương quan tuyến tính giữa hai biến và không phải là chứng cứ về mối quan hệ nhân quả giữa chúng.
2. Tính chất của hệ số tương quan r
Dưới đây là 6 tính chất của hệ số tương quan pearson:
Hệ số tương quan pearson không bị ảnh hưởng bởi việc đổi vị trí của hai biến số.
Giá trị của hệ số tương quan r có thể bị ảnh hưởng nếu tồn tại các giá trị ngoại lai (outliers) và phân phối của dữ liệu
Giá trị của r không phản ánh chính xác mối tương quan giữa hai biến sốnếu một trong hai biến số có phân phối không chuẩn (tức, không tuân theo phân phối chuẩn).
Hệ số tương quan r không chỉ ra mối quan hệ nhân quả giữa hai biến số và cũng sử dụng để suy ra mối quan hệ nhân quả.
Hệ số tương quan r có tính đối xứng, tức là giá trị của r giữa biến số X và Y bằng giá trị của r giữa biến số Y và X.
Giá trị của r không phụ thuộc vào đơn vị đo của hai biến số.
3. Công thức tính và tác động của các yếu tố đến hệ số tương quan r
3.1. Công thức
Cách tính hệ số tương quan pearson như sau:
Trong đó:
N: Số cặp điểm
Σxy: tổng các tích của các điểm được ghép nối
Σx: tổng điểm x
Σy: tổng điểm y
Σx2: tổng điểm của x bình phương
Σy2: tổng điểm của y bình phương
3.2. Tác động
Có 3 yếu tố có tác động đến hệ số tương quan r:
Outlier: Các giá trị ngoại lệ có thể làm giảm tính chính xác của hệ số tương quan pearson.
Phân phối không chuẩn: Nếu dữ liệu không tuân theo phân phối chuẩn, hệ số tương quan r có thể bị sai lệch.
Kích thước mẫu: Kích thước mẫu càng lớn thì hệ số r càng chính xác. Tuy nhiên, với kích thước mẫu nhỏ, hệ số tương quan pearson có thể bị sai lệch và không phản ánh chính xác mối quan hệ giữa hai biến số.
Khi phân tích dữ liệu trong kinh tế lượng, hiệp phương sai là một công cụ đác lục không thể thiếu. Nó cho phép chúng ta biết được mức độ tương quan giữa hai biến và hướng của mối quan hệ đó là thuận hay nghịch. Nhờ đó, chúng ta có thể phân tích và dự đoán được các biến phụ thuộc và đưa ra các quyết định phù hợp. Vậy Hiệp phương sai là gì?Cách tính Hiệp phương sai như thế nào, cùng Luận văn 1080 tìm hiểu nhé!
4. Hướng dẫn chọn biến và đọc kết quả hệ số tương quan r
4.1. Cách chạy Kiểm tra tương quan Pearson trong SPSS
Bước 1. Mở phần mềm SPSS và tạo một bảng dữ liệu mới.
Bước 2. Bạn tiến hành nhập dữ liệu vào bảng dữ liệu. Chúng ta sẽ có một bảng dữ liệu như ảnh ví dụ bên dưới.
Bước 3. Để tiến hành chạy tương quan SPSS, bạn cần chọn Analyze > Correlate > Bivariate.
Bước 4. Bạn sẽ thấy một hộp thoại mới xuất hiện trên màn hình làm việc. Tại đây, bạn sẽ tiến hành thực hiện chọn biến để chạy tương quan.
Cột bên trái là các biến có trong dữ liệu, bạn cần click chọn các biến cần tiến hành chạy tương quan SPSS. Các biến được chọn sẽ xuất hiện tại ô Variables.
Bước 5.Điều chỉnh các tùy chọn tương quan nếu cần thiết. Trong đó, bao gồm phương pháp tính tương quan, hiển thị giá trị tương quan, các thông số thống kê khác và tùy chọn khác.
Correlation Coefficients: Hệ số tương quan
Pearson
Hệ số được chọn mặc định. Bảng kết quả sẽ thể hiện một ma trận vuông chứa các hệ số tương quan.
Kendall’s tau-b
Hệ số tương quan hạng, được ước tính bằng cách tìm các cặp số (x, y) “song hành" với nhau.
Spearman
Spearman là thước đo phi tham số về tương quan hạng (sự phụ thuộc thống kê giữa thứ hạng của hai biến).
Test of significance: Kiểm định mức ý nghĩa
Two-tail
Kiểm định hai phía.
Được dùng trong trường hợp chiều hướng của mối liên hệ tuyến tính không thể xác định trước được.
Đây là loại kiểm định được chọn mặc định.
One-tail:
Kiểm định một phía.
Được dùng khi bạn có thể xác định trước chiều hướng của mối liên hệ giữa hai biến trong phần phân tích.
Flag significant correlations - Gắn cờ các mối tương quan có ý nghĩa thống kê.
Khi bạn đánh dấu tùy chọn này, trong kết quả đầu ra sẽ có các dấu hoa thị (**) bên cạnh các mối tương quan có ý nghĩa thống kê.
SPSS sẽ đánh dấu ý nghĩa thống kê ở mức alpha = 0.05 và alpha = 0.01.
Options: Các tùy chọn
Statistics
Cho chúng ta biết thông tin chung về biến đưa vào chạy thống kê, bao gồm:
Means and standard deviations: Cho biết giá trị trung bình và độ lệch chuẩn.
Cross-product deviations and covariances: Cho biết độ lệch chuẩn sản phẩm chéo và phương sai.
Missing Values
Cho biết cách xử lý khi dữ liệu bị lỗi, gồm các lựa chọn sau:
Exclude cases pairwise: Chỉ loại bỏ những giá trị trống của dòng dữ liệu bị lỗi, các cột có dữ liệu vẫn sẽ được thực hiện phân tích.
Exclude cases listwise: Loại bỏ hoàn toàn dòng dữ liệu bị lỗi ra khỏi các phân tích liên quan.
Bước6. Sau khi đã chọn biến và thực hiện các nội dung liên quan, bạn nhấn nút OK để bắt đầu chạy tương quan SPSS.
Bước 7: Xem kết quả phân tích tương quan. Sau khi chạy tương quan trong SPSS, bạn sẽ nhận được bảng hiển thị kết quả tính toán, bao gồm hệ số tương quan Pearson, giá trị p, số lượng quan sát, giá trị trung bình, độ lệch chuẩn và các thông số khác.
Bước 8: Đánh giá tính tương quan giữa hai biến. Dựa trên kết quả phân tích tương quan, bạn có thể đánh giá mức độ tương quan giữa hai biến và đưa ra kết luận.
Ví dụ, nếu giá trị tương quan r gần với 1, thì hai biến có mối quan hệ tuyến tính mạnh; nếu giá trị tương quan r gần với 0, thì hai biến có mối quan hệ tuyến tính yếu hoặc không có mối quan hệ tuyến tính.
Phân tích nhân tố khám phá EFA cũng là một nội dung rất quan trọng khi thực hiện nghiên cứu định lượng. Với những ai mới bắt đầu làm quen với kiến thức này thì sẽ thấy chúng khá khó. Hãy tham khảo các bài viết chi tiết về EFA tại Luận văn 1080 giúp bạn biết được EFA là gì? cũng như các vấn đề khác như: Hệ số KMO, Hệ số tải nhân tố, Trị số Eigenvalues,...
4.2. Cách đọc kết quả hệ số tương quan r:
Sau khi thực hiện cách tính hệ số tương quan r trong SPSS xong, kết quả sẽ được hiển thị trong bảng Output. Bảng này sẽ hiển thị giá trị của hệ số tương quan r cũng như giá trị p-value, giá trị t và số lượng mẫu và các thông tin khác.
Giá trị hệ số tương quan r thường được đưa ra trong phạm vi từ -1 đến 1, trong đó giá trị 0 có nghĩa là không có mối quan hệ tuyến tính giữa hai biến số.
Một giá trị càng gần -1 hoặc 1 thì mối quan hệ tuyến tính càng mạnh.
Cụ thể như sau
Cột Biến: Liệt kê tên của các biến số đã được chọn để tính hệ số tương quan r.
Cột N: Đếm số lượng giá trị không bị thiếu cho từng biến số.
Cột Pearson Correlation: Đây là hệ số tương quan r giữa hai biến số. Hệ số tương quan r có giá trị từ -1 đến 1. Giá trị 0 cho thấy không có mối quan hệ tuyến tính giữa hai biến số, giá trị -1 hoặc 1 cho thấy mối quan hệ tuyến tính hoàn hảo giữa hai biến số.
Cột Sig. (2-tailed): Giá trị p cho thấy mức độ đáng tin cậy của kết quả hệ số tương quan r. Giá trị p < 0,05 cho thấy kết quả là đáng tin cậy.
Cột Lower Bound và Upper Bound: Đây là khoảng tin cậy của hệ số tương quan r. Nếu khoảng tin cậy này không bao gồm giá trị 0, bạn có thể kết luận rằng mối quan hệ giữa hai biến số là có ý nghĩa thống kê.
Ví dụ:
n
N
Pearson Correlation
Sig. (2-tailed)
Lower Bound
Upper Bound
X
100
0.60
0.000
0.45
0.72
Y
100
Cột Biến (n): Bạn đang xem kết quả của biến X và Y.
Cột N: Có 100 giá trị không bị thiếu cho biến X và Y.
Cột Pearson Correlation: Hệ số tương quan r giữa X và Y là 0.60. Giá trị này thể hiện mức độ tương quan tuyến tính giữa hai biến, với giá trị dương thể hiện mối quan hệ thuận (cùng tăng hoặc giảm), và ngược lại giá trị âm thể hiện mối quan hệ nghịch
4.3. Các giá trị có thể có của hệ số tương quan r
Hệ số tương quan r có thể có các giá trị sau:
Giá trị r = 1: Mối quan hệ tuyến tính hoàn hảo giữa hai biến số.
Giá trị r > 0.7 hoặc r < -0.7: Mối quan hệ tuyến tính mạnh giữa hai biến số.
Giá trị r > 0.3 hoặc r < -0.3: Mối quan hệ tuyến tính trung bình giữa hai biến số.
Giá trị r < 0.3 hoặc r > -0.3: Mối quan hệ tuyến tính yếu giữa hai biến số.
5. Ứng dụng cơ bản của hệ số tương quan r trong SPSS
Phân tích mối quan hệ giữa hai biến số
Hệ số tương quan r trong SPSS cho phép bạn phân tích mối quan hệ giữa hai biến số. Khi giá trị r gần 0, điều này cho thấy rằng hai biến số không có mối quan hệ tuyến tính. Khi giá trị r gần -1 hoặc 1, điều này cho thấy rằng hai biến số có mối quan hệ tuyến tính mạnh.
Kiểm tra giả thuyết về mối quan hệ giữa hai biến số:
Hệ số tương quan r cũng có thể được sử dụng để kiểm tra giả thuyết về mối quan hệ giữa hai biến số.
Nếu giá trị p-value nhỏ hơn mức ý nghĩa (chẳng hạn như 0.05), thì giả thuyết rằng không có mối quan hệ tuyến tính giữa hai biến số sẽ bị bác bỏ.Tương quan là một trong những bước cần thiết trước khi thực hiện hồi quy.
Nếu bạn thực hiện chạy tương quan r trong SPSS, kết quả từ tương quan r cho bạn biết được biến độc lập có tương quan với biến phụ thuộc và khả năng biến độc lập đó sẽ tác động lên biến phụ thuộc ở hồi quy SPSS sẽ cao hơn.
Bạn có thể tìm hiểu kỹ hơn về mô hình hồi quy,hệ số chặn trong mô hình hồi quy và ý nghĩa của chúng trong các bài viết tại Luận văn 1080.
Ví dụ về việc sử dụng hệ số tương quan r trong các nghiên cứu:
Hệ số tương quan r có thể được sử dụng trong các nghiên cứu y học để phân tích mối quan hệ giữa các biến số liên quan đến sức khỏe của người bệnh.
Ví dụ, hệ số tương quan r có thể được sử dụng để phân tích mối quan hệ giữa BMI (Chỉ số khối cơ thể) và lượng mỡ trong máu của người bệnh.
Hệ số tương quan r cũng có thể được sử dụng trong các nghiên cứu về kinh tế hoặc tài chính để phân tích mối quan hệ giữa các biến số kinh tế hoặc tài chính.
Ví dụ, hệ số tương quan r có thể được sử dụng để phân tích mối quan hệ giữa thu nhập và độ tuổi của những người tham gia nghiên cứu.
6. Lưu ý cần biết khi sử dụng hệ số tương quan r
Khi sử dụng hệ số tương quan r, bạn cần lưu ý đến 5 điều sau:
Giới hạn của hệ số tương quan r: một số tương quan yếu có thể được bỏ qua nếu không có đủ dữ liệu hoặc không có sự hiểu biết đầy đủ về mối tương quan đó.
Hệ số tương quan pearson chỉ đo lường mối tương quan tuyến tính giữa hai biến số, nókhông cho phép xác định nguyên nhân và kết quả giữa các biến số. Chính vì vậy, bạn cần cẩn trọng khi suy ra những mối quan hệ giả hoặc kết luận vô căn cứ từ hệ số tương quan r.
Hệ số tương quan r chỉ áp dụng cho mô hình tuyến tính, tức là giả định rằng mối quan hệ giữa hai biến số là tuyến tính. Hệ số tương quan pearson không phản ánh chính xác mối quan hệ giữa chúng nếu giữa hai biến số không phải là tuyến tính.
Nếu các quan sát khác nhau không độc lập thì hệ số r có thể bị sai lệch. Ví dụ như khi một người được quan sát nhiều lần hoặc khi các quan sát có sự tương quan với nhau.
Các yếu tố có thể làm giảm tính chính xác của hệ số tương quan r: dữ liệu bị thiếu hoặc không chính xác, outlier, phân phối không chuẩn, kích thước mẫu, sự tương quan phi tuyến tính, các biến số không đầy đủ và mô hình tuyến tính không phù hợp.
Bạn cần phải cẩn trọng và đánh giá kỹ lưỡng để đảm bảo tính chính xác, độ tin cậy của kết quả phân tích.
Hệ số tương quan r là một thước đo rất quan trọng nhằm giúp chúng ta hiểu rõ hơn về mối tương quan giữa các biến số, giúp bạn đưa ra các quyết định đúng đắn hơn. Vì vậy, việc phân tích hệ số r là điều cần thiết. Nếu bạn đang gặp khó khăn trong việc phân tích dữ liệu trên phần mềm Eviews, tham khảo dịch vụ hỗ trợ SPSStại Luận Văn 1080 - giúp bạn xử lý số liệu nhanh chóng, kết quả chính xác, đồng thời giúp cho bài nghiên cứu của bạn trở nên chất lượng và đạt điểm cao.
Hệ số tương quan r là một chỉ số để đo mức độ mạnh yếu giữa hai biến số và được sử dụng trong nhiều lĩnh vực (khoa học, y tế, kinh tế...). Nó cung cấp thông tin về mức độ quan trọng của mối tương quan, mối quan hệ hoặc mối liên hệ. Việc kiểm tra hệ số tương quan person có thể giúp phát hiện vấn đề đa cộng tuyến khi các biến độc lập có sự tương quan mạnh với nhau. Do đó, nghiên cứu cần tìm hiểu kỹ và tham khảo thêm thông tin liên quan để tránh sai sót.
Nguyễn Tuyết Anh
Tôi là Nguyễn Tuyết Anh - Job title: Trưởng phòng nội dung - Company: Luanvan1080 Group. Kể từ khi còn bé tôi đã rất yêu thích sách vở, nên khi lớn lên tôi quyết định tâm làm nên những nội dung thật hay thật ý nghĩa. Luận văn 1080 có thâm niên hoạt động hơn 10 năm với đội ngũ chuyên gia giàu kinh nghiệm, trình độ chuyên môn cao cùng tinh thần làm việc trách nhiệm. Mọi thông tin cần tư vấn vui lòng liên hệ Website: luanvan1080.com/ - Hotline: 096.999.1080
Bạn hãy tham khảo website https://luanvan1080.com/ để rõ hơn công việc của tôi nhé !