Giới thiệu về phần mềm SPSS và cách sử dụng phần mềm SPSS

Tran Ha
Giới thiệu về phần mềm SPSS và cách sử dụng phần mềm SPSS
4.5 (90%) 2 votes

Có nhiều người thắc mắc về spss là gì, chức năng của phần mềm spss và bản hướng dẫn sử dụng phần mềm spss đầy đủ là như thế nào? Bày viết sau đây chúng tôi giới thiệu tới bạn cách sử dụng phần mềm đầy đủ và chi tiết nhất.

1. Phần mềm SPSS là gì?

SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác thống kê. Phần mềm SPSS hỗ trợ xử lý và phân tích dữ liệu sơ cấp – là các thông tin được thu thập trực tiếp từ đối tượng nghiên cứu, thường được sử dụng rộng rãi trong các các nghiên cứu điều tra xã hội học và kinh tế lượng.

2. Chức năng của SPSS

Phần mềm SPSS có các chức năng chính bao gồm:

+ Phân tích thống kê gồm

Thống kê mô tả: Lập bảng chéo, Tần suất, Mô tả, Khám phá, Thống kê Tỷ lệ Mô tả

Thống kê đơn biến: Phương tiện, t-test, ANOVA, tương quan (hai biến, một phần, khoảng cách), kiểm tra không giới

Dự đoán cho kết quả số: Hồi quy tuyến tính

Dự đoán để xác định các nhóm: Phân tích các yếu tố, phân tích cụm (hai bước, K-phương tiện, phân cấp), phân biệt.

( Tham khảo tại: https://vi.wikipedia.org/wiki/SPSS)

+ Quản lý dữ liệu bao gồm lựa chọn trường hợp, chỉnh sửa lại tập tin, tạo ra dữ liệu gốc

+ Vẽ đồ thị: Được sử dụng để vẽ nhiều loại đồ thị khác nhau với chất lượng cao.

3. Quy trình làm việc của phần mềm SPSS

Bạn đã có một một chút hiểu biết về SPSS làm việc như thế nào, chúng ta hãy nhìn vào những gì nó có thể làm. Sau đây là một quy trình làm việc của một dự án điển hình mà SPSS có thể thực hiện

B1: Mở các files dữ liệu – theo định dạng file của SPSS hoặc bất kỳ định dạng nào;

B2: Sử dữ liệu – như tính tổng và trung bình các cột hoặc các hàng dữ liệu;

B3: Tạo các bảng và các biểu đồ – bao gồm đếm các phổ biến hay các thống kê tổng hơn (nhóm) thông qua các trường hợp;

B4: Chạy các thống kê suy diễn như ANOVA, hồi quy và phân tích hệ số;

B5: Lưu dữ liệu và đầu ra theo nhiều định dạng file.

B6: Bây giờ chúng ta cùng tìm hiểu kỹ hơn về những bước sử dụng SPSS.

4. Hướng dẫn sử dụng phần mềm SPSS

4.1 Khởi động SPSS

Trên màn hình desktop của Windows nhấp vào biểu tượng SPSS. Hoặc bạn mở phím Start >>> All program>>> SPSS for Windows >>>SPSS ( phiên bản hiện tại bạn đang cài)

Sau đó tùy vào mục đích của bạn, bạn cần thống kê suy diễn, vẽ biểu đồ hay các phân tích hồi quy tuyến tính,…để lựa chọn phù hợp.

Đây là một nguồn tài liệu chúng tôi tổng hợp được, bạn có thể tham khảo tài liệu hướng dẫn sử dụng SPSS phiên bản 20, 21, 22, 23.

5. Hướng dẫn sử dụng phần mềm SPSS

5.1 Đề tài nghiên cứu

5.1.1 Đề tài nghiên cứu

Nghiên cứu các yếu tố ảnh hưởng đến sự hài lòng của nhân viên trong công việc tại công ty TNHH Nhãn Xanh.

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

5.1.2 Mô hình nghiên cứu

Ở đây, tác giả xem xét trên thực tế và kỳ vọng các biến độc lập đều tác động thuận chiều với biến phụ thuộc nên sẽ ký hiệu dấu (+). Trường hợp có biến độc lập tác động nghịch chiều với biến phụ thuộc, chúng ta sẽ ký hiệu dấu (–).

Thuận chiều là thế nào, thuận chiều có nghĩa là khi biến độc lập tăng thì biến phụ thuộc cũng tăng, ví dụ yếu tố Lương, thưởng, phúc lợi tăng lên, tốt hơn thì Sự hài lòng của nhân viên trong công việc cũng sẽ tăng lên.

Một ví dụ về tác động nghịch chiều giữa biến độc lập Giá cả sản phẩm và biến phụ thuộc Động lực mua hàng của người tiêu dùng. Trên thực tế, ta thấy rằng khi giá món hàng tăng cao thì chúng ta sẽ e dè và ít có động lực để mua món hàng đó, có thể thay vì mua nó với giá cao, chúng ta có thể mua sản phẩm thay thế khác có giá thấp hơn nhưng cùng tính năng. Như vậy, giá càng tăng, động lực mua hàng của người tiêu dùng càng giảm. Chúng ta sẽ kỳ vọng rằng, biến Giá cả sản phẩm tác động nghịch với biến phụ thuộc Động lực mua hàng của người tiêu dùng.

5.1.3 Giả thuyết nghiên cứu

Theo như tên gọi của nó, đây chỉ là các giả thuyết, giả thuyết này chúng ta sẽ khẳng định nó là đúng hay sai sau bước phân tích hồi quy tuyến tính. Thường chúng ta sẽ dựa trên những gì bản thân nhận thấy để kỳ vọng rằng mối quan hệ giữa biến độc lập và biến phụ thuộc là thuận chiều hay nghịch chiều. Hoặc cho dù bạn không biết bất kỳ điều gì về mối quan hệ này, bạn vẫn cứ đặt giả thuyết kỳ vọng của mình. Nếu sau bước hồi quy tuyến tính, kết quả xuất ra giống với kỳ vọng thì chúng ta chấp nhận giả thuyết, ngược lại, ta bác bỏ giả thuyết.

Chúng ta đừng bị sai lầm khi nhận định bác bỏ là tiêu cực, là xấu; còn chấp nhận là tích cực, là tốt. Ở đây không có sự phân biệt tốt xấu, tích cực hay tiêu cực gì cả mà chỉ là xem xét cái mình nghĩ nó có giống với thực tế số liệu nghiên cứu hay không mà thôi.

• H1: Lương, thưởng, phúc lợi tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.

• H2: Cơ hội đào tạo và thăng tiến tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.

• H3: Lãnh đạo và cấp trên tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.

• H4: Đồng nghiệp tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.

• H5: Bản chất công việc tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.

• H6: Điều kiện làm việc tác động tích cực (thuận chiều) đến sự hài lòng của nhân viên trong công việc.

5.1.4 Bảng câu hỏi khảo sát

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

5.1.5 Kích thước mẫu

Có nhiều công thức lấy mẫu, tuy nhiên, các công thức lấy mẫu phức tạp tác giả sẽ không đề cập trong tài liệu này bởi vì nó thiên về toán thống kê. Nếu lấy mẫu theo các công thức đó, lượng mẫu nghiên cứu cũng là khá lớn, hầu như chúng ta không đủ thời gian và nguồn lực để thực hiện. Do vậy, đa phần chúng ta lấy mẫu trên cơ sở tiêu chuẩn 5:1 của Bollen (1989)1, tức là để đảm bảo phân tích dữ liệu (phân tích nhân tố khám phá EFA) tốt thì cần ít nhất 5 quan sát cho 1 biến đo lường và số quan sát không nên dưới 100.

Bảng câu hỏi khảo sát tác giả trích dẫn có tổng cộng 30 biến quan sát (các câu hỏi sử dụng thang đo Likert), do vậy mẫu tối thiểu sẽ là 30 x 5 = 150. Chúng ta lưu ý, mẫu này là mẫu tối thiểu chứ không bắt buộc chúng ta lúc nào cũng lấy mẫu này, mẫu càng lớn thì nghiên cứu càng có giá trị. Cụ thể trong nghiên cứu này, tác giả lấy mẫu là 220.

5.2 Kiểm định độ tin cậy thang đo Crnbach’s Alpha

5.2.1 Lý thuyết về giá trị và độ tin cậy của đo lường

Một đo lường được coi là có giá trị (validity) nếu nó đo lường đúng được cái cần đo lường (theo Campbell & Fiske 1959). Hay nói cách khác, đo lường đó sẽ không có hiện tượng sai số hệ thống và sai số ngẫu nhiên.

• Sai số hệ thống: sử dụng thang đo không cân bằng, kỹ thuật phỏng vấn kém…

• Sai số ngẫu nhiên: phỏng vấn viên ghi nhầm số đó của người trả lời, người trả lời thay đổi tính cách nhất thời như do mệt mỏi, đau yếu, nóng giận… làm ảnh hưởng đến câu trả lời của họ.

Trên thực tế nghiên cứu, chúng ta sẽ bỏ qua sai số hệ thống và quan tâm đến sai số ngẫu nhiên. Khi một đo lường vắng mặt các sai số ngẫu nhiên thì đo lường có độ tin cậy (reliability). Vì vậy, một đo lường có giá trị cao thì phải có độ tin cậy cao.

5.2.2 Đo lường độ tin cậy bằng hệ số Cronbach’s Alpha

– Cronbach (1951) đưa ra hệ số tin cậy cho thang đo. Chú ý, hệ số Cronbach’s Alpha chỉ đo lường độ tin cậy của thang đo (bao gồm từ 3 biến quan sát trở lên) chứ không tính được độ tin cậy cho từng biến quan sát.( Cronbach’s Alpha chỉ thực hiện khi nhân tố có 3 biến quan sát trở lên trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 355.)

– Hệ số Cronbach’s Alpha có giá trị biến thiên trong đoạn [0,1]. Về lý thuyết, hệ số này càng cao càng tốt (thang đo càng có độ tin cậy cao). Tuy nhiên điều này không hoàn toàn chính xác. Hệ số Cronbach’s Alpha quá lớn (khoảng từ 0.95 trở lên) cho thấy có nhiều biến trong thang đo không có khác biệt gì nhau, hiện tượng này gọi là trùng lắp trong thang đo.( Hệ số Cronbach’s Alpha quá lớn (khoảng từ 0.95 trở lên) gây ra hiện tượng trùng lắp trong thang đo trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 364.)

5.2.3 Tính hệ số tin cậy Cronbach’s Alpha bằng SPSS

5.2.3.1 Các tiêu chuẩn kiểm định

– Nếu một biến đo lường có hệ số tương quan biến tổng Corrected Item – Total Correlation ≥ 0.3 thì biến đó đạt yêu cầu. ( Tương quan biến tổng ≥ 0.3 trích nguồn từ: Nunnally, J. (1978), Psychometric Theory, New York, McGraw- Hill.)

– Mức giá trị hệ số Cronbach’s Alpha:

• Từ 0.8 đến gần bằng 1: thang đo lường rất tốt.

• Từ 0.7 đến gần bằng 0.8: thang đo lường sử dụng tốt.

• Từ 0.6 trở lên: thang đo lường đủ điều kiện.

– Chúng ta cũng cần chú ý đến giá trị của cột Cronbach’s Alpha if Item Deleted, cột này biểu diễn hệ số Cronbach’s Alpha nếu loại biến đang xem xét. Thông thường chúng ta sẽ đánh giá cùng với hệ số tương quan biến tổng Corrected Item – Total Correlation, nếu giá trị Cronbach’s Alpha if Item Deleted lớn hơn hệ số Cronbach Alpha và Corrected Item – Total Correlation nhỏ hơn 0.3 thì sẽ loại biến quan sát đang xem xét để tăng độ tin cậy của thang đo.

5.2.3.2 Thực hành trên SPSS 20 với tập dữ liệu mẫu

Để thực hiện kiểm định độ tin cậy thang đo Cronbach’s Alpha trong SPSS 20, chúng ta vào Analyze > Scale > Reliability Analysis…

Hướng dẫn sử dụng phần mềm SPSS

Thực hiện kiểm định cho nhóm biến quan sát thuộc nhân tố Lương, thưởng, phúc lợi (TN). Đưa 5 biến quan sát thuộc nhân tố TN vào mục Items bên phải. Tiếp theo chọn vào Statistics…

Hướng dẫn sử dụng phần mềm SPSS

Trong tùy chọn Statistics, chúng ta tích vào các mục giống như hình. Sau đó chọn Continue để cài đặt được áp dụng.

Hướng dẫn sử dụng phần mềm SPSS

Sau khi click Continue, SPSS sẽ quay về giao diện ban đầu, chúng ta nhấp chuột vào OK để xuất kết quả ra Ouput:

Hướng dẫn sử dụng phần mềm SPSS

Kết quả kiểm định độ tin cậy thang đo Cronbach’s Alpha của nhóm biến quan sát TN như sau:

Hướng dẫn sử dụng phần mềm SPSS

 Kết quả kiểm định cho thấy các biến quan sát đều có hệ số tương quan tổng biến phù hợp (≥ 0.3). Hệ số Cronbach’s Alpha = 0.790 ≥ 0.6 nên đạt yêu cầu về độ tin cậy.

Chú thích các khái niệm:

• Cronbach’s Alpha: Hệ số Cronbach’s Alpha

• N of Items: Số lượng biến quan sát

• Scale Mean if Item Deleted: Trung bình thang đo nếu loại biến

• Scale Variance if Item Deleted: Phương sai thang đo nếu loại biến

• Corrected Item-Total Correlation: Tương quan biến tổng

• Cronbach’s Alpha if Item Deleted: Hệ số Cronbach’s Alpha nếu loại biến

Thực hiện tương cho từng nhóm biến còn lại. Chúng ta cần lưu ý ở nhóm biến “Điều kiện làm việc”, nhóm này sẽ có một biến quan sát bị loại.

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSSHướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

5.3 Phân tích nhân tố khám phá EFA

5.3.1 EFA và đánh giá giá trị thang đo

– Khi kiểm định một lý thuyết khoa học, chúng ta cần đánh giá độ tin cậy của thang đo (Cronbach’s Alpha) và giá trị của thang đo (EFA). Ở phần trước, chúng ta đã tìm hiểu về độ tin cậy thang đo, vấn đề tiếp theo là thang đo phải được đánh giá giá trị của nó. Hai giá trị quan trọng được xem xét trong phần này là giá trị hội tụ và giá trị phân biệt . (Hai giá trị quan trọng trong phân tích nhân tố khám phá EFA bao gồm: giá trị hội tụ và giá trị phân biệt. Trích nguồn từ: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 378.)

Hiểu một cách đơn giản:

1. Thỏa mãn “Giá trị hội tụ”: Các biến quan sát hội tụ về cùng một nhân tố.

2. Đảm bảo “Giá trị phân biệt”: Các biến quan sát thuộc về nhân tố này và phải phân biệt với nhân tố khác.

– Phân tích nhân tố khám phá, gọi tắt là EFA, dùng để rút gọn một tập hợp k biến quan sát thành một tập F (với F < k) các nhân tố có ý nghĩa hơn. Trong nghiên cứu, chúng ta thường thu thập được một số lượng biến khá lớn và rất nhiều các biến quan sát trong đó có liên hệ tương quan với nhau. Thay vì đi nghiên cứu 20 đặc điểm nhỏ của một đối tượng, chúng ta có thể chỉ nghiên cứu 4 đặc điểm lớn, trong mỗi đặc điểm lớn này gồm 5 đặc điểm nhỏ có sự tương quan với nhau. Điều này giúp tiết kiệm thời gian và kinh phí nhiều hơn cho người nghiên cứu.

5.3.2 Phân tích nhân tố khám phá EFA bằng SPSS

5.3.2.1 Các tiêu chí trong phân tích EFA

– Hệ số KMO (Kaiser-Meyer-Olkin) là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số của KMO phải đạt giá trị 0.5 trở lên (0.5 ≤ KMO ≤ 1) là điều kiện đủ để phân tích nhân tố là phù hợp. Nếu trị số này nhỏ hơn 0.5, thì phân tích nhân tố có khả năng không thích hợp với tập dữ liệu nghiên cứu.( Trị số của KMO phải đạt giá trị 0.5 trở lên là điều kiện đủ để phân tích nhân tố là phù hợp trích nguồn từ: Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008), Phân tích dữ liệu nghiên cứu với SPSS Tập 2, NXB Hồng Đức, trang 31)

– Kiểm định Bartlett (Bartlett’s test of sphericity) dùng để xem xét các biến quan sát trong nhân tố có tương quan với nhau hay không. Chúng ta cần lưu ý, điều kiện cần để áp dụng phân tích nhân tố là các biến quan sát phản ánh những khía cạnh khác nhau của cùng một nhân tố phải có mối tương quan với nhau. Điểm này liên quan đến giá trị hội tụ trong phân tích EFA được nhắc ở trên. Do đó, nếu kiểm định cho thấy không có ý nghĩa thống kê thì không nên áp dụng phân tích nhân tố cho các biến đang xem xét. Kiểm định Bartlett có ý nghĩa thống kê (sig Bartlett’s Test < 0.05), chứng tỏ các biến quan sát có tương quan với nhau trong nhân tố.1

– Trị số Eigenvalue là một tiêu chí sử dụng phổ biến để xác định số lượng nhân tố trong phân tích EFA. Với tiêu chí này, chỉ có những nhân tố nào có Eigenvalue ≥ 1 mới được giữ lại trong mô hình phân tích2. Ví dụ, bảng phía dưới cho thấy có 3 nhân tố trích được tại eigenvalue là 1.537. Nếu chúng ta trích thêm một nhân tố nữa (nhân tố thứ tư) thì eigenvalue lúc này là 0.900 < 1. Vì vậy, nếu dựa vào tiêu chí eigenvalue từ 1 trở lên, chúng ta dừng ở nhân tố thứ ba.

Hướng dẫn sử dụng phần mềm SPSS

– Tổng phương sai trích (Total Variance Explained) ≥ 50% cho thấy mô hình EFA là phù hợp. Coi biến thiên là 100% thì trị số này thể hiện các nhân tố được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến quan sát.

– Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại.

Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:

• Factor Loading ở mức  0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.

• Factor Loading ở mức  0.5: Biến quan sát có ý nghĩa thống kê tốt.

• Factor Loading ở mức  0.7: Biến quan sát có ý nghĩa thống kê rất tốt.

Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading cần phải phụ thuộc vào kích thước mẫu. Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau. Cụ thể, chúng ta sẽ xem bảng dưới đây:

Hướng dẫn sử dụng phần mềm SPSS

Trên thực tế áp dụng, việc nhớ từng mức hệ số tải với từng khoảng kích thước mẫu là khá khó khăn, do vậy người ta thường lấy hệ số tải 0.45 hoặc 0.5 làm mức tiêu chuẩn với cỡ mẫu từ 120 đến dưới 350; lấy tiêu chuẩn hệ số tải là 0.3 với cỡ mẫu từ 350 trở lên.

5.3.2.2 Thực hành trên SPSS 20 với tập dữ liệu mẫu

Lần lượt thực hiện phân tích nhân tố khám phá cho biến độc lập và biến phụ thuộc. Lưu ý, với các đề tài đã xác định được biến độc lập và biến phụ thuộc (thường khi vẽ mô hình nghiên cứu, mũi tên chỉ hướng 1 chiều từ biến độc lập hướng tới biến phụ thuộc chứ không có chiều ngược lại), chúng ta cần phân tích EFA riêng cho từng nhóm biến: độc lập riêng, phụ thuộc riêng. Việc cho biến phụ thuộc vào cùng phân tích EFA có thể gây ra sự sai lệch kết quả vì các biến quan sát của biến phụ thuộc có thể sẽ nhảy vào các nhóm biến độc lập một cách bất hợp lý.
Để thực hiện phân tích nhân tố khám phá EFA trong SPSS 20, chúng ta vào Analyze > Dimension Reduction > Factor…

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

thập phân, nếu chúng ta để Decimals về 0 sẽ không hợp lý lắm vì ta đã làm tròn về dạng số nguyên. Do vậy, chúng ta nên làm tròn 2 chữ số thập phân, nhìn vào kết quả sẽ hợp lý và tự nhiên hơn.

** Lưu ý 1: Cronbach’s Alpha và EFA giúp loại bỏ đi các biến quan sát rác, không có đóng góp vào nhân tố, và hoàn thiện mô hình nghiên cứu. Do tập dữ liệu mẫu ở đây không xảy ra tình trạng xuất hiện biến độc lập mới, hoặc một biến độc lập này lại bao gồm biến quan sát của biến độc lập khác nên mô hình nghiên cứu vẫn giữ nguyên tính chất ban đầu. Những trường hợp như giảm/tăng số biến độc lập, biến quan sát giữa các biến độc lập trộn lẫn vào nhau,… sẽ làm mất đi tính chất của mô hình ban đầu. Khi đó, chúng ta phải sử dụng mô hình mới được định nghĩa lại sau bước EFA để tiếp tục thực hiện các phân tích, kiểm định về sau mà không được dùng mô hình được đề xuất ban đầu.

** Lưu ý 2: Khi thực hiện hiện phân tích nhân tố khám phá, có nhiều trường hợp sẽ xảy ra ở bảng ma trận xoay như: biến quan sát nhóm này nhảy sang nhóm khác; xuất hiện số lượng nhân tố nhiều hơn ban đầu; số lượng nhân tố bị giảm so với lượng ban đầu; lượng biến quan sát bị loại bỏ do không thỏa điều kiện về hệ số tải Factor Loading quá nhiều… Mỗi trường hợp chúng ta sẽ có hướng xử lý khác nhau, có trường chúng ta chỉ mất ít thời gian và công sức. Tuy nhiên, cũng có những trường hợp khó, buộc chúng ta phải hủy toàn bộ số liệu hiện tại và thực hiện khảo sát lại từ đầu. Do vậy, để tránh những sự cố có thể kiểm soát được, chúng ta nên làm thật tốt các bước tiền xử lý SPSS. Đặc biệt là khâu chọn mô hình, chốt bảng câu hỏi khảo sát, chọn đối tượng/hoàn cảnh/thời gian khảo sát hợp lý và làm sạch dữ liệu trước khi xử lý.

5.4 Tương quan Pearson

Sau khi đã có được các biến đại diện độc lập và phụ thuộc ở phần phân tích nhân tố EFA, chúng ta sẽ tiến hành phân tích tương quan Pearson để kiểm tra mối quan hệ tuyến tính giữa các biến này.

5.4.1 Lý thuyết về tương quan và tương quan Pearson

– Giữa 2 biến định lượng có nhiều dạng liên hệ, có thể là tuyến tính hoặc phi tuyến hoặc không có bất kỳ một mối liên hệ nào.

Hướng dẫn sử dụng phần mềm SPSS

– Người ta sử dụng một số thống kê có tên là hệ số tương quan Pearson (ký hiệu r) để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa 2 biến định lượng (lưu ý rằng Pearson chỉ xét mối liên hệ tuyến tính, không đánh giá các mối liên hệ phi tuyến).

– Trong tương quan Pearson không có sự phân biệt vai trò giữa 2 biến, tương quan giữa biến độc lập với biến độc lập cũng như giữa biến độc lập với biến phụ thuộc.

5.4.2 Phân tích tương quan Pearson bằng SPSS

5.4.2.1 Một số tiêu chí cần biết

Tương quan Pearson r có giá trị dao động từ -1 đến 1:

• Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến về 1 là tương quan dương, tiến về -1 là tương quan âm.

• Nếu r càng tiến về 0: tương quan tuyến tính càng yếu.

• Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán Scatter như hình vẽ ở trên, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng.

• Nếu r = 0: không có mối tương quan tuyến tính. Lúc này sẽ có 2 tình huống xảy ra. Một, không có một mối liên hệ nào giữa 2 biến. Hai, giữa chúng có mối liên hệ phi tuyến.

Hướng dẫn sử dụng phần mềm SPSS

Bảng trên đây minh họa cho kết quả tương quan Pearson của nhiều biến đưa vào cùng lúc trong SPSS. Trong bảng kết quả tương quan Pearson ở trên:

• Hàng Pearson Correlation là giá trị r để xem xét sự tương thuận hay nghịch, mạnh hay yếu giữa 2 biến

• Hàng Sig. (2-tailed) là sig kiểm định xem mối tương quan giữa 2 biến là có ý nghĩa hay không. Sig < 0.05, tương quan có ý nghĩa; sig ≥ 0.05, tương quan không có ý nghĩa. Cần xem xét sig trước, nếu sig < 0.05 mới nhận xét tới giá trị tương quan Pearson r.

• Hàng N hiển thị cỡ mẫu của tập dữ liệu. Cụ thể trong bảng trên là 220.

5.4.2.2 Thực hành trên SPSS 20 với tập dữ liệu mẫu

Để thực hiện phân tích tương quan Pearson trong SPSS 20, chúng ta vào Analyze > Correlate > Bivariate…

Hướng dẫn sử dụng phần mềm SPSS

Tại đây, chúng ta đưa hết tất cả các biến muốn chạy tương quan Pearson vào mục Variables. Cụ thể là các biến đại diện được tạo ra sau bước phân tích EFA. Để tiện cho việc đọc số liệu, chúng ta nên đưa biến phụ thuộc lên trên cùng, tiếp theo là các biến độc lập. Sau đó, nhấp vào OK để xuất kết quả ra Output.

Hướng dẫn sử dụng phần mềm SPSS

**. Correlation is significant at the 0.01 level (2-tailed).

*. Correlation is significant at the 0.05 level (2-tailed).

 Sig tương quan Pearson các biến độc lập TN, CV, LD, MT, DT với biến phụ thuộc HL nhỏ hơn 0.05. Như vậy, có mối liên hệ tuyến tính giữa các biến độc lập này với biến HL. Giữa DT và HL có mối tương quan mạnh nhất với hệ số r là 0.611, giữa MT và HL có mối tương quan yếu nhất với hệ số r là 0.172.

 Sig tương quan Pearson giữa HL và DN lớn hơn 0.05, do vậy, không có mối tương quan tuyến tính giữa 2 biến này. Biến DN sẽ được loại bỏ khi thực hiện phân tích hồi quy tuyến tính bội.

 Các cặp biến độc lập đều có mức tương quan khá yếu với nhau, như vậy, khả năng cao sẽ không có hiện tượng đa cộng tuyến xảy ra1.

5.5 Hồi quy đa biến

5.5.1 Lý thuyết về hồi quy tuyến tính

– Khác với tương quan Pearson, trong hồi quy các biến không có tính chất đối xứng như phân tích tương quan. Vai trò giữa biến độc lập và biến phụ thuộc là khác nhau. X và Y hay Y và X có tương quan với nhau đều mang cùng một ý nghĩa, trong khi đó với hồi quy, ta chỉ có thể nhận xét: X tác động lên Y hoặc Y chịu tác động bởi X.

– Đối với phân tích hồi quy tuyến tính bội, chúng ta giả định các biến độc lập X1, X2, X3 sẽ tác động đến biến phụ thuộc Y. Ngoài X1, X2, X3… còn có rất nhiều những nhân tố khác ngoài mô hình hồi quy tác động đến Y mà chúng ta không liệt kê được.

5.5.2 Phân tích hồi quy đa biến bằng SPSS

5.5.2.1 Các tiêu chí trong phân tích hồi quy đa biến

– Giá trị R2 (R Square), R2 hiệu chỉnh (Adjusted R Square) phản ánh mức độ giải thích biến phụ thuộc của các biến độc lập trong mô hình hồi quy. R2 hiệu chỉnh phản ánh sát hơn so với R2. Mức dao động của 2 giá trị này là từ 0 đến 1, tuy nhiên việc đạt được mức giá trị bằng 1 là gần như không tưởng dù mô hình đó tốt đến nhường nào. Giá trị này thường nằm trong bảng Model Summary. Cần chú ý, không có sự giới hạn giá trị R2, R2 hiệu chỉnh ở mức bao nhiêu thì mô hình mới đạt yêu cầu, 2 chỉ số này nếu càng tiến về 1 thì mô hình càng có ý nghĩa, càng tiến về 0 thì ý nghĩa mô hình càng yếu. Thường chúng ta chọn mức tương đối là 0.5 để làm giá trị phân ra 2 nhánh ý nghĩa mạnh/ý nghĩa yếu, từ 0.5 đến 1 thì mô hình là tốt, bé hơn 0.5 là mô hình chưa tốt. Đây là con số nhắm chừng chứ không có tài liệu chính thức nào quy định, nên nếu bạn thực hiện phân tích hồi quy mà R2 hiệu chỉnh nhỏ hơn 0.5 thì mô hình vẫn có giá trị.

– Giá trị sig của kiểm định F được sử dụng để kiểm định độ phù hợp của mô hình hồi quy. Nếu sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và có thể sử đụng được. Giá trị này thường nằm trong bảng ANOVA.

– Trị số Durbin – Watson (DW) dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau). DW có giá trị biến thiên trong khoảng từ 0 đến 4; nếu các phần sai số không có tương quan chuỗi bậc nhất với nhau thì giá trị sẽ gần bằng 2, nếu giá trị càng nhỏ, gần về 0 thì các phần sai số có tương quan thuận; nếu càng lớn, gần về 4 có nghĩa là các phần sai số có tương quan nghịch.

Theo Field (2009), nếu DW nhỏ hơn 1 và lớn hơn 3, chúng ta cần thực sự lưu ý bởi khả năng rất cao xảy ra hiện tượng tự tương quan chuỗi bậc nhất. Theo Yahua Qiao (2011), thường giá trị DW nằm trong khoảng 1.5 – 2.5 sẽ không xảy ra hiện tượng tự tương quan, đây cũng là mức giá trị tiêu chuẩn chúng ta sử dụng phổ biến hiện nay. 1

Để đảm bảo chính xác, chúng ta sẽ tra ở bảng thống kê Durbin-Watson (có thể tìm bảng thống kê DW trên Internet). Giá trị này thường nằm trong bảng Model Summary.

Hướng dẫn sử dụng phần mềm SPSS

Hệ số k’ là số biến độc lập đưa vào chạy hồi quy, N là kích thước mẫu. Nếu N của bạn là một con số lẻ như 175, 214, 256, 311…. mà bảng tra DW chỉ có các kích thước mẫu làm tròn dạng 150, 200, 250, 300, 350… thì bạn có thể làm tròn kích thước mẫu với giá trị gần nhất trong bảng tra. Ví dụ: 175 làm tròn thành 200; 214 làm tròn 200; 256 làm tròn 250, 311 làm tròn 300…

– Giá trị sig của kiểm định t được sử dụng để kiểm định ý nghĩa của hệ số hồi quy. Nếu sig kiểm định t của hệ số hồi quy của một biến độc lập nhỏ hơn 0.05, ta kết luận biến độc lập đó có tác động đến biến phụ thuộc. Mỗi biến độc lập tương ứng với một hệ số hồi quy riêng, do vậy mà ta cũng có từng kiểm định t riêng. Giá trị này thường nằm trong bảng Coefficients.

– Hệ số phóng đại phương sai VIF dùng để kiểm tra hiện tượng đa cộng tuyến. Thông thường, nếu VIF của một biến độc lập lớn hơn 10 nghĩa là đang có đa cộng tuyến xảy ra với biến độc lập đó. Khi đó, biến này sẽ không có giá trị giải thích biến thiên của biến phụ thuộc trong mô hình hồi quy2. Tuy nhiên, trên thực tế, nếu hệ số VIF > 2 thì khả năng rất cao đang xảy ra hiện tượng đa cộng tuyến giữa các biến độc lập. Giá trị này thường nằm trong bảng Coefficients.

– Kiểm tra các giả định hồi quy, bao gồm phần dư chuẩn hóa và liên hệ tuyến tính:

• Kiểm tra vi phạm giả định phần dư chuẩn hóa: Phần dư có thể không tuân theo phân phối chuẩn vì những lý do như: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích… Vì vậy, chúng ta cần thực hiện nhiều cách khảo sát khác nhau. Hai cách phổ biến nhất là căn cứ vào biểu đồ Histogram và Normal P-P Plot. Đối với biểu đồ Histogram, nếu giá trị trung bình Mean gần bằng 0, độ lệch chuẩn gần bằng 1, ta có thể khẳng định phân phối là xấp xỉ chuẩn. Đối với biểu đồ Normal P-P Plot, nếu các điểm phân vị trong phân phối của phần dư tập trung thành 1 đường chéo, như vậy, giả định phân phối chuẩn của phần dư không bị vi phạm.

• Kiểm tra vi phạm giả định liên hệ tuyến tính: Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem, dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không. Nếu phần dư chuẩn hóa phân bổ tập trung xunh quanh đường hoành độ 0, chúng ta có thể kết luận giả định quan hệ tuyến tính không bị vi phạm.

5.5.2.2 Thực hành trên SPSS 20 với tập dữ liệu mẫu

Sau tương quan Pearson, chúng ta còn 5 biến độc lập là TN, CV, LD, MT, DT. Thực hiện phân tích hồi quy tuyến tính bội để đánh giá sự tác động của các biến độc lập này đến biến phụ thuộc HL.

Để thực hiện phân tích hồi quy đa biến trong SPSS 20, chúng ta vào Analyze > Regression > Linear…

Hướng dẫn sử dụng phần mềm SPSSHướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Hướng dẫn sử dụng phần mềm SPSS

Nếu bạn không có nhiều kinh nghiệm trong việc làm bài trên phần mềm SPSS? Bạn cần đến dịch vụ phân tích định lượng để giúp mình xóa bỏ những rắc rối về lỗi gây ra khi không sử dụng thành thạo phần mềm này?

Khi gặp khó khăn về vấn đề phân tích kinh tế lượng hay gặp vấn đề về chạy SPSS, hãy nhớ đến Tổng đài tư vấn luận văn 1080, nơi giúp bạn giải quyết những khó khăn mà chúng tôi đã từng trải qua.