Tại sao giá trị R-Squared không biểu thị bất cứ điều gì về quan hệ nhân quả?

Tại sao giá trị R-Squared không biểu thị bất cứ điều gì về quan hệ nhân quả?
Anonim

Câu trả lời:

Bình phương R cho biết dữ liệu quan sát phù hợp với dữ liệu dự kiến như thế nào nhưng nó chỉ cung cấp cho bạn thông tin về tương quan.

Giải trình:

Giá trị bình phương R cho biết mức độ dữ liệu quan sát của bạn hoặc dữ liệu bạn đã thu thập phù hợp với xu hướng dự kiến. Giá trị này cho bạn biết sức mạnh của mối quan hệ, nhưng, giống như tất cả các bài kiểm tra thống kê, không có gì được đưa ra cho bạn biết nguyên nhân đằng sau mối quan hệ hoặc sức mạnh của nó.

Trong ví dụ dưới đây, chúng ta có thể thấy biểu đồ bên trái không có mối quan hệ nào, như được biểu thị bằng giá trị bình phương R thấp. Biểu đồ bên phải có mối quan hệ rất mạnh, như được biểu thị bằng giá trị bình phương R là 1. Trong các biểu đồ này, chúng ta không thể biết điều gì cuối cùng gây ra mối quan hệ này.

Tương quan không có nghĩa là nhân quả. Các giá trị X của bạn có thể ảnh hưởng rất tốt đến các giá trị Y của bạn, nhưng các yếu tố khác có thể xảy ra hoặc mối quan hệ có thể là do tình cờ. Bạn có thể suy luận nguyên nhân, nhưng đây là giải thích của bạn và nó không thể được chứng minh bằng thử nghiệm thống kê. Có giá trị bình phương R cao vẫn chỉ cho bạn biết sức mạnh của mối quan hệ chứ không phải nguyên nhân của nó.

Để chứng minh nhân quả là một nhiệm vụ rất lớn. Nếu bạn muốn hiểu nhân quả, đặt cược tốt nhất của bạn là thông qua các thí nghiệm.