Làm thế nào để tôi thực hiện hồi quy tuyến tính trên dữ liệu?

Làm thế nào để tôi thực hiện hồi quy tuyến tính trên dữ liệu?
Anonim

Câu trả lời:

Bạn cần xem câu trả lời đầy đủ để hiểu

Giải trình:

Tôi hoàn toàn không biết ý của bạn là gì trước tiên bạn lấy tập dữ liệu của mình nơi bạn hồi quy y trên x để tìm cách thay đổi hiệu ứng x.

x y

1 4

2 6

3 7

4 6

5 2

Và bạn muốn tìm mối quan hệ giữa x và y vì vậy hãy nói rằng bạn tin rằng mô hình giống như

# y = mx + c #

hoặc trong số liệu thống kê

# y = beta_0 + beta_1x + u #

những # beta_0, beta_1 # là các tham số trong dân số và # u # là tác động của các biến không quan sát được gọi là thuật ngữ lỗi vì vậy bạn muốn các công cụ ước tính # hatbeta_0, hatbeta_1 #

Vì thế # haty = hatbeta_0 + hatbeta_1x #

Điều này cho bạn biết rằng các hệ số dự đoán sẽ cung cấp cho bạn giá trị y dự đoán.

Vì vậy, bây giờ bạn muốn tìm ước tính tốt nhất cho các đồng hiệu quả này, chúng tôi thực hiện điều này bằng cách tìm chênh lệch thấp nhất giữa giá trị y thực tế và dự đoán.

#min sum_ (i = 1) ^ nhatu_i ^ 2 ~ hatbeta_0, hatbeta_1 #

Về cơ bản, điều này nói rằng bạn muốn tối thiểu tổng của sự khác biệt giữa các giá trị y chính và giá trị y dự đoán cho đường hồi quy của bạn

Vì vậy, các công thức để tìm thấy chúng là

# hatbeta_1 = (sum_ (i = 1) ^ n (x_i- barx) (y_i-bary)) / (sum_ (i = 1) ^ n (x_i-barx) ^ 2) #

# hatbeta_0 = bary-hatbeta_1barx #