Đây là dòng cung cấp sự phù hợp gần nhất giữa các biến nếu có mối tương quan tuyến tính.
Thí dụ:
Trong công việc là một giáo viên, tôi có cảm giác rằng những học sinh đạt điểm cao môn Toán cũng đạt điểm cao môn Vật lý và ngược lại.
Vì vậy, tôi đã tạo một biểu đồ phân tán trên biểu đồ trong Excel, trong đó x = Maths và y = Vật lý, trong đó mỗi học sinh được biểu thị bằng một dấu chấm.
Tôi nhận thấy rằng bộ sưu tập các điểm trông giống như một hình dạng sigar thay vì ở khắp mọi nơi (cái sau có nghĩa là Không có mối tương quan nào cả).
Và sau đó tôi đã làm hai điều:
(1) Tôi đã tính hệ số tương quan (mức cao)
(2) Tôi đã rút ra "dòng phù hợp nhất"
Cái sau là đường hồi quy và thậm chí bạn có thể có một phương trình gắn liền với nó.
Từ điều này, bạn có thể đưa ra dự đoán hợp lý ít nhiều về điểm này từ điểm kia, tùy thuộc vào mức độ tương quan tốt như thế nào (tương quan là một môn học khác).
Ghi chú:
Có rất nhiều 'buts' và 'ifs'. Đối với một điều bạn phải chắc chắn hợp lý chắc chắn mối tương quan là tuyến tính.