Avendo le due variabili, l'equazione della retta interpolante (o perequatrice tra i punti noti)
La b al numeratore riporta la formula della covarianza tra x e y, mentre al numeratore è la definizione di varianza di x.
a e b sono i coefficienti della retta di regressione. Ora la b è semplicemente pari al rapporto tra la covarianza di x e y e la varianza di x. Ora la covarianza sai che per definizione può essere vista come il valore atteso del prodotto delle variabili aleatorie meno il prodotto dei valori attesi delle v a . A denominatore hai la varianza che è uguale al valore atteso del quadrato della v aleatoria meno il quadrato del valore atteso. Ora la retta di regressione ha equazione y= bx + a. Ora se espliciti rispetto ad a ottieni a= y-bx. Ora moltiplica la media di x per il coefficiente b che è uguale a tutta quella roba lì è ottieni l'intercetta a. Quello riportato si chiama sistema delle equazioni normali.