Ho una serie di coppie di numeri X e Y che sono in qualche modo correlati in proporzione diretta
ad esempio età e peso di n persone a caso fra 0 e 16 anni. È chiaro che i giovanissimi tendono ad essere più leggeri di quelli grandi, ma c'è comunque variabilità.
ipotizziamo: Regressione lineare
idea, potrebbe essere: Grafico con excel (scatter) su un asse età e sull altro il peso. Usa la funzione di interpolazione o approssimazione ad una retta (se non ricordo male ha diverse opzioni). Ti trovi la retta che la descrive e da quella hai una relazione biunivoca età peso
altra idea, statisticamente. Solo dall'idea di:
Penso che tutto dipenda da n.
Se n è piccolo, saputa l'età del nuovo arrivato, l'indicatore migliore è forse la media aritmetica dei pesi di quegli individui che hanno la stessa età del nuovo.
Se n è grande, il discorso è simile ma l'indicatore migliore è probabilmente dato da una distribuzione gaussiana degli individui del campione aventi la stessa età del nuovo.
Un'altra idea, potrebbe essere:
La via maestra è quella di costruire una funzione parametrica che restituisce un vettore Zi, calcolare gli scarti Wi = Zi - Yi, calcolare la "lunghezza" del vettore Wi (col teorema di Pitagora generalizzato a n "dimensioni"), variare i parametri a manina cercando un minimo mettendo in scherzosa competizione gli studenti, cercare il minimo tramite il risolutore di Excel, mostrargli che nel caso della regressione lineare questo coincide. Il tutto accompagnato da grafici che vanno apprezzare visivamente i miglioramenti.
Idea al di fuori di regressione lineare, la migliore approssimazione del legame tra le due variabili potrebbe essere anche non lineare, cioè non una retta ma una curva. Un grafico potrebbe aiutarti a capire il tipo di legame