Kobariantza

Estatistikan, kobariantza bi aldagai kuantitatiboen arteko baterako aldakortasuna jasotzen duen estatistiko bat da: aldagai baten balio handietarako, bestean balio handiak gertatzen direnean, eta lehenengoaren balio txikietarako, bestean balio txikiak, kobariantza positiboa da; aitzitik, aldagai baten balio handietarako, bestean balio txikiak gertatzen direnean (eta alderantziz), kobariantza negatiboa da. Labur esanda eta zehatzago, kobariantzak bi aldagaien kuantitatiboen arteko korrelazio linealaren norabidearen neurri bat da: linealki, aldagai batek gora egitean besteak ere gora egiten duenean, kobariantza positiboa da; eta bateak gora egitean, besteak behera egiten duenean, kobariantza negatiboa da. Kobariantzak ez du ordea ezer adierazten korrelazio horren sendotasun edo intentsitateari buruzko informaziorik ematen.

(x_1,y_1),(x_2,y_2),\ldots,(x_n,y_n) bi dimentsioko datuetarako (adibidez, (x_i,y_i) balio bikoteek pertsona ezberdinen pisuak eta altuerak adieraz ditzakete), honela adierazi eta kalkulatzen da kobariantza:

    \[cov(x,y)=s_{xy}=\cfrac{\sum (x_i-\overline{x})(y_i-\overline{y})}{n}=\cfrac{\sum x_iy_i}{n}-\overline{x}\overline{y}\]

Kobariantza bi zorizko aldagaien baterako probabilitate-banaketarako ere kalkula daiteke, hasieran aipaturiko esanahi berdinarekin. Kasu horretan ordea, datu kopuruen ordez probabilitateak hartu behar dira kontuan. Honela kalkulatzen da bi zorizko aldagaien baterako banaketen kasuan:

    \[cov(x,y)=E[(x-\mu_x)(y-\mu_y)]\]

Ikus, gainera