Estandarizazioa (estatistika)

Estatistikan, estandarizazioa edo estandarketa aldagai bateko datuen unitatea edo eskala aldatzea da, beste aldagaietako datuekin alderatu ahal izateko. Ohikoena Z estandarizazioa  da, datu bakoitzari aldagaiaren batezbestekoa kenduz eta emaitza desbideratze estandarrarekin zatituz:

    \[z=\frac{x-\overline{x}}{s_x}\]

Z datu estandartuek batezbestekotik zenbat desbideratze estandar desbideratzen diren adierazten dute. Adibidez z=2 emaitzak, dagokion datuak batezbestekotik bi desbideratze estandarretara dagoela adierazten du.

Z estandarizazioa oinarrizko eragiketa ere bada banaketa normalean: estandarizazioak edozein N(\mu,\sigma) banaketako probabilitate N(0,1) banaketa normal estandarreko probabilitatearen bitartez kalkulatzea ahalbidetzen du.

Z estandarizazioa ez da estandartzeko metodo bakarra. 0-1 estandarizazioa esaterako, datuak 0-1 eskala batean ezartzen ditu, transformazio honen bitartez:

    \[x_{0-1}=\frac{x-x_{max}}{x_{max}-x_{min}}\]

.

 


Artikulu hau honela aipatu: Sarasola, Josemari, "Estandarizazioa (estatistika)"; Gizapedian, iraila 13, 2018, https://gizapedia.hirusta.io/estandarizazioa-estatistika/.