Datu-meatzaritza

Datu-meatzaritza, maiz ingelesezko data mining izenez ere ezaguna, datu-multzo handietan patroiak edo informazio baliagarria atzemateko tekniken multzoa da, aurrez datu horietarako moldatzen den eredu edo teknikarik planteatu gabe. Horrela, datu-meatzaritza bigarren mailako azterketarekin dago loturik, non datu-multzoei ez zaie ezartzen eredu jakinik, lehen mailako azterketan ez bezala, non datu-multzoari teknika jakin bat aplikatzen zaion, datuetan aurki daitezkeen patroiak teknika horren emaitzetara moldatuz.

Era gutxiesgarrian, datu-multzoetan arrantza egitea dela ere aipatu da zenbaiten aldetik,  datu-multzoetan teknika hau eta hura aplikatzea delakoan,  informazio interesgarriren bat aurkitu delako esperantzan.  Izan ere, maiz datu-multzoetan aurkitzen diren erregulartasunak zoriaren emaitza besterik ez dira, eta ez dute adierazten errealitatea den bezala. Helburua, beraz, esanguratsuak eta errealitatean benetan existitzen diren erlazioak eta ezberdintasunak aurkitzea da, bereziki datu-multzo handietan zoriz aurki daitezkeen emaitzak baztertuz.

Bibliografia:

Data mining: Statistics and More? David J. Hand

The American Statistician

Vol. 52, No. 2 (May, 1998), pp. 112-118