Contribuţii privind utilizarea sistemelor inteligente hibride în extragerea de cunoştinţe de predicţie din cantităţi mari de date
Dată
2010Autor
Crăciun, Marian Viorel
Abstract
Lucrarea de faţă pune accentul pe modelarea predictivă ca parte componentă a procesului de extragere de cunoştinţe din date şi propune o completare a modelului meţionat anterior astfel încât acesta să poată fi folosit şi în cadrul construcţiei de modele predictive folosind date cu valori numerice. Tehnicile de modelare predictivă se reduc la determinarea unei relaţii funcţionale capabile să descrie cat mai fidel datele de antrenare şi să extrapoleze cu o eroare cât mai mică în cazul unor date noi. Cunoştinţele descoperite în cadrul acestui proces pot fi descrise pe de o parte,
explicit, prin intermediul unor formule matematice riguroase şi pe de altă parte, implicit, prin intermediul valorilor concrete obţinute pentru un set de date de intrare. Aceste cunoştinţe pot fi evaluate în ceea ce priveşte acurateţea şi performanţa prin intermediul erorii de predicţie şi scorului de predictivitate - o măsură a capacităţii modelului de a fi (re)utilizat pentru modelarea predictivă. Pentru a evalua scorul de predictivitate, mai ales în cazul datelor cu valori numerice, este propus un algoritm care extinde algoritmii din familia Relief ulilizali pentru evaluarea calităţii atributelor în contextul valorilor celorlalte atribute.