PROGETTO E REALIZZAZIONE DI ALGORITMI DI CLUSTERING PER IL TRATTAMENTO DI GROSSE MOLI DI DATI MULTI-DIMENSIONALI

[Total: 0    Average: 0/5]

I dati multi-dimensionali hanno sempre rappresentato una sfida per le tecniche di clustering. Le dimensioni dei database, l’elevata dimensionalità dei dati e la loro dispersione intrinseca sono gli aspetti che rendono più difficile l’applicazione degli algoritmi, abbattendone le prestazioni in termini di tempo e/o di accuratezza. Gli sforzi dei ricercatori per affrontare questi problemi hanno recentemente portato all’evoluzione delle tecniche e all’introduzione di proposte innovative. Con questa tesi di laurea sono state realizzate applicazioni software che implementano due diversi algoritmi orientati al clustering di grosse moli di dati multi-dimensionali. I programmi sono stati testati sia su dati artificiali che su dati reali. In uno dei casi inoltre è stata realizzata una variante dell’algoritmo implementato che lo rende efficace anche in presenza di matrici dei dati sparse.