An innovative data mining procedure, using clean algorithm and factor analysis, for irregularly sampled temporal environmental data sets


Δημοσιευμένα: Jan 1, 2007
Λέξεις-κλειδιά:
Αλγόριθμος CLEAN μετασχηματισμός Fourier παραγοντική ανάλυση περιβαλλοντικά δεδομένα
E. Fakiris
G. Papatheodorou
P. Panagiotopoulos
Περίληψη

Οι περιβαλλοντικές βάσεις δεδομένων συχνά αντιμετωπίζουν τα προβλήματα της άτακτης δειγματοληψίας στον χρόνο και της έλλειψης μετρήσεων για κάποιες περιόδους. Το γεγονός αυτό εμποδίζει τη χρήση των κλασικών μεθόδων ανάλυσης χρονοσειρών, οι οποίες απαιτούν σταθερό χρονικό βήμα ενώ ταυτόχρονα τα χρονικά κενά εισάγουν δυσκολίες στην χρήση των περισσοτέρων μεθόδων πολυδιάστατης σταπστικής ανάλυσης. Η παρούσα εργασία προτείνει ένα πλήρες μεθοδολογικό σχήμα ανάλυσης χρονικών περιβαλλονπκών δεδομένων με δειγματοληπτική ανομοιογένεια, στο οποίο γίνεται χρήση του αλγορίθμου CLEAN και της Παραγοντικής ανάλυσης (Factor Analysis). Ο αλγόριθμος CLEAN έχει την ικανότητα να αναπλάθει τις αρχικές χρονοσειρές της βάσης δεδομένων χρησιμοποιώντας φασματική ανάλυση και να δημιουργεί καινούργιες με σταθερό χρονικό βήμα και έλλειψη κενών. Λαμβάνει χώρα δηλαδή τόσο συμπλήρωση των κενών τ?/ς βάσης, όσο και «εξυγίανση» της δειγματοληψίας της. Η παραγοντική ανάλυση ομαδοποιεί τις μεταβλητές, ανάλογα με τον περιβαλλοντικό μηχανισμό από τον οποίο κάθε μια ελέγχεται και επιπλέον αποκαλύπτει τη χαρακτηριστική χρονική διακύμανση της κάθε ομάδας. Το συγκεκριμένο μεθοδολογικό σχήμα εφαρμόστηκε με πλήρη επιτυχία σε μια βάση υδροχημικών δεδομένων μεγάλης χρονικής περιόδου (1980-94) στον ποταμό Στρυμόνα

Λεπτομέρειες άρθρου
  • Ενότητα
  • New Technologies in Geophysical and Geological Research
Λήψεις
Αναφορές
Baisch, S., and Bokelman, G.H.R., 1999. Spectral analysis with incomplete time series: an example from seismology, Computers & Geosciences, 25, 739-750.
Davis, J.C., 1986. Statistics and data analysis in geology, Wiley, New York, 647pp.
Drehar, J.W., Robert, D.H., and Lehar, J., 1986. Very large array observations of rapid nonperiodic variations in OJ287, Nature, 320, 239-242.
Duvall, T.L., Jr., and Harvey, J.W. 1984. Rotational frequency splitting of solar oscillations, Nature, 310, 19-22.
Heslop, D., and Dekkers, M.J., 2002. Spectral analysis of unevenly spaced climatic time series using CLEAN: signal recovery and derivation of significance levels using a Monte Carlo simulation, Physics of the Earth and Planetary Interiors ,130, 103-116.
Mitikka, S., and Ekholm, P., 2003. Lakes in the Finnish Eurowaternet: Status and trends, The Science of the Total Environment, 310 37^15
Negi, J.G., Tiwari, R.K., and Rao, K.N.N., 1996. Clean periodicity in secular variations of dolomite abundance in deep marine sediments, Marine Geology, 133, 113-121.
Oliver, M.A., Webster, R., Edwards, K.J., and Whittington, G., 1997. Multivariate autocorrelation and spectral analyses of a pollen profile from Scotland and evidence for periodicity, Review of Palaeobotany and Palynology, 96, 121-144.
Papatheodorou, G., et al., 2006. A long-term study of temporal hydrochemical data in a shallow lake using multivariate statistical techniques, Ecological Modelling, 193, 759-776.
Raike, Α., Pietilainen, O.-P., Rekolainen, S., Kauppila, P., Pitkanen, H., Niemi, J., Raateland, Α., and Vuorenmaa, J., 2002. Trends of phosphorus, nitrogen and chlorophyll a concentrations in Finnish rivers and lakes in 1975 -2000, The Science of the Total Environment, 310 (2003) 47 -59.
Ritzi, R.W., Wright, S.L., Mann, B., and Chen, M., 1993. Analysis of Temporal Variability in Hydrogeochemical Data Used for Multivariate Analysis, Ground Water, 31(2), 221-229.
Robert, D.H., Lehar, J., and Drever. J.W. 1987. Time series analysis with clean derivation of spectra, Astron. J., 93, 968-989.
Schulz, M., and Stattegger, K., 1997. Spectrum: spectral analysis of unevenly spaced paleoclimatic time series, Computers & Geosciences, 23(9). 929-945.
Spangenberg, Α., and Bredemeier, M., 1999. Application of spectral analysis to meteorological and soil solution chemistry data, Chemosphere, 39(10), 1651-1665.
Stefanakos, Ch. N., and Athanasoulis, G.A.. 2001. A unified methodology for the analysis, completion and simulation of nonstationary time series with missing values, with application to wave data, Applied ocean research, 23, 207-220
Suk, H., and Lee, K.K., 1999. Characterization of a Ground Water Hydrochemical System through Multivariate Analysis: Clustering into Ground Water Zones. Ground Water, 37(3), 358-366.
Tiwari, R.K., and Rao, K.N.N., (1999) Solar and tidal reverberarions of déglaciation records from the tropical western Pacific: a clean spectral approach, Geofizika, 16-17, 33-41.
Vio, R., Christiannis, Lossi O., and Provenzale, Α., (1992) Time series analysis in astronomy: An application to quasar variability studies, Astron. J., 391, 518-530.
Τα περισσότερο διαβασμένα άρθρα του ίδιου συγγραφέα(s)