Author/Editor | Curk, Tomaž; Zupan, Blaž; Vidmar, Gaj | |
Title | Razvrščanje profilov izražanja genov z metodami strojnega učenja | |
Translated title | Classification of gene expression profiles with machine learning | |
Type | članek | |
Source | Inform Med Slov Print ed | |
Vol. and No. | Letnik 8, št. 1 | |
Publication year | 2003 | |
Volume | str. 69-80 | |
Language | slo | |
Abstract | The recently developed DNA microarray technology provides a way to measure expression profiles of a large number of genes and assign functions to genes. Given prior knowledge on gene functions and the microarray data, one can build models that predict functions of genes based on their expression profiles. We demonstrate on two genetic data sets that machine learning methods are suitable for induction of such prediction models. Surprisingly, naive Bayesian method proved at least as accurate but much faster than the currently prevailing support vector machines. We also present a new method for qualitative modelling of gene expression profiles, which makes less accurate predictions but it may be very useful for visualization of gene expression profiles. | |
Summary | Nedavno razvita tehnologija mikromrež DNK omogoča opazovanje časovne aktivnosti (profilov izražanja) večjega števila genov, kar nam lahko pomaga pri določanj u funkcije genov. V primeru, da za določen nabor genov njihovo funkcijo že poznamo, lahko iz podatkov gradimo modele, ki napovejo funkcijo genov na podlagi njihovih časovnih aktivnosti. Na dveh zbirkah podatkov smo pokazali, da so metode strojnega učenja primerne za indukcijo napovednih modelov funkcij genov. Navkljub splošnemu prepričanju na področju bioinformatike, da je za obravnavo tovrstnih podatkov najprimernejša metoda podpornih vektorjev, smo pokazali, da dosti bolj preprosta in časovno veliko bolj učinkovita metoda naivnega Bayesa dosega podobne oziroma celo boljše rezultate. Razvili smo tudi novo metodo kvalitativnega modeliranja profilov izražanja genov, ki se je v napovedih izkazala za manj točno, lahko pa uspešno služi za vizualizacijo aktivnosti genov v času. | |
Descriptors | GENE EXPRESSION REGULATION, FUNGAL ARTIFICIAL INTELLIGENCE BAYES THEOREM DECISION MAKING, COMPUTER-ASSISTED DECISION TREES SACCHAROMYCES CEREVISIAE DICTYOSTELIUM |