Aktivitātes WP1 ietvaros:
Formulēti divi atšķirīgi bioloģiski nozīmīgi proteīnu koncentrāciju prognozēšanas uzdevumi: 1) koncentrāciju prognozēšana konkrētam gēnam visiem dotajiem audu vai šūnu kultūru tipiem, un 2) koncentrāciju prognozēšana konkrētam audu vai šūnu kultūru tipam visiem dotajiem gēniem. Koncentrāciju prognozēšana konkrētam gēnam pamatā pabeigta Gene Ontology nozīmes izvērtēšana veicot prognozēšanu ar DL neironu tīkliem Pandey/Uhlen datu kopai par 12 audu tipiem. Koncentrāciju prognozēšana konkrētam audu vai šūnu kultūru tipam parādīta DL metožu noderība gan Pandey/Uhlen, gan normalizētajai COREAD/Genetech datu kopai, kā arī konstatēts, ka Gene Ontology anotācijas prognožu rezultātus uzlabo nedaudz.
Uzsākta iespēju izpēte gēnu anotācijas papildināt ar gēnu regulācijas datiem un izvērtēt to noderību koncentrāciju prognozēšanai.
Aktivitātes WP2 ietvaros:
Izstrādātas vairākas alternatīvas iespējas BLEUPRINT projekta HiC hromatīna interakciju datus attēlot ar grafveida struktūrām un izanalizētas iegūto grafu metrikas. Uzsākta jau zināmo grafu analīzes algoritmu izpēte, izvērtējot to noderību apakšstruktūru (paternu) meklēšanai hromatīnu interakcijas grafos, kā arī atrasto paternu statistiskās nozīmības izvērtēšanai.
Aktivitātes WP3 ietvaros:
Veikta S.cerevisiae 6270 gēniem atbilstošo proteīnu homoloģijas analīze un iegūta visu proteīnu virkņu pāru līdzības matrica. Uzsākta iespēju izpēte no šīs līdzības matricas iegūt t.s. “homoloģijas karti” – divdaļīgu grafu, kas pēc iespējas labāk atdala evolūcijas laikā dublicēto gēnu pārus.
Aktivitātes WP4 ietvaros:
Veikta COREAD/Genetech CCLE datu kopās iekļauto gēnu anotācija ar no Swiss-Prot datubāzes iegūstamo informāciju par šiem gēniem atbilstošajiem proteīniem. Uzsākta ENCODE projekta ietvaros publicēto gēnu regulācijas datu analīze un piemērotāko datu kopu izvēle gēnu kopu papildus anotācijai. Uzsākta nesen publicēto ChIP-seq datu kopu izpēte par S.cerevisiae gēnu regulāciju un to piemērotības izvērtēšana projektu pētījumu veikšanai.
Aktivitātes WP5 ietvaros:
Izstrādāta uz DL metodēm balstīta programmatūra koncentrāciju prognozēšanai konkrētam audu vai šūnu kultūru tipam. Izstrādāts programmatūras modulis proteīnu visu pāru līdzības matricas konstruēšanai dotai proteīnu virkņu kopai. Papildināti programmatūras moduļi grafu reprezentāciju konstruēšanai no HiC un ChIP-chip datu kopām.