Aktivitātes WP1 ietvaros:
Uz dziļās mašīnmācīšanās balstītā metode proteīnu ekspresijas līmeņa prognozēšanai ir papildināta ar iespēju aprēķināt katram gēnam specifiskus koeficientus, kas ar neironu tīkliem izskaitļotās prognozes ļauj aprēķināt arī ar katram gēnam piešķirto specifisko lineāro izteiksmi. Veikti eksperimenti, kuros cilvēka gēniem piešķirtie koeficienti (izmantojot Pandey/Uhlen audu tipiem specifiskos datus) tiek pielietoti proteīnu ekspresijas aprēķināšanai homologajiem peles gēniem tiem pašiem audu tipiem (Huttlin et al un E-GEOD-43721 dati), kuri apstiprina hipotēzi, ka gēnam specifiskie uz GO balstītie koeficienti var tikt izmantoti arī proteīnu ekspresijas prognozēšanai citu organismu homologajos gēnos, iegūstot būtiski labākas prognozes salīdzinot ar uz regresijas metodēm balstītajām.
Aktivitātes WP2 ietvaros:
Izstrādāts efektīvs algoritms bioloģiski ‘nozīmīgu’ komponenšu atrašanai PCHi-C hromatīna interakcijas grafos. Algoritms pielietots lai izanalizētu komponenšu struktūra PCHi-C interakciju grafiem, kas ir specifiski 17 dažādiem hematopoētisko šūnu tipiem (Javierre et al datu kopa). Veikta atrasto komponenšu bioloģiskās nozīmības validācija balstoties FANTOM5 un gēnu ekspresijas datiem, iegūtie rezultāti apstiprina, ka vienas komponentes ietvaros gēniem ir statistiski nozīmīga gēnu ekspresijas paternu līdzība.
Par projekta aktivitātes rezultātiem sagatavots raksts, kas pieņemts publicēšanai izdevumā BMC Bioinformatics (tiek indeksēts Scopus datu bāzē, citēšanas indekss sasniedz vismaz 50 procentus no nozares vidējā citēšanas indeksa) un prezentēšanai konferencē GIW/ABACBS 2019.
Aktivitātes WP3 ietvaros:
Tālāk attīstīta (papildinot ar konkrētiem gēnu regulācijas tīkliem specifiskiem šabloniem) uz paterniem un grafletiem balstīta metode paralogo un onologo gēnu pāru identifikācijai balstoties uz gēnu regulācijas tīklu topoloģija. Šobrīd jau iegūti samērā labi rezultāti, kas ļauj sagaidīt, ka ir izstrādāto metodi būs iespējams ar augstu precizitāti prognozēt visus S.cerevisiae homoloģijas kartēs iekļautos gēnu pārus (iepriekš izstrādātai metodes variants bija tiešā veidā pielietojams tikai salīdzinoši nedaudziem gēnu pāriem, kas ir zināmie transkripcijas faktori).
Par projekta aktivitātes rezultātiem sagatavots raksts, kas pieņemts publicēšanai izdevumā ACM konferenču rakstu krājumā (tiek indeksēts Scopus datu bāzē) un prezentēšanai konferencē The 10th International Conference on Computational Systems-Biology and Bioinformatics (CSBio 2019).
Aktivitātes WP4 ietvaros:
WP1 “unlabelled” proteomikas pētījumu ietvaros izmantotās datu kopas ir papildinātas ar nesen publicētajiem proteīnu ekspresijas datiem 29 dažādiem cilvēka audu tipiem (Kuster et al). Balstoties uz SwissProt datubāzē publicētajiem datiem atjaunotas GO datu kopas cilvēka un peles genomu anotācijai. Šīs datu kopas tiks izmantotas šobrīd gatavotajā publikācijā, kuru plānots iesniegt izdevumā Proteomics.
WP2 un WP3 pētījumos izmantoto/iegūto ieejas un validācijas/eksperimentu rezultātu datu kopu sagatavošana ir pamatā pabeigta un tās būs pieejamas kā papildmateriāli sagatavotajām publikācijām.
Aktivitātes WP5 ietvaros:
WP1 ietvaros izstrādātā un GitHub repozitorijā jau iepriekš publicētā programmatūra “unlabelled” proteomikas datu analīzei ir papildināta un GitHub repozitorijā tiks atjaunināta pirms šobrīd gatavotās publikācijas iesniegšanas.
Šobrīd tiek papildināta WP3 ietvaros izstrādātā programmatūra gēnu regulācijas motīvu evolūcijas analīzei, un GitHub repozitorijā tiks atjaunināta pirms plānotās publikācijas iesniegšanas.
WP2 ietvaros plānotās programmatūras izstrādi var uzskatīt par pabeigtu, tā ir publicēta GitHub repozitorijā kā pielikums BMC Bioinformatics https://github.com/IMCS-Bioinformatics/PCHiCNetworkExplorer).