2018.gada jūlijs - septembris (28.09.2018)

Aktivitātes WP1 ietvaros:
Pamatā pabeigta t.s. metožu izstrāde t.s. “unlabelled” proteomikas datu kvantitatīvai prognozēšanai. Izstrādāti pieci, uz
regresijām balstīti, prognozēšanas modeļi M0 - M4, kā arī dziļās mašīnmācīšanās prognozēšanas modelis, kas izmanto uz ontoloģijām
balstītas gēnu anotācijas (šobrīd izmantotas GO un KEGG, bet metode pieļauj praktiski jebkādu ontoloģiju izmantošanu).
Izvērtēta GO anotāciju salīdzinošā ietekme uz prognozēšanas precizitāti.

Projekta rezultāti tika prezentēti konferencē DB&IS 2018 (Viļņā, 2018. gada jūlijā), kā arī vienā no prestižākajām
bioinformātikas konferencēm ECCB 2018 (Atēnās, 2018. gada septembrī).

Sagatavots un publicēts raksts:
E.Celms, K.Cerans, K.Freivalds, P.Kikusts, L.Lace, G.Melkus, M.Opmanis, D.Rituma, P.Rucevskis, J.Viksna.
Application of graph clustering and visualisation methods to analysis of biomolecular data. Communications in Computer
and Information Science 838, 243-257, 2018.

Aktivitātes WP2 ietvaros:
Izveidota vairāku (pašreizējā variantā 34) metriku kopa hromosomu mijiedarbību aprakstošo grafu topoloģijas raksturošanai,
un izvērtēta šo metriku statistiskā nozīmība hematopoētisko šūnu tipu (tiek pētīti 17 dažādi šūnu tipi) atšķirību noteikšanai,
no šīs kopas atlasītas 11 statistiski izteikti nozīmīgākās metrikas – t.s. Base11 kopa; sīkāk izanalizēta Base11
metriku salīdzinošā nozīmība, ja tiek izmatotas dažādi definētas distances starp šūnu tipiem, vai, ja analīzei tiek
izmantoti tikai atsevišķu hromosomu dati.

Izpētīta uz PCHi-C interakcijām konstruēto grafu topoloģija un konstatēts, ka tā ir pamatā balstīta uz savstarpēji
nesaistītam komponentēm, kurām sagaidāms, ka var būt izteikta bioloģiskā nozīme. Veikta vairāku šādu komponenšu manuālā
analīze, kurām šī hipotēze tika apstiprināta.

Projekta rezultāti tika prezentēti vienā no prestižākajām bioinformātikas konferencēm ECCB 2018 (Atēnās, 2018. gada spetembrī).

Aktivitātes WP3 ietvaros:
S.cerevisae gēnu regulācijas tīklam uzsākta divu divdaļīgu apakštīklu salīdzināšana, meklējot tajos kopīgus
regulācijas šablonus. Divdaļīgie apakštīkli konstruēti eksperimentos izmantoto transkripcijas faktoru apakškopai,
(ap 120 gēnu), un divām dažādām prognozēto gēnu dublikātu (“ohnologues”) kopām (katrā ap 530 gēnu).

Izveidots grafu modelis E.coli gēnu regulācijas tīklam izmantojot RegulonDB publicētās datu kopas.

Aktivitātes WP4 ietvaros:
Sagatavotas normalizētas proteomikas un transkriptomikas datu kopas, kas izmanto attiecīgi Pandey/Uhlen un NCI60 datus,
kā arī cilvēka genoma GO anotāciju datu kopu. Datu kopas ir publicētas GitHub repozitorijā:
https://github.com/IMCS-Bioinformatics/UnlabelledProteomicsImputation.

Sagatavota anotēta PCHi-C datu kopa, kas apraksta hromatīna interakciju topoloģiju. Kopā ar grafu vizualizācijas komponentēm
tā ir publicēta GitHub repozitorijā: https://github.com/IMCS-Bioinformatics/HiCGraphAnalysis.

Aktivitātes WP5 ietvaros:
Pamatā pabeigta programmatūras izstrāde “unlabelled” proteomikas datu analīzei; programmas komponentes ir pieejamas GitHub
repozitorijā: https://github.com/IMCS-Bioinformatics/UnlabelledProteomicsImputation.