Aktivitātes WP1 ietvaros:
Uz dziļās mašīnmācīšanās un regresijām balstīto metožu izstrādi “unlabelled” proteomikas datu kvantitatīvai prognozēšanai var uzskatīt par pamatā pabeigtu. Tiek turpināts darbs pie datu normalizācijas un prognozēšanas rezultātu interpretācijas metožu izstrādes, kas ļautu labāk salīdzināt rezultātus datu kopām ar dažādu (un salīdzinoši lielu) audu vai šūnu tipu skaitu (kas pamatā saistīts ar grūtībām atšķirt N/A vērtības (par kuram vienkārši nav datu) ar zemām izmērītajām koncentrāciju vērtībām proteomikas datu kopās).
Žurnālā “Baltic Journal of Modern Computing” ir publicēts iepriekšējā pārskata periodā iesniegtais raksts (vol.7:2, pp.271-292, 2019); žurnāls tiek indeksēts Web of Science datu bāzē.
Aktivitātes WP2 ietvaros:
Pilnveidota metode nozīmīgāko metriku identifikācijai, kas vislabāk ļauj atšķirt dažādos hematopoētisko šūnu tipus PCHi-C mijiedarbību datos. Šobrīd ir identificēta sešu metriku kopa Base6, kura nodrošina augstu atšķiramības pakāpi un vienlaicīgi iekļauj no topoloģiskā viedokļa vienkārši definētas metrikas (sakarīgo un divsakarīgo komponenšu skaits un to izmēri, neliela izmēra kliķu skaits, ciklu skaits garumā 2), kuru bioloģisko lomu/nozīmību ir salīdzinoši vienkārši validēt. Uzsākta bioloģiskā validācija izmantojot FANTOM5 un gēnu ekspresijas datu kopas.
Izstrādāts precīzs matemātisks formālisms PCHi-C mijiedarbības grafu komponenšu struktūras analīzei, kā arī algoritms to automātiskai identifikācijai.
Projekta aktivitātes rezultāti tika prezentēti vienā no prestižākajām bioinformātikas konferencēm ISMB/ECCB 2019 (apakšsekcijā "Regulatory and Systems Genomics", Bāzelē, 2019. gada jūlijā).
Par projekta aktivitātes rezultātiem sagatavots raksts, kas iesniegts prezentēšanai konferencē "The 30th International Conference on Genome informatics" (GIW/ABACBS 2019) un publicēšanai žurnālā "BMC Bioinformatics" (izdevums tiek indeksēts Scopus un Web of Science datu bāzēs, citēšanas indekss sasniedz vismaz 50 procentus no nozares vidējā citēšanas indeksa).
Tāpat par projekta aktivitātes rezultātiem sagatavots raksts, kas iesniegts publicēšanai izdevumā Springer izdevumā “Communications in Computer and Information Science” (tiek indeksēts Scopus datu bāzē, citēšanas indekss sasniedz vismaz 50 procentus no nozares vidējā citēšanas indeksa).
Aktivitātes WP3 ietvaros:
Pilnveidota uz randomizētu grafu analīzi balstīta metode, lai izvērtētu vairāku (FFL, divu veidu DFFL un to vispārinātās formas) gēnu regulācijas motīvu saistību ar paralogo un onologo gēnu pāriem. Šobrīd izstrādātā metode ir pielietojama (salīdzinoši nedaudziem) gēnu pāriem, kas ir zināmie transkripcijas faktori. Uzsākts darbs pie tās vispārināšanas un/vai alternatīvas metodoloģijas izstrādes, kas ļautu analizēt visus S.cerevisiae homoloģijas kartēs iekļautos gēnu pārus.
Projekta aktivitātes rezultāti tika prezentēti vienā no prestižākajām bioinformātikas konferencēm ISMB/ECCB 2019 (apakšsekcijā "Evolution and Comparative Genomics", Bāzelē, 2019. gada jūlijā).
Projekta aktivitātes rezultāti ir publicēti žurnālā "BMC Bioinformatics" (vol.20:296, 2019); izdevums tiek indeksēts Scopus un Web of Science datu bāzēs, citēšanas indekss sasniedz vismaz 50 procentus no nozares vidējā citēšanas indeksa.
Tāpat par projekta aktivitātē iegūtajiem rezultātiem ir būtiski pilnveidots iepriekšējā atskaites periodā sagatavotais raksts, kas šobrīd iesniegts prezentēšanai konferencē "The 10th International Conference on Computational Systems-Biology and Bioinformatics" (CSBio 2019), kā arī publicēšanai šīs konferences rakstu krājumā (ACM konferenču rakstu krājumu izdevumā, kurš tiek indeksēts Scopus datu bāzē).
Aktivitātes WP4 ietvaros:
WP2 ietvaros atrastu Base6 kopas metriku iespējamās bioloģiskās nozīmības validācijai sagatavota PCHi-C mijiedarbības grafu noklājošā FANTOM5 transkripcijas faktoru piesaistes apgabalu aktivitātes datu kopa (pieejama par 11 no 17 šūnu tipiem), ka arī pieejamā BLUEPRINT gēnu ekspresijas datu apakškopa.
WP3 ietvaros S.cerevisiae gēnu regulācijas tīkla analīzei tiek papildināta ar kvantitavīem gēnus raksturojošiem datiem (gēnu, proteīnu un promoteru virkņu līdzība), kā arī šogad YEASTRACT datu bāzē publicēto informāciju par prognozēto regulācijas saišu kvalitatīvo raksturojumu (apkārtājās vides ietekme, regulācijas tips, pārliecības līmenis).
Aktivitātes WP5 ietvaros:
WP2 ietvaros implementēts jauns algoritms komponenšu automatizētai identifikācijai PCHi-C tīklos (sagatavots kā pielikums iesniegtajai publikācijai un publicēts GitHub repozitorijā https://github.com/IMCS-Bioinformatics/PCHiCNetworkExplorer).
Pilnveidotas un adaptētas jaunajai Base6 kopai metodes metriku un to statistiskās nozīmības aprēķiniem hromatīva interakcijas grafos (attiecīgi papildinot GitHub repozitoriju https://github.com/IMCS-Bioinformatics/HiCGraphAnalysis). WP3 ietvaros pilnveidots algoritms gēnu regulācijas motīvu evolūcijas analīzei (attiecīgi papildinot GitHub repozitoriju).