Pārskats par periodu: 2019. gada oktobris - 2019. gada decembris

 

Aktivitātes WP1 ietvaros:

T.1.1.1:

Tiek turpināts darbs pie ietvara arhitektūras izstrādes. Atbilstoši iepriekš izstrādātajai arhitektūrai, sistēmai ir divas komponentes. Viena datu pārsūtīšanai no treniņprogrammas uz ietvaru un šai komponentei ir izstrādāts modelis, ka paredz sadarbību ar ietvaru, izmantojot sešu komandu modeli. Otrai komponentei, kas paredz treniņprocesu pārlūkošanu, testēta un papildināta lietotāju saskarne, kas tiek programmistiski realizēta aktivitātē T1.2.1.

T.1.2.1:

Tiek turpināts darbs pie dziļās mašīnmācīšanas eksperimentu pārvaldības ietvara funkcionalitātes izstrādes. Ir realizēts funkcionējošs ietvara prototips, kas ļauj izveidot jaunu eksperimentu - projektu, pievienot šim projektam apmācības procesā izmantojamās datu kopas (treniņdatu kopa, testa datu kopa, validācijas datu kopa), ietvarā ir iespēja protokolēt notiekoša eksperimenta gaitu (izveidot ''log'' ierakstus un saglabāt eksperimenta gaitas metadatus), kā arī ir iespēja saglabāt eksperimentā izmantojamos failus.
Ir uzsākti
T2.4.1 uzdevuma lietojamības un funkcionalitātes testi. Tiek plānots darbs pie lietotāja definētu paplašinājumu mehānisma, ar kura palīdzību būtu iespējama ietvara paplašināšana ar lietotāja definēto funkcionalitāti un pielāgošana konkrētajam lietojumam. Tiek plānota arī sistēmas lietotāju pārvaldības un autorizācijas izveidošana.

T.1.3.1:

Ir izstrādāta publikācijas sākotnējā versija, tiek precizēti publikācijas beigu versijas teksti un vizuālais noformējums (attēli, ekrānuzņēmumi, utt.). Publikāciju ir plānots iesniegt konferencei DB&IS 2020.

T.1.3.2:

Ir uzsākts darbs pie publikācijas par ietvara realizāciju, tiek izstrādāts publikācijas plāns.

 

Aktivitātes WP2 ietvaros:

T.2.1:

Tiek turpināts darbs pie attēlu aprakstu ģenerēšanas, kuras pamatversija tika izstrādāta iepriekšējos projekta mēnešos. Šajā periodā ir veikta personu atpazīšanas pēc to sejām attēlos izpēte . Tieši mazpazīstamu personu atpazīšana attēlos ir svarīgākā praktiskā problēma LETA ziņu aģentūrā un šobrīd projektā tiek pētīts, kā šo problēmu risināt.
Seju atpazīšanas risinājumam tika aprobētas vairakas pieejas un tika izvēlēta Python Face_recognition bibliotēka, uz kuras bāzes tika veikti eksperimenti ar LETA ziņu arhīva attēliem un pazīstamu cilvēku portretiem. Pamatsecinājums bija, ka minētā pieeja darbojas labi un vienīgā prasība ir, lai references portreti būtu ar augstu izšķirtspēju, frontāli un vienai personai būtu iespējami fairāk references portretu. Atbilstoši šiem secinājumiem šobrīd kopā ar LETA strādājam pie references portretu kopas izveides.

T.2.2:

Uzsākts darbs pie ziņu rakstiem atbilstošu attēlu ieteikšanas komponentes. Ir izveidota datu kopa ar ziņu rakstiem un tiem atbilstošajiem attēliem. Ir veikts pirmais eksperiments, kur tika pārbaudīta "embedding" pieeja. Ar šo pieeju ziņu raksti un attēli tiek pārveidoti par vektoriem. Pēc tam ziņu raksta vektoram tiek piemeklēti tuvākie attēlu vektori. Plānots uzsākt eksperimentu, kur tiktu veikta ziņu rakstu semantiskā analīze un tad piemeklēti tuvākie attēlu vektori.

 

Aktivitātes WP3 ietvaros:

Sabiedrības informēšana notiek izmantojot Twitter kontu (https://twitter.com/imcs_dl), kur tiek publicētas gan projekta, gan pasaules mēroga aktualitātes. Informācija par projekta gaitu tiek ievietota projekta vietnē (https://syslab.lumii.lv/projects/erafprojects/dzilas-mm-modelu-projekts).

Dziļās mašīnmācīšanās modeļu projekta jaunumi