Među središnjim problemima bioinformatike je rekonstrukcija genoma. Manji dijelovi genoma, zvani očitanjima, trebaju biti sastavljena u potpuni genom. Očitanja se međusobno preklapaju u svrhu određivanja onih koja su zaista susjedna u originalnom genomu. Alati za rekonstrukciju ponekad uzimaju u obzir preklapanja koja u stvarnom genome ne postoje, ili propuste točna preklapanja. Ovaj rad nastoji klasificirati takva očitanja u točno pozitivnu, lažno pozitivnu ili lažno negativnu klasu. Koristi brojčane i tekstualne značajke preklapanja, poput sličnosti, dužine preklapanja i CIGAR niza. U sklopu rada predstavljeno je nekoliko arhitektura dubokih modela, poput neuronske mreže i transformatora za obradu jezika.One of the biggest problems in bio...