Iako je optičko prepoznavanje znakova (OCR) uglavnom riješen problem, uvijek ima mjesta za poboljšanja, pogotovo kod obrade povijesnih dokumenata i slika slabije kvalitete. Koristeći pristup CTC, duboki modeli temeljeni na povratnim neuronskim mrežama su uspješno primijenjeni na probleme označavanja sekvenci, kao što je prepoznavanje teksta. Danas često korištena arhitektura neuronskih mreža, koja spaja konvolucijske i povratne slojeve s izlazima CTC i odgovarajućim gubitkom, je isprobana na većem javno dostupnom skupu podataka i na drugom manjem skupu koji je dobiven skeniranjem izabranih knjiga. Drugi skup je označen koristeći aplikaciju s grafičkim korisničkim sučeljem koja je razvijena u sklopu ovog rada i služi za poluautomatsko označa...