Úloha automatického rozpoznávání notových zápisů (Optical Music Recognition) se zabývá převodem obrazových dat obsahujících notový zápis (tištěný nebo ručně psaný) do strojově čitelné reprezentace s cílem hudbu dále zpracovat (přehrát, editovat, tisknout). Současné přístupy založené na hlubokém učení využívají tzv. učení s učitelem (supervised learning), které vyžaduje značné množství anotovaných dat. Anotovaných dat je ovšem v oboru nedostatek (hlavně pro ručně psané notopisy) a tak se běžně využívají techniky augmentace dat nebo popřípadě jejich úplné syntézy. V jiných oblastech počítačového vidění (např. rozpoznávání textu) se již využívá částečné učení s učitelem (semi-supervised learning), které dokáže k trénování navíc využít i data bez anotací. Cílem práce je prozkoumat semi-supervised učení v kontextu rozpoznávání hudby a porovnat ho s výsledky klasického supervised učení.
Seznam odborné literatury
Aviad Aberdam, Ron Litman, Shahar Tsiper, Oron Anschel, Ron Slossberg, Shai Mazor, R. Manmatha, Pietro Perona: Sequence-to-Sequence Contrastive Learning for Text Recognition. In: 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021, pp. 15297-15307.