Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Semi-supervised learning in Optical Music Recognition
Název práce v češtině: Automatické rozpoznávání notových zápisů s využitím neanotovaných dat
Název v anglickém jazyce: Semi-supervised learning in Optical Music Recognition
Klíčová slova: optické rozpoznávání notopisů|semi-supervised učení|hluboké neuronové sítě
Klíčová slova anglicky: optical music recognition|semi-supervised learning|deep neural network
Akademický rok vypsání: 2021/2022
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Pavel Pecina, Ph.D.
Řešitel: Mgr. Jiří Mayer - zadáno a potvrzeno stud. odd.
Datum přihlášení: 24.02.2022
Datum zadání: 24.02.2022
Datum potvrzení stud. oddělením: 04.03.2022
Datum a čas obhajoby: 07.06.2022 09:00
Datum odevzdání elektronické podoby:05.05.2022
Datum odevzdání tištěné podoby:16.05.2022
Datum proběhlé obhajoby: 07.06.2022
Oponenti: RNDr. Milan Straka, Ph.D.
 
 
 
Zásady pro vypracování
Úloha automatického rozpoznávání notových zápisů (Optical Music Recognition) se zabývá převodem obrazových dat obsahujících notový zápis (tištěný nebo ručně psaný) do strojově čitelné reprezentace s cílem hudbu dále zpracovat (přehrát, editovat, tisknout). Současné přístupy založené na hlubokém učení využívají tzv. učení s učitelem (supervised learning), které vyžaduje značné množství anotovaných dat. Anotovaných dat je ovšem v oboru nedostatek (hlavně pro ručně psané notopisy) a tak se běžně využívají techniky augmentace dat nebo popřípadě jejich úplné syntézy. V jiných oblastech počítačového vidění (např. rozpoznávání textu) se již využívá částečné učení s učitelem (semi-supervised learning), které dokáže k trénování navíc využít i data bez anotací. Cílem práce je prozkoumat semi-supervised učení v kontextu rozpoznávání hudby a porovnat ho s výsledky klasického supervised učení.
Seznam odborné literatury
Aviad Aberdam, Ron Litman, Shahar Tsiper, Oron Anschel, Ron Slossberg, Shai Mazor, R. Manmatha, Pietro Perona: Sequence-to-Sequence Contrastive Learning for Text Recognition. In: 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021, pp. 15297-15307.

Alireza Makhzani, Jonathon Shlens, Navdeep Jaitly, Ian Goodfellow: Adversarial Autoencoders In: arXiv, 2015, https://arxiv.org/abs/1511.05644
 
Univerzita Karlova | Informační systém UK