Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Semi-supervised learning in Optical Music Recognition

Název práce v češtině:	Automatické rozpoznávání notových zápisů s využitím neanotovaných dat
Název v anglickém jazyce:	Semi-supervised learning in Optical Music Recognition
Klíčová slova:	optické rozpoznávání notopisů\|semi-supervised učení\|hluboké neuronové sítě
Klíčová slova anglicky:	optical music recognition\|semi-supervised learning\|deep neural network
Akademický rok vypsání:	2021/2022
Typ práce:	diplomová práce
Jazyk práce:	angličtina
Ústav:	Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel:	doc. RNDr. Pavel Pecina, Ph.D.
Řešitel:	Mgr. Jiří Mayer - zadáno a potvrzeno stud. odd.
Datum přihlášení:	24.02.2022
Datum zadání:	24.02.2022
Datum potvrzení stud. oddělením:	04.03.2022
Datum a čas obhajoby:	07.06.2022 09:00
Datum odevzdání elektronické podoby:	05.05.2022
Datum odevzdání tištěné podoby:	16.05.2022
Datum proběhlé obhajoby:	07.06.2022
Oponenti:	RNDr. Milan Straka, Ph.D.

Zásady pro vypracování

Úloha automatického rozpoznávání notových zápisů (Optical Music Recognition) se zabývá převodem obrazových dat obsahujících notový zápis (tištěný nebo ručně psaný) do strojově čitelné reprezentace s cílem hudbu dále zpracovat (přehrát, editovat, tisknout). Současné přístupy založené na hlubokém učení využívají tzv. učení s učitelem (supervised learning), které vyžaduje značné množství anotovaných dat. Anotovaných dat je ovšem v oboru nedostatek (hlavně pro ručně psané notopisy) a tak se běžně využívají techniky augmentace dat nebo popřípadě jejich úplné syntézy. V jiných oblastech počítačového vidění (např. rozpoznávání textu) se již využívá částečné učení s učitelem (semi-supervised learning), které dokáže k trénování navíc využít i data bez anotací. Cílem práce je prozkoumat semi-supervised učení v kontextu rozpoznávání hudby a porovnat ho s výsledky klasického supervised učení.

Seznam odborné literatury

Aviad Aberdam, Ron Litman, Shahar Tsiper, Oron Anschel, Ron Slossberg, Shai Mazor, R. Manmatha, Pietro Perona: Sequence-to-Sequence Contrastive Learning for Text Recognition. In: 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021, pp. 15297-15307.

Alireza Makhzani, Jonathon Shlens, Navdeep Jaitly, Ian Goodfellow: Adversarial Autoencoders In: arXiv, 2015, https://arxiv.org/abs/1511.05644