Multimodal Summarization
Název práce v češtině: | Multimodální Sumarizace |
---|---|
Název v anglickém jazyce: | Multimodal Summarization |
Klíčová slova: | sumarizace|textová sumarizace|modelování vidění a jazyka|multimodální data |
Klíčová slova anglicky: | summarization|text summarization|vision-language modeling|multimodal data |
Akademický rok vypsání: | 2020/2021 |
Typ práce: | disertační práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Pavel Pecina, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 08.09.2020 |
Datum zadání: | 08.09.2020 |
Datum potvrzení stud. oddělením: | 05.10.2020 |
Datum a čas obhajoby: | 27.09.2024 13:00 |
Datum odevzdání elektronické podoby: | 15.07.2024 |
Datum odevzdání tištěné podoby: | 15.07.2024 |
Datum proběhlé obhajoby: | 27.09.2024 |
Oponenti: | Dr. Mohamed Hasanuzzaman |
prof. Dr. Adam Jatowt | |
Zásady pro vypracování |
Multimodal summarization is the task of automatic construction of summaries of information resources in multimodal formats such as texts, images, videos and audios. The goal of the thesis is to study the recent advances in the area of multimodal summarization, explore possible data sets for training and evaluation, and advance the state of the art by proposing and evaluating new methods and applications. |
Seznam odborné literatury |
Ian Goodfellow, Yoshua Bengio and Aaron Courville. Deep Learning. MIT Press. 2016
Zhu, Junnan et al. “MSMO: Multimodal Summarization with Multimodal Output.” EMNLP 2018 Junnan Zhu, Yu Zhou, Jiajun Zhang, Haoran Li, Chengqing Zong, Changliang Li: Multimodal Summarization with Guidance of Multimodal Reference. AAAI 2020: |