Webová aplikace pro analýzu mluvčích českého parlamentu z dat kolekce ParCzech
Název práce v češtině: | Webová aplikace pro analýzu mluvčích českého parlamentu z dat kolekce ParCzech |
---|---|
Název v anglickém jazyce: | A web application for analyzing speakers in the Czech Parliament using data from the ParCzech collection |
Klíčová slova: | webová aplikace|parlamentní data|analýza mluvčích a projevů |
Klíčová slova anglicky: | web application|parliamentary data|speaker and speech analysis |
Akademický rok vypsání: | 2024/2025 |
Typ práce: | bakalářská práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Mgr. Barbora Vidová Hladká, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 31.07.2024 |
Datum zadání: | 31.07.2024 |
Datum potvrzení stud. oddělením: | 31.07.2024 |
Konzultanti: | Bc. Matyáš Kopp |
Zásady pro vypracování |
ParCzech je kolekce dat z Poslanecké sněmovny PČR, zahrnující stenozáznamy a audionahrávky parlamentních projevů, včetně informací o mluvčích a parlamentních organizacích (kluby, komise). Stenozáznamy obsahují časové značky synchronizované s audionahrávkami a automaticky označené pojmenované entity (jména osob, geografické názvy, názvy institucí aj.). Kolekce ParCzech slouží k analýze parlamentního diskurzu a výzkumu politických témat.
Cílem bakalářské práce je vytvořit nad kolekcí ParCzech webovou aplikaci, která umožní analýzu parlamentních mluvčích a jejich promluv. Dílčí cíle práce jsou tyto: 1. Implementovat webovou aplikaci s přívětivým uživatelským rozhraním: (a) Základem backendu aplikace bude ParlaStat 1.0 (Bačo, 2024); (b) Webové rozhraní bude navrženo tak, aby uživatelé mohli intuitivně vytvářet dotazy nad kolekcí ParCzech bez technické zátěže. Aplikace nabídne možnosti výběru, jako jsou různé kolekce a časová období; (c) Výsledky dotazů budou vhodně vizualizovány pro lepší přehlednost a analýzu dat. 2. Vytvořit inspirativní a snadno pochopitelnou uživatelskou nápovědu pro užívání aplikace. 3. Navrhnout a implementovat sadu vhodných automatických testů pro zajištění správné funkčnosti a ladění systému. |
Seznam odborné literatury |
1. Bačo Matěj. ParlaStat 1.0 - Statistická analýza českých parlamentních dat. Ročníkový projekt. MFF UK. https://github.com/ufal/ParlaStats/tree/v1.0.0. 2024.
2. Erjavec Tomaž, Kopp Matyáš, Ljubešić Nikola et al. ParlaMint II: Advancing Comparable Parliamentary Corpora Across Europe,PREPRINT (Version 1) available at Research Square [https://doi.org/10.21203/rs.3.rs-4176128/v1], 2024. 3. Erjavec Tomaž et al. The ParlaMint corpora of parliamentary proceedings. Language Resources and Evaluation, vol. 57, no. 1, pp. 415-448. 2023. 4. Kopp Matyáš. ParCzech 4.0. LINDAT/CLARIAH-CZ digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University, http://hdl.handle.net/11234/1-5360. 2024. 5. Kopp Matyáš, Stankov Vladislav, Krůza Jan Oldřich, Straňák Pavel, Bojar Ondřej. ParCzech 3.0: A Large Czech Speech Corpus with Rich Metadata. In Proceedings of the 24th International Conference on Text, Speech and Dialogue, pp. 293-304.Springer, Cham, Switzerland. 2021. |
Předběžná náplň práce |
ParCzech is a data collection from the Chamber of Deputies of the Czech Republic, featuring stenographic records and audio recordings of parliamentary speeches, along with details about speakers and parliamentary organizations (such as committees and commissions). The stenographic records include timestamps synchronized with the audio recordings and automatically labeled named entities, e.g. personal names, geographical locations, institution names. The ParCzech collection is intended for analyzing parliamentary discourse and research on political topics.
The aim of this bachelor's thesis is to create a web application utilizing the ParCzech collection, which will facilitate the analysis of parliamentary speakers and their speeches. The specific objectives of the thesis are: 1. Develop a web application with an intuitive user interface: (a) The application's backend will utilize ParlaStat 1.0 (Bačo, 2024); (b) The web interface will be designed to enable users to easily create queries on the ParCzech collection without technical difficulty. The application will provide options to select various collections and time periods; (c) Query results will be effectively visualized for improved clarity and data analysis. 2. Create a user guide that is both engaging and straightforward to ensure easy navigation of the application. 3. Create and run an automated test suite to confirm the application's functionality and support debugging efforts. |