Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 384)
Detail práce
   Přihlásit přes CAS
Webová aplikace pro analýzu mluvčích českého parlamentu z dat kolekce ParCzech
Název práce v češtině: Webová aplikace pro analýzu mluvčích českého parlamentu z dat kolekce ParCzech
Název v anglickém jazyce: A web application for analyzing speakers in the Czech Parliament using data from the ParCzech collection
Klíčová slova: webová aplikace|parlamentní data|analýza mluvčích a projevů
Klíčová slova anglicky: web application|parliamentary data|speaker and speech analysis
Akademický rok vypsání: 2024/2025
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Mgr. Barbora Vidová Hladká, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 31.07.2024
Datum zadání: 31.07.2024
Datum potvrzení stud. oddělením: 31.07.2024
Konzultanti: Bc. Matyáš Kopp
Zásady pro vypracování
ParCzech je kolekce dat z Poslanecké sněmovny PČR, zahrnující stenozáznamy a audionahrávky parlamentních projevů, včetně informací o mluvčích a parlamentních organizacích (kluby, komise). Stenozáznamy obsahují časové značky synchronizované s audionahrávkami a automaticky označené pojmenované entity (jména osob, geografické názvy, názvy institucí aj.). Kolekce ParCzech slouží k analýze parlamentního diskurzu a výzkumu politických témat.

Cílem bakalářské práce je vytvořit nad kolekcí ParCzech webovou aplikaci, která umožní analýzu parlamentních mluvčích a jejich promluv. Dílčí cíle práce jsou tyto:

1. Implementovat webovou aplikaci s přívětivým uživatelským rozhraním: (a) Základem backendu aplikace bude ParlaStat 1.0 (Bačo, 2024); (b) Webové rozhraní bude navrženo tak, aby uživatelé mohli intuitivně vytvářet dotazy nad kolekcí ParCzech bez technické zátěže. Aplikace nabídne možnosti výběru, jako jsou různé kolekce a časová období; (c) Výsledky dotazů budou vhodně vizualizovány pro lepší přehlednost a analýzu dat.
2. Vytvořit inspirativní a snadno pochopitelnou uživatelskou nápovědu pro užívání aplikace.
3. Navrhnout a implementovat sadu vhodných automatických testů pro zajištění správné funkčnosti a ladění systému.
Seznam odborné literatury
1. Bačo Matěj. ParlaStat 1.0 - Statistická analýza českých parlamentních dat. Ročníkový projekt. MFF UK. https://github.com/ufal/ParlaStats/tree/v1.0.0. 2024.
2. Erjavec Tomaž, Kopp Matyáš, Ljubešić Nikola et al. ParlaMint II: Advancing Comparable Parliamentary Corpora Across Europe,PREPRINT (Version 1) available at Research Square [https://doi.org/10.21203/rs.3.rs-4176128/v1], 2024.
3. Erjavec Tomaž et al. The ParlaMint corpora of parliamentary proceedings. Language Resources and Evaluation, vol. 57, no. 1, pp. 415-448. 2023.
4. Kopp Matyáš. ParCzech 4.0. LINDAT/CLARIAH-CZ digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University, http://hdl.handle.net/11234/1-5360. 2024.
5. Kopp Matyáš, Stankov Vladislav, Krůza Jan Oldřich, Straňák Pavel, Bojar Ondřej. ParCzech 3.0: A Large Czech Speech Corpus with Rich Metadata. In Proceedings of the 24th International Conference on Text, Speech and Dialogue, pp. 293-304.Springer, Cham, Switzerland. 2021.
Předběžná náplň práce
ParCzech is a data collection from the Chamber of Deputies of the Czech Republic, featuring stenographic records and audio recordings of parliamentary speeches, along with details about speakers and parliamentary organizations (such as committees and commissions). The stenographic records include timestamps synchronized with the audio recordings and automatically labeled named entities, e.g. personal names, geographical locations, institution names. The ParCzech collection is intended for analyzing parliamentary discourse and research on political topics.

The aim of this bachelor's thesis is to create a web application utilizing the ParCzech collection, which will facilitate the analysis of parliamentary speakers and their speeches. The specific objectives of the thesis are:

1. Develop a web application with an intuitive user interface: (a) The application's backend will utilize ParlaStat 1.0 (Bačo, 2024); (b) The web interface will be designed to enable users to easily create queries on the ParCzech collection without technical difficulty. The application will provide options to select various collections and time periods; (c) Query results will be effectively visualized for improved clarity and data analysis.
2. Create a user guide that is both engaging and straightforward to ensure easy navigation of the application.
3. Create and run an automated test suite to confirm the application's functionality and support debugging efforts.
 
Univerzita Karlova | Informační systém UK