Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Trénovatelný korektor angličtiny
Název práce v češtině: Trénovatelný korektor angličtiny
Název v anglickém jazyce: Trainable Correction of English Grammar
Akademický rok vypsání: 2014/2015
Typ práce: ročníková práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel:
Zásady pro vypracování
Téma je rozsáhlé a podle potřeby je možné omezit jej do rozsahu ročníkového projektu, bakalářské práce, nebo i diplomové práce.

Celkovým úkolem je navrhnout, implementovat a empiricky vyhodnotit trénovatelný korektor angličtiny. Korektor na vstupu dostane text v angličtině s chybami. V rámci trénování dostane též seznam oprav, které v takovém textu provedl člověk-učitel. V hlavním běhu nebo testování pak program sám zvýrazní problematická místa a současně navrhne opravy. Takto formulovaný úkol je velmi ambiciózní. V prvním přiblížení se proto omezíme na předem danou relativně malou množinu korekcí, např.: přidat člen, ubrat člen, změnit člen, změnit předložku, změnit množné a jednotné číslo, změnit čas.

Program bude v jádru pracovat s automatickým větným rozborem angličtiny (je k dispozici) a vhodnou metodou strojového učení (řada algoritmů je opět k dispozici). Na základě ukázkových oprav (a v případě potřeby i ukázkových potvrzených "neoprav"), předem připravených šablon pravidel a příznaků ze strojově rozebraného textu bude modul strojového učení sám navrhovat, kde by se měly opravy ve vstupním textu provést.

Uživatelské rozhraní buď prohlásíme za zcela nezajímavé (čili, že stačí jakýkoli textový formát na vstupu i výstupu), nebo naopak prohlásíme za hlavní část práce. Druhá varianta by se týkala spíše ročníkového projektu a bakalářské práce: nejprve by se programoval editor či rozšíření editoru, které by sbíralo data, a následně, ať už v bakalářské či navazující diplomové práci, by se sebraná data použila k přípravě modelu korektoru.
Seznam odborné literatury
dodám později
 
Univerzita Karlova | Informační systém UK