Trénovatelný korektor angličtiny
Thesis title in Czech: | Trénovatelný korektor angličtiny |
---|---|
Thesis title in English: | Trainable Correction of English Grammar |
Academic year of topic announcement: | 2014/2015 |
Thesis type: | school year task |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Ondřej Bojar, Ph.D. |
Author: |
Guidelines |
Téma je rozsáhlé a podle potřeby je možné omezit jej do rozsahu ročníkového projektu, bakalářské práce, nebo i diplomové práce.
Celkovým úkolem je navrhnout, implementovat a empiricky vyhodnotit trénovatelný korektor angličtiny. Korektor na vstupu dostane text v angličtině s chybami. V rámci trénování dostane též seznam oprav, které v takovém textu provedl člověk-učitel. V hlavním běhu nebo testování pak program sám zvýrazní problematická místa a současně navrhne opravy. Takto formulovaný úkol je velmi ambiciózní. V prvním přiblížení se proto omezíme na předem danou relativně malou množinu korekcí, např.: přidat člen, ubrat člen, změnit člen, změnit předložku, změnit množné a jednotné číslo, změnit čas. Program bude v jádru pracovat s automatickým větným rozborem angličtiny (je k dispozici) a vhodnou metodou strojového učení (řada algoritmů je opět k dispozici). Na základě ukázkových oprav (a v případě potřeby i ukázkových potvrzených "neoprav"), předem připravených šablon pravidel a příznaků ze strojově rozebraného textu bude modul strojového učení sám navrhovat, kde by se měly opravy ve vstupním textu provést. Uživatelské rozhraní buď prohlásíme za zcela nezajímavé (čili, že stačí jakýkoli textový formát na vstupu i výstupu), nebo naopak prohlásíme za hlavní část práce. Druhá varianta by se týkala spíše ročníkového projektu a bakalářské práce: nejprve by se programoval editor či rozšíření editoru, které by sbíralo data, a následně, ať už v bakalářské či navazující diplomové práci, by se sebraná data použila k přípravě modelu korektoru. |
References |
dodám později |