Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 290)
Detail práce
   Přihlásit přes CAS
Podobnostní vyhledávání v databázích jmen
Název práce v češtině: Podobnostní vyhledávání v databázích jmen
Název v anglickém jazyce: Similarity search in databases of personal names
Klíčová slova: podobnost řetězců, porovnávání řetězců, podobnostní vyhledávání
Klíčová slova anglicky: string similarity, string comparison, similarity search
Akademický rok vypsání: 2018/2019
Typ práce: bakalářská práce
Jazyk práce:
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: doc. Mgr. Martin Nečaský, Ph.D.
Řešitel:
Zásady pro vypracování
Cílem bakalářské práce je ve spolupráci s Bezpečnostní informační službou České republiky (BIS) navrhnout optimální metodu pro měření podobnosti jmen osob v různých světových jazycích. Při řešení práce bude řešitel vycházet z existujících technik pro měření podobnosti řetězců (resp. jmen osob) a provede jejich detailní rešerši. Analyzuje je z pohledu vhodnosti pro měření podobnosti jmen osob, přičemž bude brát v úvahu specifika jednotlivých jazyků. Součástí rešerše a analýzy budou i metody založené na strojovém učení. Pro tento účel ve spolupráci s BIS navrhne a provede experimentální porovnání vybraných technik (včetně návrhu a přípravy podobnostní databáze pro takové porovnání) s určením jejich vhodnosti pro měření podobnosti jmen osob. Součástí práce bude také návrh a implementace softwarového řešení včetně grafického uživatelského rozhraní, které umožní koncovým uživatelům využívat vybrané techniky nad dodanou databází jmen. Řešení najde uplatnění např. v prohledávání databází hledaných osob.
Seznam odborné literatury
[1] Jun Gong, Lidan Wang, and Douglas W. Oard. 2009. Matching person names through name transformation. In Proceedings of the 18th ACM conference on Information and knowledge management (CIKM '09). ACM, New York, NY, USA, 1875-1878. DOI=http://dx.doi.org/10.1145/1645953.1646253

[2] Simone Faro and Thierry Lecroq. 2013. The exact online string matching problem: A review of the most recent results. ACM Comput. Surv. 45, 2, Article 13 (March 2013), 42 pages. DOI=http://dx.doi.org/10.1145/2431211.2431212

[3] P. Christen, A Comparison of Personal Name Matching: Techniques and Practical Issues, Sixth IEEE International Conference on Data Mining - Workshops (ICDMW'06), Hong Kong, 2006, pp. 290-294.
doi: 10.1109/ICDMW.2006.2, URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4063641&isnumber=4063581
 
Univerzita Karlova | Informační systém UK