Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Product mapping
Název práce v češtině: Měření podobnosti produktů
Název v anglickém jazyce: Product mapping
Akademický rok vypsání: 2019/2020
Typ práce: disertační práce
Jazyk práce: angličtina
Ústav: Katedra teoretické informatiky a matematické logiky (32-KTIML)
Vedoucí / školitel: doc. Mgr. Martin Pilát, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 20.02.2020
Datum zadání: 20.02.2020
Datum potvrzení stud. oddělením: 02.03.2020
Zásady pro vypracování
Product mapping neboli měření podobnosti produktů je proces hledání identických produktů mezi e-shopy, kdy každý produkt může být charakterizován různými obrazovými a textovými údaji, jako jsou název, cena, obrázek, popis nebo specifikace. Product mapping má silné uplatnění v e-commerce, protože umožňuje obecnou analýzu trhu a cenové srovnání produktů napříč e-shopy i přes to, že neexistuje žádný obecný identifikátor, podle kterého by se jinak daly produkty mapovat.

Cílem práce je analýza existujících datasetů a algoritmů pro měření podobnosti produktů mezi různými e-shopy. Dalším krokem je vytvoření vlastních datasetů a porovnání různých technik zpracování informacích o produktech a analýzy datasetů, včetně porovnání odlišností jednotlivých produktů mezi různými e-shopy. Posledním důležitým cílem je srovnání různých přístupů strojového učení a nalezení modelu s nejlepšími výsledky.
Seznam odborné literatury
[1] KULIS, Brian, et al. Metric learning: A survey. Foundations and trends in machine learning, 2012, 5.4: 287-364.
[2] KAYA, Mahmut; BILGE, Hasan Şakir. Deep metric learning: A survey. Symmetry, 2019, 11.9: 1066.
[3] YANG, Liu; JIN, Rong. Distance metric learning: A comprehensive survey. Michigan State University, 2006, 2.2: 4.
[4] MAJUMDER, Bodhisattwa Prasad, et al. Deep Recurrent Neural Networks for Product Attribute Extraction in eCommerce. arXiv preprint arXiv:1803.11284, 2018.
[5] APPALARAJU, Srikar; VINEET, Chaoji. Image similarity using deep CNN and curriculum learning. arXiv preprint arXiv:1709.08761 (2017).
[6] TRACZ, Janusz, et al. BERT-based similarity learning for product matching. In: Proceedings of Workshop on Natural Language Processing in E-Commerce. 2020. p. 66-75.
[7] CHEREDNICHENKO, Olga; YANHOLENKO, Olha; KANISHCHEVA, Olga. Developing the Key Attributes for Product Matching Based on the Item's Image Tag Comparison. In: MoMLeT+ DS. 2020. p. 237-247.
[8] RISTOSKI, Petar, et al. A machine learning approach for product matching and categorization. Semantic web, 2018, 9.5: 707-728.
[9] RAMOS, Juan, et al. Using tf-idf to determine word relevance in document queries. In: Proceedings of the first instructional conference on machine learning. 2003. p. 29-48.
[10] YANG, Bian; GU, Fan; NIU, Xiamu. Block mean value based image perceptual hashing. In: 2006 International Conference on Intelligent Information Hiding and Multimedia. IEEE, 2006. p. 167-172.
[11] MORE, Ajinkya. Product matching in ecommerce using deep learning. Walmart Global Tech, Septemeber, 2017, 11.
[12] PRIMPELI, Anna; BIZER, Christian; PEETERS, Ralph. The WDC training dataset and gold standard for large-scale product matching. In: Companion Proceedings of The 2019 World Wide Web Conference. 2019, May. p. 381-386.
[13] (2012) Similarity Learning. In: Seel N.M. (eds) Encyclopedia of the Sciences of Learning. Springer, Boston, MA. https://doi.org/10.1007/978-1-4419-1428-6_1811
[14] HOFFER, Elad; AILON, Nir. Deep metric learning using triplet network. In: International workshop on similarity-based pattern recognition. Springer, Cham, 2015. p. 84-92.
 
Univerzita Karlova | Informační systém UK