Product mapping
Název práce v češtině: | Měření podobnosti produktů |
---|---|
Název v anglickém jazyce: | Product mapping |
Akademický rok vypsání: | 2019/2020 |
Typ práce: | disertační práce |
Jazyk práce: | angličtina |
Ústav: | Katedra teoretické informatiky a matematické logiky (32-KTIML) |
Vedoucí / školitel: | doc. Mgr. Martin Pilát, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 20.02.2020 |
Datum zadání: | 20.02.2020 |
Datum potvrzení stud. oddělením: | 02.03.2020 |
Zásady pro vypracování |
Product mapping neboli měření podobnosti produktů je proces hledání identických produktů mezi e-shopy, kdy každý produkt může být charakterizován různými obrazovými a textovými údaji, jako jsou název, cena, obrázek, popis nebo specifikace. Product mapping má silné uplatnění v e-commerce, protože umožňuje obecnou analýzu trhu a cenové srovnání produktů napříč e-shopy i přes to, že neexistuje žádný obecný identifikátor, podle kterého by se jinak daly produkty mapovat.
Cílem práce je analýza existujících datasetů a algoritmů pro měření podobnosti produktů mezi různými e-shopy. Dalším krokem je vytvoření vlastních datasetů a porovnání různých technik zpracování informacích o produktech a analýzy datasetů, včetně porovnání odlišností jednotlivých produktů mezi různými e-shopy. Posledním důležitým cílem je srovnání různých přístupů strojového učení a nalezení modelu s nejlepšími výsledky. |
Seznam odborné literatury |
[1] KULIS, Brian, et al. Metric learning: A survey. Foundations and trends in machine learning, 2012, 5.4: 287-364.
[2] KAYA, Mahmut; BILGE, Hasan Şakir. Deep metric learning: A survey. Symmetry, 2019, 11.9: 1066. [3] YANG, Liu; JIN, Rong. Distance metric learning: A comprehensive survey. Michigan State University, 2006, 2.2: 4. [4] MAJUMDER, Bodhisattwa Prasad, et al. Deep Recurrent Neural Networks for Product Attribute Extraction in eCommerce. arXiv preprint arXiv:1803.11284, 2018. [5] APPALARAJU, Srikar; VINEET, Chaoji. Image similarity using deep CNN and curriculum learning. arXiv preprint arXiv:1709.08761 (2017). [6] TRACZ, Janusz, et al. BERT-based similarity learning for product matching. In: Proceedings of Workshop on Natural Language Processing in E-Commerce. 2020. p. 66-75. [7] CHEREDNICHENKO, Olga; YANHOLENKO, Olha; KANISHCHEVA, Olga. Developing the Key Attributes for Product Matching Based on the Item's Image Tag Comparison. In: MoMLeT+ DS. 2020. p. 237-247. [8] RISTOSKI, Petar, et al. A machine learning approach for product matching and categorization. Semantic web, 2018, 9.5: 707-728. [9] RAMOS, Juan, et al. Using tf-idf to determine word relevance in document queries. In: Proceedings of the first instructional conference on machine learning. 2003. p. 29-48. [10] YANG, Bian; GU, Fan; NIU, Xiamu. Block mean value based image perceptual hashing. In: 2006 International Conference on Intelligent Information Hiding and Multimedia. IEEE, 2006. p. 167-172. [11] MORE, Ajinkya. Product matching in ecommerce using deep learning. Walmart Global Tech, Septemeber, 2017, 11. [12] PRIMPELI, Anna; BIZER, Christian; PEETERS, Ralph. The WDC training dataset and gold standard for large-scale product matching. In: Companion Proceedings of The 2019 World Wide Web Conference. 2019, May. p. 381-386. [13] (2012) Similarity Learning. In: Seel N.M. (eds) Encyclopedia of the Sciences of Learning. Springer, Boston, MA. https://doi.org/10.1007/978-1-4419-1428-6_1811 [14] HOFFER, Elad; AILON, Nir. Deep metric learning using triplet network. In: International workshop on similarity-based pattern recognition. Springer, Cham, 2015. p. 84-92. |