語義距離

一個簡單語義網絡表示咗哺乳類Mammal)、Cat)同鯨魚Whale)... 等多個概念之間嘅啦掕。由幅圖入面睇得出,貓同哺乳類之間淨係隔咗一條線,而貓同鯨魚之間隔咗兩條線。

語義距離(粵拼:jyu5 ji6 keoi5 lei4英文semantic distance)係自然語言處理(NLP)上成日用嘅一個概念,指兩隻(或者第啲語言單位)之間喺意思上爭幾遠。舉個簡化嘅例子,呢兩隻字嘅語義距離好近-兩隻字都係分別表示緊某種動物,而且兩隻字所表示嘅動物好相似;相比之下,呢兩隻字嘅語義距離就遠,因為兩隻字表示嘅事物冇乜直接嘅啦掕。

喺實際 NLP 上,「語義距離要點量度」係一條相當受爭義嘅問題:喺最簡單嗰種情況下,語義距離可以用「兩隻字喺語義網絡入面最短要通過幾多條邊,先可以將佢哋連埋一齊」嚟量度-理論上,要過嘅邊數量愈少,兩隻字嘅語義距離就算愈短;實際計數嗰陣,研究者可以攞 WordNet 等現成嘅語義網絡-呢啲網絡會紀錄嗮隻語言入面啲之間嘅關係,然後攞要計嗰兩隻字 1 同 2,睇吓字 1 同字 2 之間「隔咗幾多隻字」,就得出一個語義距離估計值[2]。專業 NLP 上仲有更加進階複雜嘅方法計語義距離。

响廿一世紀初嘅 NLP 同相關應用上,語義距離相當有用,可以攞嚟做詞義消歧(WSD;教電腦撞到歧義情況嗰陣,同每隻有歧義嘅字搵出佢嘅意思)嘅工作[3],而且仲有認知心理學工作者提倡可以運用語義距離嘅概念嚟衡量文字作品「幾有創意[4][5]

數學概念

睇埋

文獻

  1. Agirre, E., & Rigau, G. (1997). A proposal for word sense disambiguation using conceptual distance. AMSTERDAM STUDIES IN THE THEORY AND HISTORY OF LINGUISTIC SCIENCE SERIES 4, 161-172.
  2. Budanitsky, Alexander and Hirst, Graeme. "Evaluating WordNet-based measures of lexical semantic relatedness." Computational Linguistics, 32(1), March 2006, 13-47.
  3. Diamantini, C.; Mircoli, A.; Potena, D.; Storti, E. (2015-06-01). "Semantic disambiguation in a social information discovery system". 2015 International Conference on Collaboration Technologies and Systems (CTS): 326-333.
  4. Kenett, Y. N. (2019). What can quantitative measures of semantic distance tell us about creativity?. Current Opinion in Behavioral Sciences, 27, 11-16.
  5. Olson, J. A., Nahas, J., Chmoulevitch, D., Cropper, S. J., & Webb, M. E. (2021). Naming unrelated words predicts creativity. Proceedings of the National Academy of Sciences, 118(25).