字嵌入

字嵌入英文word embedding)係自然語言處理上嘅一個重要概念。

家陣攞段俾個 AI 分析,段嘢入面每隻字都有件字嵌入,每件字嵌入係個以實數表示嘅 向量,啲實數會表示隻字嘅意思,所以啲數值相近嘅字嵌入會係表示緊意思上相近嘅字[1]

例如想像每隻字嘅字嵌入有 30 個實數(),當中第一個實數表示嗰隻字同「貓科」有幾強嘅語義關聯,第二個實數表示嗰隻字同「人類」有幾強嘅語義關聯,所以

  • 呢隻字嘅字嵌入係 [0.9, 0.1, ...]
  • 老虎呢隻字嘅字嵌入係 [0.7, -0.6, ...]... 呀噉[註 1]

註釋

  1. 喺實際應用上, 嘅數值閒閒哋會係幾百。

睇埋

參攷

  1. Jurafsky, Daniel; H. James, Martin (2000). Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition. Upper Saddle River, N.J.: Prentice Hall.