字詞

嘅古今意思有異。

古義

「字」係文字嘅組成部分,係意思嘅基本部份。有啲有基本意思,未必成字,例唐文拆字細件,或者英文字綴。字可以組成一嚟讀,一句讀組成[1]。古時嘅「字」同現代嘅「詞」,意思部分重疊[2]

華夏講字,有兩重意思,一種為單字,逐個單字理解,如說文咁,解林單字,「平土有叢木曰林。」另一種唔理單字定多字,按意思為一字,好似爾雅咁,釋訓有「明明斤斤,察也」,明明斤斤視為一字。又釋天,「大歲在寅曰攝提格」,「攝提格」為一字咁。

周禮後人加註,「古曰名,今曰字。滋益而名,故更曰字。」上古叫字做名,叫字因為佢衍生繁多。亦即事物畀得名就係字,無話單個定多個。近世或有唔明解,或想將兩者分開,改叫,或叫,反而造成混亂。辭同詞經常通假,然意思各異,之不過,都同講嘢有關。不過都無拆細基本元素嘅意思。辭同詞,一句又得,長到成篇咁又得,如楚辭、陳辭、宋詞、曲詞。

今意

喺語言學上,「字」喺中文係書寫單位,各佔一個方塊,有幾千個常用,數以萬計或更多個少見,詞語係意思單位,多數由一至幾個「字」組成[3]。喺拼音文字當中,書寫單位叫「字母」,意思單位叫「字」、「詞」或「詞語」——以上三者喺本句之中同義。[4]

字切割

字切割(word segmentation)係指「將一段字切割做一隻隻字」嘅工作,對自然語言處理好重要。喺英文等嘅文字當中,字切割好簡單,因為呢啲文字每隻字之間都有空格,不過喺粵文中文等唔興用空格嘅文字裏面就撈絞啲。

參攷

  1. "文字的定義". club.ntu.edu.tw. 喺2021-08-22搵到.
  2. https://humanum.arts.cuhk.edu.hk/cgi-bin/agrep-lindict?query=%c3%f8&category=wholerecord
  3. "字≠詞". www.pcerc.org. 喺2021-08-24搵到.
  4. Yeung, Zephyr. "「oct-」、「cent-」與數字有關!破解英文詞彙DNA,從字首字根入手,記單詞更易入腦!-Zephyr Yeung 職場英語教室-職場-生活-ET Net Mobile". ETNet. 喺2021-12-21搵到.