取碼原則 倉頡輸入法
例外字
特別注意 

95%以上中文字都可依據前述原則取碼,其餘約5%的字,若按同樣規則取碼,本來亦無不可,但顧及使用方便,特別處理一些例外字形,這些字稱做「例外字」,包括:[1]

  1. 複合字首:做字首或次字首時視爲一整體,只取頭、尾兩碼。
  2. 複合字:一律視爲一整體,只取頭、尾兩碼。
  3. 難字:難取部份以「難」碼代替。
  4. 特殊字:被其他部件橫貫時,先取特殊字,再取重疊於上的部件,並且可與骨幹的中豎重複。

注意以下例外字均已舉全,不可憑個人主觀自訂例外字,否則會取不到正確字碼。[2]

複合字首

「複合字首」(或稱「特別字首」)在做「字首」或「次字首」時,視爲一整體,只取頭、尾兩碼[3][4]

複合字首列表
版本 複合字首 圖解 取碼 字例 補充說明
三五     人弓 人弓・火木)、人戈・人弓
三五     尸一 尸一・中)、尸一・木竹水
三五     戈金 戈金・女戈)、戈金・一口 按台灣標準字形,「」等字的字首應爲「戈金」而非「戈木」,但微軟倉頡採後者編碼,詳參〈特別注意〉一節。
三五     戈木 戈木・竹戈)、戈木・一口
三五     一大 一大・土)、一大・一田中
三五     一女 一女・中一戈)、一女・木戈
三五     一人 一人・竹日火 五代手冊未列此複合字首。[5]
三      一木 一木・卜中一)、一木・山戈戈 五代:一・木木・一)、一・木木・戈
三      一木 一木・卜中一)、一木・日 五代:一・竹木・一)、一・竹木・日
三      一火 一火・月山金 五代:一・人火・金
三      一土 一土・月山金 五代:一・人土・金
三      戈土 戈土・心)、戈土・竹日火 五代:戈・人土・心)、戈・人土・火
三      戈戈 戈戈・人月人)、戈戈・火 五代:戈・人戈・月)、戈・人戈・火
三  卜人 卜人・月山金 五代:卜・女人・金[6]
 五     人口 人口・手)、人口・月廿 三代:人・一・口手)、人・一・口廿
 五     廿十 廿十・弓木)、廿十・口卜人 三代:廿・竹十・木)、廿・竹十・人

複合字首單獨使用,或用做「字身」、「次字身」時,則依一般方式取碼。例如:

戈・十金・金),廿・戈・十金),女・戈・十金);
一・日月・大),心・一・日大),手・一・日大);
一・一・一女),十・一・一女),女・一・一女);
人・一・弓),水・人・一弓),廿・人・一弓);
尸一・尸戈一),十水・尸一・一),竹尸・尸一・一)。
戈・人・木戈),人・戈・人戈),月・戈・人戈);
人・一・口),水・人・一口),竹・人・一口);
廿・竹口・十),𡤏女・廿・竹十),𨇨口一・廿・竹十)。

許多複合字首在書寫時會視爲整體形塊。例如「愿」、「壓」、「辱」等字,有時作撇筆一撇到底,包住下方部件,有時則較短,使兩字能上下切開,把它們定義作複合字首可避免字首應該取「厂」或取「原」、「厭」、「辰」的疑惑

另一些複合字首是為了減少重碼。例如若不把「麻」定義作複合字首,「麻」部字得取「戈・十金・(尾碼)」或「戈・木木・(尾碼)」,許多字形只靠一個尾碼便難以區分,會產生大量重碼。同理「羽」、「气」、「薛」、「合」等皆有此作用。

複合字

「複合字」不論是單獨使用或與其他字形組合使用,一律只取其頭、尾兩碼[7]

複合字列表
版本 複合字 圖解 取碼 字例 補充說明
三五     日弓 日弓・口)、人・日弓
三五     中弓 中弓・卜中月)、中弓・竹難山
三五     弓中 弓中・人一木)、弓廿・弓中 大陸視爲兩筆,不作複合字亦解得「弓中」。
三五     人土 大戈・人土)、女火・人土 不可依正常拆碼(人卜手一)或取首尾(人一)。
當中可以被其他成份夾雜,比如)。
「佳」字則是取(人・土土)。
三五     女戈 女戈)、女戈竹戈 」從「𢆶」從「戍」,因此下方亦按「戍」字取碼,尾部份取「竹戈」不取「人」。
三五     卜心 卜心・竹山)、卜心・尸一
三      竹戈 土・竹戈)、廿・竹戈)、竹戈・十木 五代:竹山・戈)、土・竹山・戈)、廿・竹山・戈)、竹戈・十木
三      卜口 卜口・月・月弓)、卜口・月・廿弓
 五     中尸 中尸・日)、人・中尸 1987年版五代加入,1999年版移除。
無定義時:中戈尸)、人・中戈尸)。
 五     卜弓 卜弓・月山金)、卜弓・廿手

難字

有些字的部份形狀過於瑣碎,拆碼繁瑣。爲了方便取碼,特別規定了一些「難字」,以「難(X)」碼代替難取部份。以下是難字列表:

一、「首、難、尾」型:首、尾碼好取,其餘難取。

「首、難、尾」型難字列表
難字 圖解 取碼 字例
    竹難竹 弓火・竹難竹)、金・竹難竹
    戈難水 木・戈難水)、廿手・戈難水
    戈難火 廿・戈難火)、廿十・戈難火
    戈難心 木木・戈難心)、戈心・土
    中難竹 女・中難竹)、竹・中難竹
    中難中 水・中難中)、女・中難中
    廿難金 月金・廿難金)、廿・廿難金
    口難山 女火・口難山)、土大・口難山
    弓難山 中弓・弓難山)、竹木・弓難山
    竹難山 竹難山)、𤒅火・竹難山

二、「首、難」型:僅有首碼好取

「首、難」型難字列表
難字 圖解 取碼 字例
    竹難 竹難竹山)、人・竹難山)、竹難人
    竹難 竹難中水)、竹難・月廿
    竹難 竹月・弓木)、竹月・一金・竹
    竹難 竹難卜金)、竹難月金)、輿竹難十金
    中難 廿・中難)、金・中難
    弓難
    女難
    卜難 水・卜難)、卜難火

特殊字

有部件重疊在以下幾種字形的中間時,可先取特殊字,再取重疊於上的部件。[8]

特殊字列表
版本 特殊字 字例
三五   木十)、木月)、木中)、木人人)、木田)、木田火)、竹木中)、竹木中心
三五    火金・月)、火手・手
三五   戈大・口・一)、金・戈手)、线女一・戈十
三五   大大大大)、大一日日)、大弓)、大人人
三五    心山[8]

注意特殊字的一些特性:

  • 重疊在特殊字上的字形可以計入中豎,且計入中豎的取碼方式通常優先採用。例如「」字視爲「」重疊在「」上,取碼「木田」;而非「」或「」重疊在「」上,取碼「木日」。
  • 只有在特殊字內部重疊字形時適用特殊字的規則。例如若「」取碼作「大月」(  ),則並非使用特殊字規則(因為「 」不是在「 」的內部),而是試圖跨越取碼(但此字不符合跨越取碼的條件,因而實際取碼是按區塊取碼作「中月大」)。
  • 特殊字無絕對優先權,具體取碼仍須考量精簡、字形特徵、先繁後簡等其他原則。其中,特殊字會優先(但非必定)選擇讓橫筆對應原字最長、最突出的橫,以彰顯字形特徵。例如:
    • 」取碼作「十木」而非「木十」(使用特殊字),而「」取碼作「木十」(使用特殊字)而非「十木」,因如此取碼更能彰顯字形特徵(「木」橫筆對應原字最長橫)。
    • 」取碼作「手大日」而非「大手日」(使用特殊字)、「」取碼作「十手大」而非「十大手」(使用特殊字),因前者更符合字形特徵原則(若取「大手日」則「大」橫筆並非對應原字最長橫)與先繁後簡原則。
    • 」取碼作「手人」而非「大十」(使用特殊字),因前者更符合字形特徵原則(若取「大十」則「大」橫筆並非對應原字最長橫)與先繁後簡原則。
    • 」取碼作「竹手山」而非「竹心十」(使用特殊字),因前者更符合字形特徵原則(若取「竹心十」則「七」橫筆並非對應原字最長橫)與先繁後簡原則。
    • 」取碼作「十心・一山」而非「心十・一山」(使用特殊字),因前者較符合字形特徵原則(區塊分割優先)。
    • 」取碼作「戈十」(使用特殊字)而非「戈手心」、「」取碼作「戈手」(使用特殊字)而非「戈手十心」,因前者較符合精簡原則與先繁後簡原則。

註釋

  1. 五代手冊原文將「例外字」分為「複合字」、「難字」、「特殊字」、「重複字」,「複合字」下又分「複合字首」、「複合字」。可見五代手冊之「複合字」有廣義與狹義之別。三代手冊有「複合字」一詞,但由於三代未直接定義「複合字首」,其實質內容相當於五代的狹義複合字。由於廣義和狹義的「複合字」並存容易混淆,且廣義的「複合字」極其罕用——五代手冊除標題外未提及廣義的「複合字」;一般使用者談及「複合字」時也都是指三代或狹義的「複合字」——因此本教科書稍微調整架構,省去廣義的「複合字」,以避免歧義。「重複字」主要用於倉頡系統,但目前主流系統一般改以選字處理重碼字,本教科書遂將此部分移至〈進階知識〉一節。
  2. 就使用者角度而言,例外字不得新增。若站在輸入法或編碼表開發者的角度,則可考慮比照原開發者的精神,適當創造新例外字,以便為罕用字、造字編碼。
  3. 1994年版三代手冊未談及「複合字首」,但於第三章第三節介紹字首時提及「3.戊、戈、𢦏、㦰、产、麻、䧹、厭、厤、鴈、辰、厥、羽、府、鹿、亥、老、包、君‥等字,雖不能作上下或左右一次分離,然為了取碼方便,一律定義之為字首。」(1984年版之同一節字例尚有「雁」字),觀念與五代之複合字首相當。本教科書將其中可直接以漢字分割原則解釋者省略或於〈漢字分割〉一節討論,其餘則視為三代定義之複合字首。
  4. 五代倉頡實際上有哪些複合字首有爭議,官方五代手冊影印版和電子版列出的「複合字首」不一致,後者將「春」、「登」列為複合字首。因兩者在〈第三代、第五代改碼字〉皆把「蠢」、「凳」等相關字列為「五、取碼原則不一致者,使其統一」而非「三、增加複合字首或改變原複合字的取碼,以避免重複字者」,本教科書主要採影印版之說。其餘細節可參見〈爭議編碼〉一節。
  5. 《第五代倉頡輸入法手冊》(1999年版五代)附錄六〈第五代倉頡字碼表〉列出「鷢」(字形為「⿸厥鳥」)編碼為「一人竹日火」,附錄一〈第三代、第五代改碼字字碼對照表〉亦未提及相關改碼字,可見五代「厥」與三代一樣為複合字首。然而,五代手冊於介紹複合字首時未將「厥」列入,與前者不一致,對此有兩種解釋:一是五代手冊漏列此複合字首;二是五代取消了此二複合字首,唯將相關字之取碼字形由「⿸厥*」改為「⿱厥*」以致取碼未變,手冊字形則是印刷錯誤。解釋二需要較多巧合同時成立,可能性較低。 查漢文庫典「鷢」、「憠」、「橜」、「蟨」之六代編碼分別為「一廿人片」、「一廿人心」、「一廿人木」、「一廿人戈」,可見取碼所據字形為「⿸厥鳥」、「⿸厥心」、「⿸厥木」、「⿸厥虫」(若所據字形為「⿱厥鳥」、「⿱厥心」、「⿱厥木」、「⿱厥虫」,則應取碼「一廿山片」、「一廿山心」、「一廿山木」、「一廿山戈」),漢文庫典字形圖片顯示「⿱厥*」應屬錯誤。漢文庫典為五、六代共用系統,取碼所據字形相同,又漢文庫典與五代手冊皆屬五代倉頡,絕大部分取碼所據字形相同,因此五代倉頡之取碼所據字形當為「⿸厥*」,再次反駁了解釋二。 總上所述,解釋一顯較解釋二合理,五代倉頡應仍比照三代承認「厥」為複合字首;五代手冊未將「厥」列入複合字首應屬疏漏。
  6. 1994年版三代於字首一節有談及「亥」字特別定義為字首,並有例字「⿱亥月」。五代手冊於複合字首一節未提及此字形,改碼字一節未談及相關改碼,亦無相關字例。查漢文庫典(2003年版五代)將「賌」編碼為「卜女人金」,可見五代不將此字型認定為複合字首。
  7. 朱邦復於《第三代倉頡輸手法手冊》曾提及將「目」定為複合字取「月山」以免取「月一」時與「且」重碼;然而其《第五代倉頡輸手法手冊》主張「目」取「月一」不符合完整原則。本教材採五代之說,不將「目」視為複合字。
  8. 8.0 8.1 《第五代倉頡輸入法手冊》將「 」列為特殊字,並於附表描述「屯」之取碼是採用輔助字形「七凵」,可知是比照類似「朿」的原則取碼(但有論以為視為「七屮」更佳)。有論以為此特殊字只有「屯」一個應用實例,不將「 」視為特殊字也能按〈跨越分則〉解釋「屯」的取碼,且加入此特殊字會導致「毛」、「尧」等字取碼有爭議,而主張此字形不應納入特殊字[1]。該說可參,惟其所稱爭議並非不能用其他原則解釋,又考慮不將「 」視為特殊字的跨越取碼方式與〈跨越分則〉的典型實例較不似,且無法排除未來處理更大字集遇到更多應用實例之可能,此仍從原說將「 」列為特殊字。


 取碼原則 倉頡輸入法
例外字
特別注意