◁ 主頁
◁ 主頁

取碼規則 – 倉頡

倉頡中文輸入法(英文﹕Cangjie input method,原名:形意檢字法)是由臺灣人朱邦復先生在1976年創立的中文輸入法,也是初期在不同的作業系統,最先出現的一套中文輸入法程式,用於解決中文用戶群在電腦輸入漢字的問題。在1978年由中華民國前國防部長「蔣緯國」將軍,正式命名為「倉頡輸入法」中文套件。然而,朱邦復先生為了中文輸入法能夠快速普及應用,他不收取一分一毫,放棄倉頡輸入法專利權,促使了電腦漢化急速成長的步伐,推動電腦中文化的先驅者。目前,差不多所有的作業系統都已經內置倉頡三代、五代及速成輸入法,亦是繁體中文用戶使用率最高的形碼輸入法。

倉頡輸入法源遠流長,版本眾多。由創始人開發的二代、三代及五代外,還有一些坊間的修改版。直到現在,倉頡輸入法通行的最新公開版本是第五代,而流傳最廣泛、最常使用版本是第三代。三代倉頡與五代倉頡相差不大。朱邦復的多年助手沈紅蓮,另行設計「蒼頡檢字法」,坊間多稱之爲「第六代」倉頡,但實際使用上,一般都不把它視爲倉頡輸入法的新版本,相反更像另一款由倉頡衍生而來的新輸入法。它與三代倉頡或五代倉頡相差較大,字根明顯增多,拆碼規則也有不少改變。它應用於二人開發的倉頡系統上,該系統字庫完整收錄了歷代文獻用字十萬以上,以蒼頡碼作為內碼,重位元速率低於5%。雖然倉頡輸入法愛好者向朱邦復工作室索取到蒼頡檢字法編碼,但它尚未正式公開。

倉頡版本演進

1977年,朱邦復在台灣發表第一代倉頡,根據一萬二千字的《國語辭典》所設計。

1980年,發表第二代倉頡,僅將第一代倉頡略作調整。

1982年,發表第三代倉頡,是以《康熙字典》為範圍,選取其中四萬字,將第二代加以改良的結果。

1985年,在美國發表第四代倉頡。

1987年,返中國深圳科技園,任兩儀文化科技公司總經理,發表聚珍大字庫、第五代倉頡輸入法。第五代將正、簡體字統一處理,共收集了約六萬字,同時增加一些輔助字形及修正了少許的取碼。在朱邦復工作室網站上的《第五代倉頡輸入法手冊》一書中提供了第三代、第五代改碼字的對照表。

1990年,與台灣資策會合作開發微軟中文視窗系統3.0,採用倉頡系統的概念。後來朱邦復與微軟的合作關係破裂,之後Windows系統改採其他的漢字編碼系統,並自行更新第三代倉頡輸入法(修改了一些異體字及加入了部分香港字,但有錯碼),成為目前所見的主流版本。目前一般所稱的「三代倉頡」多指此版。

2002年,朱邦復在其論壇提及:「倉頡輸入法最後一版本 —— 第六代已完成,並據之設計中文CPU」。因為朱邦復已不理輸入法之事,轉交沈紅蓮女士負責。第六代倉頡輸入法改名為「蒼頡檢字法」,原本並不公開,僅供與朱邦復工作室有工作關係之專家學者使用,直至2013年才釋出予倉頡輸入法愛好者。雖然通稱「六代」,但實際使用上,一般都不把它視爲倉頡輸入法的新版本,相反更像另一款由倉頡衍生而來的新輸入法。

由「面」、「非」兩字即可辨別是第三代、第五代倉頡或者蒼頡檢字法:

三代:「面」字取碼(MWYL  / 一田卜中);「非」字取碼(LMYYY  /  中一卜卜卜)

五代:「面」字取碼(MWSL  / 一田尸中);「非」字取碼(LMSY  /  中一尸卜)

蒼檢:「面」字取碼(MWS  /  一田尸);「非」字取碼(LSY  /  中尸卜)

倉頡(取碼規則)

倉頡輸入法是按照漢字的字形結構和組字原理, 共歸納出 24 個「倉頡字母」及 82 個由這些基本字母所衍生出來的「輔助字形」及 8 個慣用偏旁,共計 90 個。因為倉頡字母所用到的 24 個鍵,都分別被配對到英文打字的 26 個字母鍵,當中(XZ 鍵)除外,所以輸入起來非常快捷方便。

學者在拆碼時需分辨中文字是「分體字(又稱﹕組合字)」、「連體字(又稱﹕整體字)、「複合字」或「特殊字(又稱﹕例外字)」字形。取碼方式則分為「並列形上下形外內形」三種。而取碼順序需根據中文字「由上而下由左而右由外而內」三大原則分拆成字型結構,再使用倉頡字母去取碼。

①)分體字

如果該中文字為「分體字」可以切割成「字首」和「字身」兩部份,用作限制取碼數目,而使到每個字最多只能取 5 個碼。「字首」字體中本身可作外內、上下或左右切割分離者,而其最外面,最左邊或最上方的字形則稱之為字首,取碼部份最多 2 碼。「字身」是指字首以外的部份,取碼最多 3 碼。「次字首、次字身」當一個字的字身可以再次分拆為「字首」及「字身」時,則稱為「次字首」及「次字身」。

例: 加(大尸口)、你(人弓火)、測(水月金弓)、順(中中中金)

詳解: 分體字 »

②)連體字

如果遇到一些無法適當切割的「連體字」可以有兩種取碼狀況。

狀況一﹕若該中文字取碼超過 4 碼,由於倉頡輸入法規定連體字最多僅能取 4 碼,故請依序取「1、2、3、尾」碼。

狀況二﹕若該中文字取碼在 4 碼或之內,則請全數取碼。

詳解: 連體字 »

③)精簡原則

所謂「精簡原則」是指當一個字有多種取碼的方式時,取碼數較小者,以達到取碼數盡量精簡為原則。

例: 耳 – 正碼(尸十)錯碼(一卜卜十)

④)先繁後簡原則

所謂「先繁後簡原則」是指當一個字有多種取碼的方式時,取外形較為複雜的字形為優先,再取外形較為簡單的字形。

例: 夫 – 正碼(手人)錯碼(十大)

⑤)包含省略原則

所謂「包含省略原則」是指當字首或字身的尾碼被包含在外框字形之內時,我們不取該尾碼,而直接取該包含外框的取後一碼。所謂的外框字形可分為,被「三面」圍住的非封閉外框;以及,被「四面」圍住的封閉外框。

詳解: 省略原則 »

⑥)特殊字

當看到「」、「」、「」、「」、「」與其它字形疊合,遇到這種情況,先取該字型,再取重疊其上的部份碼。

詳解: 特殊字 »

⑦)複合字

在倉頡輸入法中共有 9 個複合字,這些字無論它是單獨出現,或是與其它字形合併同時出現,無論任意組合位置,我們都只取「首、尾」兩碼。

詳解: 複合字 »

⑧)難字

字形筆劃特別瑣碎的困難字形,這些字包括了「身」、「鹿」、「臼」、「肅」、「齊」、「卐」、「卍」、「慶」、「龜」、「廌」、「繩」…等難字碼,至於其不易取碼的部份,以難字鍵(X)代替。

詳解: 難字 »

⑨)字形特徵原則

所謂「字形特徵原則」是指相連或重疊的字形,為了保持兩個字形完整特徵,應該分割取碼且避免在轉角處分割。

例: 永 – 正碼(戈弓水)錯碼(戈一水)

⑩)常見的重複字取碼

在中國字中有部分其倉頡拆碼相同,這種有相同拆碼的文字,我們稱為「重複字」。輸入這類文字要特別小心,當你打完所有倉頡碼時,這些「重碼字」會以編號列出,您再按一下數字編號才可以正確地輸入。否則就會出現想輸入「引」字,卻出現「弔」的不當錯誤了﹗

由於倉頡版本眾多,目前,坊間最多人使用3代及5代。兩個版本的文字拆碼方式大部分相同,但是,仍有部份的文字在倉3的原有基礎上修改後,演進成倉5時,略有不同。

參考: 第三代及第五代異體字 »

倉頡摘要

個人想在此分享小小倉頡口訣與拆碼心得,希望能夠幫助到大家在學習的路上更得心應手。

🄀 口訣﹕日丶月丶金丶木丶水丶火丶土丶竹(斜)丶戈(點)丶十(交)丶大(叉)丶中(縱)丶一(橫)丶弓(鉤)丶人丶心丶手丶口丶尸(側)丶廿(並)丶山(仰)丶女(紐)丶田(方)丶卜

1. 取碼順序:

口訣: 上下、左右、外內

例: 早(日十)由上而下

例: 材(木木竹)由左而右

例: 囧(田金月)由外而內

2. 連體字 :

口訣: 頭二三尾(1、2、3、尾)

例: 步(卜中一竹)

口訣: 四碼或以內全取

例: 老(十大心)

3. 分體字:

3.1 一分體字(簡: 一分)

口訣: 頭三尾

例: 倉(人戈日口)

例: 岑(山人戈弓)

例: 簽(竹人一人)

3.2 二分體字(簡: 二分)

口訣: 頭尾頭二尾

例: 輪(十十人一月)

例: 愁(竹火心)

例: 變(女火人大)

3.3 三分體字(簡: 三分)

口訣: 頭尾頭尾尾

例: 辯(卜十卜口十)

例: 體(月月廿田廿)

例: 聶(尸十尸十十)

口訣: 頭尾頭頭尾

例: 淅(水木竹中)

例: 髓(月月卜大月)

例: 洲(水戈中中)

4. 精簡原則﹕

例:

正碼:一土

錯碼:一十一

5. 先繁後簡 :

例:

正碼:竹手山

錯碼:竹十心

6. 盡量不重疊(字形特徵原則):

例:

正碼:中田中

錯碼:中日

7. 包含省略:

例:

正碼:弓尸月廿

錯碼:弓水月廿

初學者﹕建議使用手機或平板電腦練習打字及學習倉頡拆碼。