本身使用Postgresql(簡稱pgsql)這套open source的資料庫有一段時間,
但發現當他採用EUC_TW的編碼時,是無法接受造字區的中文字,
所以嘗試著利用「補完計劃」的解決方案時,也無解。
近日決止再試看看如何解決,研究了數日,在它的source code內
有一個專門解決的BIG5函數庫,如連接(http://doxygen.postgresql.org/big5_8c.html)
我發現他有一個BIG5>CNS11643的陣列,如果我將自己的造字big5碼填上去
並且重新編譯pgsql,即可以認得並存入該字元,例如
{0xFA40, 0x4338},該字段第一個為BIG5碼,第二個為CNS編碼
但是對C並不是非常熟,對big5也不精通,所以想請教先進。
1.我去中文全字庫研究了好幾天,裡面並沒有造字區big5>CNS的對應編碼,而我在pgsql裡
給它的隨便的CNS編碼,可能有一半都是可以存進去的,但是似乎某些CNS碼,pgsql又不認得
,請問我要從那裡得知 正確的big5 > cns碼?
2.從附件中的source code,是不是造字區一定要透過我加入陣列的方式,才有辦法存入
是否還有其他做法?
謝謝 |