作者 主題: 請問一個中文造字區的處理(PostgreSQL)?  (閱讀 2849 次)

0 會員 與 1 訪客 正在閱讀本文。

guard

  • 活潑的大學生
  • ***
  • 文章數: 205
    • 檢視個人資料
本身使用Postgresql(簡稱pgsql)這套open source的資料庫有一段時間,
但發現當他採用EUC_TW的編碼時,是無法接受造字區的中文字,
所以嘗試著利用「補完計劃」的解決方案時,也無解。

近日決止再試看看如何解決,研究了數日,在它的source code內
有一個專門解決的BIG5函數庫,如連接(http://doxygen.postgresql.org/big5_8c.html)
我發現他有一個BIG5>CNS11643的陣列,如果我將自己的造字big5碼填上去
並且重新編譯pgsql,即可以認得並存入該字元,例如
{0xFA40, 0x4338},該字段第一個為BIG5碼,第二個為CNS編碼
但是對C並不是非常熟,對big5也不精通,所以想請教先進。

1.我去中文全字庫研究了好幾天,裡面並沒有造字區big5>CNS的對應編碼,而我在pgsql裡
給它的隨便的CNS編碼,可能有一半都是可以存進去的,但是似乎某些CNS碼,pgsql又不認得
,請問我要從那裡得知 正確的big5 > cns碼?

2.從附件中的source code,是不是造字區一定要透過我加入陣列的方式,才有辦法存入
是否還有其他做法?

elleryq

  • 區域板主
  • 鑽研的研究生
  • *****
  • 文章數: 908
  • 性別: 男
    • 檢視個人資料
    • Thinking more...
回覆: 請問一個中文造字區的處理(PostgreSQL)?
« 回覆 #1 於: 2010-07-20 09:42 »
有考慮過都轉成 unicode 來處理嗎?
Plan your work, then work your plan.
我的首頁:http://blog.elleryq.idv.tw
351899by http://counter.li.org