2004年8月4日 星期三

目前不使用utf-8的原因

(註:這是舊文,之前在主站的討論區發表過,放在這只是讓網友更清楚了解為什麼現在還是使用big5編碼作為修改中文版的基礎)

1.utf-8雖可以解決許功蓋等斜線字元的問題,但無法解決與外界通聯的問題,例如由mambo發給各註冊者的email,如果發到沒有自動支援utf-8編碼的網站電子信箱(例如yahoo!是以big5為預設編碼),就是亂碼。有兩解可達到:一是hack mambo核心的發信程式。二是對外發信全用英文--這不太人道

2.有些核心功能不支援utf-8編碼,例如pdf的生成程式。

3.中文windows的預設編碼是big5,雖然在xp等新版本已全面支援utf-8,新版本的ie也一定可以看得到。但是,如果你把一個utf-8編碼的中文txt檔打開,還是一堆亂碼,系統似乎不會自動發覺是utf-8編碼。原因是在兩種編碼方式中,還是以big5為預設。這會造成我翻譯中文檔案時每次要轉碼再編,編完再轉…另外像有些元件已經有內含big5碼的語言檔(例如DOCMAN),裝上前必須先進行轉碼,才會顯示正常。

4.其實並不是我排斥utf-8,只是utf-8對我網站的好處大概只有繁簡共用同一頁面,事實上繁體的用字遣詞有些時候大陸人看不太懂,反之亦然。真要作簡體支援,還是架另外一個簡體網站會爽快的多。(註:目前使用big5的作法,繁體、簡體、日文、韓文都可正常在IE或Molliza顯示)

2 則留言:

Somebody 提到...

使用UTF-8編碼陸續還會有許多好處:
1. 圖形輸出大多以UTF-8編碼為基礎,例如jpgraph - 一個知名的圖形產生程式庫
2. XML的基礎是UTF-8,所以資訊的分享,如RSS,就必須以UTF-8編碼為基礎

類似的問題還有許多,轉換成UTF-8編碼後最大的好處是相容性,官方釋出的程式只要經過翻譯就能使用,其他國家朋友提供的模組或HACK也可以順利套用,這是為什麼我建議使用UTF-8編碼的理由之一。我已經將您提供的翻譯檔案製作成UTF-8編碼的壓縮檔,也希望與您能夠進一步討論接下來的發展,期待您的回信: kiang@osobiz.com

對了,我已經將您加入msn的聯絡清單

Bill Winer 提到...

您最後的附註讓人有點迷惑...:
《註:目前使用big5的作法,繁體、簡體、日文、韓文都可正常在IE或Molliza顯示》

這是什麼意思呢?
因為這個附註與一般的認知有頗大差距,希望採用utf-8編碼就是希望能夠在同一個網站、同一個螢幕上能夠呈現多語(不僅是繁簡)。