r5297 MediaWiki - Code Review archive

Repository:MediaWiki
Revision:r5296‎ | r5297 | r5298 >
Date:01:30, 19 September 2004
Author:zhengzhu
Status:old
Tags:
Comment:
Updated the Simplified to Traditional table; Added comments crediting sources used to build the tables
Modified paths:
  • /trunk/phase3/includes/ZhConversion.php (modified) (history)

Diff [purge]

Index: trunk/phase3/includes/ZhConversion.php
@@ -1,6 +1,22 @@
22 <?php
3 -/* Simplified/Traditional conversion tables */
 3+/* Simplified/Traditional Chinese conversion tables
44
 5+ The character-to-character mappings are mainly extracted from the
 6+ Unihan database from the 4.0.1 version of the Unicode standard,
 7+ with some modification adapted from the following paper published
 8+ in China:
 9+ 冯寿忠,“非对称繁简字”对照表, 《语文建设通讯》1997-9第53期.
 10+ The paper is available from
 11+ /http://www.yywzw.com/jt/feng/fengb01.htm
 12+
 13+ The phrases are extracted from various phrase tables in the SCIM
 14+ package (http://www.freedesktop.org/Software/scim), and the mappings
 15+ of the phrases are computed using the character-to-character
 16+ mappings. Only phrases that contains one-to-many
 17+ character-to-character mappings are included, and the length of the
 18+ phrases are limited to below 5 characters.
 19+*/
 20+
521 $wgZhSimp2Trad=array(
622 "万"=>"萬",
723 "与"=>"與",
@@ -2645,7 +2661,6 @@
26462662 "硷度" => "鹼度",
26472663 "硷性" => "鹼性",
26482664 "硷液" => "鹼液",
2649 -"古柯硷" => "古柯鹼",
26502665 "什么" => "什麼",
26512666 "多么" => "多麼",
26522667 "干么" => "幹麼",
@@ -5013,410 +5028,6 @@
50145029 "庞克" => "龐克",
50155030 "龟壳" => "龜殼",
50165031 "当" => "當",
5017 -"一夥人" => "一夥人",
5018 -"一夥儿" => "一夥兒",
5019 -"一年里" => "一年裡",
5020 -"一条线" => "一條線",
5021 -"一院制" => "一院制",
5022 -"七巧板" => "七巧板",
5023 -"七里香" => "七里香",
5024 -"三八制" => "三八制",
5025 -"三折肱" => "三折肱",
5026 -"三极管" => "三極管",
5027 -"三角板" => "三角板",
5028 -"三只手" => "三隻手",
5029 -"中文系" => "中文系",
5030 -"中台路" => "中臺路",
5031 -"丹斯里" => "丹斯里",
5032 -"主播台" => "主播台",
5033 -"主机板" => "主機板",
5034 -"二部制" => "二部制",
5035 -"五台山" => "五台山",
5036 -"五斗米" => "五斗米",
5037 -"五线谱" => "五線譜",
5038 -"五里雾" => "五里霧",
5039 -"亚松森" => "亞松森",
5040 -"交管系" => "交管系",
5041 -"人类系" => "人類系",
5042 -"介系词" => "介系詞",
5043 -"代议制" => "代議制",
5044 -"企管系" => "企管系",
5045 -"伊拉克" => "伊拉克",
5046 -"伯克来" => "伯克來",
5047 -"来福线" => "來福線",
5048 -"供应线" => "供應線",
5049 -"保险系" => "保險系",
5050 -"信号台" => "信號台",
5051 -"内阁制" => "內閣制",
5052 -"两院制" => "兩院制",
5053 -"八字胡" => "八字鬍",
5054 -"八斗子" => "八斗子",
5055 -"公有制" => "公有制",
5056 -"公训系" => "公訓系",
5057 -"准考证" => "准考證",
5058 -"分封制" => "分封制",
5059 -"分水线" => "分水線",
5060 -"分页线" => "分頁線",
5061 -"划不来" => "划不來",
5062 -"划得来" => "划得來",
5063 -"刮地皮" => "刮地皮",
5064 -"刮胡刀" => "刮鬍刀",
5065 -"制海权" => "制海權",
5066 -"制空权" => "制空權",
5067 -"制高点" => "制高點",
5068 -"加旁线" => "加旁線",
5069 -"动物系" => "動物系",
5070 -"劳工系" => "勞工系",
5071 -"化妆台" => "化妝台",
5072 -"化学奖" => "化學獎",
5073 -"千百只" => "千百隻",
5074 -"南台路" => "南臺路",
5075 -"卡洛里" => "卡洛里",
5076 -"卡路里" => "卡路里",
5077 -"印刷系" => "印刷系",
5078 -"古柯硷" => "古柯鹼",
5079 -"可怜虫" => "可憐虫",
5080 -"台机路" => "台機路",
5081 -"司令台" => "司令台",
5082 -"司令台" => "司令臺",
5083 -"合得来" => "合得來",
5084 -"合桃街" => "合桃街",
5085 -"合浦街" => "合浦街",
5086 -"合经系" => "合經系",
5087 -"合订本" => "合訂本",
5088 -"後北街" => "后北街",
5089 -"後安路" => "后安路",
5090 -"後平路" => "后平路",
5091 -"向心力" => "向心力",
5092 -"告示板" => "告示板",
5093 -"和平奖" => "和平獎",
5094 -"咸认为" => "咸認為",
5095 -"商数系" => "商數系",
5096 -"启德道" => "啟德道",
5097 -"启昌街" => "啟昌街",
5098 -"启超道" => "啟超道",
5099 -"嘉咸街" => "嘉咸街",
5100 -"回归线" => "回歸線",
5101 -"国文系" => "國文系",
5102 -"国贸系" => "國貿系",
5103 -"园艺系" => "園藝系",
5104 -"土壤系" => "土壤系",
5105 -"土木系" => "土木系",
5106 -"地平线" => "地平線",
5107 -"地政系" => "地政系",
5108 -"地理系" => "地理系",
5109 -"地质系" => "地質系",
5110 -"埃荣冲" => "埃榮衝",
5111 -"塑胶板" => "塑膠板",
5112 -"塔里木" => "塔里木",
5113 -"压克力" => "壓克力",
5114 -"外交系" => "外交系",
5115 -"外文系" => "外文系",
5116 -"夜光表" => "夜光錶",
5117 -"大传系" => "大傳系",
5118 -"天文台" => "天文台",
5119 -"天文台" => "天文臺",
5120 -"天花板" => "天花板",
5121 -"太阳系" => "太陽系",
5122 -"太麻里" => "太麻里",
5123 -"奥克兰" => "奧克蘭",
5124 -"委员制" => "委員制",
5125 -"姜太公" => "姜太公",
5126 -"姜子牙" => "姜子牙",
5127 -"子午线" => "子午線",
5128 -"孟姜女" => "孟姜女",
5129 -"学区制" => "學區制",
5130 -"宇宙线" => "宇宙線",
5131 -"安眠药" => "安眠藥",
5132 -"家政系" => "家政系",
5133 -"家长制" => "家長制",
5134 -"密苏里" => "密蘇里",
5135 -"富台街" => "富臺街",
5136 -"富里乡" => "富里鄉",
5137 -"封锁线" => "封鎖線",
5138 -"对角线" => "對角線",
5139 -"小夥子" => "小夥子",
5140 -"小班制" => "小班制",
5141 -"尼克森" => "尼克森",
5142 -"尼龙线" => "尼龍線",
5143 -"屯田制" => "屯田制",
5144 -"工教系" => "工教系",
5145 -"工业系" => "工業系",
5146 -"工管系" => "工管系",
5147 -"工设系" => "工設系",
5148 -"巧克力" => "巧克力",
5149 -"巴拉松" => "巴拉松",
5150 -"巴洛克" => "巴洛克",
5151 -"巴尔干" => "巴爾幹",
5152 -"巴里岛" => "巴里島",
5153 -"市政系" => "市政系",
5154 -"师铎奖" => "師鐸獎",
5155 -"干德道" => "干德道",
5156 -"平行线" => "平行線",
5157 -"干下去" => "幹下去",
5158 -"干不了" => "幹不了",
5159 -"干不成" => "幹不成",
5160 -"干起来" => "幹起來",
5161 -"康百克" => "康百克",
5162 -"广告系" => "廣告系",
5163 -"广电系" => "廣電系",
5164 -"延长线" => "延長線",
5165 -"建筑系" => "建築系",
5166 -"弹珠台" => "彈珠檯",
5167 -"徐光启" => "徐光啟",
5168 -"御花园" => "御花園",
5169 -"复健系" => "復健系",
5170 -"德文系" => "德文系",
5171 -"心理系" => "心理系",
5172 -"忘忧谷" => "忘憂谷",
5173 -"情报台" => "情報台",
5174 -"应化系" => "應化系",
5175 -"应数系" => "應數系",
5176 -"戏剧系" => "戲劇系",
5177 -"所有制" => "所有制",
5178 -"手术台" => "手術台",
5179 -"打印台" => "打印台",
5180 -"打擂台" => "打擂臺",
5181 -"扣板机" => "扣板機",
5182 -"抛物线" => "拋物線",
5183 -"指挥台" => "指揮台",
5184 -"捋虎须" => "捋虎鬚",
5185 -"采石场" => "採石場",
5186 -"采石厂" => "採石廠",
5187 -"揭示板" => "揭示板",
5188 -"搭错线" => "搭錯線",
5189 -"政治系" => "政治系",
5190 -"教心系" => "教心系",
5191 -"教育系" => "教育系",
5192 -"文学奖" => "文學獎",
5193 -"斑马线" => "斑馬線",
5194 -"新闻系" => "新聞系",
5195 -"断头台" => "斷頭台",
5196 -"日文系" => "日文系",
5197 -"昆虫系" => "昆蟲系",
5198 -"景观系" => "景觀系",
5199 -"智慧板" => "智慧板",
5200 -"会员制" => "會員制",
5201 -"会计系" => "會計系",
5202 -"服务台" => "服務台",
5203 -"本松路" => "本松路",
5204 -"材料系" => "材料系",
5205 -"松南路" => "松南路",
5206 -"松寿路" => "松壽路",
5207 -"松安路" => "松安路",
5208 -"松德路" => "松德路",
5209 -"松文路" => "松文路",
5210 -"松智路" => "松智路",
5211 -"松节油" => "松節油",
5212 -"松兴路" => "松興路",
5213 -"松隆路" => "松隆路",
5214 -"板着脸" => "板著臉",
5215 -"板金科" => "板金科",
5216 -"板门店" => "板門店",
5217 -"柏克莱" => "柏克萊",
5218 -"查号台" => "查號台",
5219 -"核工系" => "核工系",
5220 -"梁启超" => "梁啟超",
5221 -"梳妆台" => "梳妝台",
5222 -"森林系" => "森林系",
5223 -"植物系" => "植物系",
5224 -"植病系" => "植病系",
5225 -"标准制" => "標準制",
5226 -"机械系" => "機械系",
5227 -"止痛药" => "止痛藥",
5228 -"杀虫药" => "殺虫藥",
5229 -"杀虫药" => "殺蟲藥",
5230 -"气象台" => "氣象台",
5231 -"气象系" => "氣象系",
5232 -"水利系" => "水利系",
5233 -"水平线" => "水平線",
5234 -"沈剑虹" => "沈劍虹",
5235 -"沈甸甸" => "沈甸甸",
5236 -"法律系" => "法律系",
5237 -"法文系" => "法文系",
5238 -"法兰克" => "法蘭克",
5239 -"洛克道" => "洛克道",
5240 -"流水线" => "流水線",
5241 -"流理台" => "流理台",
5242 -"流线型" => "流線型",
5243 -"海岸线" => "海岸線",
5244 -"海平线" => "海平線",
5245 -"海洋系" => "海洋系",
5246 -"减肥药" => "減肥藥",
5247 -"测量系" => "測量系",
5248 -"渔业系" => "漁業系",
5249 -"漆咸道" => "漆咸道",
5250 -"乌克兰" => "烏克蘭",
5251 -"乌干达" => "烏干達",
5252 -"营养系" => "營養系",
5253 -"父权制" => "父權制",
5254 -"牙医系" => "牙醫系",
5255 -"牛肉面" => "牛肉麵",
5256 -"物理奖" => "物理獎",
5257 -"物理系" => "物理系",
5258 -"特别奖" => "特別獎",
5259 -"特效药" => "特效藥",
5260 -"奖学金" => "獎學金",
5261 -"兽医系" => "獸醫系",
5262 -"玻璃板" => "玻璃板",
5263 -"环境系" => "環境系",
5264 -"瓜子壳" => "瓜子殼",
5265 -"甘谷街" => "甘谷街",
5266 -"生命线" => "生命線",
5267 -"生物系" => "生物系",
5268 -"生产线" => "生產線",
5269 -"产品线" => "產品線",
5270 -"畜牧系" => "畜牧系",
5271 -"当不起" => "當不起",
5272 -"发射台" => "發射台",
5273 -"百分制" => "百分制",
5274 -"尽人事" => "盡人事",
5275 -"尽全力" => "盡全力",
5276 -"尽可能" => "盡可能",
5277 -"尽本分" => "盡本分",
5278 -"尽义务" => "盡義務",
5279 -"石钟乳" => "石鐘乳",
5280 -"破折号" => "破折號",
5281 -"磁力线" => "磁力線",
5282 -"社工系" => "社工系",
5283 -"社教系" => "社教系",
5284 -"社会系" => "社會系",
5285 -"祝英台" => "祝英台",
5286 -"私有制" => "私有制",
5287 -"窝里反" => "窩裡反",
5288 -"第一线" => "第一線",
5289 -"第二线" => "第二線",
5290 -"精工舍" => "精工舍",
5291 -"系主任" => "系主任",
5292 -"纪念奖" => "紀念獎",
5293 -"纺织系" => "紡織系",
5294 -"统计系" => "統計系",
5295 -"经合会" => "經合會",
5296 -"经济奖" => "經濟獎",
5297 -"经济系" => "經濟系",
5298 -"纵贯线" => "縱貫線",
5299 -"绷着脸" => "繃著臉",
5300 -"美术系" => "美術系",
5301 -"翘翘板" => "翹翹板",
5302 -"耳刮子" => "耳刮子",
5303 -"联邦制" => "聯邦制",
5304 -"背地里" => "背地裡",
5305 -"致良知" => "致良知",
5306 -"致远路" => "致遠路",
5307 -"台中市" => "臺中市",
5308 -"台中县" => "臺中縣",
5309 -"台儿庄" => "臺兒莊",
5310 -"台东市" => "臺東市",
5311 -"台东县" => "臺東縣",
5312 -"台柱子" => "臺柱子",
5313 -"台机路" => "臺機路",
5314 -"舞蹈系" => "舞蹈系",
5315 -"航海系" => "航海系",
5316 -"航空系" => "航空系",
5317 -"航管系" => "航管系",
5318 -"英文系" => "英文系",
5319 -"范仲淹" => "范仲淹",
5320 -"茅台酒" => "茅臺酒",
5321 -"蒙汗药" => "蒙汗藥",
5322 -"蒲松龄" => "蒲松齡",
5323 -"艺术系" => "藝術系",
5324 -"药检局" => "藥檢局",
5325 -"萤光板" => "螢光板",
5326 -"蜡光纸" => "蠟光紙",
5327 -"血小板" => "血小板",
5328 -"补给线" => "補給線",
5329 -"装订线" => "裝訂線",
5330 -"复鼎金" => "覆鼎金",
5331 -"观光系" => "觀光系",
5332 -"讯号线" => "訊號線",
5333 -"记分板" => "記分板",
5334 -"许可制" => "許可制",
5335 -"调理台" => "調理台",
5336 -"调频台" => "調頻台",
5337 -"誊写板" => "謄寫板",
5338 -"警戒线" => "警戒線",
5339 -"护理系" => "護理系",
5340 -"豆腐干" => "豆腐干",
5341 -"贝里斯" => "貝里斯",
5342 -"负责制" => "負責制",
5343 -"财税系" => "財稅系",
5344 -"财管系" => "財管系",
5345 -"财金系" => "財金系",
5346 -"责任制" => "責任制",
5347 -"资管系" => "資管系",
5348 -"资讯系" => "資訊系",
5349 -"路东里" => "路東里",
5350 -"踏脚板" => "踏腳板",
5351 -"跷跷板" => "蹺蹺板",
5352 -"辅导系" => "輔導系",
5353 -"轮机系" => "輪機系",
5354 -"农化系" => "農化系",
5355 -"农业系" => "農業系",
5356 -"农经系" => "農經系",
5357 -"农艺系" => "農藝系",
5358 -"迴文诗" => "迴文詩",
5359 -"迴纹针" => "迴紋針",
5360 -"迷幻药" => "迷幻藥",
5361 -"迷魂药" => "迷魂藥",
5362 -"退烧药" => "退燒藥",
5363 -"这夥人" => "這夥人",
5364 -"速食面" => "速食麵",
5365 -"造船系" => "造船系",
5366 -"避孕药" => "避孕藥",
5367 -"郡县制" => "郡縣制",
5368 -"都计系" => "都計系",
5369 -"醋坛子" => "醋罈子",
5370 -"医学奖" => "醫學獎",
5371 -"医工系" => "醫工系",
5372 -"医技系" => "醫技系",
5373 -"里斯本" => "里斯本",
5374 -"里肌肉" => "里肌肉",
5375 -"金像奖" => "金像獎",
5376 -"金师奖" => "金師獎",
5377 -"金熊奖" => "金熊獎",
5378 -"金牌奖" => "金牌獎",
5379 -"金球奖" => "金球獎",
5380 -"金马奖" => "金馬獎",
5381 -"金鼎奖" => "金鼎獎",
5382 -"钓鱼台" => "釣魚台",
5383 -"银保系" => "銀保系",
5384 -"银行系" => "銀行系",
5385 -"钟乳石" => "鐘乳石",
5386 -"钟鼎文" => "鐘鼎文",
5387 -"阿里山" => "阿里山",
5388 -"阳春面" => "陽春麵",
5389 -"双绞线" => "雙絞線",
5390 -"双轨制" => "雙軌制",
5391 -"双黄线" => "雙黃線",
5392 -"雨花台" => "雨花臺",
5393 -"雪里红" => "雪裡紅",
5394 -"雪里荭" => "雪裡葒",
5395 -"云咸街" => "雲咸街",
5396 -"电子系" => "電子系",
5397 -"电子表" => "電子錶",
5398 -"电机系" => "電機系",
5399 -"电源线" => "電源線",
5400 -"电算系" => "電算系",
5401 -"电视台" => "電視台",
5402 -"电话线" => "電話線",
5403 -"电路板" => "電路板",
5404 -"音乐台" => "音樂台",
5405 -"音乐系" => "音樂系",
5406 -"音源线" => "音源線",
5407 -"风景线" => "風景線",
5408 -"食品系" => "食品系",
5409 -"马拉松" => "馬拉松",
5410 -"马里兰" => "馬里蘭",
5411 -"骨子里" => "骨子裡",
5412 -"脏兮兮" => "髒兮兮",
5413 -"脏东西" => "髒東西",
5414 -"体育系" => "體育系",
5415 -"高松路" => "高松路",
5416 -"魁北克" => "魁北克",
5417 -"凤松路" => "鳳松路",
5418 -"麦当劳" => "麥當勞",
5419 -"麻醉药" => "麻醉藥",
5420 -"鼎折足" => "鼎折足",
54215032 "一国两制" => "一國兩制",
54225033 "一拍即合" => "一拍即合",
54235034 "一板一眼" => "一板一眼",

Status & tagging log