|
|
|
Wikipedia:地区词处理在中文维基百科裡,地區詞处理和繁简处理是字词转换系统的两大组成部分。地區詞转换旨在为中国大陆、台湾、新加坡、马来西亚、香港、澳门地区的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡与马来西亚(zh-sg)的地區詞为简体中文;台湾(zh-tw)、香港与澳门(zh-hk)的地區詞为繁体(正體)中文。
[编辑] 地区词的全局转换地区词的全局转换总共通过五个转换表来实现:其一是MediaWiki内置的转换表ZhConversion.php,其二是在MediaWiki:Conversiontable/zh-cn中定义的大陆简体转换表,其三是在MediaWiki:Conversiontable/zh-tw中定义的台湾正体转换表,其四是在Mediawiki:Conversiontable/zh-hk中定义的港澳繁体转换表、其五是在Mediawiki:Conversiontable/zh-sg中定义的新马简体转换表。 全局转换是最为方便快速的转换处理方式,但也较容易出现过度转换的问题。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。 对于地区词的全局转换,维基百科特别设立了一个Wikipedia:地区词全局转换侯选的页面,在该页面中,用户可根据需求,并在符合后文中列出的先决条件的情况下,提交其希望加入全局转换的地區詞。并通过社群投票产生共识,再由管理员加入相应的转换页面中。 判断投票通过的一般依据是:在7天时间里,总共获得6名具备投票资格的维基人的支持,且反对票数不超过总票数的三分之一。 以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这样的限制,提报位置见下):
此外,被转换词字数较少(不大于三字)的转换,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。 关于汉字字频方面的研究,可参考汉字单字字频总表、现代汉语常用字表与其他的相关统计。 如果您发现了地区词的过度转换错误,请前往Wikipedia:字词全局转换修复请求提报。 [编辑] 地區詞的全文转换全文转换适用于特定的单个条目,有极强的针对性。 “-{A|转换内容}-”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利于进行维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“ 由于全文转换的针对性极强,所以较难出现过度转换的情况。但有些情况也需要利用单独转换来实现。 [编辑] 地區詞的公共组转换对于一些主题、领域相同和相似的条目,其中需要被转换的内容是大同小异的,可以把這些多个条目中要用到的共同轉換字詞單獨建立一個公共轉換組。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。 建立一個公共轉換組時,要依據這一組大多數詞彙在多個條目中被轉換的可能性,而不應依據轉換詞彙的類別。比如,各國現任領導人的姓名轉換,存在復用的可能性非常低,就不應當建立這樣類別的公共組。建立公共轉換組的方法可參見Wikipedia:字詞轉換處理/公共轉換組中。 公共组转换中的转换内容可由普通用户所控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换。一个典型的例子是“數位=>数码”的转换:对于全局转换来说,在非电脑和信息技术相关的条目中,“數位”的后侧极有可能会搭配“人士”并组成“數位人士”一词,这样便会导致“数码人士”的过度转换结果产生。然而,在电脑和信息技术的公共组转换中,所涉及到的条目大多是技术类型的条目,其中有许多本来就应该被转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。 然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也是有其局限性的。过度的地区转换可以通过繁简处理的全局转换来进行修复(详见该页面),也可以通过后文中提供的其他方式实现。 [编辑] 地區詞的单独转换“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。 举例而言,在条目艾奥瓦州中,单独转换“ 又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位=>数码”转换的同时可通过“數-{}-位人士”来避免过度转换。 [编辑] 注意事项[编辑] 手动转换的书写格式
虽然,地區詞处理只涉及zh-cn、zh-tw、zh-hk、zh-sg四种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。 然而,上述的操作实际上并不完全符合于繁简转换与地區詞转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填寫繁简體對應詞,不要填寫對應地區詞。對A轉換采用哪一地區詞先到先得(即先編輯轉換的),對於T轉換,要求除繁簡之別外與標題一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。 [编辑] 参考文献中应避免地区词转换的情况此外,参考文献中的文字应只进行繁简转换,而不进行地區詞转换(非中文的标题、姓名、引文等内容的中译除外)。但在目前,尚未有此种技术可在参考文献中进行单独的转换。因此,如果在参考文献中不进行避免过度转换的处理,则无论是在全局转换、主题转换还是全文转换中,都有可能会对其中的文字造成影响。 [编辑] 參見 |