Wikipedia:字词转换错误修复请求

维基百科,自由的百科全书

跳转到: 导航, 搜索

现在繁简体、地區詞转换的程序已经初具雏形。本页将用来對已投入的轉換進行檢驗,對過度轉換的情況可以在此報請修復。请大家热心参与!

目录

[编辑] 一對多轉換原理及錯誤原因

由於简体中文以單一简体字來取代多個繁體字,因此必須有額外的資料來補足原先丟失的資訊。舉例說明:例如在繁體中的“髮”或“發”,在简体下都是“发”。在程式裡,我們有一個預設的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程式遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢? 這個就要看詞庫內而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。

那詞庫是如何建立的呢? 我們先有每個字的預設對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含(繁體)“發”的的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的預設對應關係。

修復過度轉換也是由上述的方法來處理。

下面的请求处理后,如有必要,处理者应将之完善到Wikipedia:简繁一多对应校验表Wikipedia:繁简一多对应校验表

[编辑] 修復討論

现在繁简体、地區詞转换的程序已经初具雏形。本页将用来對已投入的轉換進行檢驗,對過度轉換的情況可以在此報請修復。请大家热心参与!

目录

[编辑] 一對多轉換原理及錯誤原因

由於简体中文以單一简体字來取代多個繁體字,因此必須有額外的資料來補足原先丟失的資訊。舉例說明:例如在繁體中的“髮”或“發”,在简体下都是“发”。在程式裡,我們有一個預設的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程式遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢? 這個就要看詞庫內而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。

那詞庫是如何建立的呢? 我們先有每個字的預設對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含(繁體)“發”的的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的預設對應關係。

修復過度轉換也是由上述的方法來處理。

下面的请求处理后,如有必要,处理者应将之完善到Wikipedia:简繁一多对应校验表Wikipedia:繁简一多对应校验表

[编辑] 修復討論

2008年6月

[编辑] 錯誤轉換:「钟情」現換成「鐘情」,應為「鍾情」

[编辑] 錯誤轉換:「卷」換成「捲」

請修復古藉文獻中「卷」多少,會自動轉換為「捲」多少,如《新唐書‧捲300》,幾乎全部古藉都有同樣問題(當然文庫會最嚴重);其他說明:不知可否直接取消卷這一個字的轉換,然後卷->捲的繁簡轉換用特例處理呢?加油,明白及體諒你的辛勞。罰抄(罰抄會館) 2008年6月18日 (三) 04:55 (UTC)

[编辑] 錯誤轉換:「本斗」在繁體下會過度轉換成「本鬥」

[编辑] Template:CGroup/Show收錄越多字會令越多文章出錯

2008年7月

[编辑] 錯誤轉換:“郁永河”在台灣正體下被過度轉換成了“鬱永河”

[编辑] 錯誤轉換:“向日市”在台灣正體下被過度轉換成了“嚮日市”

[编辑] 錯誤轉換:“漏斗”在台灣正體、繁體、港澳繁體下被過度轉換成了“漏鬥”

[编辑] 錯誤轉換:「占城」在繁體、台灣正體、港澳繁體下被過度轉換成「佔城」

[编辑] 錯誤轉換:「悉尼」在港澳繁體下被錯誤轉換成「雪梨」

[编辑] 錯誤轉換:「水平」不完全等於「水準」

「水平」一詞在台灣正體下會被轉換為「水準」,但並不是所有的水平都等於水準,請求取消這個轉換;錯誤案例:三色旗。—jitcji 2008年7月31日 (四) 10:23 (UTC)

2008年8月

[编辑] 错误转换:繁体词“恐佈”被转换成了“恐布”

[编辑] 錯誤轉換:干涉 → 幹涉

請修復干涉 → 幹涉;錯誤案例:約翰·梅納德·凱恩斯條目中:「他的這些思想為政府幹涉經濟以擺脫經濟蕭條和防止經濟過熱提供了理論依據」;其他說明:繁體中文一樣是用「干涉」,這裡有過度翻譯的問題。。—Quest for Truth (留言) 2008年8月5日 (二) 16:53 (UTC)

可能是個別條目的繁簡轉換出錯,原因未明,因在其他頁面中也沒發現問題(Wikipedia:简繁一多对应校验表/干→乾干幹榦User:Stewart/test/03a<第3個>),而在zh-hant、zh-hk、zh-tw也均沒發現出錯。Stewart~惡龍 2008年8月6日 (三) 00:56 (UTC)

[编辑] 錯誤轉換:新西兰→紐西蘭

香港使用「紐西蘭」居多。請修改:「紐西蘭=>新西蘭」「新西蘭=>紐西蘭」,並添加「新西兰=>紐西蘭」。HoiNapBakTsyn 2008年7月26日 (六) 15:28 (UTC)

Done完成 Stewart~惡龍 2008年8月6日 (三)

[编辑] 錯誤轉換:福斯→福士

威伯福斯」在zh-hk顯示成「威伯福士」,不知為何,但應屬字詞轉換問題。HoiNapBakTsyn 2008年7月26日 (六) 15:28 (UTC)

未發現有關問題。未完成未完成 Stewart~惡龍 2008年8月6日 (三) 00:44 (UTC)
(:)回應:找到了。是美國的電視台Fox TV「zh-cn: 福克斯; zh-tw: 福斯; zh-hk: 福士」的過度轉換問題,請核實。HoiNapBakTsyn 2008年8月6日 (三) 03:17 (UTC)

[编辑] 錯誤轉換:索贊尼辛→蘇辛尼津

俄羅斯文學家Aleksandr Solzhenitsyn最近逝世。「Solzhenitsyn」,中國大陸譯作「索尔仁尼琴」,台灣譯作「索忍尼辛」,香港譯作「索贊尼辛」。現時系統錯誤把(zh-cn)的「索尔仁尼琴」轉換為(zh-hk)「蘇辛尼津」(懷疑是惡搞,網上極少結果,今天的報章也不用此譯名)。因為此譯名在首頁的新聞動態顯示,希望你可以盡快修改。HoiNapBakTsyn 2008年8月5日 (二) 02:24 (UTC)

已處理有關申請。Done完成 Stewart~惡龍 2008年8月6日 (三) 00:58 (UTC)

[编辑] 錯誤轉換:“迈克尔”被过度转换成了“米高”

請修復“迈克尔”被过度转换成了“米高”;錯誤案例:所有並非運動員、藝人的「迈克尔」;其他說明:香港並非盲目把所有Michael譯「米高」,只有在運動員、藝人人名上才譯「米高」,其餘依大陸用「邁克爾」。。—HoiNapBakTsyn 2008年8月6日 (三) 06:12 (UTC)

[编辑] zh-hans:人参; zh-hant:人蔘;

[编辑] 錯誤轉換:zh-hans:人参; zh-hant:人蔘;

請修復zh-hans:人参; zh-hant:人蔘;,其實可轉換成zh-hant:人參;錯誤案例:Wikipedia:互助客栈/方针#关于版权,内容来源,词条数量:「可见是没人参与的」錯誤轉換成「可見是沒人蔘與的」;其他說明:其實就算真的是說補品的那個人參,在繁體中文世界裡還是多數用不加草花頭那個的,即「人參」就可以了,至於單字「蔘」本身已經有人參的意思。—Quest for Truth (留言) 2008年8月6日 (三) 18:13 (UTC)

[编辑] 錯誤轉換:「大坂」被转换為「大阪」

請修復「大坂」被转换為「大阪」;錯誤案例:「大坂」被转换為「大阪」;其他說明:「大坂」與「大阪」不是繁簡關係,應取消。。—百楽兎 (留言) 2008年8月8日 (五) 02:21 (UTC)

[编辑] 错误转换:zh-hans:复平面;zh-hant:復平面

请修复“复平面”→“復平面”的错误转换,正确的转换应为“复平面”→“平面”,错误案例:亚纯函数(在复分析中,一个复平面的开子集D上的……)。--Maxwell's demon (留言) 2008年8月8日 (五) 13:55 (UTC)

[编辑] 字詞轉換錯誤修復請求/2008年8月

[编辑] 錯誤轉換:「相干」變了「相乾」,無論簡繁應該都是「相干」

請修復「相干」變了「相乾」,無論簡繁應該都是「相干」;錯誤案例:原文(簡體)的「还是经理解后在前后文不相干的情况下复述而来」在繁體下變成了「還是經理解後在前後文不相乾的情況下複述而來」,正確的轉換為「還是經理解後在前後文不相干的情況下複述而來」;其他說明:來自Wikipedia:互助客栈/方针#是否版权偏执了?。—Quest for Truth (留言) 2008年8月8日 (五) 16:26 (UTC)


Marketing Zakup nieruchomości Kołki rozporowe kowalstwo artystyczne nieruchomości Szczecin Autokomis bilety do anglii pikniki firmowe nieruchomości Katowice dodatki krawieckie Witryny chłodnicze Projekty domów ekologiczne produkty ps3 forum akwarystyka kick koparki Bułgaria wczasy Karaoke tani kredyt hipoteczny COOLsurf