跳转到内容

维基词典:語言

維基詞典,自由的多語言詞典
(重定向自Wiktionary:语言
關於所有語言代碼的列表,請參見Wiktionary:語言列表
關於如何在維基詞典中添加或移除語言,請參見Help:新增和刪除語言

維基詞典收錄了許多語言中的許多詞彙。本頁詳述了與維基詞典中各種語言相關的慣例和實踐。

收錄標準

[编辑]

語言資訊

[编辑]

為了區分不同語言,維基詞典為每種語言賦予一個獨特的名稱和代碼以作識別。此外還收集了其他資訊。

語言名稱

[编辑]

維基詞典用獨特的名稱稱呼其收錄的每種語言。這些名稱用於標題、翻譯表格、分類、附錄和其他地方。大多數語言只有一個名稱,但有些語言可能有多個名稱。在這種情況下,會選擇該語言的其中一個名稱在維基詞典中使用。這個名稱被稱為該語言的「規範名稱」。規範名稱藉由共識選定。已確認的名稱(符合WT:CFI的名稱)是最優先考慮的。

規範名稱必須是獨特的,意味著一個名稱最多只能指代一種語言。當兩種或更多語言通常以相同的名稱為人所知時,維基詞典藉由各種方法為每種語言選擇不同的規範名稱來區分它們:

  • 在許多情況下,這些語言也有其他名稱。這時會選擇其中一個獨特的名稱。
  • 相同名稱的不同拼寫方式也可用於區分原本名稱相同的語言。例如,印度和孟加拉國的 Riang(代碼:ria)在維基詞典中稱為「梁語」,以區別於緬甸的 Riang「日昂語」(代碼:ril)。
  • 如果無法通過替代名稱來區分語言,則在名稱後的括號中加上該語言使用地區,如「麥瓦語 (印尼)」(代碼:wmm)和麥瓦語 (新幾內亞)」(代碼:mti)。
  • 如果語言使用相同的名稱在相同的地方使用,可以使用其語系來區分。例如,「莫爾語 (南島語系)」(代碼:mhz)和「莫爾語 (巴布亞諸語言)」(代碼:moq),這兩種語言都在印尼使用。

語言代碼

[编辑]

維基詞典中的每種語言也都有一個獨特的代碼,通常由兩個或三個字母組成。在條目中使用模板時會使用這些代碼來識別語言。這種情況下不使用語言名稱,因為它們較長且較不精確,如上節所述。

標準語言代碼的列表可在Wiktionary:語言列表找到,而特殊語言代碼(包括僅用於詞源的語言)的列表則可在其子頁面Wiktionary:語言列表/特殊找到。

維基詞典按以下優先順序為語言選擇代碼:

  1. 如果該語言在ISO 639-1標準中有雙字母代碼,則使用該代碼。維基百科有ISO 639-1代碼列表
    1. 少數語言在維基詞典中使用了已被國際標準化組織(ISO)棄用639-1代碼。這通常發生在ISO將某幾種言語視為一組語言,但維基詞典仍將其視為單一語言的情況。例如,塞爾維亞-克羅地亞語由代碼sh表示。
  2. 如果該語言在ISO 639-3標準中有三字母代碼,則使用該代碼。維基百科有ISO 639-3代碼列表。跨語言詞語使用代碼mul
  3. 如果該語言在ISO 639-2標準中有三字母代碼,則使用該代碼。這種情況很少見。
  4. 對於沒有ISO代碼但需要納入維基詞典的語言,會為其制定新的維基詞典特有的「特例」代碼。這種代碼由兩部分組成。第一部分是來自ISO 639-5最接近的三字母(ISO)語系代碼,後面加上連字號。第二部分是一組近似於該語言名稱的三個小寫字母。(不使用數字、大寫字母等:IANA標籤允許這些,且不區分大小寫,但MediaWiki軟體有更嚴格的限制。)例如,加羅語的代碼是roa-gal:「roa」是羅曼語族的ISO 639-5代碼,「gal」是「Gallo」的縮寫。
    1. 在極少數情況下,維基媒體基金會語言委員會已經制定了這種形式的代碼來表示某種語言,在該語言的維基項目的URL子域名中使用;在這種情況下,我們使用維基媒體代碼。例如,維基媒體基金會使用map-bms表示班尤馬山語(班尤馬山語維基百科的網址是map-bms.wikipedia.org),因此維基詞典也使用這個代碼表示班尤馬山語。如果維基媒體代碼採用不同形式,則維基詞典不使用;例如,塔倫蒂諾語的維基媒體代碼是roa-tara,但維基詞典代碼是roa-tar
    2. 如果該語言所屬的語系沒有ISO代碼,或不知道該語言屬於哪個語系,則使用前綴mis:例如,加喜特語由代碼mis-kas表示。
    3. 如果該語言是底層語言,則使用前綴qsb而不是qfa-sub
    4. 祖語或「原始語言」(通常是重建的,但有些像原始諾爾斯語是直接有史料佐證的)被賦予由語系代碼加上「-pro」組成的特例代碼:例如,原始日耳曼語由代碼gem-pro表示。因為使用了完整的語系代碼作為代碼的第一部分,所以代碼可能超過七個字元:例如,原始米塞-索克語的代碼是nai-miz-pro

不是所有被ISO賦予代碼的語言都在維基詞典中被賦予代碼或被收錄,例如某些人工語言。此外,有許多被ISO賦予代碼的語言在維基詞典中不被視為獨立的語言。例如,ISO為摩爾多瓦語摩爾達維亞語賦予了639-1代碼mo,但維基詞典將其視為羅馬尼亞語的一種形式,並用相同的代碼ro表示它和羅馬尼亞語。更多資訊請參見英語維基詞典的語言處理

與維基媒體代碼的不匹配

[编辑]

在少數情況下,維基詞典使用的(通常源自ISO的)語言代碼與維基媒體基金會使用的代碼之間存在不匹配。例如,阿羅馬尼亞語在維基詞典和ISO 639-3中由代碼rup表示,但維基媒體基金會使用代碼roa-rup,阿羅馬尼亞語維基百科位於roa-rup.wikipedia.org。維基詞典用於連結到姊妹項目的模板(如Template:wikipedia)只接受維基詞典代碼。為了能夠連結到使用特殊代碼的項目(如阿羅馬尼亞語維基百科),Module:wikimedia languages將維基詞典代碼映射到維基媒體代碼,而Module:languages則執行相反的映射。

語系

[编辑]

維基詞典將語言分類到語系中。大多數語系是通過共同祖先的後裔相關聯的,但有少數僅僅是分類,如「克里奧爾語和皮欽語」。維基詞典在Module:languages的資料模組中記錄每種語言所屬的語系。與語言一樣,語系也有獨特的代碼和規範名稱。

  • 漢語屬於漢語族(代碼:zhx)。
  • 英語屬於西日耳曼語支(代碼:gmw)。
  • 塞爾維亞-克羅地亞語屬於南斯拉夫語支(代碼:zls)。
  • 阿貝納基語屬於阿爾岡昆語族(代碼:alg)。
  • 古典納瓦特爾語屬於納瓦語族(代碼:azc-nah)。

有些語言並非自然從其他語言演變而來,而是有其他起源。這些語言使用特殊類型的語系:

  • 廣泛使用的人工語言世界語是一種人工語言(代碼:art)。
  • 查瓦卡諾語,一種克里奧爾語,被歸類於克里奧爾語或皮欽語(代碼:crp)。

語言使用的文字

[编辑]

維基詞典也記錄每種語言使用的文字(書寫系統)。這些資訊主要用於模組,以便自動檢測和適當格式化非拉丁字母的文字。文字系統也有獨特的代碼和規範名稱。

  • 英語使用拉丁字母(代碼:Latn)。
  • 塞爾維亞-克羅地亞語同時使用拉丁字母文字和西里爾字母(代碼:LatnCyrl)。

查找和組織某種語言的詞條

[编辑]

每種語言都有一個主分類,包含英語維基詞典中該語言的所有詞條。這個分類的名稱使用該語言的規範名稱。例如,漢語的主分類是Category:漢語、法語的主分類是Category:法語

一種語言的主分類會有各種子分類,以不同方式組織詞條。最重要的是「詞元」分類樹,它按詞性組織該語言中的所有詞元。由於維基詞典一直在擴展和改進,並非所有語言都有自己的分類,某些子分類可能仍然是空的或缺失的。分類會在需要時創建,即當有新條目添加到其中時。當在缺少分類的語言中添加內容時,只要名稱遵循其他語言使用的標準格式,就可以簡單地使用{{auto cat}}模板創建。

語言通常也有一個頁面,包含對想要創建或編輯該語言條目的用戶有用的資訊。這個頁面的名稱是「Wiktionary:關於(語言的規範名稱)」,例如Wiktionary:關於西班牙語Wiktionary:關於查蒂諾語。這些頁面包含各種資訊,具體取決於其他編輯者認為有用的內容。它們可能解釋使用哪些模板、關於拼寫、發音或音譯的具體慣例等等。按照慣例,會為這些頁面創建一個快捷重定向以方便訪問,名為WT:A(語言代碼)。例如,WT:AEN重定向到Wiktionary:關於英語(因為其代碼為en)。

存儲和檢索語言資訊

[编辑]

模板和模組使用一個系統來存儲和檢索可能與語言相關的各種資訊。模組Module:languages用於從其他模組檢索所有與語言相關的資訊。這個模組不能直接在模板中使用,因此還有另一個名為Module:languages/templates的模組,允許模板訪問這些資訊。

關於一種語言的所有基本資訊概覽,如其規範名稱、替代名稱、代碼、語系或文字系統,都可以在Wiktionary:语言列表(或簡稱WT:LL)中查詢。當你需要查找特定語言的代碼,或需要知道某種語言的規範名稱時,這很有用。

資料本身並不存儲在Module:languages中,而是包含在一些資料模組中(參見Category:語言資料模塊)。 關於如何編輯這些資訊的說明,請參見任何資料模組的文件。

僅用於詞源的語言

[编辑]

某些言語(如方言/dialect、時間方言/chronolect和地域方言/topolect)有自己的語言代碼,可以在許多類型的模板中代替完整的語言代碼使用,但沒有自己的二級語言條目。例如古典波斯語被賦予代碼fa-cls,但其條目列在==波斯語==標題下(對應語言代碼fa)。「僅用於詞源的語言」這個術語最初是恰當的,因為這些語支通常只能在詞源模板中使用,如{{inh}}{{bor}}{{der}},但它們的使用現在已經遠遠超出了這些模板,「僅用於詞源的語言」在未來可能會更名為「語言變體」。

僅用於詞源的代碼完整列表可在Wiktionary:語言列表/特殊#僅用於詞源的語言中找到,描述它們的源模組是Module:etymology languages/data

另見

[编辑]