维基词典:文字
| 這是一個維基詞典政策、指引或常規做法頁面。具體而言,這是一個政策智庫,致力於制定正式政策。 | |
| Template:Policy-list |
- 本頁面是關於書寫系統(文字)。關於使用者腳本列表,請參見 Wiktionary:使用者腳本;關於 Lua 程式編寫資訊,請參見 Wiktionary:Scribunto。
- 關於所有文字代碼的列表,請參見Wiktionary:文字列表。
文字(Scripts)或書寫系統(Writing systems)是指一組字符的集合。
約定
[编辑]在維基詞典中,每種文字都由一個「代碼」和一個「名稱」來識別。這些文字代碼源自 ISO 15924(附錄、unicode.org),並增加了一些補充內容。例如:
Arab:阿拉伯字母 (Arabic script)Cyrl:西里爾字母 (Cyrillic script)Latn:拉丁字母 (Latin script)
某些維基詞典文字代碼(用於特定語言的文字變體)是透過結合 ISO 文字代碼與維基詞典語言代碼來命名的。
fa-Arab:阿拉伯字母(波斯語變體)ks-Arab:阿拉伯字母(喀什米爾語變體)ota-Arab:阿拉伯字母(鄂圖曼土耳其語變體)pa-Arab:阿拉伯字母(旁遮普語變體)pjt-Latn:拉丁字母(皮詹查查拉語變體)ur-Arab:阿拉伯字母(烏爾都語變體)
還有一些命名較為特殊的代碼:
None:用於完全不進行格式化。這被用作一種「空白」或「未知」文字,供尚未在 Module:languages 中指定文字的語言使用。Polyt:用於古希臘語(相對於現代希臘語)文本,使用多調符號(polytonic diacritics)。Music:用於五線譜記號符號。Morse:用於摩斯密碼符號。Semap:用於旗語符號。Ipach:用於國際音標 (IPA) 字符。Rumin:用於魯米數字 (Rumi numerals,參見 Rumi Numeral Symbols)。
維基詞典所辨識的完整文字代碼列表可在 Wiktionary:文字列表 找到。
功能
[编辑]組織
[编辑]根據我們的收錄標準,維基詞典作為收錄所有語言中所有詞彙的字典,也包含了對單個字符的定義。因此,我們需要知道字符屬於哪些文字;這些知識也有助於透過分類和在附錄中進一步說明來組織這些字符。
文字定義於 Module:scripts/data。
格式化
[编辑]此外,文字片段可以根據其所屬文字,透過包裹 HTML span 標籤來進行格式化。理論上瀏覽器應該自動處理格式化,但在實務上效果往往不佳。因此,格式化(文本方向、字型家族或字型大小)是透過套用 HTML class 屬性(可用於透過中央階層式樣式表 (CSS)、已註冊編者的使用者樣式表或網頁瀏覽器的使用者樣式表來格式化文本)或行內樣式 (inline style) 屬性來控制。
使文字套用書寫系統
[编辑]為了格式化文本,我們提供了 {{lang}} 模板,它作為預定格式約定的包裝器。它是一個「基礎」模板,僅套用特定語言和文字的格式,不執行其他功能。當需要在一般情況下書寫非拉丁文本時可以使用此模板。此模板需要一個必填的語言代碼參數,以及要包裝的文本。選填參數 |sc= 用於在必要時覆蓋自動偵測的文字。|face= 參數可用於對文本套用特定樣式,可選值為 term、head、bold,或留空以顯示一般文本。這允許以特定文字的方式實作斜體和粗體效果,並採用適合該文字約定的格式,同時增進易讀性。
大多數顯示非英語文本的其他模板也有語言參數,以及用於覆蓋自動偵測文字的 |sc= 參數。這包括廣泛使用的模板,如 {{l}}、{{m}}、{{t}}、{{head}} 和 {{form of}}:
{{lang|sh|вријеме|sc=Cyrl}}顯示 вријеме{{m|sh|вријеме|sc=Cyrl}}顯示 вријеме{{head|sh|noun|g=n|sc=Cyrl}}顯示 вријеме 中{{t|sh|вријеме|n|sc=Cyrl}}顯示 вријеме 中
大多數模板(包括上述所有模板)都會執行文字自動偵測。它們會查看提供的文本,並嘗試判斷正在使用該語言(在 Module:languages 資料子模組中指定)的哪種文字。因此,幾乎不需要用到 |sc= 參數。然而,如果文本是以該語言未辨識的文字書寫的,則有必要提供該參數。
{{l|sh|vrijeme}}顯示 vrijeme(塞爾維亞-克羅埃西亞語的預設文字為 "Latn"){{l|sh|вријеме}}顯示 вријеме(模板也會辨識塞爾維亞-克羅埃西亞語列出的任何其他可能文字,在此範例中為西里爾字母){{l|sh|β|sc=Grek}}顯示 β(如果您想在塞爾維亞-克羅埃西亞語中寫入希臘字母,則需要提供文字代碼,因為希臘字母不是該語言的常規文字)
何時需要文字參數
[编辑]在絕大多數情況下,不需要使用文字參數,因為後端程式碼會自動處理文字標籤。只有在無法自動處理的罕見情況下才需要 |sc=。例如:
{{m|el|;|sc=Grek}}—— 在希臘語中,當術語不包含希臘字符但在希臘文字文本中使用時(如希臘語分號)。{{m|zh|man|sc=Hani|t=有男子氣概的}}—— 在漢語新詞中(主要借自英語),當一個拉丁字母單字被用於漢字文本中,且它不是羅馬化轉寫,因此不應被標記為Latn(拉丁字母)時。{{m|cmn|man}}—— 漢語拼音輕聲音節,會被自動偵測為拉丁字母。
- 在同時使用
Cyrl(西里爾字母)和Cyrs(古西里爾字母)的羅馬尼亞語中,兩者字符相同,但Cyrl代表現代摩爾多瓦語,而Cyrs代表較舊的西里爾拼寫法。
文字代碼列表
[编辑]截至2023年4月,維基詞典已納入所有 ISO 15924 代碼(參見 Appendix:ISO 15924),但以下代碼除外:
Aran, Cirt, Hanb, Jamo, Pcun, Pelm, Piqd, Psin, Sara, Syre, Syrj, Syrn, Zinh, Zsye, Zxxx。(ISO 還預留了幾個代碼空間;這些尚未納入。)
維基詞典也使用了一些未列於 ISO 15924 中的代碼。這些代碼包含在中央文字列表中,包括阿拉伯字母變體(fa-Arab 等)、拉丁字母變體(pjt-Latn)、多調希臘字母(Polyt)以及其他內容(如 mnc-Mong),還有音樂記譜法(Music)和國際音標(Ipach)代碼。代碼 None 在某些方面的功能類似於文字代碼。