通译百科：合字

含光混世贵无名,孤高何用比云月

合字

查询结果如下：

详细条目英文搜索 <<快速查询：

合字、连字、连结字或合体字，中文里指多个独体字组成的字，如：“昌”、“想”等，在西方字体排印学中一般表示将多于一个字母的合成一个字形。如印刷品中常常将拉丁字母两个字母fi的i上一点常与f的一横合并，而德语字母“β”原为ss等等。合字经过演变、长时间流行后，可能被视为直接的符号、文字而非合字。如W源自VV或UU，Æ源自AE，而表示“与”的意思的“&”，原是e和t的合字。另外，汉字中如孔孟好学、招财进宝、日进斗金、囍一般称为合文。

合字历史起源

印刷合字单纯源于手写本中连写的字符。以发现的最早的楔形文字手写本中就已经含有很多

“招财进宝”的合书

连写字符。中世纪的拉丁文手写本中，誊写僧人为加快速度将字符连写，诞生了很多手写缩合字，如在哥特体中，带右圈的字母 (b, o, 和 p) 和带左圈的字母 (c, e, o, d, g 和 q) 的圈部都被重叠书写。很多手写本字符如h, m和n的竖划都被重叠，而且诞生了很多手写缩合字。14世纪的手写本中含有很多这种手写缩合字。

当活字印刷诞生后，很多合字直接被制造成了铅字。但是在1950年代无衬线字体广泛使用，以及1970年代照相排版技术之后，合字就逐渐很少被使用。最早能进行合字电脑排版（之后激光打印机）之一的是高德纳的TeX 程序 (详见下文)。这一潮流也影响到了1985年之后的桌面排版技术。早期电脑软件 ( TeX除外)无法进行合字替换，大部分新制作的电脑字体里也没有合字。早期的个人电脑多使用英文，而英文中并不是必须使用合字，所以也没有实际需要。

随着现代电脑处理的多语言化和现代电子排版技术（如 OpenType），合字开始逐渐恢复被使用。

合字拉丁文字

合字书法合字

标识得最后一个字是 'tʒ'合字。

许多合字都把字母f和其后的字符组合起来，最常用的就是ﬁ (或 fi，显示为两个独立字符)。很多字体的这两个字母并排在一起后，字母i上的点会抵挡到字母f的弧形勾，无法正确排印，所以干脆就制造一个合字铅字，把 i 的点融入 f 的勾来直接使用。其他 f 合字包括 fj, fl (ﬂ), ff (ﬀ), ffi (ﬃ), 和 ffl (ﬄ)。其他合字包括fa, fe, fo, fr, fs, ft, fb, fh, fu, fy，以及f 后加句号、逗号或连字符，还有不太常用的双写ff和 fft 。

使用这些合字是因为通常的小写字母 f中弧形勾影响字符间距调整。

有时，跨词合字 (如 shelfful的'ff')是不希望出现的，电脑程序 (如TeX)提供手动方式将它们分开。一些字体带有 fff合字 (如Requiem体甚至包括一个 fffl 合字)用于德语的复合词，如 Sauerstoffflasche ("氧气罐") 和 Schifffahrt ("游艇") (仅在遵循1996年拼写改革法的前提下才写作 fff）。正式的德文正字法，如 Duden所述，不赞成跨词合字，由于fff组合在德文中只会在组合词出现如 (Schiff-fahrt, Sauerstoff-flasche)，所以这样跨词合字在德文中使用会被认为是不正确的

土耳其语中有带点和不带点的字母I，如单词 fırın ("烤箱") 和 fikir ("主意".。 fi合字容易混淆，所以在土耳其文排印中一般不使用该合字。像 fl合字一般也不用，土耳其语本来就没有这样的拼写。

合字"ſʒ ("sz")和tʒ ("tz") 来自德语哥特体，现在街头、城市广场的标识中带Platz或者以-platz结尾时仍常被使用。

有时 st (ﬆ) ſt (ﬅ), ch, ct以及Qu的合字也被使用(如字体Linux Libertine)。

合字起源字母

字母W是7世纪左右才被加入拉丁字母表的，其发音不尽相同。古英语使用卢恩字母Wynn (Ƿ) ，但受到诺曼人影响后废弃不用。14世纪，这个起源于双写的V或U的"新"字母W诞生并在字母表中占有一席。由于它相对于其他字母比较年轻，只有很少欧洲语言（英语、荷兰语、德语、波兰语、威尔士语、马耳他语和瓦龙语）使用它来拼写本土词汇。

字符Æ（小写æ，中世纪时称为aesc）作为一个字符在丹麦语、挪威语、冰岛语以及古英语中使用，并不是一个印刷用的合字。它是一个实在的字母——代表一个元音，且在字母表中有位置。现代英文正字法中Æ不作为一个单独字母，而只是一种拼写异形，如百科全书的英文单词 "encyclopædia" 也可拼写成 "encyclopaedia" 或"encyclopedia"。

Æ源自中世纪拉丁文，当时只是一些词汇的随意合字如 "Æneas"。它还可以在英文和法文中出现，但是现在已经倾向把 A和E分开印刷。同样，Œ 和œ在法文中虽然通常印刷成合字，但在技术限制情况下仍可以拆开书写。

在德文正字法中，带两点的字母元音ä, ö和ü来自历史上的ae, oe, ue 合字（严格的说是上标的e，即aͤ, oͤ, uͤ）。现在当文字处理无法显示这三个字符的情况下仍可改写为二合字母ae, oe, ue。字母排序中它们不等价于ae, oe, ue，而是被简单看成 a, o, u。而北欧语言则不同：带两点的字母被视为独立字母，并排在字母表最后。

一些元音中的圈形附加符号，如 å起源于一个o合字。现在把旧式 aa 改写为 å 已经称为不成文习惯，但在此之前也可写成 a 上再加一个小 a (aͣ)，如 Johannes Bureus, Runa ABC boken 。

uo 合字 ů 的使用实例也在早期现代高地德语里找到，但其后来混同到u中（如中期高地德语的fuosz、早期现代高地德语 fuͦß、现代德语 Fuß）。它仍存在于捷克语中，被称为kroužek。

西班牙语和葡萄牙语中的上波浪线，分别用于字母ñ和表示元音鼻音化，起源于一个nn合字（Espanna = España, anno = año）。同样法语中的抑扬符也源自不发音s。法语、葡萄牙语、西班牙语等中的字母ç其实是一个字母 "c" 盖在一个"z"上面的形式。

字母hwair（ƕ）仅用于转写哥德语，代表hw合字。最早在1900年左右心理学者使用这个字用于代替二合字母 hv 用于表示有问题的现象，如Jacques Paul Migne在其1860年代的著作 (Patrologia Latina，第18卷).

拜占庭帝国有一个独特的合字o-u ligature (Ȣ) ，它源于希腊字母的 ο-υ 两个字母的合字，并被加入到了字母表中。

Gha (ƣ)是一个罕见的字母，起源于 Q 和 G，但在ISO的文件中误注成 O-I 合字（参见Unicode注解）

国际音标使用合字来表示塞擦音，其中6个有Unicode编码: ʣ, ʤ, ʥ, ʦ, ʧ and ʨ。一个擦音仍使用合字：ɮ，而国际音标扩展里加入了后三个：ʩ , ʪ and ʫ.

合字起源符号

最常用的合字符号当属 &。它起源于E 和t的合字，即拉丁文的单词“和”（ "et"）。它在法文中保持原音原意而在英文中也使用。由于其使用广泛，一般已经不认为它是一个合字而是一个普通符号。

和其他合字一样，它被仍当作一个字母来使用（如早期现代英语），英语中它念作"and"而不是"et"，而&c念作 "et cetera"（等等）。大多数字体中的字形和两字直接组合不一样，但仍有一些字体 (如Trebuchet MS) 就把他们设计 & 为合字。

同样，美元符号 $可能也起源于合字 ( "pesos"，但有也有其他不同说法)，但现在实际上已经被当成一个普通符号。西班牙比塞塔(peseta)也有时被写作合字 ₧ (源自 Pts).

合字二合字母

二合字母，如西班牙语和威尔士语中的 ll，一般不被看成是合字，因为印刷上两个字母通常是分开的。正如上讨论的合字一样，一些二合字母在一些语言中有不同处理方式。西班牙1994年拼写改革时，二合字母ch 和 ll 已经被考虑为分开的两个字母。

法文的情况也一样，œu被看成为合字 œ与字母 u的组合。

尽管如此，荷兰语中 "ĳ"的定位比较模糊。根据不同的使用标准，它可看成是一个二合字母，或合字，或者一个独立字母。它有独立的大小写形式，而在一些专业字体中，通常是有一个独立字形也有合字 (如 Zapfino)。无衬线字体大写字母的Ĳ流行于荷兰，通常形状像是一个断左臂的U。更令人混淆的是，手写时可以把小写字母y写作没有点的 ĳ，和大写字母IJ (同样没有点)看起来只是大小差异而已。而 Y在本土荷兰语词汇中不被使用。

合字合字语言

丹麦语和挪威语

法语德语冰岛语瑞典语

合字非拉丁字符

合字不仅出现在拉丁文本中：

婆罗米系文字的元音附标文字频繁使用合字标注辅音。合字的数量依据语言而不同，如同样的天城文，用于梵文的合字就要比印地文多。总数为37的辅音中，在天城文两个字母组成的合字总数为1369，很少字体能全部显示这些合字。微软[Windows]]系统附带的''Mangal.ttf''字体带有印地语支持，但不能正确处理在द, ट, ठ, ड, 和 ढ右边的辅音合字，而只是加 virama后按照一般形式显示在辅音之后。希腊字母中使用一些合字，特别是在 omicron (Ο) 和 upsilon (Υ)连写 which later gave rise to one of the letters of the Cyrillic alphabet —参见Ou字母。西里尔合字: Љ, Њ, Ы, Ѿ. Iotified 西里尔字母是早期西里尔illic decimal I和其他元音的合字: Ꙗ (Я的祖先), Ѥ, Ѩ, Ѭ, Ю (源自另外一个合字，Оу,早期的У形式）。马其顿和塞尔维亚字母表中的两个字母 lje 和 nje (љ, њ)在19世纪曾分别是El En (л, н) 与软音符 (ь)的合字。还有一个ya (Я)和 e 的合字：Ԙԙ,其他合字包括 Ꚅꚅ 和 Ꚉꚉ. 格拉哥里字母的一些手写形式：用于中世纪到19世纪书写 Slavic 语言，多为方形且常用合字。在希伯来语中字母aleph 和 lamed 在一些前现代文本中（主要是宗教或“犹太-阿拉伯”文本）可组合为合字。该组合很常用，因为 [ʔ][a]l- (在希伯来文中写作 aleph加lamed)是阿拉伯语中的定冠词。阿拉伯文：各个字母在词头，词中，词尾均有不同形式。如阿拉伯文的mīm，单独书写为 م‎，三个连写 (mmm，显示为词头，词中，词尾形)就变为 ممم ‎。注意 lām + ʼalif 的情况是特殊的： ﻻ‎, 而 lām + ʼalif 词中，词尾形是ﻼ‎。在Unicode有一个特殊的安拉合字位于U+FDF2: ﷲ‎. 乌尔都语使用阿拉伯字母的手写体 (Nasta`līq Script) ，在电子排印中有大量合字。乌尔都语最常用的排版工具 InPage使用 Nasta`līq Script字体多达 20,000个合字。

合字电脑排版

TeX是电脑排版系统中能使用合字的典型程序。它能提供五个常用合字： ff、fi、fl、ffi 和 ffl。当TeX遇到这些组合时会自动替换成合字。当然操作者可以手动切换。

OpenType字体格式可以针对一个字符提供多个字形，因此用来作为合字替换，但需要软件支持。XeTeX是一个TeX 排版引擎用来调用这些功能。这种替换原先主要用于阿拉伯文排版，但现在已经广泛用于西文。

下表列出了常用文字对的合字以及Unicode代码。正确显示需要使用能正确处理合字的操作系统和浏览器并调用正确的Unicode 电脑字体。

Unicode中对合字的处理不是一种字符定义，而是一种表现形式。比如，如果一个现代字体需要显示'h'后加 'r'，且该字体确实有'hr'合字，这个合字才会被显示出来。因此，使用特殊Unicode合字字符是"不鼓励"且"在任何环境下不会被再度编码"。注意，合字 æ 和 œ 不能随意替代 'ae' 和 'oe'，比如 'does'不能写作 'dœs'。

Unicode

这是一个不完整列表。U+A732到U+A73D 区域及其临近区域的一些字符没有列出。

非合字	合字	Unicode
Et	&	U+0026
ſs, ſz	ß	U+00DF
AE, ae	Æ, æ	U+00C6, U+00E6
OE, oe	Œ, œ	U+0152, U+0153
IJ, ij	Ĳ, ĳ	U+0132, U+0133
ue	ᵫ	U+1D6B
ff	ﬀ	U+FB00
fi	ﬁ	U+FB01
fl	ﬂ	U+FB02
ffi	ﬃ	U+FB03
ffl	ﬄ	U+FB04
ſt	ﬅ	U+FB05
st	ﬆ	U+FB06

另外，Dz、克罗地亚语和波斯尼亚语字母 DŽ, LJ, 和 NJ都有单独的码位。它们不是合字而是二合字母。仅在语音转写中使用的合字

Non-ligature	Ligature	Unicode
db	ȸ	U+0238
qp (cp)	ȹ	U+0239
dz	ʣ	U+02A3
dʑ (or dz curl)	ʥ	U+02A5
dʒ (or dezh)	ʤ	U+02A4
fŋ	ʩ	U+02A9
ls	ʪ	U+02AA
lz	ʫ	U+02AB
lʒ (or lezh)	ɮ	U+026E
tɕ (or tc curl)	ʨ	U+02A8
ts	ʦ	U+02A6
tʃ (or tesh)	ʧ	U+02A7