合字历史起源
印刷合字单纯源于手写本中连写的字符。以发现的最早的
楔形文字手写本中就已经含有很多

“招财进宝”的合书
连写字符。中世纪的
拉丁文手写本中,誊写僧人为加快速度将字符连写,诞生了很多手写缩合字,如在
哥特体中,带右圈的字母 (
b,
o, 和
p) 和带左圈的字母 (
c,
e,
o,
d,
g 和
q) 的圈部都被重叠书写。很多手写本字符如
h,
m和
n的竖划都被重叠,而且诞生了很多手写缩合字。14世纪的手写本中含有很多这种手写缩合字。
当
活字印刷诞生后,很多合字直接被制造成了铅字。但是在1950年代无衬线字体广泛使用,以及1970年代
照相排版技术之后,合字就逐渐很少被使用。最早能进行合字电脑排版 (之后激光打印机)之一的是
高德纳的
TeX 程序 (详见下文)。这一潮流也影响到了
1985年之后的
桌面排版 技术。早期电脑软件 ( TeX除外)无法进行合字替换,大部分新制作的电脑字体里也没有合字。早期的个人电脑多使用英文,而英文中并不是必须使用合字,所以也没有实际需要。
合字拉丁文字
合字书法合字

标识得最后一个字是 'tʒ'合字。
许多合字都把字母
f和其后的字符组合起来,最常用的就是
fi (或
fi,显示为两个独立字符)。很多字体的这两个字母并排在一起后,字母
i上的点会抵挡到字母
f的弧形勾,无法正确排印,所以干脆就制造一个合字铅字,把 i 的点融入 f 的勾来直接使用。其他 f 合字包括
fj,
fl (fl),
ff (ff),
ffi (ffi), 和
ffl (ffl)。其他合字包括
fa,
fe,
fo,
fr,
fs,
ft,
fb,
fh,
fu,
fy,以及
f 后加
句号、
逗号或
连字符,还有不太常用的双写
ff和
fft 。
使用这些合字是因为通常的
小写字母 f中弧形勾影响字符间距调整。
有时,跨词合字 (如
shelfful的'ff')是不希望出现的,电脑程序 (如
TeX)提供手动方式将它们分开。 一些字体带有
fff合字 (如
Requiem体甚至包括一个
fffl 合字)用于德语的复合词,如
Sauerstoffflasche ("氧气罐") 和
Schifffahrt ("游艇") (仅在遵循1996年拼写改革法的前提下才写作
fff)。正式的德文正字法,如 Duden所述,不赞成跨词合字,由于
fff组合在德文中只会在组合词出现如 (
Schiff-fahrt,
Sauerstoff-flasche),所以这样跨词合字在德文中使用会被认为是不正确的
土耳其语中有带点和不带点的字母I,如单词
fırın ("烤箱") 和
fikir ("主意".。
fi合字容易混淆,所以在土耳其文排印中一般不使用该合字。像
fl合字一般也不用,土耳其语本来就没有这样的拼写。
合字
"ſʒ ("sz")和
tʒ ("tz") 来自德语
哥特体,现在街头、城市广场的标识中带
Platz或者以
-platz结尾时仍常被使用。
合字起源字母
字符
Æ(小写
æ,中世纪时称为
aesc)作为一个字符在
丹麦语、
挪威语、
冰岛语以及
古英语中使用,并不是一个印刷用的合字。它是一个实在的
字母——代表一个
元音,且在字母表中有位置。现代英文正字法中
Æ不作为一个单独字母,而只是一种拼写异形,如百科全书的英文单词 "encyclopædia" 也可拼写成 "encyclopaedia" 或"encyclopedia"。
Æ源自
中世纪拉丁文,当时只是一些词汇的随意合字如 "Æneas"。它还可以在英文和法文中出现,但是现在已经倾向把
A和
E分开印刷。 同样,
Œ 和
œ在法文中虽然通常印刷成合字,但在技术限制情况下仍可以拆开书写。
在德文正字法中,带两点的字母元音ä,
ö和ü来自历史上的
ae,
oe,
ue 合字(严格的说是上标的e,即aͤ, oͤ, uͤ)。现在当文字处理无法显示这三个字符的情况下仍可改写为二合字母
ae, oe, ue。字母排序中它们不等价于
ae,
oe,
ue,而是被简单看成
a,
o,
u。而
北欧语言则不同:带两点的字母被视为独立字母,并排在字母表最后。
一些元音中的圈形
附加符号,如
å起源于一个
o合字。现在把旧式 aa 改写为 å 已经称为不成文习惯,但在此之前也可写成 a 上再加一个小 a (aͣ),如 Johannes Bureus, Runa ABC boken 。
uo 合字
ů 的使用实例也在早期现代
高地德语里找到,但其后来混同到
u中(如中期
高地德语的
fuosz、 早期现代
高地德语 fuͦß、现代
德语 Fuß)。它仍存在于
捷克语中,被称为
kroužek。
字母hwair(ƕ)仅用于转写
哥德语,代表
hw合字。最早在1900年左右心理学者使用这个字用于代替二合字母
hv 用于表示有问题的现象,如Jacques Paul Migne在其1860年代的著作 (Patrologia Latina,第18卷).
拜占庭帝国有一个独特的合字o-u ligature (Ȣ) ,它源于
希腊字母的 ο-υ 两个字母的合字,并被加入到了字母表中。
国际音标使用合字来表示
塞擦音,其中6个有Unicode编码: ʣ, ʤ, ʥ, ʦ, ʧ and ʨ。一个
擦音仍使用合字:ɮ,而
国际音标扩展里加入了后三个:ʩ , ʪ and ʫ.
合字起源符号
最常用的合字符号当属
&。它起源于
E 和
t的合字,即
拉丁文的单词“和”( "et")。它在法文中保持原音原意而在英文中也使用。由于其使用广泛,一般已经不认为它是一个合字而是一个普通符号。
和其他合字一样,它被仍当作一个字母来使用(如早期现代英语),英语中它念作"and"而不是"et",而&c念作 "et cetera"(等等)。大多数字体中的字形和两字直接组合不一样,但仍有一些字体 (如Trebuchet MS) 就把他们设计 & 为合字。
同样,美元符号
$可能也起源于合字 ( "pesos",但有也有其他不同说法),但现在实际上已经被当成一个普通符号。 西班牙
比塞塔(peseta)也有时被写作合字 ₧ (源自 Pts).
合字二合字母
二合字母,如
西班牙语和
威尔士语中的
ll,一般不被看成是合字,因为印刷上两个字母通常是分开的。正如上讨论的合字一样,一些二合字母在一些语言中有不同处理方式。西班牙1994年拼写改革时,二合字母
ch 和
ll 已经被考虑为分开的两个字母。
法文的情况也一样,
œu被看成为合字
œ与字母
u的组合。
尽管如此,
荷兰语中 "ij"的定位比较模糊。根据不同的使用标准,它可看成是一个二合字母,或合字,或者一个独立字母。它有独立的大小写形式,而在一些专业字体中,通常是有一个独立字形也有合字 (如 Zapfino)。无衬线字体 大写字母的
IJ流行于
荷兰,通常形状像是一个断左臂的
U。更令人混淆的是,手写时可以把小写字母
y写作没有点的
ij,和大写字母
IJ (同样没有点)看起来只是大小差异而已。而
Y在本土荷兰语词汇中不被使用。
合字合字语言
丹麦语和挪威语
合字非拉丁字符
合字不仅出现在拉丁文本中:
婆罗米系文字的
元音附标文字频繁使用合字标注辅音。合字的数量依据语言而不同,如同样的
天城文,用于
梵文的合字就要比印地文多。总数为37的辅音中,在天城文两个字母组成的合字总数为1369,很少字体能全部显示这些合字。
微软[Windows]]系统附带的''Mangal.ttf''字体带有
印地语支持,但不能正确处理在द, ट, ठ, ड, 和 ढ右边的辅音合字, 而只是加 virama后按照一般形式显示在辅音之后。
希腊字母中使用一些合字,特别是在 omicron (Ο) 和 upsilon (Υ)连写 which later gave rise to one of the letters of the Cyrillic alphabet —参见
Ou字母。 西里尔合字: Љ,
Њ,
Ы, Ѿ. Iotified 西里尔字母是早期西里尔illic decimal I和其他元音的合字: Ꙗ (
Я的祖先), Ѥ, Ѩ, Ѭ,
Ю (源自另外一个合字,Оу,早期的У形式)。
马其顿和
塞尔维亚字母表中的两个字母 lje 和 nje (љ, њ)在19世纪曾分别是
El En (л, н) 与
软音符 (ь)的合字。还有一个ya (Я)和 e 的合字:Ԙԙ,其他合字包括 Ꚅꚅ 和 Ꚉꚉ.
格拉哥里字母的一些手写形式:用于中世纪到19世纪书写 Slavic 语言,多为方形且常用合字。 在
希伯来语中字母
aleph 和
lamed 在一些前现代文本中(主要是宗教或“犹太-阿拉伯”文本)可组合为合字。该组合很常用,因为
[ʔ][a]l- (在希伯来文中写作
aleph加
lamed)是阿拉伯语中的
定冠词。
阿拉伯文:各个字母在词头,词中,词尾均有不同形式。如阿拉伯文的
mīm,单独书写为 م,三个连写 (
mmm,显示为词头,词中,词尾形)就变为 ممم 。注意
lām + ʼalif 的情况是特殊的: ﻻ, 而 lām + ʼalif 词中,词尾形是ﻼ。在Unicode有一个特殊的
安拉 合字位于U+FDF2: ﷲ.
乌尔都语 使用
阿拉伯字母的手写体 (Nasta`līq Script) ,在电子排印中有大量合字。
乌尔都语最常用的排版工具 InPage使用 Nasta`līq Script字体多达 20,000个合字。
合字电脑排版
TeX是电脑排版系统中能使用合字的典型程序。 它能提供五个常用合字:
ff、
fi、
fl、
ffi 和
ffl。当TeX遇到这些组合时会自动替换成合字。当然操作者可以手动切换。
OpenType字体格式可以针对一个字符提供多个
字形,因此用来作为合字替换,但需要软件支持。
XeTeX是一个TeX 排版引擎用来调用这些功能。这种替换原先主要用于阿拉伯文排版,但现在已经广泛用于西文。
下表列出了常用文字对的合字以及Unicode代码。正确显示需要使用能正确处理合字的
操作系统和
浏览器 并调用正确的Unicode 电脑字体。
Unicode中对合字的处理不是一种字符定义,而是一种表现形式。比如,如果一个现代字体需要显示'h'后加 'r',且该字体确实有'hr'合字,这个合字才会被显示出来。因此,使用特殊Unicode合字字符是"不鼓励"且"在任何环境下不会被再度编码"。注意,合字 æ 和 œ 不能随意替代 'ae' 和 'oe',比如 'does'不能写作 'dœs'。
Unicode
这是一个不完整列表。U+A732到U+A73D 区域及其临近区域的一些字符没有列出。
非合字 | 合字 | Unicode |
|---|
Et | | U+0026 |
ſs, ſz | | U+00DF |
AE, ae | | U+00C6, U+00E6 |
OE, oe | | U+0152, U+0153 |
IJ, ij | IJ, ij | U+0132, U+0133 |
ue | ᵫ | U+1D6B |
ff | ff | U+FB00 |
fi | fi | U+FB01 |
fl | fl | U+FB02 |
ffi | ffi | U+FB03 |
ffl | ffl | U+FB04 |
ſt | ſt | U+FB05 |
st | st | U+FB06 |
另外,
Dz、 克罗地亚语和波斯尼亚语字母 DŽ, LJ, 和 NJ都有单独的码位。它们不是合字而是二合字母。 仅在语音转写
中使用的合字 Non-ligature | Ligature | Unicode |
|---|
db | ȸ | U+0238 |
qp (cp) | ȹ | U+0239 |
dz | ʣ | U+02A3 |
dʑ (or dz curl) | ʥ | U+02A5 |
dʒ (or dezh) | ʤ | U+02A4 |
fŋ | ʩ | U+02A9 |
ls | ʪ | U+02AA |
lz | ʫ | U+02AB |
lʒ (or lezh) | ɮ | U+026E |
tɕ (or tc curl) | ʨ | U+02A8 |
ts | ʦ | U+02A6 |
tʃ (or tesh) | ʧ | U+02A7 |
U+0238 和 U+0239 是二合字母,但实际上是合字。