|
本文作者:Alari团队Ayasala、Sulfa 《五体清文鉴》(下称“五体”)是清代编纂的一部重要多语言辞书,收录了满、汉、蒙古、藏、察合台五种语言的词汇。其中,数词作为最基础的语言元素,不仅反映了不同民族在计数方式上的异同,也展现了语言的历史演变。 虽然乾隆朝距今不过两百余年,但这部辞书的编纂本身就是一个重要的历史节点——在此之前,似乎还从未有过如此系统的五语对照辞书,这得益于乾隆皇帝卓越的军事成就奠定的多民族统一格局,以及他本人好学宽容的胸怀(没有阴阳怪气,认真脸)。本文通过整理这五种语言的独立数词,分析它们在书写上的特点及其源流。 虽然只有五种文字,但却涉及了四种截然不同的文字排版方式: ·从上到下再右到左换行的汉文; ·从左到右再从上到下换行的藏文; ·从上到下再左到右换行的满蒙文; ·从右到左再从上到下换行的察合台文。 同时由于各系统的满蒙字体存在很多问题,所以本文将采用图片(为了在同一张图片尽可能多的对比,姑且强制横排)和拉丁转写(我会在必要时说明转写方案)结合的方式记录。 这里的独立数词指表达基本数量概念的不可再分的最小数词单位,独立是相对合成数词来说的,本文将沿汉语数级体系完整展开——从“个、十、百、千”至“载、极、恒河沙”等传统大数。 闲言少序,让我们从“一”开始吧。 一、个位数词 严格来说,“十”自然不算个位数词,区别于一到九,它还会作为独立的数级单位,这几种语言中,“十”存在存在类似汉语的"十进位枢纽"特性,而女真语和突厥语原本使用20作为11-19数词的枢纽,这一点不同于汉语的十,英语的ten,因此姑且将十也纳入下表。 汉、满、藏的写法与现代完全相同,蒙古文最明显的区别是:y并未使用撅钩长牙。这里我想对比一下察语与其他突厥语的区别,详见下表(原书中有用满文音写察合台文,这里直接转写满字察合台文): 这里三的写法值得注意,关于满文中 /y/(iui) 的写法请参考这篇文章: 首先可以确定的是,这里的满文写错了,正常应该写作 ᠶᡠᡱᡳ / yuĉi(我个人喜欢将 ᡱ 转写为ĉ),其他以 ﺝ (察合台文多数时候 j、č 不分)结尾的词,比如:树木 ﻳﻐﺎﺝ / ıγač 会被音写成 igaĉi,在《西域同文志》也是如此。至于是此词条的记录者笔误,还是发音人口误就不得而知了。 二、十位数词 五体中词条“十五”的情况如下: 除了满文,其他都是合成数词,同时,察合台语是正序的10-5,而不是古突厥语的5-20(biš yigirmi)。现代突厥语言,只有西部裕固语——尧乎尔语等极少数语言保留了古突厥语的所谓“逆序计数法”。下面五体中10-90的词条汇总: 同样的,对比一下,察合台语和其他几种突厥语,见下表: 三、一般大数 在此强调一下,清代时,蒙古文的识点是个可加可不加的东西,这里的mingγan就是这样。一般认为,阿尔泰语盟的万/tümän来自吐火罗语A也就是焉耆语的tmāṃ,含义为“万,无数”,现代各突厥语受西方千进语言影响,一般已经不再使用万,转而使用十千了,比如哈萨克语的on mıŋ,而 tümen 作为旧词一般只会出现在特殊的文学语言中。 而在五体中的察合台文,(可能也是为硬译汉语),从万到万万都使用了 tuman,但这部分不属于独立数词,因此不展开讨论了。 四、传统大数 下面的内容才是本文主要想讨论的,正式开始介绍大数之前,需要掉些书袋,《五经算术》中有: 其下数者,十十变之。若言十万曰亿,十亿曰兆,十兆曰京也。中数者,万万变之。若言万万曰亿,万万亿曰兆,万万兆曰京也。上数者,数穷则变。若言万万曰亿,亿亿曰兆、兆兆曰京也。 翻译成现代数学语言就是: ·下数,后者是前者的10倍; ·中数,后者是前者的10的八次方倍; ·上数,后者是前者的平方。 康熙朝编撰的《御制数理精蕴》中有: 自亿以上,有以十进者,如十万曰亿,十亿曰兆之类; 有以万进者,如万万曰亿,万亿曰兆之类; 有以自乘之数进者,如万万曰亿,亿亿曰兆之类。今立法从中数。 “十进”就是下数,“自乘之数进”就是上数,而中间的“万进”就是我们今日常用的方式。说白了就是古代“亿、兆、京、垓、秭、壤、沟、涧、正、载”等数字的数量级关系,并没有统一的规定,实际上存在四种进位方式,分别是:上数、中数、下数,还有现在东亚文化圈广泛使用的万进。 而五体中,其实并没有说明这些大数的进制关系,(《御制增订清文鉴》中的规定是十进,也就是一亿等于十万,一兆等于十亿。)下文所谈论的只是这些数词的拼写和词源,至于它具体表示多大的数、现在还用不用,不在讨论范围之内,特此说明 需要特别说明的是,在传统汉语典籍中,“秭”通常被视为比“垓”更高一级的数量单位。然而《五体清文鉴》中却出现了相反的排序。这一点在《御制增订清文鉴》的满文记载“juwan dungšun be terbun sembi”(十秭为一垓)中得到了印证。正如前文所述,具体数值并非关键,重要的是可以确认在五体中,“垓”被记录为比“秭”更高一级的单位。 这种特殊的数级排序在东亚汉字文化圈中显得尤为独特。藏语dung phyur明确表示"万万",虽然它在今天表示亿(10⁸),但本质是比万高四级,原应对应汉语“垓”而非“秭”。满语 dungšun、蒙语 düngsiγur 均为藏语 dungphyur (五体中满文音写为:dungcur)之借词借词,当无讹误。因此更大的可能是编纂时的讹误,错将汉字之“垓”和“秭“颠倒。 这一结论可以在其他东亚汉字文化圈的语言中加以验证: ·越南语中的“tỷ”(秭)等于1000个“triệu”(兆),虽然改用西方千进数制,但仍完全遵循传统“兆→京→垓→秭”的递进关系; ·韩语中的“秭”(자)则等于10000个“垓”(해),同样使用汉字大数,但采用了更为规范传统的四位分隔万进制体系; ·日语与韩语一样使用万进,“𥝱(⿰禾予,秭之异体字,音じょ)”比“垓”(がい)大一级。 虽然前文强调不再具体讨论数值,但此处仍需指出:现代汉语(大陆地区)已基本弃用“亿”以上大数单位,值得注意的是,仅存的“兆”字就存在三种不同解释:百万(源于十进的万→亿→兆序列)、十亿(源于十进的亿→兆序列)和万亿(传统万进)。这种现象进一步印证了传统数级体系在传承过程中的淆乱。 下面我简要分析一下各数词的词源,限于个人能力,主要集中于满蒙文的分析。 1. 亿 bunai 在清初的《大清全书》中,“亿万”之“亿”被写作 bujun,而 bujun 应当是来自满语固有词 buju buja,含义为“不清”,而这个词被挪用为“无量数”,可能因此重新构造了bunai 一词,从音节上看,和原词有些说不清道不明的关系。 蒙古语之 lakṣan,来自梵语 लक्षlakṣam,即洛叉,意为十万。这个蒙古文使用使用阿礼嘎礼字母ṣ,现在传统蒙文中并不使用。蒙古文的借音字母的规范是在近现代才确立的,不像满文在创制之初就确立了借音字母的写法。因此这个词用了阿狸咖喱字母,但拼写上并没有特殊之处。 2. 兆 saja 这个词显然是借自藏语之 saya,百万。五体中,无论是满文音写的藏文,还是蒙古文都是写作 saya 的,本人暂时无法确定满文为何会将 y 变为 j。顺带一提,察合台文亿写作san,而兆写作 lak,似乎是将 lakṣan 一拆为二。 3. 京 jirun 先说藏文 byeba,千万。音写为 jewa,察合台文的音写为 jawa,当于此有关。而蒙古文写作kolti 来自梵语 कोटिkoṭi,途径回鹘语借来的,也就是俱胝。有趣的是,回鹘语的后代们并没有继承。 而满语的 jirun似乎也与藏语之 byeba 有关,同时也可能是截搭了汉语“京”与某个词,虽然说京本身是团音,但满文中混淆尖团的情况屡见不鲜,(即使尖团这个名称都是直接来自满文字形)。截搭是满语特有的一种构词方式,最广泛的应用为二十八星宿(请见 https://zhuanlan.zhihu.com/p/351119629)。 4. 垓 dungšun 这个词之前分析过了,就不赘述了。 5. 秭 terbun 这个词也是来自藏语ther ʼbum,音写为 terbum,蒙古文也写作 terbum。 6. 壤 cakcin 来自藏语 khrakhrig,音写为 cakĉik,蒙古文写作 čaγčiγ。 7. 沟 jabsun 来自藏语 rabbgrams,音写为 rabram,蒙古文写作 rabǰam。 8. 涧 damdan 来自藏语 gtams,音写为 dam,蒙古文写作 dam,满语不喜欢单音节,重叠为 damdan。 9. 正 jiri 先说藏语mi ʼkrugs,音写为mincuk,蒙古文写作 minǰuγ。jiri 和这个词应该是没啥关系,倒是和察合台语的 jar 有些相似,具体有何关联,需要更进一步的研究。 10. 载 mišun 藏语 khya ʼbyin,音写为 catcin,蒙古文写作 čadǰin,满文的词源稍后分析。 11. 极 cata 藏语 rgyurigs,音写为 jurik,蒙古文写作 ǰüriγ(清代蒙古文借词通常不会用阴性的音节尾 g )。我们有理由怀疑,正、载、极这三个词的满文错位的,拐带着察合台文也错了(后面的大数,察合台文都是截取的满文首音节,他们偷懒了)。如果 jiri 对应 jurik,mišun 对应 mincuk,而cata 对应 catcin,会合理很多。这三个词的对照见下表(调整顺序后的): 12. 恒河沙 ganggi 应该是源自梵语恒河 गङ्गा / gaṅga,蒙古语是意译的:gangga mören-ü qumaki,满文或为此词的缩合。 13. 阿僧祇 jamuri 蒙古语asangki 直接借自梵文असंख्य / asāṃkhya,在一些满文佛经中也会直接使用类似 asanggi 的写法,至于jamuri 和下文的 samuri 详见下文,而察合台文的 jam、sam应该也是根据满文来的。 14. 那由他 samuri 蒙古语 nayud 借自梵语 नयुत / nayuta,满文同上。 15. 不可思议 samina 蒙古语和察合台语都是意译的,蒙古语用的是 V-si ügei结构,察合台语用的NsIz 结构,比如在哈萨克语中 -sIz 是构词否定后缀,其中 hayal 借自阿拉伯语 ﺧﻴﺎﻝ,含义为:想象、幻想、念头,hayal sız表达“不可想象”之意。 按照清文鉴,saja(saya)= 1 × 10⁶,damdan(dam)=1× 10¹²,jiri(mincuk) = 1 ×10¹³; 而 samuri = 1 × 10¹⁸,samina= 1 × 10¹⁹。 似乎 saja × damdan = samuri,按照藏语组合就是 sam,这可能就是察合台和满语里面 sam 的来源,满语的 ri 是词缀,u 是增音; saja × jiri = samina,按照藏语组合就是 samin,na 是 n 的变体,所以满语是samina; jamuri 的 ja 可能是 saja 的 ja,察合台的 san 和 lak 似乎也是 lakṣan 的拆解,因而 jam 也能对得上; 无独有偶,jamuri还有 yamuri 这个异体字,那就更有可能是saja(saya) 来源了。 16. 无量数 buju baja 基本同上,察合台语写作 adat sız,adat 应是借自阿拉伯语 ﻋﺎﺩﺕ,含义为:习惯、常规、常态。adat sız 意为 “无常规的”,指数量超出常规计量范围,即“无量、不可计数”。至于满语的 buju baja 前文解释过。 五、传统小数 其实相比传统大数来说,汉语人群应当对传统小数(的名字)更加熟悉,因为传统小数在今天的国际单位制度中仍有部分运用。 例如我们都知道,1米=10分米=100厘米=1000毫米。这里的“分”“厘”“毫”就是传统小数,分别表示十分之一、百分之一、千分之一。现在仍运用于单位中的传统小数还有“丝”“微”“埃”等,但这些没有“分”“厘”“毫”出名。 五体中的小数记载如下: 下面依旧是简要分析一下这些小数的词源: 1.分 fuwen 相信大家一眼就看出来了,这就是汉语的分。满语里uw这个结构叫作“切音字”,w不发音,所以fuwen的读音相当于汉语拼音的fuen,是一个音节。 fuwen的写法是乾隆时期确定下来的,在更早之前写作fun。fun字同时包含了“分厘毫之分”“脂粉之粉”以及“化身”这几个含义。 为了避免歧义,乾隆规定,在表示“化身”时仍使用fun字,来自汉语“分”的改为fuwen字如“时分秒”“分厘毫”“度分秒”的“分”,而“脂粉”的“粉”使用满语自身的fiyen字。 蒙古文和察合台文的分明显也是来自汉语,实际上从这里开始,一直到漠,蒙古文和察合台文都是直接音译汉语,下文不再赘述。 2.厘 eli 这个eli也是来自汉语的厘。尽管eli的说法也是在乾隆时期才确定下来的,但其实这个字早在大清全书里就有记载。词首的e可能是为了避免流音开头所添加的,就像来自藏语的rin po(仁波切的仁波)一词在满语中变成了erimbu一样。 但毕竟满语最不能忍受的是r开头,l开头还是可以的,所以乾隆之前运用更广的还是li字。 乾隆改li字为eli,大概有两个原因。一是为了避免单音节词,二是因为乾隆的名字里有li这个字,不让用。 3.毫hina 这个词就比较麻烦了,汉语是肯定对不上了,藏语是skra rtse,音写ja dze,感觉也没法对应。 要说是意译的,“毫”字应当对应满语的funiyehe或者nunggari,也对不上。 要是忽略汉语的意思,hibcan到是有点接近。 4.丝 sunji 这个词的词源也难以判断,藏语是sbu rdul,音写bu dul,看起来不是那么像。当然了,你要是硬说这俩读音接近也可以。 如果猜测这个词是意译,那么丝还是可以和subeliyen等词联系上的,但要解释-nji是什么并不容易。 5.忽 niše 这个词来自藏语nyirdul,音写nidul。 6.微 langju 这个词也来自藏语glangrdul,音写lang dul。 值得一提的是,满语中langju一词还表示“一秒的六十分之一”,这个单位似乎比较少见。 7.纤 luju 这个词来自藏语lugrdul,音写luk dul。 8.纱 libu 这个词似乎来自藏语ribong rdul。满语截取了ri bo这一部分,然后将ribo改成了libu。原因正如前文所述,r不能打头,而l可以打头。不过r变l的做法可以说是相当少见。 9.尘 cudu 这个词来自藏语churdul,音写cu dul。 10.埃 jakdu 这个词来自藏语lcagrdul,音写jiyak dul。 值得一提的是,这个词的蒙古文和察合台都是音译的汉语,但蒙古文是yai,察合台文音写是ai。 11.渺 sesiri 这个词也有seseri的写法,看起来像是意译词。要么就是ser sere的某种变形,要么就是sese的变形。 但sese的意思是“丝”,要是它的话,似乎作为“丝”更合适一些。 12.漠 parsu 这个词似乎也是来自藏语rdul phra rab,音写dul carab。parsu的par可能来自phra,但phra的音写是ca,这又似乎不那么对得上了。su则可能是满语自身的词缀。 13.模糊 itele 需要注意的是,五体原文的小数是分在两个部分写的,itele以前的数字出自正编,而i从itele开始,剩下的小数都出自补编。并且从这里开始,这些数字都出现了显著的特征改变。 汉语的数字从单音节变成了双音节,并且借用了时间单位的名称。 满文数字的词源开始难以直接判断。 蒙古文和察合台的数字从全盘音译汉语,变成了自力更生,看起来是这两本书的单位不是一个人翻译的。 满语的itele难以看出词源,这个发音让人联想到了iletu。但是iletu是“清楚”的意思,正好是“模糊”的反义词,感觉不太可能是iletu的变化。 蒙古语的baruγ到是直接翻译的“模糊” 14.逡巡 yutu 这个词满蒙是一样的,感觉可能是蒙古语抄的满语。 大清全书里面可以查到yukūršambi这个词给了“逡巡”的汉语翻译,这个词对应乾隆时期的ikūršambi iburšambi yuburšembi等,那么yutu似乎可以解释为yuburšembi+派生词缀-tu。 15.须臾 tanji 满语的词源稍后再讲,蒙古语就是“一瞬间”的意思。 16.瞬息 gʻaci 众所周知,满语自己是没有gʻa这个音节的,所以它必定不是满语原生的词,但似乎汉语和藏语也都对不上。 不过根据清文鉴,瞬息表示的是10⁻¹⁶,而10¹⁶是恒河沙ganggi,恒河在满语里是gʻanggʻa bira,这倒是gʻa的一个可靠的来源。所以如果这个词来自gʻanggʻa bira加上了满语的派生词缀-ci也是颇有可能。 蒙古语的irmel来自动词irmekü“瞬目”“眨眼”,汉语的“瞬”指的是眨眼,所谓“一瞬间”就是“眨眼间”的意思,因此蒙古语这里是意译的汉语。 17.弹指 jalari 看到弹指,我突然感觉前文满语的tanji可能是这个词,如果真是的话,那满语的数字又一次错位了… 满语的jalari看起来又是满语自己产生的词,但看不太出来究竟是什么思路,可能是jalambi“间隔”+ri,和弹指对不上,和须臾到是能对上一点点。 蒙古语inčidtül看起来也是意译的“弹”,和inčirülte有关系。 18.刹那 taburi 满语的这个词看起来也是非常奇怪,不过taburi和下文miburi的ta-mi-很容易让人联想到满语的tanggū和minggan,似乎是表达“某数字的百分之一/千分之一”,满语的百分之一叫tanggū ubu i emu ubu,这似乎也能对上bu字。 但很遗憾,刹那无论是从数字上,还是从字面上,都和百分之一没有什么关系。 蒙古语的aγsan应该是来自梵语 क्षण (kṣaṇa) 19.六德 sehuji 满语实在是难以看出具体构成,但是作为一个三音节词,我们有理由怀疑这是满语自己构成的词汇。 蒙古语的jirdem应该是jirγuγan+erdem意译的汉语六德。 20.虚空 miburi 满语前文解释过了。 蒙古语的qoγosor应当来自qoγoson“空”,也是意译的汉语。 21.清净 duina 满语的dui-并不多见,因而很容易让人联想到duin四,但是duina又和四没有什么关联。 蒙古语的arilum应当来自arilqu“消失”,表示“这个世界都清净了”的含义。
|