林语堂和女儿林太乙正在使用他发明的明快打字机。 这台打字机的内部结构堪称天才,但最终没有量产。 (照片/图片由受访者提供)
“哒哒、哒哒、哒哒哒……”说起打字机,或许它的声音比画面更能直观地唤起人们的记忆。 美国恐怖片《闪灵》中有一个场景,一个处于疯狂边缘的作家在打字机上重复着一句话,“只工作不玩耍,聪明的孩子变笨了……”与此同时,打字机“哒哒”单调的滴答声刺耳,烘托出影片恐怖变态的气氛。
但是等一下,为什么打字机的声音是“哒哒哒”的? 而中国人在看这部电影的时候,为什么会很自然地接受打字机发出的声音是“哒哒哒”这样的设定呢?
一台50、60年代常用的中文打字机静静地躺在二手拍卖网站上。 双阁牌,售价2980元。 “打字机共2450台,保存完好,按键灵活,重约六七十斤,运费200元。” 卖家对这款中文打字机的介绍,与我们脑海中对打字机的想象相去甚远。
双阁打字机曾经为不常用的字符配备了一个类型框。 当活字版上没有汉字时,工人们只好用镊子从字盒中取字。 如何把几万个字装进这么小的机器,一直是中文打字机的技术难点。 (照片/图片由受访者提供)
对于大部分以拉丁字母为基础的拼音文字,按下打字机上的一个字母键,通过传动杆的传导,可以将对应的字母打印在纸上,几十个字母,一个小小的操作键盘就可以容纳,打出来的就是打出来的,于是打字机的声音就变成了自然而然的“哒哒哒”。
对于机械时代的中文打字机来说,这样的技术路线是完全走不通的。 工程师只能找出中文中最常用的2450个汉字,并按照易查找的原则进行排列。 传动杆位于密密麻麻的表盘上方。 来回扫动。 打字员每打一个字,就好像在地图上寻宝一样:“只”在打字板的中间,“功”是幸运的,离“只”不远,“佐”却在上面左角… 如果哪个疯狂的作家用中文打字机写字,那声音肯定会变成“嘎哒,嘎哒…”(“嘎”的意思是选定的金属活字被送到夹板杆撞击滚轮;“哒”表示金属活字被送回表盘的声音。)
这就是中国文字进入工业时代后所面临的命运。 1876年,中国海关官员李贵参加在费城举行的美国独立百年博览会企业简介英文,看到了当时的一项新发明——英文打字机。 在被英文打字机的便利性震惊的同时,他也敏感地意识到,这台机器“不能打中文真是可惜”。
我们今天熟悉的英文打字机是美国雷明顿公司生产的最受欢迎的打字机。 它有一个单开关键盘和一个传动杆,字母在纸上线性输入。 显然,后来流行的类似于双阁品牌的中文打字机,技术路线与雷明顿路线完全不同。 当象形文字和方块文字面对这种基于线性拼音发明的机器时,各种尴尬充斥着中文打字机的发明过程。 不仅有天才的火花,还有受挫的实验和昙花一现的投资。 .
“中文打字机不仅是现代信息技术史上最重要但最容易被误解的发明之一,它还是(无论是物理上还是隐喻上的)一个非常清晰的历史镜头,我们可以通过它来审视现代社会的社会建构斯坦福大学历史学教授托马斯·穆拉尼在他的新书《中国打字机》中写道。
Thomas S. Mullaney,斯坦福大学历史学教授,哥伦比亚大学历史学博士,研究领域为中国史。 (照片/图片由受访者提供)
如何将象形文字机械化和数字化,几乎吸引了全世界的技术语言学专家和业余爱好者。 在过去15年的研究生涯中,莫雷宁曾在12个国家的几十个档案馆工作过,“让我印象最深的是中文信息技术的奥秘是如何吸引世界各地的天才怪人和业余爱好者。来自IBM、麻省理工到中国政府和学术机构,我采访了很多。” 莫雷宁告诉南方周末记者。
这些人的事迹被收录在《中国打字机》和即将上映的续集《中国电脑》中。 ’以及传统的‘技术扩散’叙事,长期以来一直主导着我们对西方工业、军事和其他设备和操作如何扩散到非西方地区的理解。”通俗地说,如果西方发明了内燃机传动装置技术进入中国需要资金、人才、政策的配合,但打字机的普及还有一个维度的障碍——文明的维度。
作为一名研究者,莫雷宁当然自己设计了一台中文打字机,但他并没有在书中和采访中分享企业简介英文,“太牵强了,我不好意思分享。” 像双阁品牌那样设计一款不以肉眼搜索为技术路线的中文打字机,需要克服的技术障碍太大了。
事实上,历史上曾出现过技术路线完全不同的中国打字机。 它的大小与雷明顿打字机相似,但其内部结构堪称天才。 这就是林语堂的“光明打字机”。
明快打字机消耗了林语堂多年的积蓄,十几年的时间。 1947年只生产了一台样机,虽然当时的新闻报道和目击者证明它确实可以打汉字,但最终没有量产。 不被市场接受。 然而,林语堂却天才地提出了“输入法”的概念——输入法不像英文打字机,也不像双阁打字机那样用肉眼搜索汉字,而是将某种代码输入到机器,代码驱动机器运行,最终生成汉字。 对于今天的中国电脑用户来说,这套“输入-选择”的流程再熟悉不过了,而它的先行者就是林语堂。
名快打字机的内部结构非常复杂。 即便是用最简单的语言来描述,也可想而知其各个部分的精密和复杂程度。 它既有全字的常用字,又有活字的汉字部分。 为了让打字机尽可能紧密地塞进几千个字,林语堂选择了类似行星运行系统的设计。
在这个结构中,一系列八角棱柱形金属棒充当卫星。 每个侧面都刻有汉字和部首,8面共可容纳232个汉字或部首。 六根八角形的金属棒固定在一个圆形的旋转齿轮中,就像六颗卫星绕着同一个行星轴旋转。 同时,这些金属棒还可以绕着自己的中心轴旋转。 林语堂一共做了6组这样的“行星”,然后将它们固定在一个更大的圆形旋转棒上,就像6颗行星围绕着一颗中心恒星运转一样。 36根金属杆卫星轴,6根高阶滚轮套件行星轴,1根最高阶滚筒星轴,这是它的整体设计结构,一共包含43根独立轴。 当用户在键盘上敲击某个汉字的几个部分时,内部滚轮开始转动。 林语堂设计的查字法将每次排列组合后出现的汉字数量控制在八个以内,而这八个汉字会出现在键盘上方的“显示器”上,用户可以选择自己想要的汉字- 非常类似于今天的电脑输入汉字。
根据当时的记载,这台机器几乎可以打出所有的汉字。 但唯一的原型已经丢失,现在只能看到用它打字的视频片段。 2023年,B站一位网友和几位朋友根据当时专利文件上的技术说明,以及林语堂留下的几十张设计图,尝试用现代机械技术复刻出一台明快打字机。 不幸的是,三个月后,这个复制实验也以失败告终。 “辉煌号”内部的复杂程度超出了他们的想象。
虽然“明快”失败了,“明快打字机标志着中国信息技术的一次变革,这种变革连它的发明者林语堂自己都可能没有预料到,”莫雷宁说。
计算机“排斥中文”的早期历史
南方周末:林语堂发明的中文打字机为什么没有商业化? 你认为它是一台成功的中文打字机吗?
莫雷宁:明快打字机是天才之作。 然而,尽管它很好,但它未能取得商业上的成功。 背后的投资人都是美国人,他们被当时的地缘政治局势吓跑了,包括朝鲜战争。 Mergenthaler Linotype(明快打字机的专利权人)担心这种情况对其专利权的影响。 1950年,随着朝鲜半岛局势的升级,“明快”计划的梦想也破灭了。 然后,众所周知,林语堂本人破产了。
但是,“明快”提出的原则继续存在,并为美国、英国和中国的工程师所接受。 可以说,铭快打字机没有了,但“铭快”发明的输入法思想却一直存在。
南方周末:很明显,您不同意那些提倡汉字罗马化的学者的观点,但从当时的历史情况来看,汉字罗马化是否有一定的合理性?
莫雷宁:从19世纪初开始,中国就卷入了一个不可控的全球新秩序。 在此期间,中华文明受到不同政治观点的改革者的批判性重新评估。 批判的主要对象是儒家伦理制度和父权家庭单位。 一些改革者呼吁废除汉字,他们认为汉字是问题的根源。 他们试图像土耳其语或越南语那样将书写系统罗马化。
但汉字最终并没有被抛弃,另外一批人开发了技术语言系统来管理中文的信息环境,包括中文的索引、字典和计算工具。 具有讽刺意味的是,这些构建信息基础设施的“赢家”都是匿名的,只留下零散的数据; 而那些号召废除汉字的人,比如钱玄同,虽然是“失败者”,但他们的名字却为大众所熟知。
南方周末:你在书中提到了日文的假名打字机,但在东亚文字中,韩文的字形结构似乎更像汉字——虽然是注音文字,但韩文在空间上不是线性排列的,这与中文相似打字机似乎是一个类似的问题。 韩式打字机的技术路线是怎样的?
Leining Mok:韩语字母的大小和位置会根据它所在的单词而变化,这是西方设计的打字机(以及后来的文字处理器和计算机)根本无法处理的。 人们想出了各种方法来尝试解决这个问题。 最激进的方法就是把韩文一个一个打碎成字母,然后把这些零散的字母线性排列! 这是一种将韩语“重新命名”的奇怪且最终失败的方法。
南方周末:在众多的技术路线中,雷明顿打字机的技术路线最终占据了主流。 您认为主要原因是什么?
雷宁摩尔:雷明顿打字机公司在全球的成功,得益于其在英语世界,尤其是美国制造业的主导地位。 从这个起点开始,打字机通过英美渠道(无论是非正式地通过美国经济帝国,还是正式地通过大英帝国)传播到世界各地。 从此,单键键盘打字机成为衡量语言现代性的标准,在世界范围内得到广泛采用。 然而,雷明顿使用的单开关键盘在 19 世纪只是一种打字方式,当时还有索引打字机和双键盘打字机。 这些方法未能主导英语打字市场。
雷明顿公司最初是一家内战时期的武器制造商,与打字机公司和发明家合作,于 1873 年首次推出了 Shoals and Gladden 打字机,该打字机采用单开关键盘系统。 直到 1880 年代和 1890 年代初期,得益于驻扎在不同国家的销售代理和直接代表,公司在全球市场的销售额才显着增长。
南方周末:这个现象似乎不仅仅出现在打字机领域。 许多领域都经历了类似的技术演进。 在您以后的汉字和计算机书籍中是否也会出现这种现象?
莫雷宁:《中文打字机》所讨论的以拉丁字母为主导的技术路线,其“遗产”在计算机时代再次被“激活”。 在大多数计算历史中,计算一直偏向于某些字母脚本,最重要的莫过于拉丁字母表。
例如,在 20 世纪中叶,西方工程师确定 5×7 点阵网格提供的分辨率足以使拉丁字母在监视器和点阵打印输出上清晰可辨。 要对中文做同样的事情,就需要工程师将这个网格扩展到不少于 16 x 16。在 1960 年代,ASCII(美国信息交换标准代码)背后的开发团队确定了 7 位编码结构及其 128 个地址为所有拉丁字母以及数字和符号提供了足够的空间。 相比之下,汉字需要不少于 16 位的体系结构来处理其 60,000 多个字符。
无论是字符编码、计算机显示器、点阵打印机、编程语言、CD-ROM操作系统、光学字符识别算法,还是其他方面,计算机的早期历史都是一场又一场的“排华行为”很多方法。 的故事。
在过去15年的研究生涯中,莫雷宁先后在12个国家的几十个档案馆工作,采访了从IBM公司、麻省理工学院到中国政府和学术机构的多位人士,了解了中国打字机。 发明史。 (照片/图片由受访者提供)
世界上超过 50% 人口的书写系统被排除在外
南方周末:您认为中国打字机和计算机的发展史是否超越了西方传统的“技术传播”叙事? 你担心你的作品会被解读为“例外”吗?
莫雷宁:乍看之下,中国近代信息技术发展史看似“异类”,但其实指向了机械化时代许多非拉丁文字所面临的一个更大的问题。 中文等非拉丁语种不得不放弃传统的人机交互模式。 这是因为拉丁字母长期以来在个人电脑、电报、打字和其他技术中享有特权地位,损害了大多数其他书写系统。 为了使非拉丁字母与西方文字处理程序兼容,必须开发各种计算解决方法。
例如,使用阿拉伯语的人需要一些变通方法才能使这个经常根据上下文改变形状的脚本在假设字母不接触或改变形状的西方文字处理程序中工作。 印地语和乌尔都语等印度书写系统也需要不同的计算解决方案,因为天城体字母之间的“连接点”在不同短语之间会有很大差异,而早期的西方计算机无法处理它。 当然,还有刚才说的韩国语。
今天,至少需要七种不同类型的此类“解决方法”才能使 PC 与各种非拉丁文字兼容。 这个问题影响了世界上50%以上的人,他们的书写系统被排除在西方制造的打字机、个人电脑等的计算逻辑之外。换句话说,在相当长的一段时间里,为了使用电脑,大多数人世界上的人们需要通过各种硬件或软件解决方案来“改造”它们。
南方周末:计算机时代输入法的变化对语言本身有什么影响吗? 为什么使用五笔输入法的人越来越少?
莫雷宁:五笔等基于汉字结构的输入法没落,是因为拼音输入法越来越普及。 然而,拼音输入法兴起于1990年代,比大多数人意识到的要晚得多。 在此之前,从 1950 年代到 90 年代初期,基于汉字结构的中文输入法更为流行。 拼音输入法来晚了,不是因为工程师、语言学家或政治家缺乏兴趣或努力,而是因为拼音本身的深层次问题,包括同音字,这对消歧提出了深刻的挑战。 与基于其结构的输入序列相比,拼出一个字符的完整语音值似乎是一个巨大的倒退,并且在许多方面是从计算机检索一个字符的效率最低的方法。
不过,拼音输入并没有失败。 正如我在即将出版的《中文计算机》(2024 年出版英文版)一书中所解释的那样,在 1990 年代之后,预测脚本和其他强大的预测技术的日益成熟和广泛使用迅速与拼音类型“联姻”。 攻克同音字、缩短序列长度等技术突破,也为拼音输入法的最终普及带来了一线希望。 最重要的是,要让汉语拼音成为一种高效的中文输入法,它需要像五笔和其他输入工具一样:一个检索汉字的系统,而不是简单地“拼写”出来。 所以拼音输入法和汉语拼音不是一回事,前者是一个字符检索系统(用于计算机)。 拼音输入法与汉语拼音(一种拼音拼法)密不可分,但又有本质区别。
技术不断改变着语言。 无论是黑客语言、表情符号、日语颜文字(Kaomoji)、辅助文字、翻译语言、代码转换、双关语、代码混合、中式英语,还是网络语言、游戏语言等,语言与技术在当今时代相互塑造。 它的深度堪比洞穴时代的绘画与泥板之间的关系。
南方周末:很多新生代网民会用拼音首字母代替汉语词组,比如yyds、xs、wsl,你知道它们是什么意思吗? 您如何看待这一现象?
莫雷宁:这是一个普遍现象。 我知道wsl代表“我死了”,可以说相当于英文网络俚语中的“OMG”; yyds代表“Forever God”,基本相当于网络俚语中的英文“GOAT”。
这说明了我前面提到的一个更大更重要的现象:拼音输入法和汉语拼音不一样。 汉语拼音是一个用拉丁字母拼出汉字发音的系统,而拼音输入法是一种基于从记忆中检索汉字的输入系统,允许人们使用技术上汉语拼音所没有的各种快捷方式和缩写允许。 如果你在小学的汉语拼音考试中写wsl,你会失败,但是如果你在键盘上打字,你会成功找到你想要的字符。 很多人误以为拼音输入法和汉语拼音是一回事。 但我认为,虽然拼音输入法是以汉语拼音为基础的,但两者是有本质区别的。
南方周末:现在很多中国人抱怨打字多了,手写汉字的时候就忘了怎么写了。 我个人也有这种情况。 而对于注音文字,打字就是书写,不存在这个问题。 您如何看待汉字面临的问题?
莫雷宁:在我的新书《中国计算机》中,我认为这种所谓的“提笔忘字”现象,并不是很多人描述的书写困难、文盲、健忘症。 而是在计算机和新媒体时代,所谓的“写作”在变,但用来理解“语言”的理论框架和理论术语并没有随之改变。
毕竟,如果 21 世纪的中国真的有数以亿计的新文盲或健忘症患者,我们为什么不找到这种危机的证据,例如经济收缩或高等教育崩溃,以及中国如何成为世界上受教育程度最高的充满活力的数字经济体之一呢? 中国大陆约有9亿网民,中文内容不断传播。 这怎么可能? 如果这些人真的“不会写”(书写障碍的基本定义),那么谁在写中文呢? 在我的工作中,我将尝试建立一个新的词汇来解释和理解数字时代的汉字。
南方周末记者 王华珍