今年是CERNET建设30年。;;赝骨,作为中国首个互联网主干网,CERNET不仅见证了中国互联网从无到有、、从小到大的发展事业,也为高校师生群体提供了创新的舞台,缔造了中国互联网汗青上众多的第一。。
中国第一个电子杂志的诞生
1995年1月12日,中国第一个电子杂志——《神州学人》电子版(英文名CHISA,取自China Scholars Abroad)诞生。。


△1995年《神州学人》电子版的主页
承载与颁布这本电子杂志的平台是1994年起头建设的我国首个覆盖全国的互联网——中国教育和科研推算机网CERNET。。!耙宦吠,我们就和CERNET结下了不解之缘。。!痹巍渡裰菅恕犯弊鼙嘧氲男礴缢。。
外洋学子的呼声
创办于1987年5月的《神州学人》是一本专门面向我国外洋留学人员的杂志。。
“鼎新盛开后,很多中国留学生奔赴世界各地,但其时的通讯之难,成本之高,此刻难以设想。。这本杂志像是一个感情的纽带,衔接着身处全球的中国留学生们,各人对它有着极度出格的感情。。!毙礴缁毓。。
80年代末,互联网在国外大学首先鼓起,大学师生是最早接触互联网的群体。。!澳懿荒馨压诘男畔⑹凳卑洳荚谕???”这是其时好多留学生们的巴望。。中央有关部门得知这样的等待,因而在1994年10月21日,有关辅导建议由国度教育委员会掌管办理此事。。国度教委极度器重这项工作,4天之后,就向中央递交了汇报,指出已起头成立中国教育和科研推算机网CERNET,通过CERNET,即可让国外的留学生看到国内的媒体信息。。因而,1995年1月,在中央的领导和国度教委的推动下,《神州学人》电子版在CERNET上诞生了。。


△1995年,时任国度教委主任朱开轩、、副主任韦钰等视察《神州学人》电子版
CERNET支持CHISA的诞生
《神州学人》电子版CHISA诞生的前夕,1994岁首,在其时国度打算委员会、、教育委员会的辅导下,清华大学吴建平、、李星等一批年轻的专家起头牵头建设中国第一个互联网主干网——中国教育和科研推算机网CERNET。。
一个无意的机遇,听说国度教委正在筹办《神州学人》电子版CHISA,李星立刻想到,能不能把这本电子刊放到CERNET上???在回国之前,他在国外留学8年,对《神州学人》很有感情。。正是这样一种情结,使得李星极力争取,要把《神州学人》电子版放在刚刚建成的CERNET上颁布。。
这和国度教委的设法不谋而合,可能也正是许珑提到的“缘分”。。其时CERNET的提议辅导之一,也就是主管CERNET工作的国度教委副主任韦钰,也分管留学生工作,而韦钰自己的留学经历和其“报效祖国,义不容辞”的留学理念,使得她对留学生和《神州学人》也有格外的关注和厚爱。。天时地利人和,就这样,《神州学人》电子版和CERNET相伴而生。。
《神州学人》电子版启发了中国出版刊物上网的先河。。对于这样的新鲜事物,各人感应十别离致,也极度包涵与支持。。!拔颐侨グ炖怼渡裰菅恕返缱影娉霭媸中,新闻出版署期刊司说,这是一个全新的事物,他们之前也没有任何经验。。让我们先办,也是给我国以来的电子刊摸索出一些经验。。! 回顾起29年前往新闻出版署的场景,许珑说。。
区别于《神州学人》杂志重要颁发原创文章的模式,电子刊摘选汇集了其时很多媒体的精华文章。。!渡裰菅恕返缱影娴某霭,重要分为两个部门:神州学人编纂部掌管内容建设,CERNET掌管电子刊的颁布、、网页的创建、、运营和守护。。


△2004年,CERNET网络中心李星、、朱爽回首CHISA的创办
名副其实的技术守护征询
《神州学人》电子版最初的服务器是一台其时盛行的Sun Sparc 20工作站,位于清华大学主楼CERNET的机房。。
电子版的颁布由CERNET网络中心朱爽和李星教员共同实现。。在昔时那极度单一,却极度能干的《神州学人》电子版的版权页上,写着一行字:“技术守护征询:朱爽,李星,chisa-tech@chisa.edu.cn ”。。
“我们名副其实,哈哈。。!敝焖毓怂。。!拔烁瞎舛琳咴亩恋氖辈,选定在每周周五发刊。。!
固然设备已经是其时的最好,但互联网是那么新,全球其时的网络硬件环境、、颁布技术和软件环境都刚刚起步:短短两万多字的文字内容,有时要花上几个小时能力颁布实现。。为了电子版的颁布和网上传布稳操胜券,李星和朱爽进行了大量的筹备。。为保障1月12日顺利发刊,他们要在1月6日颁布“试刊”。。在试刊的过程中,解决了很多技术上的小挑战。。
最初,电子刊只是单一的文件体式,编纂部制作成磁盘,由专人送到CERNET网络中心,后来通过FTP上传到网络中心,再后来,就直接以拨号上网的方式上传到服务器了。。
在收到编纂部发来的期刊后,他们将当期的内容天生各类编码版本,蕴含GB、、BIG5、、HZ、、T3、、ISO2022-CN和Postscript等,这些今天我们看来极度单一的技术,在其时却是相当专业、、超前的。。经过编码后的版本被颁布到FTP、、GOPHER和WWW上,同时以UUCODE编码邮件,发送到外洋留学人员的订阅邮箱中。。
“无论是在外出差还是寒暑假,我们都想方设法地保障在周五按时颁布上线。。!敝焖。。
1995年1月15日,李星和朱爽到泰国参与第一届亚太地域网络信息中心会议。;;岷,在取道香港回北京时,正好是个周五——电子版第二期的发刊日。。他们到达香港后,顾不上忙其他事件,第一功夫就去了香港中文大学网络中心,为的就是定时颁布《神州学人》电子版。。
“电子刊创刊仅仅几个月,随机浏览人数就达到了数万人,订阅人数有8000多个。。!毙礴缢。。一功夫,《神州学人》电子版成为了中国互联网上的一道亮点,连版权页的技术守护征询邮箱都收成了很多读者周到洋溢的来信。。!坝胁簧俣琳哐视⑽幕肪诚略亩林形牡奈侍,我们当即做了一个若何在网上阅读中文的指南。:罄,为了方便读者查找信息,我们还做了具体目录分类检索。。记得李星教员还时时现写一些小的软件来援手颁布,好比查抄编码谬误等等。。!敝焖毓。。
在那段功夫里,为了让电子刊颁布得更好更快,他们钻研出了好多小技巧,好比电子邮件会商组技术(MAILING-LIST)。:罄,《神州学人》电子版还有了具体的目录分类。。其时李星教授带的一位钻研生还针对电子版内容的特殊性,设计了最初的中英文搜索引擎,方便读者查找电子版上的有关资料。。这在其时互联网刚刚鼓起的全球,都是极度实用、、有趣的索求。。
开创了一个先河
1995年的夏天,时任国度教委主任朱开轩、、副主任韦钰来到了位于CERNET网络中心的机房,视察电子刊工作的进展情况。。韦钰暗示:“《神州学人》电子版是与《神州学人》杂志比翼齐飞的一份电子杂志。。!
“电子杂志颁布后,收到了来自全世界的声音,每一期内容刊发后,都有几百个留学生给我们发Email互动。。各人把身在异国他乡的所思所感都通过互联网与我们分享,极度让人感动。。!毙礴缢。。
在没有其他来自祖国的中文刊物上网的年代,这份来自祖国的声音弥足宝贵。。其时的读者纷纷暗示:“读到神州学人电子版,犹如饮到了戈壁中的甘泉,听到了来自北京的声音。。!薄霸诠馔ü渡裰菅恕返缱影嬷苯拥慊鞴谝藕妥约焊行酥碌睦改,倍觉亲切温暖,心能与祖国一路跳动。。!
《神州学人》电子版的问世,开创了国内里文媒体进入国际互联网的先河,拥有划时期的汗青意思,它的创办,立即引起了国内媒体的关注,中央电视台新闻联播、、新华社、、人民日报等媒体都迅速颁布了新闻。。
随着《神州学人》电子版影响力的增大,国务院新闻办公室将其纳入了国度对外新闻宣传平台。。国内高校编写的新闻学教科书也将《神州学人》电子版的诞生作为开创性的汗青事务,编入了我国新闻发展史。。
1995年,美国国会图书馆电脑网络中心OCLC(Online Computer Library Center)将《神州学人》电子版正式编目,成为被此类大型图书馆编主张第一个中国大陆的中文新闻媒体。。
“有一次我看王小丫主持的《开心辞典》,其中一个问题是‘我国最早的电子期刊是哪一家’???台下一位来自媒体的答题者很快就说:《神州学人》!!我其时极度的激昂和高慢。。!被厥淄,已经退休多年的许珑说。。
扩大阅读:1990年代的网络刊物刊行技术
三十年前网络刊物刊行技术与当今并不一样。。为了适应全世界各个地域读者环境的多样性,《神州学人》网络版刊行了分歧的大局,使用分歧的中文编码步骤。。
一、、利用和谈
1.邮件列表(Mailing List)
邮件列表的发源能够追忆到1975年,是互联网上最早的社区大局之一,也是Internet上的一种重要工具,用于各类群体之间的信息互换和信息颁布。。
早期的邮件列表是一个小组成员通过电子邮件会商某一个特定话题,通常称为会商组,由于早期联网的推算机数量很少,会商组的参加者也很少。。会商组很快就发展演变出另一种大局,即有治理者管束的会商组,也就是通常所说的邮件列表,或者叫狭义的邮件列表。。
由于互联网早期使用ASCII编码,只有7比特,电子邮件、、域名系统(DNS)等主流畅用只支持7比特的通明传输,因而,对于中文等多字节文字(每个字节的全数8比特均需传输)必须转换成7比特字符。。从而《神州学人》邮件列表选取了UUCODE编码。。
2.文件传输和谈(FTP)
文件传输和谈(File Transfer Protocol)是在推算机网络的客户端和服务器间传输文件的利用层和谈。。传送文件(file transfer)和接见文件(file access)之间的区别在于:前者由FTP提供,后者由NFS等利用系统提供。。文件传输和谈由RFC959规范。。
FTP是8位的客户端-服务器和谈,能操作任何类型的文件而不必要后续处置,就像MIME或Unicode一样,但FTP有极高的延时,意味着从起头要求到第一次接管数据间的功夫极度长,并且必须不断地执行一些冗长的登录过程。。
Chrome和Firefox等主流浏览器都打算弃用对FTP的支持, 2019年推出的Chrome 82已终场对FTP支持,2020年疫情原因导致远程办公需要增长,Chrome短暂地复原了FTP,但于2021年10月推出的Chrome95齐全移除了FTP有关代码。。而Firefox原打算在版本77中终场支持FTP,最终在2021年7月刊行的90版正式终场支持FTP和谈。。微软的Edge浏览器也在2020年起终场支持FTP,Internet Explorer 11仍保留FTP客户端,直到2022年6月15日终止支持。。
3.地鼠(Gopher)
Gopher是一个互联网上使用的散布型的文件网络获取网络和谈。。它是1991年由明尼苏达大学发现的。。!癎opher”(地鼠)这个名字有三层寓意:第一是“挖掘信息”;;第二,使用菜单大局网络来的信息与地鼠洞相类似;;第三,明尼苏达大学有一支活动队名叫“黄金地鼠队”。。
Gopher最初的设计指标与万维网类似:共享文档。。今天的万维网险些已经代替了Gopher。。但Gopher和谈还提供了一些万维网先天不足的职能,好比在Gopher中所有信息都以层级大局存储,这被以为是存储大量信息的最好方式之一。。
万维网在1991年被发现,由于耗用带宽较少,Gopher网络其时依然是极度盛行和制作良好的。。1993年2月,明尼苏达大学颁发他们将对Gopher的使用收取牌照费,这就部门削减了Gopher服务器数量。。一些人相信这是Gopher造成互联网汗青的原因。:枚嗳讼嘈臛opher的陵夷现实上是它那有限度的结机关成的,这种结构使得它没有自由状态的HTML网页矫捷。。使用Gopher时,每个文档都已有一个预约义的体式和类型,一个Gopher用户必须通过一个服务器界说的系统菜单导航进某一个特定的文档。:枚嗳瞬幌不禛opher系统中这种报答制作的菜单和文件的分辨,而Web网络上使用的超文本和谈和交互式利用法式显得更为盛开矫捷。。
4.万维网(WWW)
万维网(World Wide Web)是一个通过互联网接见的、、由很多相互链接的超文本组成的信息系统。。英国科学家蒂姆·伯纳斯-李于1989年发了然万维网,1990年,他在瑞士CERN工作期间编写了第一个网页浏览器。。网页浏览器于1991年1月向其他钻研机构刊行,并于同年8月向公共盛开。。
万维网是信息时期发展的主题,也是数十亿人在互联网上进行交互和浏览的重要工具。。网页重要是文本文件体式化和超文本置标语言(HTML)。。除了体式化文字之外,网页还可能蕴含图片、、影片、、声音和软件组件,这些组件会在用户的网页浏览器中出现为多媒体内容的页面。。万维网并不等同于互联网,万维网只是互联网所能提供的服务之一,是靠着互联网运行的一项服务。。
1993年4月30日,欧洲核子钻研组织颁发万维网对任何人免费盛开,且不收取任何用度。。两个月之后,Gopher和谈颁发不再免费使用,造成大量用户从Gopher转向万维网。。早期盛行的网页浏览器是用于Unix和X Windows系统的ViolaWWW。。
学者普遍以为,万维网的一个转折点始于1993年推出的Mosaic网页浏览器,这是由伊利诺伊大学厄巴纳-香槟分校(NCSA-UIUC)的国度超等推算机利用中心团队所开发的图形接口浏览器,由马克·安德里森辅导。。Mosaic的资金来自美国高速运算及通讯打算(High-Performance Computing and Communications Initiative)和高速运算及通讯法案(High Performance Computing and Communication Act of 1991),这也是美国参议员阿尔·戈尔所提议的几项运算发展打算之一。。在Mosaic颁布之前,网页中的图片和文字混归并不常见,万维网的受欢迎水平远低于互联网上使用的旧和谈,例如Gopher和WAIS。。Mosaic的图形使用接口让万维网成为迄今为止最受欢迎的互联网和谈。。
1994年10月,万维网联盟(W3C)在麻省理工学院推算机科学尝试室成立,成立者是万维网的发现者蒂姆·伯纳斯-李。。到了1994年底,全球网站数量依然相对稀少,但是好多驰名网站已经相当活跃,这些网站已经预示或者启发了当今最盛行的服务。。
二、、中文编码
1.UUCODE (uuencoding)
uuencode这个名字衍生自"Unix-to-Unix encoding",原先是Unix系统下将二进制的资料借由uucp邮件系统传输的一个编码程式,是一种二进制到文字的编码。。uudecode是与uuencode搭配的解码程式,uuencode/decode常见于电子邮件中的档案传送以及usenet新闻组和BBS的贴文等等。。最近已被MIME大量取代。。
2.GB
GB/T 2312,GB/T 2312—80 或 GB/T 2312—1980 是中华人民共和国国度尺度简体中文字符集,全称《信息互换用汉字编码字符集·根基集》,通常简称GB(“国标”汉语拼音首字母),又称GB0,由中国国度尺度总局于1980年颁布,1981年5月1日执行。。
在GB 2312内,每个汉字及符号的码位使用两个字节来暗示。。第一个字节称为“高位字节”,对应分区的编号(把区位码的“区码”加上特定值);;第二个字节称为“低位字节”,对应区段内的个别码位(把区位码的“位码”加上特定值)。。
3.BIG5
大五码(英语:Big5,又称五大项目码、、五大码)是繁体中文社群最常用的电脑汉字字符集尺度,共收录13060个汉字。。
大五码是双字节字符集,以十六进制暗示,使用双八码存储步骤,以两字节安放一字。。第一字节称为“高位字节”,第二字节称为“低位字节”。。
4.Postscript
PostScript(PS)是一种页面描述说话和编程说话 ,由Adobe Systems公司于1984年推向市场。。或许在这个时辰,史蒂夫·乔布斯参观了Adobe公司的工作,并督促他们改进PostScript作为驱动激光打印机的说话,将其增长到Canon打印机,诞生了LaserWriter。。1985年3月,Apple LaserWriter是第一款带有PostScript的打印机,这也带来了1980年代中期的桌面印刷革命。。它的技术利益和宽泛利用使得PostScript成为打印利用领域影像输出的一个选择。。直到1990年代,PostScript说话诠释器,有时称作Raster image processor,已经一度成为激光打印机的一个通常组成部门。。随着使用电子方式颁布文档最终版本成为事实上的尺度,PostScript就在这个领域不休地被它的后续版本Portable Document Format(PDF)所超过。。
5.HZ
HZ编码是1988年发现的编码系统。。其主张是在7字节的限度下(如电子邮件)贮存GB/T 2312的双字节字符。。
其在ISO 2022编码字符的前后别离加上转义字符~{(7E 7B)和~}(7E 7D)后,使用正常的ASCII转码造成 ASCII 字符。。部门机械也能够接受使用EUC-CN编码的转义字符。。
HZ出现于RFC 1843《HZ - A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII characters》,作者来自斯坦福大学。。
6.T3
T3其主张是在7字节的限度下(如电子邮件)贮存BIG5的双字节字符。。
7.ISO2022-CN
为避开ASCII字符中的不成显示字符(十六进制为0×00至0×1F,十进制为0至31)及空格字符(十六进制为0×20,十进制为32),国标码(又称为互换码)参考ISO 2022划定暗示非ASCII字符双字节编码领域为十六进制为 <21 21>-<7E 7E>,十进制为 (33, 33) 至 (126, 126)。。因而,在进行码位转换时,须将“区码”和“位码”别离加上32(十六进制为0×20)作为国标码。。
在这个编码模式内,软件必要使用低端节制字符(C0),高端节制字符(C1)和US-ASCII字符集(GL)标注字符属于单字节(ASCII)还是双字节,相对容易造成乱码(如迷失节制/转义字符)。。
ISO2022-CN在RFC 1922《互联网新闻的汉字编码》(Chinese Character Encoding for Internet Messages)中被界说。。RFC1922是中国大陆的第一个RFC,其重要作者来自清华大学。。
8.UNICODE
Unicode,全称为Unicode尺度(The Unicode Standard),其官方机构Unicode联盟所用的中文名称为统一码,又译作万国码、、统一字符码、、统一字符编码,是信息技术领域的业界尺度,其整顿、、编码了世界上大部门的文字系统,使得电脑能以通用的字符集来处置和显示文字,不只减轻在分歧编码系统间切换和转换的困扰,更提供了一种跨平台的乱码问题解决规划。。Unicode由非投机机构Unicode联盟(Unicode Consortium)掌管守护,该机构致力于让Unicode尺度取代既有的字符编码规划,由于既有规划编码空间有限,亦不合用于多语环境。。
Unicode陪伴着通用字符集ISO/IEC 10646的尺度而发展,同时也以书本的大局对外颁发。。Unicode至今仍在不休增修,每个新版本都参与了更多新的字符。。目前最新的版本为2022年9月颁布的15.0.0,已经收录超过14万个字符(第十万个字符在2005年获得选取)。。Unicode尺度不仅仅是为文字指定代码。。除了涵盖视觉上的字形、、编码步骤、、尺度的字符编码资料外,联盟官方出版品还蕴含了关于各书写系统的细节及出现方式,如规范化的准则、、拆分、、测序、、绘制、、双向文本显示、、书写方向、、字符个性(如巨细写字母)等等。。此外还提供参考资料和视觉图像,以援手开发者和设计师正确利用尺度。。
Unicode备受认可,被ISO纳入国际尺度,成为通用字符集,即 ISO/IEC 10646。。Unicode兼容ISO/IEC 10646,能齐全对应各个版本尺度。。Unicode宽泛利用于电脑软件的国际化与本地化过程。:枚嘈驴萍,如可扩大置标语言(Extensible Markup Language,简称:XML)、、Java编程说话以及现代操作系统,都选取Unicode来编码。。Unicode最普遍的编码体式是和ASCII兼容的UTF-8,以及和UCS-2兼容的UTF-16。。
。。ㄒ陨献柿侠醋酝纾
起源:中国教育和科研推算机网CERNET