在中國,活字印刷術(shù)的故鄉(xiāng),卻仍在按照1488年德國谷登堡的辦法:以火熔鉛,以鉛鑄字,以鉛排版,以版印刷。暗灰色的鉛字與赤熱的烈焰每天都在炙烤著印刷工人。
當時在中國國內(nèi),僅有五家機構(gòu)正在開發(fā)精密照排項目,其中有三家研制二代機,另外兩家開始研制第三代照排機。
而且,無論是二代機還是三代機,在存貯漢字方面,他們均采用的是模擬方式。但是,“漢字字型的信息量龐大,模擬存貯的方法不可能解決存貯和輸出等技術(shù)難關(guān)。”
王選很清楚地意識到:“二代機用機械方式選字,對機械精密程度要求極高,需要非常精細的機械制造工藝,依照我國當時的機械工業(yè)水平,很難達到要求,研制和生產(chǎn)都很困難。同時,不能適應復雜版面的要求,尤其不可能實現(xiàn)文圖合一的輸出,因此,二代機是沒有發(fā)展前途的。三代機所用的陰極射線管比黑白電視機分辨率高20倍,生產(chǎn)難度極大,對底片靈敏度要求也很高,國產(chǎn)底片很難過關(guān)?!?/p>
但是王選發(fā)現(xiàn)了西德Hell公司的Digiset。1965年在巴黎TRG展覽會上,西德Hell公司首次展示了用CRT(陰極射線管)作為光源的照排機。這并不重要,重要的是它采用了數(shù)字式存貯和數(shù)字式輸出,“被稱為‘真正的突破’,使高速輸出和文圖合一的處理成為可能”。情報所的一份雜志上刊登了Digiset輸出的線條圖,王選驚喜地看到,這個圖形質(zhì)量極好。
在1965年在巴黎TRG展覽會十年之后,西方國家的三代機已經(jīng)大多采用數(shù)字存儲,把每個字型變成一連串由0、1組成的二進位信息,存儲在計算機內(nèi)。
“看來,數(shù)字式存儲將占統(tǒng)治地位?!蓖踹x隱隱有了這樣的見識。
“對國外狀況的調(diào)查,使我于1975年得出下述結(jié)論:數(shù)字式存儲將占統(tǒng)治地位;光機式二代機,尤其是漢字二代機難度很大,但沒有前途;字模管式三代機和飛點掃描式三代機正在走下坡路,很快將被數(shù)字存儲的CRT三代機所淘汰。”
很快,陳堃銶也成了王選的同盟者。他們立刻開始了中文漢字數(shù)字存儲方案的探究。
在浩瀚無垠的漢字之海中遨游,王選被震驚了。
康熙字典收入的漢字多達47000多個,常用的字就有五六千個,印刷用的漢字更存在多種字體,有宋體、黑體、仿宋、楷體等十余種,而且還有十多種大小不同的字號。如此匡算,印刷用的漢字字頭數(shù)多達100萬個,若不采用信息壓縮的方法,總存貯量竟高達200億字節(jié)!
而我們的計算機呢?
國產(chǎn)DJS130計算機的磁芯存儲器,最大容量只有64K,還有一個512KB的磁鼓和一條磁帶,僅相當于美國20世紀50年代的水平。這就如同將太平洋的海水盛放在昆明湖中,還要騰出空間來對海水進行分析、分類、處理……
癡人說夢??!