美國人在自己的腦子和小本本裡麵,記下“addition=關關關開”。
大明人在小本本上寫下了“加=陰陰陰陽”,或者是畫上三陰一陽的爻線。
無論是addition還是加,都隻是人類方便自己記憶的“備注”
在機器裡麵實際上都是在乾“關關關開”的活兒。
要控製計算機,就要直接去控製四個開關,組成“關關關開”的效果。
最後計算機算完的數據,也用紙帶上對應位置的空洞順序,來表示一串的開和關。
人類再把這些有規律的開關,翻譯城人類能夠理解的語言。
最早期的計算機,是與人類語言完全沒有關係的,就看使用者怎麼去命名和解讀。。
但是這樣實在太麻煩了。
如果能讓計算機直接識彆人類語言就好了。
關鍵是,為什麼是我這個人類,把自己的話翻譯成你這個機器的語言。
為什麼不能是我說我們人類的語言,然後你這個機器自己去翻譯成你們機器能理解的語言?
機器當然不知道怎麼乾。
於是人類給決定給機器做個翻譯器,或者說轉換器。
在翻譯器上輸入人類語言,翻譯器給機器翻譯成機器語言,再讓機器去執行計算。
計算機算完之後輸出,再讓翻譯器翻譯成人類語言。
這個想法是非常好的,這其實也是所有程序語言的基本邏輯。
程序語言的最終目的,就是實現人類直接說法,讓機器完全理解並完美執行。
隻可惜啊,彆說完全聽懂人話並完美執行了,單純的讓機器直接執行最基本的命令,都讓最早的研究人員們費老勁了。
翻譯器怎麼才能把addition翻譯成一連串的開關呢?
怎麼讓機器知道“加”是什麼意思呢?
看上去,好像隻要做一個表格,左邊一列寫addition或者加,右邊寫“關關關開”。
告訴機器,我輸入addition或者加,你就去給我執行“關關關開”。
然而更進一步的問題是,怎麼“輸入”addition或者加。
輸入法這個東西,在後世看來很常見的東西,在早期電腦上絕對是黑科技。
就算是看上去能夠按鍵直出的英文字母,也要去乾一個物理按鍵綁定字母表的活兒。,
否則機器不知道a是啥,c又是啥,根本沒有b數。
所以要再做一個表格,把一個開關序列綁定a,一個開關序列綁定b,一個開關序列綁定c……二十六個字母和標點符號數字都做好。
再再做一個表格,把這些開關序列綁定鍵盤上的按鍵,並在按鍵上寫上a、b、c……
我依次按下寫著addition這幾字母的按鍵,計算機收到按鍵對應的信號去查表。
找到了關關開關、關關開開、關關關關……等一連串的開關命令。
如果是英文係統,這時候就在屏幕上依次顯示addition幾個字母。
同時,這關關開關、關關開開、關關關關……這一連串命令,按照順序組合起來,就對應另一個命令“關關關開”。
如果是漢字係統,這時候在屏幕上顯示“加”。
最後,計算機去執行最後的“關關關開“命令。
輸入英文是一個相同表格有幾個字母循環查幾遍,漢字是設計兩到四層嵌套的表格逐次查一遍。
做到這些就已經非常困難了。
甚至於,對早期計算機性能都有了一定的要求……
最早的計算機字節長度是四位的。
一個二進製位可以記錄兩個編號,字節長度為四的話,最多可以記錄二的四次方,也就是總共十六個編號。
這甚至不能容納所有的英文字母。
要記錄所有字母,至少要把字節長度增加到五,這樣編碼容量增加到了三十二。
可以容納所有的字母,再加上幾個常用的符號。
但是還不能同時單獨輸入數字,用純英文單詞去拚數字就太惡心了。
於是又把字節長度增加到六位,編碼容量增加到了六十四。
這就能夠容納字母、數字、常見符號了。
所以六位的計算機,甚至於在計算機出現之前,就在打孔卡上用了很久了。
但是六位的情況下,字母隻能有大寫或者小寫一種。
彙編語言也全部都是大寫字母。
如果用來輸出文字的話,全篇大寫字母看著也是很頭疼。
所以就繼續增加到七位數。
這樣就有了總共一百二十八個的編碼容量,對於英語而言基本圓滿了。
能表達所有大小寫字母、主要符號、十個數字。
以及換行、回車、刪除等常用的輸入控製命令。
美利堅製定的ASCII標準就是七位編碼。
後世的通用計算機字節長度是八位,因為IBM設計的第一套通用計算機,在七位的基礎上增加了一位校驗碼。
後來隨著技術提升,校驗碼被省略,八位編碼的容量就增加到了二百五十六個了。
相比最初的計算機,字節長度已經翻倍了。
這還隻是英文,如果要記錄漢字的話,難度就進一步飆升了。
現在大明通行的《通用標準漢字表》就有八千個字。
一個字卦長度至少要增加到十三爻,有八千一百九十二的容量才能容納。
字卦長度要增加到十五爻,有三萬兩千七百六十八的容量,才能整個《大明標準漢字總表》的所有漢字。
現在的生產工藝級彆較低,還要參考IBM的做法,價格校驗位。
這樣字節長度就增加到了十六爻。
與此同時,三萬多個十六位字卦,編碼總容量已經達到了65536爻,折合前世的65KB。
這對於早期的計算機而言,是一個非常大的數字。
更關鍵的是,這隻是漢字編號。
如果把漢字當做是一個個的人,這個表格相當於所有他們所有人的地址表。
要讓漢字在屏幕上顯示,還要把漢字做成點陣圖像。
按照前世的經驗,要讓漢字顯示的相對自然,要用十六乘以十六的點陣。
一個點陣的開關也要用一個字卦控製。
十六乘以十六就是256個字卦,32768個漢字合計8388608字卦,折合前世的16MB。
當時的大部分硬盤都裝不下,更彆說內存了。
要讓漢字勉強完整顯示,不缺少筆畫,也要十二乘以十二的點陣。
這樣總共也要9MB。
就算是隻記錄通用漢字表,也需要2.25MB。
七十年代以前的電腦,裝下這個東西是非常吃力的。
再次基礎上,這也還隻是點陣字庫。
要通過鍵盤把漢字打出來,輸入到電腦裡麵去,還需要一個輸入法程序。
用於按照人類能夠理解的邏輯,通過特定的按鍵組合,把想要的漢字從字庫中篩選出來。
這個過程跟英文打單詞是一樣的,區彆隻是一個字母一個字母的顯示,最後組合起來形成命令。
還是依次打完特定的組合的按鍵,組合形成成命令的同時顯示出目標漢字。
如果不涉及到高級的聯想功能,用高度機械死板的輸入法,限定死隻能用哪些漢字,就是這樣的邏輯。
不過,點陣數據還可以放在硬盤上,字表和輸入法就要載入內存了。
當時的超級計算機內存也隻有100KB出頭的樣子。
這對當時的計算機而言是一個巨大的挑戰。
要先運行輸入法程序,從字表中篩查出要輸入的漢字,再去硬盤查點陣圖輸出到屏幕。
就算是不惜成本,將字庫輸入法都所有功能都實現出來了。
這台電腦多半也會出現打一個字就要等好幾秒的狀態。
所以,朱靖垣現在看到電腦屏幕上有漢字,就知道工部絕對沒有把漢字全做進計算機。
因為現在的電腦也不需要將所有漢字輸入進去。
這時候的計算機就不是用來處理文字的。
英文編程也不會把addition打完整,那這一個單詞就需要64B的空間來容納。
一段代碼打上幾十個單詞,就要占用KB級彆的內存了,英文係統同樣撐不住。
肯定要能省就省的,直接寫個ADD就行了。
反正電腦不是處理文字的,當時的命令也隻有幾十個,單詞都用簡寫也不會認錯。
漢字肯定是這麼處理的,也隻能這麼處理。
朱靖垣懷疑,這台電腦隻能顯示一兩百,甚至幾十個漢字。
很可能是一個按鍵固定出一個字,一個對應一個固定的程序命令,剩下的就都是標點符號和數字了。
符號係統也不會存在什麼全角半角的區彆,輸入過程也不需要轉換輸入法。
如果是這樣的話,漢字彙編反而比英文更簡單。
因為單個漢字就有英文單詞的作用,特彆是在傳統文言文仍然盛行的時代。
朱靖垣眼前屏幕上的程序中的命令,確實全都是一個一個的單字。
英文環境下單個字母很少有實際意義,至少要用兩個到三個字母,才能讓程序員產生有實際含義的聯想。
同時,眼前這個屏幕肯定是非常“高級”的功能。
低級型號的電腦,很可能根本沒有屏幕。
因為屏幕上顯示漢字和字母,哪怕是隻有幾十個,也非常浪費存儲空間。
早期的英文電腦同樣是沒有屏幕的。
操作員都是盲打的。
至於完整的八千個漢字,隻能等下一代的電腦,把集成電路做出來再說了。