用Open Source工具開發軟體: 新軟體開發關念
Prev	Chapter 4. GNU Compiler Collection	Next

gcc與OS - User space/Kernel space

簡介

space的涵義在數學上或物理上，就是用了另一個參考基準點 (不同的參考座標系)，怎麼說呢，例如一個蘋果，我剛剛講的一個，這個 "一"這個數量是根據單位是完整的蘋果得來的，但是我也可以說是兩個 (半個蘋果)，相對的指的是同一件事情，但是2這個數字是根據單位是半個蘋果得來的。物理上來說，由於一些幾何的特性，我們會在(x,y,z)與(r,theta,phi)做轉換，線性數學上會比較好處理(所以科學是很可憐的只能處理特定線性的世界)。相對的電腦裡面由於保護的原因，它也有兩個space，在ELF的image中我們可以知道 0 ~ 3G的連續位址是User Space，3G~4G是kernel space。 user kernel間每次切換都要靠軟體中斷，而且如果有要處理的buffer 例如
char *string="string"; printf(string);
則最後用system call write到螢幕時這個string，會有一個buffer在user space，也會有個buffer在kernel space，也就是user kernel的資料不是相通的，必須靠kernel內的function來copy來copy去，這些額外的處理不管是中斷也好，資料處理的動作也好，當然會耗掉多餘的時間。

當你用nm /bin/ls ldd /bin/ls看到的位址是函式庫的參照位址，是Virtual Address，不是真的physical address 這其實是廢話，既然我們在user層次。virtual address 它會根據不同的硬體cache與cpu系統，有另一個轉換而有所不同（不同CPU的 cache定址和方式不一樣，OS必須配合這些。) 所以nm看到的address是只有特定的"平台"才懂， Solaris 與Linux的同一隻用gcc編出來的程式的虛擬位址架構是完全不同的。不管怎樣，可以想像kernel與user的差異點在哪裡了。

gcc與System call

所有user建立的執行檔都是user space，只有 OS kenrel的執行程式碼才是kernel space 程式碼。當user程式想要存取電腦上重要資源時抱歉不準，你放一隻病毒我format硬碟還得了，因此都必須透過System Call這個系統提供的函式API來由kernel幫你做，通常切換到kernel的是你的程式裡面呼叫了例如fork, open, read, write，這時編譯器分析c程式碰到這些system call，會先放個system call ID到暫存器，例如
mov eax, 01 然後用 int 80
做80號中斷，kernel就會根據CPU暫存器的值，知道要Jump到那一個 system call routine去做一些動作 (在/usr/src/linux/archi/xxxxx/kernel/entry.S)，那function call呢?例如printf scanf最後到要存取螢幕鍵盤時，去看libc的source code，其實也要用read/write來存取device file 這時又會放個中斷80了。

各個OS提供的System Call當然都不一樣，即使每家Unix like的都長很像甚至很多system call 如read() write() fork()等等在使用者角度看都一樣 (這就是程式可攜性)，一號通常就是exit()這個system call，其實這要看系統的設定，在Linux上定義在/usr/include/linux/asm/unistd.h，在Solaris上定義在 /usr/include/sys/syscall.h。但內部的編號或許不一樣，而實際運做的方式當然更不一樣了。就像從台北到高雄目的地一樣到達方法卻很多種。

所以為什麼gcc可以做cross compiler呢?因為他知道每個cpu的指令的長相，知道每個OS的要求，知道ELF的格式，它只是在建造出一個image而已。所以用 shell script也能作出一個compiler，原理只要把該放的字串，該放的Byte長相，放進檔案就可以了。 MIPS的 32 bit指令中如圖

Figure 4-4. MIPS指令

add是MIPS裡面的R-type指令，如果要定址的指令，例如 lw(load word)就是I-type， R-type opcode 是0， lw opcode 是35， rs rt rd 分別是$1 $2 $3這些register，由於只有32個register所以用5bits就可以定址了， function code: R-type內add的function code是32所以是100010，最後這32根線送進CPU內CPU就會處理了，這就是所謂的32位元電腦。因此在build gcc時要知道target， build 的OS, CPU種類，就是這個道理，根據這樣各CPU公司的資訊就可以做各種轉換了。

Cross Compiler通常要連binutils, glibc, gdb一起都要作cross platform 的重新編譯，通常是在configure時加--target=xxxx這樣的選項就可以了。

Prev	Home	Next
gcc與Obj檔，動態連結與ELF檔	Up	binutils