訂閱
糾錯(cuò)
加入自媒體

C語(yǔ)言中威力最大的指針底層原理和使用技巧講解

這是道哥的第014篇原創(chuàng)

一、前言

二、變量與指針的本質(zhì)

三、指針的幾個(gè)相關(guān)概念

四、指向不同數(shù)據(jù)類型的指針

五、總結(jié)

一、前言

如果問C語(yǔ)言中最重要、威力最大的概念是什么,答案必將是指針!威力大,意味著使用方便、高效,同時(shí)也意味著語(yǔ)法復(fù)雜、容易出錯(cuò)。指針用的好,可以極大的提高代碼執(zhí)行效率、節(jié)約系統(tǒng)資源;如果用的不好,程序中將會(huì)充滿陷阱、漏洞。

這篇文章,我們就來(lái)聊聊指針。從最底層的內(nèi)存存儲(chǔ)空間開始,一直到應(yīng)用層的各種指針使用技巧,循序漸進(jìn)、抽絲剝繭,以最直白的語(yǔ)言進(jìn)行講解,讓你一次看過癮。

說明:為了方便講解和理解,文中配圖的內(nèi)存空間的地址是隨便寫的,在實(shí)際計(jì)算機(jī)中是要遵循地址對(duì)齊方式的。

二、變量與指針的本質(zhì)

 1. 內(nèi)存地址

我們編寫一個(gè)程序源文件之后,編譯得到的二進(jìn)制可執(zhí)行文件存放在電腦的硬盤上,此時(shí)它是一個(gè)靜態(tài)的文件,一般稱之為程序。

當(dāng)這個(gè)程序被啟動(dòng)的時(shí)候,操作系統(tǒng)將會(huì)做下面幾件事情:

把程序的內(nèi)容(代碼段、數(shù)據(jù)段)從硬盤復(fù)制到內(nèi)存中;創(chuàng)建一個(gè)數(shù)據(jù)結(jié)構(gòu)PCB(進(jìn)程控制塊),來(lái)描述這個(gè)程序的各種信息(例如:使用的資源,打開的文件描述符...);在代碼段中定位到入口函數(shù)的地址,讓CPU從這個(gè)地址開始執(zhí)行。

當(dāng)程序開始被執(zhí)行時(shí),就變成一個(gè)動(dòng)態(tài)的狀態(tài),一般稱之為進(jìn)程。

內(nèi)存分為:物理內(nèi)存和虛擬內(nèi)存。操作系統(tǒng)對(duì)物理內(nèi)存進(jìn)行管理、包裝,我們開發(fā)者面對(duì)的是操作系統(tǒng)提供的虛擬內(nèi)存。
這2個(gè)概念不妨礙文章的理解,因此就統(tǒng)一稱之為內(nèi)存。

在我們的程序中,通過一個(gè)變量名來(lái)定義變量、使用變量。變量本身是一個(gè)確確實(shí)實(shí)存在的東西,變量名是一個(gè)抽象的概念,用來(lái)代表這個(gè)變量。就比如:我是一個(gè)實(shí)實(shí)在在的人,是客觀存在與這個(gè)地球上的,道哥是我給自己起的一個(gè)名字,這個(gè)名字是任意取得,只要自己覺得好聽就行,如果我愿意還可以起名叫:鳥哥、龍哥等等。

那么,我們定義一個(gè)變量之后,這個(gè)變量放在哪里呢?那就是內(nèi)存的數(shù)據(jù)區(qū)。內(nèi)存是一個(gè)很大的存儲(chǔ)區(qū)域,被操作系統(tǒng)劃分為一個(gè)一個(gè)的小空間,操作系統(tǒng)通過地址來(lái)管理內(nèi)存。

內(nèi)存中的最小存儲(chǔ)單位是字節(jié)(8個(gè)bit),一個(gè)內(nèi)存的完整空間就是由這一個(gè)一個(gè)的字節(jié)連續(xù)組成的。在上圖中,每一個(gè)小格子代表一個(gè)字節(jié),但是好像大家在書籍中沒有這么來(lái)畫內(nèi)存模型的,更常見的是下面這樣的畫法:

也就是把連續(xù)的4個(gè)字節(jié)的空間畫在一起,這樣就便于表述和理解,特別是深入到代碼對(duì)齊相關(guān)知識(shí)時(shí)更容易理解。(我認(rèn)為根本原因應(yīng)該是:大家都這么畫,已經(jīng)看順眼了~~)

2. 32位與64位系統(tǒng)

我們平時(shí)所說的計(jì)算機(jī)是32位、64位,指的是計(jì)算機(jī)的CPU中寄存器的最大存儲(chǔ)長(zhǎng)度,如果寄存器中最大存儲(chǔ)32bit的數(shù)據(jù),就稱之為32位系統(tǒng)。

在計(jì)算機(jī)中,數(shù)據(jù)一般都是在硬盤、內(nèi)存和寄存器之間進(jìn)行來(lái)回存取。CPU通過3種總線把各組成部分聯(lián)系在一起:地址總線、數(shù)據(jù)總線和控制總線。地址總線的寬度決定了CPU的尋址能力,也就是CPU能達(dá)到的最大地址范圍。

剛才說了,內(nèi)存是通過地址來(lái)管理的,那么CPU想從內(nèi)存中的某個(gè)地址空間上存取一個(gè)數(shù)據(jù),那么CPU就需要在地址總線上輸出這個(gè)存儲(chǔ)單元的地址。假如地址總線的寬度是8位,能表示的最大地址空間就是256個(gè)字節(jié),能找到內(nèi)存中最大的存儲(chǔ)單元是255這個(gè)格子(從0開始)。即使內(nèi)存條的實(shí)際空間是2G字節(jié),CPU也沒法使用后面的內(nèi)存地址空間。如果地址總線的寬度是32位,那么能表示的最大地址就是2的32次方,也就是4G字節(jié)的空間。

【注意】:這里只是描述地址總線的概念,實(shí)際的計(jì)算機(jī)中地址計(jì)算方式要復(fù)雜的多,比如:虛擬內(nèi)存中采用分段、分頁(yè)、偏移量來(lái)定位實(shí)際的物理內(nèi)存,在分頁(yè)中還有大頁(yè)、小頁(yè)之分,感興趣的同學(xué)可以自己查一下相關(guān)資料。

3. 變量

我們?cè)贑程序中使用變量來(lái)“代表”一個(gè)數(shù)據(jù),使用函數(shù)名來(lái)“代表”一個(gè)函數(shù),變量名和函數(shù)名是程序員使用的助記符。變量和函數(shù)最終是要放到內(nèi)存中才能被CPU使用的,而內(nèi)存中所有的信息(代碼和數(shù)據(jù))都是以二進(jìn)制的形式來(lái)存儲(chǔ)的,計(jì)算機(jī)根據(jù)就不會(huì)從格式上來(lái)區(qū)分哪些是代碼、哪些是數(shù)據(jù)。CPU在訪問內(nèi)存的時(shí)候需要的是地址,而不是變量名、函數(shù)名。

問題來(lái)了:在程序代碼中使用變量名來(lái)指代變量,而變量在內(nèi)存中是根據(jù)地址來(lái)存放的,這二者之間如何映射(關(guān)聯(lián))起來(lái)的?

答案是:編譯器!編譯器在編譯文本格式的C程序文件時(shí),會(huì)根據(jù)目標(biāo)運(yùn)行平臺(tái)(就是編譯出的二進(jìn)制程序運(yùn)行在哪里?是x86平臺(tái)的電腦?還是ARM平臺(tái)的開發(fā)板?)來(lái)安排程序中的各種地址,例如:加載到內(nèi)存中的地址、代碼段的入口地址等等,同時(shí)編譯器也會(huì)把程序中的所有變量名,轉(zhuǎn)成該變量在內(nèi)存中的存儲(chǔ)地址。

變量有2個(gè)重要屬性:變量的類型和變量的值。

示例:代碼中定義了一個(gè)變量

int a = 20;

類型是int型,值是20。這個(gè)變量在內(nèi)存中的存儲(chǔ)模型為:

我們?cè)诖a中使用變量名a,在程序執(zhí)行的時(shí)候就表示使用0x11223344地址所對(duì)應(yīng)的那個(gè)存儲(chǔ)單元中的數(shù)據(jù)。因此,可以理解為變量名a就等價(jià)于這個(gè)地址0x11223344。換句話說,如果我們可以提前知道編譯器把變量a安排在地址0x11223344這個(gè)單元格中,我們就可以在程序中直接用這個(gè)地址值來(lái)操作這個(gè)變量。

在上圖中,變量a的值為20,在內(nèi)存中占據(jù)了4個(gè)格子的空間,也就是4個(gè)字節(jié)。為什么是4個(gè)字節(jié)呢?在C標(biāo)準(zhǔn)中并沒有規(guī)定每種數(shù)據(jù)類型的變量一定要占用幾個(gè)字節(jié),這是與具體的機(jī)器、編譯器有關(guān)。

比如:32位的編譯器中:

char: 1個(gè)字節(jié);
short int: 2個(gè)字節(jié);
int: 4個(gè)字節(jié);
long: 4個(gè)字節(jié)。

比如:64位的編譯器中:

char: 1個(gè)字節(jié);
short int: 2個(gè)字節(jié);
int: 4個(gè)字節(jié);
long: 8個(gè)字節(jié)。

為了方便描述,下面都以32位為例,也就是int型變量在內(nèi)存中占據(jù)4個(gè)字節(jié)。

另外,0x11223344,0x11223345,0x11223346,0x11223347這連續(xù)的、從低地址到高地址的4個(gè)字節(jié)用來(lái)存儲(chǔ)變量a的數(shù)值20。在圖示中,使用十六進(jìn)制來(lái)表示,十進(jìn)制數(shù)值20轉(zhuǎn)成16進(jìn)制就是:0x00000014,所以從開始地址依次存放0x00、0x00、0x00、0x14這4個(gè)字節(jié)(存儲(chǔ)順序涉及到大小端的問題,不影響文本理解)。

根據(jù)這個(gè)圖示,如果在程序中想知道變量a存儲(chǔ)在內(nèi)存中的什么位置,可以使用取地址操作符&,如下:

printf("&a = 0x%x ", &a);

這句話將會(huì)打印出:&a = 0x11223344。

考慮一下,在32位系統(tǒng)中:指針變量占用幾個(gè)字節(jié)?

4. 指針變量

指針變量可以分2個(gè)層次來(lái)理解:

指針變量首先是一個(gè)變量,所以它擁有變量的所有屬性:類型和值。它的類型就是指針,它的值是其他變量的地址。 既然是一個(gè)變量,那么在內(nèi)存中就需要為這個(gè)變量分配一個(gè)存儲(chǔ)空間。在這個(gè)存儲(chǔ)空間中,存放著其他變量的地址。指針變量所指向的數(shù)據(jù)類型,這是在定義指針變量的時(shí)候就確定的。例如:int *p; 意味著指針指向的是一個(gè)int型的數(shù)據(jù)。

首先回答一下剛才那個(gè)問題,在32位系統(tǒng)中,一個(gè)指針變量在內(nèi)存中占據(jù)4個(gè)字節(jié)的空間。因?yàn)镃PU對(duì)內(nèi)存空間尋址時(shí),使用的是32位地址空間(4個(gè)字節(jié)),也就是用4個(gè)字節(jié)就能存儲(chǔ)一個(gè)內(nèi)存單元的地址。而指針變量中的值存儲(chǔ)的就是地址,所以需要4個(gè)字節(jié)的空間來(lái)存儲(chǔ)一個(gè)指針變量的值。

示例:

int a = 20;
int *pa;
pa = &a;
printf("value = %d ", *pa);

在內(nèi)存中的存儲(chǔ)模型如下:

對(duì)于指針變量pa來(lái)說,首先它是一個(gè)變量,因此在內(nèi)存中需要有一個(gè)空間來(lái)存儲(chǔ)這個(gè)變量,這個(gè)空間的地址就是0x11223348;

其次,這個(gè)內(nèi)存空間中存儲(chǔ)的內(nèi)容是變量a的地址,而a的地址為0x11223344,所以指針變量pa的地址空間中,就存儲(chǔ)了0x11223344這個(gè)值。

這里對(duì)兩個(gè)操作符&和*進(jìn)行說明:

&:取地址操作符,用來(lái)獲取一個(gè)變量的地址。上面代碼中&a就是用來(lái)獲取變量a在內(nèi)存中的存儲(chǔ)地址,也就是0x11223344。

*:這個(gè)操作符用在2個(gè)場(chǎng)景中:定義一個(gè)指針的時(shí)候,獲取一個(gè)指針?biāo)赶虻淖兞恐档臅r(shí)候。

int *pa; 這個(gè)語(yǔ)句中的表示定義的變量pa是一個(gè)指針,前面的int表示pa這個(gè)指針指向的是一個(gè)int類型的變量。不過此時(shí)我們沒有給pa進(jìn)行賦值,也就是說此刻pa對(duì)應(yīng)的存儲(chǔ)單元中的4個(gè)字節(jié)里的值是沒有初始化的,可能是0x00000000,也可能是其他任意的數(shù)字,不確定;

printf語(yǔ)句中的*表示獲取pa指向的那個(gè)int類型變量的值,學(xué)名叫解引用,我們只要記住是獲取指向的變量的值就可以了。

1  2  3  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)