一個printf(結構體指針)引發(fā)的血案
編譯、執(zhí)行,打印結果如下:
示例3:參數(shù)類型是 char*,但是參數(shù)個數(shù)不固定#include <unistd.h>#include <stdio.h>#include <stdlib.h>#include <stdarg.h>
void my_printf_string(char *first, ...){ char *str = first; va_list arg; va_start(arg, first); do { printf("%s ", str); str = va_arg(arg, char*); } while (str 。 NULL ); va_end(arg); printf("");}
int main(){ char *a = "aaa", *b = "bbb", *c = "ccc"; my_printf_string(a, b, c, NULL);}
編譯、執(zhí)行,打印結果如下:
注意:以上這3個示例中,雖然傳入的參數(shù)個數(shù)是不固定的,但是參數(shù)的類型都必須是一樣的!
另外,處理函數(shù)中必須能夠知道傳入的參數(shù)有多少個,處理 int 和 float 的函數(shù)是通過第一個參數(shù)來判斷的,處理 char* 的函數(shù)是通過最后一個可變參數(shù)NULL來判斷的。
2. 可變參數(shù)的原理2.1 可變參數(shù)的幾個宏定義typedef char * va_list;
#define va_start _crt_va_start#define va_arg _crt_va_arg #define va_end _crt_va_end
#define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) ) #define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) #define _crt_va_end(ap) ( ap = (va_list)0 )
注意:va_list 就是一個 char* 型指針。
2.2 可變參數(shù)的處理過程
我們以剛才的示例 my_printf_int 函數(shù)為例,重新貼一下:
void my_printf_int(int num, ...) // step1{ int i, val; va_list arg; va_start(arg, num); // step2 for(i = 0; i < num; i++) { val = va_arg(arg, int); // step3 printf("%d ", val); } va_end(arg); // step4 printf("");}
int main(){ int a = 1, b = 2, c = 3; my_printf_int(3, a, b, c);}
Step1: 函數(shù)調用時
C語言中函數(shù)調用時,參數(shù)是從右到左、逐個壓入到棧中的,因此在進入 my_printf_int 的函數(shù)體中時,棧中的布局如下:
Step2: 執(zhí)行 va_start
va_start(arg, num);
把上面這語句,帶入下面這宏定義:
#define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) )
宏擴展之后得到:
arg = (char *)num + sizeof(num);
結合下面的圖來分析一下:首先通過 _ADDRESSOF 得到 num 的地址 0x01020300,然后強轉成 char* 類型,再然后加上 num 占據(jù)的字節(jié)數(shù)(4個字節(jié)),得到地址 0x01020304,最后把這個地址賦值給 arg,因此 arg 這個指針就指向了棧中數(shù)字 1 的那個地址,也就是第一個參數(shù),如下圖所示:
Step3: 執(zhí)行 va_arg
val = va_arg(arg, int);
把上面這語句,帶入下面這宏定義:
#define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
宏擴展之后得到:
val = ( *(int *)((arg += _INTSIZEOF(int)) - _INTSIZEOF(int)) )
結合下面的圖來分析一下:先把 arg 自增 int 型數(shù)據(jù)的大。4個字節(jié)),使得 arg = 0x01020308;然后再把這個地址(0x01020308)減去4個字節(jié),得到的地址(0x01020304)里的這個值,強轉成 int 型,賦值給 val,如下圖所示:
簡單理解,其實也就是:得到當前 arg 指向的 int 數(shù)據(jù),然后把 arg 指向位于高地址處的下一個參數(shù)位置。
va_arg 可以反復調用,直到獲取棧中所有的函數(shù)傳入的參數(shù)。
Step4: 執(zhí)行 va_end
va_end(arg);
把上面這語句,帶入下面這宏定義:
#define _crt_va_end(ap) ( ap = (va_list)0 )
宏擴展之后得到:
arg = (char *)0;
這就好理解了,直接把指針 arg 設置為空。因為棧中的所有動態(tài)參數(shù)被提取后,arg 的值為 0x01020310(最后一個參數(shù)的上一個地址),如果不設置為 NULL 的話,下面使用的話就得到未知的結果,為了防止誤操作,需要設置為NULL。
3. printf利用可變參數(shù)打印信息
理解了 C 語言中可變參數(shù)的處理機制,再來思考 printf 語句的實現(xiàn)機制就很好理解了。
3.1 GNU 中的 printf 代碼__printf (const char *format, ...){ va_list arg; int done;
va_start (arg, format); done = vfprintf (stdout, format, arg); va_end (arg);
return done;}
可見,系統(tǒng)庫中的 printf 也是這樣來處理動態(tài)參數(shù)的,vfprintf 函數(shù)最終會調用系統(tǒng)函數(shù) sys_write,把數(shù)據(jù)輸出到 stdout 設備上(顯示器)。vfprintf 函數(shù)代碼看起來還是有點復雜,不過稍微分析一下就可以得到其中的大概實現(xiàn)思路:
逐個比對格式化字符串中的每一個字符;如果是普通字符就直接輸出;如果是格式化字符,就根據(jù)指定的數(shù)據(jù)類型,從可變參數(shù)中讀取數(shù)據(jù),輸出顯示;
以上只是很粗略的思路,實現(xiàn)細節(jié)肯定復雜的多,需要考慮各種細節(jié)問題。下面是 2 個簡單的示例:
void my_printf_format_v1(char *fmt, ...){ va_list arg; int d; char c, *s;
va_start(arg, fmt); while (*fmt) { switch (*fmt) { case 's': s = va_arg(arg, char *); printf("%s", s); break;
case 'd': d = va_arg(arg, int); printf("%d", d); break;
case 'c': c = (char) va_arg(arg, int); printf(" %c", c); break; default: if ('%' != *fmt || ('s' 。 *(fmt + 1) && 'd' != *(fmt + 1) && 'c' 。 *(fmt + 1))) printf("%c", *fmt); break; } fmt++; } va_end(arg);}
int main(){ my_printf_format_v1("age = %d, name = %s, num = %d ", 20, "zhangsan", 98);}
編譯、執(zhí)行,輸出結果:
完美!但是再測試下面代碼(把格式化字符串最后面的 num 改成 score):
my_printf_format_v1("age = %d, name = %s, score = %d ", 20, "zhangsan", 98);
編譯、執(zhí)行,輸出結果:
因為普通字符串 score 中的字符 s 被第一個 case 捕獲到了,所以發(fā)生錯誤。稍微改進一下:
void my_printf_format_v2(char *fmt, ...){ va_list arg; int d; char c, lastC = '', *s;
va_start(arg, fmt); while (*fmt) { switch (*fmt) { case 's': if ('%' == lastC) { s = va_arg(arg, char *); printf("%s", s); } else { printf("%c", *fmt); } break;
case 'd': if ('%' == lastC) { d = va_arg(arg, int); printf("%d", d); } else { printf("%c", *fmt); } break;
case 'c': if ('%' == lastC) { c = (char) va_arg(arg, int); printf(" %c", c); } else { printf("%c", *fmt); } break; default: if ('%' 。 *fmt || ('s' != *(fmt + 1) && 'd' 。 *(fmt + 1) && 'c' 。 *(fmt + 1))) printf("%c", *fmt); break; } lastC = *fmt; fmt++; } va_end(arg);}
int main(){ my_printf_format_v2("age = %d, name = %s, score = %d ", 20, "zhangsan", 98);}
編譯、執(zhí)行,打印結果:
五、總結
我們來復盤一下上面的分析過程,開頭的第一個代碼本意是測試關于指針的,結果到最后一直分析到 C 語言中的可變參數(shù)問題?梢钥闯觯治鰡栴}-定位問題-解決問題是一連串的思考過程,把這個過程走一遍之后,理解才會更深刻。
我還有另外一個感受:如果我沒有寫公眾號,就不會寫這篇文章;如果不寫這篇文章,就不會研究的這么較真。也許在中間的某個步驟,我就會偷懶對自己說:理解到這個層次就差不多了,不用繼續(xù)深究了。所以說以文章的形式來把自己的思考過程進行輸出,是技術提升是非常有好處的,也強烈建議各位小伙伴嘗試一下這么做。
而且,如果這些思考過程能得到你們的認可,那么我就會更有動力來總結、輸出文章。因此,如果這篇總結對你能有一絲絲的幫助,請轉發(fā)、分享給你的技術朋友,在此表示衷心的感謝!
【原創(chuàng)聲明】
作者:道哥

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?