新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > linux內(nèi)核啟動流程

linux內(nèi)核啟動流程

作者: 時間:2016-11-22 來源:網(wǎng)絡(luò) 收藏
arch/arm/kernel/head-armv.S
該文件是內(nèi)核最先執(zhí)行的一個文件,包括內(nèi)核入口ENTRY(stext)到start_kernel間的初始化代碼,主要作用是檢查CPU ID, Architecture Type,初始化BSS等操作,并跳到start_kernel函數(shù)。在執(zhí)行前,處理器應(yīng)滿足以下狀態(tài):
r0 - should be 0
r1 - unique architecture number
MMU - off
I-cache - on or off
D-cache – off
[cpp]view plaincopy
print?
  1. /*部分源代碼分析*/
  2. /*內(nèi)核入口點(diǎn)*/
  3. ENTRY(stext)
  4. /*程序狀態(tài),禁止FIQ、IRQ,設(shè)定SVC模式*/
  5. movr0,#F_BIT|I_BIT|MODE_SVC@makesuresvcmode
  6. /*置當(dāng)前程序狀態(tài)寄存器*/
  7. msrcpsr_c,r0@andallirqsdisabled
  8. /*判斷CPU類型,查找運(yùn)行的CPUID值與Linux編譯支持的ID值是否支持*/
  9. bl__lookup_processor_type
  10. /*跳到__error*/
  11. teqr10,#0@invalidprocessor?
  12. moveqr0,#p@yes,errorp
  13. beq__error
  14. /*判斷體系類型,查看R1寄存器的ArchitectureType值是否支持*/
  15. bl__lookup_architecture_type
  16. /*不支持,跳到出錯*/
  17. teqr7,#0@invalidarchitecture?
  18. moveqr0,#a@yes,errora
  19. beq__error
  20. /*創(chuàng)建核心頁表*/
  21. bl__create_page_tables
  22. adrlr,__ret@returnaddress
  23. addpc,r10,#12@initialiseprocessor
  24. /*跳轉(zhuǎn)到start_kernel函數(shù)*/
  25. bstart_kernel

本文引用地址:http://butianyuan.cn/article/201611/319977.htm

1. start_kernel()函數(shù)分析

下面對start_kernel()函數(shù)及其相關(guān)函數(shù)進(jìn)行分析。

1.1 lock_kernel()

[cpp]view plaincopy
print?
  1. /*Gettingthebigkernellock.
  2. *Thiscannothappenasynchronously,
  3. *soweonlyneedtoworryaboutother
  4. *CPUs.
  5. */
  6. extern__inline__voidlock_kernel(void)
  7. {
  8. if(!++current->lock_depth)
  9. spin_lock(&kernel_flag);
  10. }
kernel_flag 是一個內(nèi)核大自旋鎖,所有進(jìn)程都通過這個大鎖來實(shí)現(xiàn)向內(nèi)核態(tài)的遷移。只有獲得這個大自旋
鎖的處理器可以進(jìn)入內(nèi)核,如中斷處理程序等。在任何一對 lock_kernel/unlock_kernel函數(shù)里至多可以有一個程序占用CPU。 進(jìn)程的lock_depth成員初始化為-1,在 kerenl/fork.c文件中設(shè)置。在它小于0時
(恒為 -1),進(jìn)程不擁有內(nèi)核鎖;當(dāng)大于或等于0時,進(jìn)程得到內(nèi)核鎖。

1.2 setup_arch()

setup_arch()函數(shù)做體系相關(guān)的初始化工作,函數(shù)的定義在arch/arm/kernel/setup.c文件中,主
要涉及下列主要函數(shù)及代碼。
5.2.1 setup_processor()
該函數(shù)主要通過
[cpp]view plaincopy
print?
  1. for(list=&__proc_info_begin;list<&__proc_info_end;list++)
  2. if((processor_id&list->cpu_mask)==list->cpu_val)
  3. break;
這樣一個循環(huán)來在.proc.info段中尋找匹配的processor_id,processor_id在head_armv.S文件
中設(shè)置。

1.2.2 setup_architecture(machine_arch_type)

該函數(shù)獲得體系結(jié)構(gòu)的信息,返回mach-xxx/arch.c 文件中定義的machine結(jié)構(gòu)體的指針,包含以下內(nèi)容
MACHINE_START (xxx, “xxx”)
MAINTAINER ("xxx"
BOOT_MEM (xxx, xxx, xxx)
FIXUP (xxx)
MAPIO (xxx)
INITIRQ (xxx)

MACHINE_END

1.2.3內(nèi)存設(shè)置代碼

[cpp]view plaincopy
print?
  1. if(meminfo.nr_banks==0)
  2. {
  3. meminfo.nr_banks=1;
  4. meminfo.bank[0].start=PHYS_OFFSET;
  5. meminfo.bank[0].size=MEM_SIZE;
  6. }

meminfo結(jié)構(gòu)表明內(nèi)存情況,是對物理內(nèi)存結(jié)構(gòu)meminfo的默認(rèn)初始化。 nr_banks指定內(nèi)存塊的數(shù)量,
bank指定每塊內(nèi)存的范圍,PHYS _OFFSET指定某塊內(nèi)存塊的開始地址,MEM_SIZE指定某塊內(nèi)存塊長度。
PHYS _OFFSET和MEM_SIZE都定義在include/asm-armnommu/arch-XXX/memory.h文件中,其中
PHYS _OFFSET是內(nèi)存的開始地址,MEM_SIZE就是內(nèi)存的結(jié)束地址。這個結(jié)構(gòu)在接下來內(nèi)存的初始化代碼中
起重要作用。


1.2.4 內(nèi)核內(nèi)存空間管理

init_mm.start_code = (unsigned long) &_text; 內(nèi)核代碼段開始
init_mm.end_code = (unsigned long) &_etext; 內(nèi)核代碼段結(jié)束
init_mm.end_data = (unsigned long) &_edata; 內(nèi)核數(shù)據(jù)段開始
init_mm.brk = (unsigned long) &_end; 內(nèi)核數(shù)據(jù)段結(jié)束

每一個任務(wù)都有一個mm_struct結(jié)構(gòu)管理其內(nèi)存空間,init_mm 是內(nèi)核的mm_struct。其中設(shè)置成員變量
* mmap指向自己, 意味著內(nèi)核只有一個內(nèi)存管理結(jié)構(gòu),設(shè)置 pgd=swapper_pg_dir,
swapper_pg_dir是內(nèi)核的頁目錄,ARM體系結(jié)構(gòu)的內(nèi)核頁目錄大小定義為16k。init_mm定義了整個內(nèi)核的
內(nèi)存空間,內(nèi)核線程屬于內(nèi)核代碼,同樣使用內(nèi)核空間,其訪問內(nèi)存空間的權(quán)限與內(nèi)核一樣。

1.2.5 內(nèi)存結(jié)構(gòu)初始化

bootmem_init (&meminfo)函數(shù)根據(jù)meminfo進(jìn)行內(nèi)存結(jié)構(gòu)初始化。bootmem_init(&meminfo)函數(shù)中調(diào)
用 reserve_node_zero(bootmap_pfn, bootmap_pages) 函數(shù),這個函數(shù)的作用是保留一部分內(nèi)存使之
不能被動態(tài)分配。這些內(nèi)存塊包括:
reserve_bootmem_node(pgdat, __pa(&_stext), &_end - &_stext); /*內(nèi)核所占用地址空間*/
reserve_bootmem_node(pgdat, bootmap_pfn</*bootmem結(jié)構(gòu)所占用地址空間*/

1.2.6 paging_init(&meminfo, mdesc)

創(chuàng)建內(nèi)核頁表,映射所有物理內(nèi)存和IO空間,對于不同的處理器,該函數(shù)差別比較大。下面簡單描述一下ARM
體系結(jié)構(gòu)的存儲系統(tǒng)及MMU相關(guān)的概念。
在ARM存儲系統(tǒng)中,使用內(nèi)存管理單元(MMU)實(shí)現(xiàn)虛擬地址到實(shí)際物理地址的映射。利用MMU,可把SDRAM的
地址完全映射到0x0起始的一片連續(xù)地址空間,而把原來占據(jù)這片空間的FLASH或者ROM映射到其他不相沖突
的存儲空間位置。例如,F(xiàn)LASH的地址從0x0000 0000~0x00FFFFFF,而SDRAM的地址范圍是
0x3000 0000~0x3lFFFFFF,則可把SDRAM地址映射為0x0000 0000~0xlFFFFFF,而FLASH的地址可以
映射到0x9000 0000~0x90FFFFFF(此處地址空間為空閑,未被占用)。映射完成后,如果處理器發(fā)生異常,
假設(shè)依然為IRQ中斷,PC指針指向0xl8處的地址,而這個時候PC實(shí)際上是從位于物理地址的0x3000 0018處
讀取指令。通過MMU的映射,則可實(shí)現(xiàn)程序完全運(yùn)行在SDRAM之中。在實(shí)際的應(yīng)用中.可能會把兩片不連續(xù)的
物理地址空間分配給SDRAM。而在操作系統(tǒng)中,習(xí)慣于把SDRAM的空間連續(xù)起來,方便內(nèi)存管理,且應(yīng)用程序
申請大塊的內(nèi)存時,操作系統(tǒng)內(nèi)核也可方便地分配。通過MMU可實(shí)現(xiàn)不連續(xù)的物理地址空間映射為連續(xù)的虛擬
地址空間。操作系統(tǒng)內(nèi)核或者一些比較關(guān)鍵的代碼,一般是不希望被用戶應(yīng)用程序訪問。通過MMU可以控制地
址空間的訪問權(quán)限,從而保護(hù)這些代碼不被破壞。
MMU的實(shí)現(xiàn)過程,實(shí)際上就是一個查表映射的過程。建立頁表是實(shí)現(xiàn)MMU功能不可缺少的一步。頁表位于系統(tǒng)的
內(nèi)存中,頁表的每一項對應(yīng)于一個虛擬地址到物理地址的映射。每一項的長度即是一個字的長度(在ARM中,
一個字的長度被定義為4Bytes)。頁表項除完成虛擬地址到物理地址的映射功能之外,還定義了訪問權(quán)限和緩
沖特性等。
MMU的映射分為兩種,一級頁表的變換和二級頁表變換。兩者的不同之處就是實(shí)現(xiàn)的變換地址空間大小不同。
一級頁表變換支持1 M大小的存儲空間的映射,而二級可以支持64 kB,4 kB和1 kB大小地址空間的映射。

動態(tài)表(頁表)的大小=表項數(shù)*每個表項所需的位數(shù),即為整個內(nèi)存空間建立索引表時,需要多大空間存放索
引表本身。
表項數(shù)=虛擬地址空間/每頁大小
每個表項所需的位數(shù)=Log(實(shí)際頁表數(shù))+適當(dāng)控制位數(shù)
實(shí)際頁表數(shù) =物理地址空間/每頁大小


1.3 parse_options()

分析由內(nèi)核引導(dǎo)程序發(fā)送給內(nèi)核的啟動選項,在初始化過程中按照某些選項運(yùn)行,并將剩余部分傳送給init進(jìn)
程。這些選項可能已經(jīng)存儲在配置文件中,也可能是由用戶在系統(tǒng)啟動時敲入的。但內(nèi)核并不關(guān)心這些,這些
細(xì)節(jié)都是內(nèi)核引導(dǎo)程序關(guān)注的內(nèi)容,嵌入式系統(tǒng)更是如此。

1.4 trap_init() (/kernel/traps.c do_trap)

這個函數(shù)用來做體系相關(guān)的中斷處理的初始化,在該函數(shù)中調(diào)用__trap_init((void *)vectors_base())
函數(shù)將exception vector設(shè)置到vectors_base開始的地址上。 __trap_init函數(shù)位于entry-armv.S文
件中,對于ARM處理器,共有復(fù)位、未定義指令、SWI、預(yù)取終止、數(shù)據(jù)終止、IRQ和FIQ 幾種方式。SWI主要
用來實(shí)現(xiàn)系統(tǒng)調(diào)用,而產(chǎn)生了IRQ之后,通過exception vector進(jìn)入中斷處理過程,執(zhí)行do_IRQ函數(shù)。
armnommu的trap_init()函數(shù)在arch/armnommu/kernel/traps.c文件中。vectors_base是寫中斷向
量的開始地址,在include/asm-armnommu/proc-armv/system.h文件中設(shè)置,地址為0或0XFFFF0000。
[plain]view plaincopy
print?
  1. ENTRY(__trap_init)
  2. stmfdsp!,{r4-r6,lr}
  3. mrsr1,cpsr@codefrom2.0.38
  4. bicr1,r1,#MODE_MASK@clearmodebits/*設(shè)置svc模式,disableIRQ,FIQ*/
  5. orrr1,r1,#I_BIT|F_BIT|MODE_SVC@setSVCmode,disableIRQ,FIQ
  6. msrcpsr,r1
  7. adrr1,.LCvectors@setupthevectors
  8. ldmiar1,{r1,r2,r3,r4,r5,r6,ip,lr}
  9. stmiar0,{r1,r2,r3,r4,r5,r6,ip,lr}/*拷貝異常向量*/
  10. addr2,r0,#0x200
  11. adrr0,__stubs_start@copystubsto0x200
  12. adrr1,__stubs_end
  13. 1:ldrr3,[r0],#4
  14. strr3,[r2],#4
  15. cmpr0,r1
  16. blt1b
  17. LOADREGS(fd,sp!,{r4-r6,pc})
__stubs_start到__stubs_end的地址中包含了異常處理的代碼,因此拷貝到vectors_base+0x200的位置上。

1.5 init_IRQ()

[cpp]view plaincopy
print?
  1. void__initinit_IRQ(void)
  2. {
  3. externvoidinit_dma(void);
  4. intirq;
  5. for(irq=0;irq
  6. irq_desc[irq].probe_ok=0;
  7. irq_desc[irq].valid=0;
  8. irq_desc[irq].noautoenable=0;
  9. irq_desc[irq].mask_ack=dummy_mask_unmask_irq;
  10. irq_desc[irq].mask=dummy_mask_unmask_irq;
  11. irq_desc[irq].unmask=dummy_mask_unmask_irq;
  12. }
  13. CSR_WRITE(AIC_MDCR,0x7FFFE);/*disableallinterrupts*/
  14. CSR_WRITE(CAHCNF,0x0);/*CloseCache*/
  15. CSR_WRITE(CAHCON,0x87);/*FlushCache*/
  16. while(CSR_READ(CAHCON)!=0);
  17. CSR_WRITE(CAHCNF,0x7);/*OpenCache*/
  18. init_arch_irq();
  19. init_dma();
  20. }
這個函數(shù)用來做體系相關(guān)的irq處理的初始化,irq_desc數(shù)組是用來描述IRQ的請求隊列,每一個中斷號分配
一個irq_desc結(jié)構(gòu),組成了一個數(shù)組。NR_IRQS代表中斷數(shù)目,這里只是對中斷結(jié)構(gòu)irq_desc進(jìn)行了初始
化。在默認(rèn)的初始化完成后調(diào)用初始化函數(shù)init_arch_irq,先執(zhí)行arch/armnommu/kernel/irq-
arch.c文件中的函數(shù)genarch_init_irq(),然后就執(zhí)行 include/asm-armnommu/arch-xxxx/irq.h中
的inline函數(shù)irq_init_irq,在這里對irq_desc進(jìn)行了實(shí)質(zhì)的初始化。其中mask用阻塞中斷;unmask用
來取消阻塞;mask_ack的作用是阻塞中斷,同時還回應(yīng)ack給硬件表示這個中斷已經(jīng)被處理了,否則硬件將再
次發(fā)生同一個中斷。這里,不是所有硬件需要這個ack回應(yīng),所以很多時候mask_ack與mask用的是同一個函
數(shù)。
接下來執(zhí)行init_dma()函數(shù),如果不支持DMA,可以設(shè)置include/asm-armnommu/arch-xxxx/dma.h中
的 MAX_DMA_CHANNELS為0,這樣在arch/armnommu/kernel/dma.c文件中會根據(jù)這個定義使用不同的函
數(shù)。

1.6 sched_init()

初始化系統(tǒng)調(diào)度進(jìn)程,主要對定時器機(jī)制和時鐘中斷的Bottom Half的初始化函數(shù)進(jìn)行設(shè)置。與時間相關(guān)的初
始化過程主要有兩步:(1)調(diào)用 init_timervecs()函數(shù)初始化內(nèi)核定時器機(jī)制;(2)調(diào)用init_bh()函
數(shù)將BH向量TIMER_BH、TQUEUE_BH和 IMMEDIATE_BH所對應(yīng)的BH函數(shù)分別設(shè)置成timer_bh()、
tqueue_bh()和immediate_bh()函數(shù)

1.7 softirq_init()

內(nèi)核的軟中斷機(jī)制初始化函數(shù)。調(diào)用tasklet_init初始化tasklet_struct結(jié)構(gòu),軟中斷的個數(shù)為32個。用
于bh的 tasklet_struct結(jié)構(gòu)調(diào)用tasklet_init()以后,它們的函數(shù)指針func全都指向bh_action()。
bh_action就是tasklet實(shí)現(xiàn)bh機(jī)制的代碼,但此時具體的bh函數(shù)還沒有指定。

HI_SOFTIRQ用于實(shí)現(xiàn)bottom half,TASKLET_SOFTIRQ用于公共的tasklet。

open_softirq(TASKLET_SOFTIRQ, tasklet_action, NULL); /* 初始化公共的tasklet_struct要
用到的軟中斷 */
open_softirq(HI_SOFTIRQ, tasklet_hi_action, NULL); /* 初始化tasklet_struct實(shí)現(xiàn)的
bottom half調(diào)用 */


1.8 time_init()

這個函數(shù)用來做體系相關(guān)的timer的初始化,armnommu的在arch/armnommu/kernel/time.c。這里調(diào)用了
在 include/asm-armnommu/arch-xxxx/time.h中的inline函數(shù)setup_timer,setup_timer()函數(shù)
的設(shè)計與硬件設(shè)計緊密相關(guān),主要是根據(jù)硬件設(shè)計情況設(shè)置時鐘中斷號和時鐘頻率等。
[cpp]view plaincopy
print?
  1. void__inline__setup_timer(void)
  2. {
  3. /*-----disabletimer-----*/
  4. CSR_WRITE(TCR0,xxx);
  5. CSR_WRITE(AIC_SCR7,xxx);/*settingpriorityleveltohigh*/
  6. /*timer0:100ticks/sec*/
  7. CSR_WRITE(TICR0,xxx);
  8. timer_irq.handler=xxxxxx_timer_interrupt;
  9. setup_arm_irq(IRQ_TIMER,&timer_irq);/*IRQ_TIMERistheinterruptnumber*/
  10. INT_ENABLE(IRQ_TIMER);
  11. /*Clearinterruptflag*/
  12. CSR_WRITE(TISR,xxx);
  13. /*enabletimer*/
  14. CSR_WRITE(TCR0,xxx);
  15. }

1.9 console_init()

控制臺初始化。控制臺也是一種驅(qū)動程序,由于其特殊性,提前到該處完成初始化,主要是為了提前看到輸出
信息,據(jù)此判斷內(nèi)核運(yùn)行情況。很多嵌入式Linux操作系統(tǒng)由于沒有在/dev目錄下正確配置console設(shè)備,造
成啟動時發(fā)生諸如unable to open an initial console的錯誤。

/*******************************************************************************/
init_modules()函數(shù)到smp_init()函數(shù)之間的代碼一般不需要作修改,
如果平臺具有特殊性,也只需對相關(guān)函數(shù)進(jìn)行必要修改。
這里簡單注明了一下各個函數(shù)的功能,以便了解。
/*******************************************************************************/

1.10 init_modules()

模塊初始化。如果編譯內(nèi)核時使能該選項,則內(nèi)核支持模塊化加載/卸載功能

1.11 kmem_cache_init()

內(nèi)核Cache初始化。

1.12 sti()

使能中斷,這里開始,中斷系統(tǒng)開始正常工作。

1.13 calibrate_delay()

近似計算BogoMIPS數(shù)字的內(nèi)核函數(shù)。作為第一次估算,calibrate_delay計算出在每一秒內(nèi)執(zhí)行多少次
__delay循環(huán),也就是每個定時器滴答(timer tick)―百分之一秒內(nèi)延時循環(huán)可以執(zhí)行多少次。這種計算只
是一種估算,結(jié)果并不能精確到納秒,但這個數(shù)字供內(nèi)核使用已經(jīng)足夠精確了。
BogoMIPS的數(shù)字由內(nèi)核計算并在系統(tǒng)初始化的時候打印。它近似的給出了每秒鐘CPU可以執(zhí)行一個短延遲循環(huán)
的次數(shù)。在內(nèi)核中,這個結(jié)果主要用于需要等待非常短周期的設(shè)備驅(qū)動程序――例如,等待幾微秒并查看設(shè)備的
某些信息是否已經(jīng)可用。
計算一個定時器滴答內(nèi)可以執(zhí)行多少次循環(huán)需要在滴答開始時就開始計數(shù),或者應(yīng)該盡可能與它接近。全局變
量jiffies中存儲了從內(nèi)核開始保持跟蹤時間開始到現(xiàn)在已經(jīng)經(jīng)過的定時器滴答數(shù), jiffies保持異步更
新,在一個中斷內(nèi)——每秒一百次,內(nèi)核暫時掛起正在處理的內(nèi)容,更新變量,然后繼續(xù)剛才的工作。

1.14 mem_init()

內(nèi)存初始化。本函數(shù)通過內(nèi)存碎片的重組等方法標(biāo)記當(dāng)前剩余內(nèi)存, 設(shè)置內(nèi)存上下界和頁表項初始值。

1.15 kmem_cache_sizes_init()

內(nèi)核內(nèi)存管理器的初始化,也就是初始化cache和SLAB分配機(jī)制。

1.16 pgtable_cache_init()

頁表cache初始化。

1.17 fork_init()

這里根據(jù)硬件的內(nèi)存情況,如果計算出的max_threads數(shù)量太大,可以自行定義。

1.18 proc_caches_init();

為proc文件系統(tǒng)創(chuàng)建高速緩沖

1.19 vfs_caches_init(num_physpages);

為VFS創(chuàng)建SLAB高速緩沖

1.20 buffer_init(num_physpages);

初始化buffer

1.21 page_cache_init(num_physpages);

頁緩沖初始化

1.22 signals_init();

創(chuàng)建信號隊列高速緩沖

1.23 proc_root_init();

在內(nèi)存中創(chuàng)建包括根結(jié)點(diǎn)在內(nèi)的所有節(jié)點(diǎn)

1.24 check_bugs();

檢查與處理器相關(guān)的bug

1.25 smp_init();


1.26 rest_init(); 此函數(shù)調(diào)用kernel_thread(init, NULL, CLONE_FS | CLONE_FILES | CLONE_SIGNAL)函數(shù)。


1.26.1 kernel_thread()函數(shù)分析

這里調(diào)用了arch/armnommu/kernel/process.c中的函數(shù)kernel_thread,kernel_thread函數(shù)中通過
__syscall(clone) 創(chuàng)建新線程。__syscall(clone)函數(shù)參見armnommu/kernel目錄下的entry- common.S文件。

1.26.2 init()完成下列功能:

Init()函數(shù)通過kernel_thread(init, NULL, CLONE_FS | CLONE_FILES | CLONE_SIGNAL)的回調(diào)
函數(shù)執(zhí)行,完成下列功能。
do_basic_setup()
在該函數(shù)里,sock_init()函數(shù)進(jìn)行網(wǎng)絡(luò)相關(guān)的初始化,占用相當(dāng)多的內(nèi)存,如果所開發(fā)系統(tǒng)不支持網(wǎng)絡(luò)功
能,可以把該函數(shù)的執(zhí)行注釋掉。
do_initcalls()實(shí)現(xiàn)驅(qū)動的初始化, 這里需要與vmlinux.lds聯(lián)系起來看才能明白其中奧妙。
[cpp]view plaincopy
print?
  1. staticvoid__initdo_initcalls(void)
  2. {
  3.   initcall_t*call;
  4.   call=&__initcall_start;
  5.   do{
  6.    (*call)();
  7.    call++;
  8.   }while(call<&__initcall_end);
  9.   /*Makesurethereisnopendingstufffromtheinitcallsequence*/
  10.   flush_scheduled_tasks();
  11. }
查看 /arch/i386/vmlinux.lds,其中有一段代碼
[cpp]view plaincopy
print?
  1. __initcall_start=.;
  2. .initcall.init:{*(.initcall.init)}
  3. __initcall_end=.;
其含義是__initcall_start指向代碼節(jié).initcall.init的節(jié)首,而__initcall_end指向.initcall.init的節(jié)尾。

do_initcalls所作的是系統(tǒng)中有關(guān)驅(qū)動部分的初始化工作,那么這些函數(shù)指針數(shù)據(jù)是怎樣放到了.initcall.init節(jié)呢?在include/linux/init.h文件中有如下3個定義:
1. #define __init_call   __attribute__ ((unused,__section__ (".initcall.init" ))
__attribute__的含義就是構(gòu)建一個在.initcall.init節(jié)的指向初始函數(shù)的指針。
2. #define __initcall(fn) static initcall_t __initcall_##fn __init_call = fn
##意思就是在可變參數(shù)使用宏定義的時候構(gòu)建一個變量名稱為所指向的函數(shù)的名稱,并且在前面加上__initcall_
3. #define module_init(x) __initcall(x);
很多驅(qū)動中都有類似module_init(usb_init)的代碼,通過該宏定義逐層解釋存放到.initcall.int節(jié)
中。

blkmem相關(guān)的修改(do_initcalls()初始化驅(qū)動時執(zhí)行此代碼)
在blkmem_init ()函數(shù)中,調(diào)用了blk_init_queue()函數(shù),blk_init_queue()函數(shù)調(diào)用了blk_init_free_list()函數(shù), blk_init_free_list()函數(shù)又調(diào)用了blk_grow_request_list()函
數(shù),在這個函數(shù)中會 kmem_cache_alloc出nr_requests個request結(jié)構(gòu)體。
這里如果nr_requests的值太大,則將占用過多的內(nèi)存,將造成硬件內(nèi)存不夠,因此可以根據(jù)實(shí)際情況將其替
換成了較小的值,比如32、16等。

free_initmem
這個函數(shù)在arch/armnommu/mm/init.c文件中,其作用就是對init節(jié)的釋放,也可以通過修改代碼指定為
不釋放。

1.26.3 init執(zhí)行過程

在內(nèi)核引導(dǎo)結(jié)束并啟動init之后,系統(tǒng)就轉(zhuǎn)入用戶態(tài)的運(yùn)行,在這之后創(chuàng)建的一切進(jìn)程,都是在用戶態(tài)進(jìn)行。
這里先要清楚一個概念:就是init進(jìn)程雖然是從內(nèi)核開始的,即在前面所講的init/main.c中的init()函數(shù)
在啟動后就已經(jīng)是一個核心線程,但在轉(zhuǎn)到執(zhí)行init程序(如 /sbin/init)之后,內(nèi)核中的init()就變成
了/sbin/init程序,狀態(tài)也轉(zhuǎn)變成了用戶態(tài),也就是說核心線程變成了一個普通的進(jìn)程。這樣一來,內(nèi)核中
的init函數(shù)實(shí)際上只是用戶態(tài)init進(jìn)程的入口,它在執(zhí)行execve("/sbin/init",argv_init,
envp_init)時改變成為一個普通的用戶進(jìn)程。這也就是exec函數(shù)的乾坤大挪移法,在exec函數(shù)調(diào)用其他程
序時,當(dāng)前進(jìn)程被其他進(jìn)程“靈魂附體”。
  除此之外,它們的代碼來源也有差別,內(nèi)核中的init()函數(shù)的源代碼在/init/main.c中,是內(nèi)核的一部
分。而/sbin/init程序的源代碼是應(yīng)用程序。
init程序啟動之后,要完成以下任務(wù):檢查文件系統(tǒng),啟動各種后臺服務(wù)進(jìn)程,最后為每個終端和虛擬控制臺
啟動一個getty進(jìn)程供用戶登錄。由于所有其它用戶進(jìn)程都是由init派生的,因此它又是其它一切用戶進(jìn)程的
父進(jìn)程。
  init進(jìn)程啟動后,按照/etc/inittab的內(nèi)容進(jìn)程系統(tǒng)設(shè)置。很多嵌入式系統(tǒng)用的是BusyBox的init,
它與一般所使用的init不一樣,會先執(zhí)行/etc/init.d/rcS而非/etc/rc.d/rc.sysinit。


關(guān)鍵詞: linux內(nèi)核啟動流

評論


技術(shù)專區(qū)

關(guān)閉