imx8mm偶现启动内核失败问题分析报告
? ? ? ? 轉(zhuǎn)載自前同事zhouyuanjie。?
- 問題環(huán)境
project:ubox
openwrt:v18.06.4
kernel:4.14.98
uboot:2018.03
- 問題現(xiàn)象
在openwrt編譯ubox鏡像后,使用鏡像啟動偶現(xiàn)鏡像卡在“Starting kernel ...”階段。
ubox鏡像是通過mkimage工具做的FIT鏡像,配置如下:
- 問題分析
分析一:????????
因未打包的源文件在uboot中使用的是booti命令啟動,FIT鏡像需要使用bootm命令啟動,所以將有問題的FIT鏡像采用booti的命令啟動,發(fā)現(xiàn)能夠正常啟動,判斷FIT打包前的源文件是沒有問題的,排除因去掉了不該去掉的配置造成不能啟動的情況。
分析二:
因問題是屬于uboot->kernel的交付階段,在此階段沒有可用調(diào)試工具和設備,則采用黑盒和代碼分析的方法,首先分析bootm的啟動流程:
| do_bootm | bootm命令 |
| do_bootm_states | 完成image和fdt的查找、解壓、裝載等動作 |
| boot_selected_os | 選擇從什么啟動系統(tǒng)并設置回調(diào)函數(shù) |
| do_bootm_linux | 為啟動image做準備,如關(guān)閉dcache等 |
| armv8_switch_to_el2 | 選擇啟動模式(32 or 64)和級別(el2為系統(tǒng)級別) |
| armv8_switch_to_el2_m | 實際啟動內(nèi)核 |
經(jīng)上述流程分析發(fā)現(xiàn),uboot在實際啟動前做了級別切換,懷疑CPU在進入kernel前進入了某種模式,導致CPU卡死在uboot中?然后分析kernel啟動代碼,并在kernel中添加點亮led的方式確定CPU是否成功進入內(nèi)核,代碼如下:
經(jīng)上述內(nèi)核代碼調(diào)試分析后發(fā)現(xiàn),在上圖(1)的位置CPU會拋出(synchronoud abort異常,led實則未點亮,看拋出的這個異常大致確定是尋址或譯碼上的問題,此處并未深究,但能夠拋出異常也能確定是進入kernel中),而去掉圖(1)在圖(2)出則會卡死,分析問題點代碼{
????????adr_l x0, __hyp_stub_vectors
????????msr vbar_el2, x0
},異常點代碼是在設置異常向量表后卡死。經(jīng)objdump分析判斷CPU在uboot交付kernel后產(chǎn)生異常,進入異常處理(死循環(huán)),詳見下圖:
經(jīng)上述分析,啟動過程中是卡死在kernel階段,并且是在設置異常向量表后出現(xiàn)的異常,所以排除是因uboot模式切換錯誤導致的卡死。因無法確定CPU是產(chǎn)生的哪種異常,所以啟動流程暫停分析。
分析三:
結(jié)合分析一、分析二,在有問題的FIT的鏡像使用FIT源文件用booti命令能夠成功啟動。則嘗試在do_bootm_states鏡像裝載完成后,調(diào)用booti去啟動內(nèi)核,代碼如下:
經(jīng)嘗試,在bootm鏡像裝載完成后,使用booti命令啟動問題依然。繼續(xù)分析booti和bootm啟動流程的差異點,發(fā)現(xiàn)booti和bootm的啟動流程基本相同,所不同的是,在booti在調(diào)用do_bootm_states前對裝載的鏡像做了偏移操作,如下:
經(jīng)偏移操作后,kernel的FIT鏡像中的Load地址為0x4380000,經(jīng)偏移后實際使用地址為0x43880000,懷疑問題在kernel或fdt的load地址上。
分析四:
經(jīng)分析三結(jié)論,嘗試修改FIT鏡像中的kernel和fdt的load地址,如下:
經(jīng)多次嘗試發(fā)現(xiàn)一個共同點,就是kernel的地址后面必須是0x80000(bootm并不會做對齊操作),并且fdt的load地址必須對齊(fdt的load地址在openwrt中默認是沒有的,則bootm解析FIT后fdt的load地址為bootm裝載的地址),結(jié)合分析三和linux-4.14.98/Documentation/arm64/booting.txt,以及查看kernel頭部信息確認,頭部信息中確實設置了相關(guān)位置,并且load的地址需要做偏移,如下:
- 結(jié)論
經(jīng)問題分析測試后,確定問題有兩點。
- kernel的load地址必須偏移0x80000,如基址是0x43800000則實際的load地址必須是0x43880000;
- 固定fdt的load地址。
因上述兩點則會導致,進入kernel后CPU出現(xiàn)異常被掛起。
總結(jié)
以上是生活随笔為你收集整理的imx8mm偶现启动内核失败问题分析报告的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C#数据类型转换—使用Convert类转
- 下一篇: win10 java8安装包双击之后完