日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

[ARM-assembly]-ARMv8-A64指令集总结和学习

發布時間:2025/3/21 84 豆豆
生活随笔 收集整理的這篇文章主要介紹了 [ARM-assembly]-ARMv8-A64指令集总结和学习 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

★★★ 個人博客導讀首頁—點擊此處 ★★★

文章目錄

      • 1、一個簡單的aarch64架構圖
      • 2、A64指令集的特點:
      • 3、跳轉指令
        • (1)、條件跳轉指令
        • (2)、無條件跳轉label指令
        • (3)、無條件跳轉register指令
      • 4、異常產生和返回
        • (1)、異常產生指令
        • (2)、異常返回指令
        • (3)、debug的異常指令
      • 5、系統訪問指令
        • (1)、系統寄存器訪問指令
        • (2)、系統操作指令
      • 6、提示指令Hint instructions
      • 7、Barriers指令
      • 7、指針授權指令:Pointer authentication instructions
      • 8、存取指令 : Loads and stores
        • (1)、存取指令的尋址模式
        • (2)、load/store指令的介紹
          • a、Load-Store Pair
          • b、LDNP and STNP 非暫存指令
          • c、Load-Store Unprivileged
          • d、Load-Store Exclusive
          • e、Load-Acquire / Store-Release

1、一個簡單的aarch64架構圖

2、A64指令集的特點:

  • x0-x30 : 31個通用寄存器(general-purpose register),且都擴展到了64位, 其中x30是sp(Stack Pointer)
  • Zero Register: XZR/WZR,在大多數情況下,作為源寄存器使用時, 讀出來的值 是0; 作為目標寄存器使用時, 丟棄結果。
  • 不再有LDM、STM、PUSH、POP指令, 取而代之的是STP、LDP
  • 條件指令大量的減少了
  • 不能將CPSR作為單個寄存器訪問,確認代之的是PSTATE
  • 刪除了"協處理器"概念,取而代之的是通過系統寄存器訪問
    o System register access
    o Cache/TLB management
    o VAPA translation
    o Barriers and CLREX
    o Architectural hints (WFI, etc)
    o Debug

通用寄存器分類

PSTATE寄存器:

3、跳轉指令

指令統計

  • 條件跳轉指令 : 5個
  • 無條件跳轉label指令 : 2個
  • 無條件跳轉register指令 : 3個

(1)、條件跳轉指令

(偏移范圍為±1MiB)

  • b.cond label
  • cbz Xn|Wn, label
  • cbnz Xn|Wn, label
  • tbz Xn|Wn, #uimm6, label //如果Xn的第uimm的bit位位0,則跳轉到label
  • tbnz Xn|Wn, #uimm6, label

(b.cond的condition條件)

(b.cond的應用)

.align 7, INV_INSN el0_sync_a64:restore_mappingmrs x2, esr_el1mrs x3, sp_el0lsr x2, x2, #ESR_EC_SHIFTcmp x2, #ESR_EC_AARCH64_SVCb.eq el0_svc //-----------b.cond的應用b el0_sync_abortcheck_vector_size el0_sync_a64

(cbz、cbnz的應用)
當調用__cpu_spin_trylock(lock)時

FUNC __cpu_spin_trylock , :mov x1, x0mov w2, #SPINLOCK_LOCK .loop: ldaxr w0, [x1]cbnz w0, .cpu_spin_trylock_out //------相當于是在檢查參數的合法性,lock==NULL時直接返回stxr w0, w2, [x1]cbnz w0, .loop .cpu_spin_trylock_out:ret END_FUNC __cpu_spin_trylock

(tbz、tbnz的應用)

LOCAL_FUNC el1_sync_abort , :mov x0, spmsr spsel, #0mov x3, sp /* Save original sp *//** Update core local flags.* flags = (flags << THREAD_CLF_SAVED_SHIFT) | THREAD_CLF_ABORT;*/ldr w1, [x0, #THREAD_CORE_LOCAL_FLAGS]lsl w1, w1, #THREAD_CLF_SAVED_SHIFTorr w1, w1, #THREAD_CLF_ABORTtbnz w1, #(THREAD_CLF_SAVED_SHIFT + THREAD_CLF_ABORT_SHIFT), \ //--------------tbnz的使用.Lsel_tmp_sp/* Select abort stack */ldr x2, [x0, #THREAD_CORE_LOCAL_ABT_STACK_VA_END]b .Lset_sp .Lsel_tmp_sp:/* Select tmp stack */ldr x2, [x0, #THREAD_CORE_LOCAL_TMP_STACK_VA_END]orr w1, w1, #THREAD_CLF_TMP /* flags |= THREAD_CLF_TMP; */

(2)、無條件跳轉label指令

(偏移范圍為 : ±128MiB)

  • b label
  • bl label

(3)、無條件跳轉register指令

(偏移范圍為 : 無限制)

  • br Xn
  • blr Xn
  • ret {Xn}

4、異常產生和返回

  • 異常產生指令 : 5個
  • 異常返回指令 : 1個
  • debug的異常指令 : 4個

(1)、異常產生指令

  • BRK Breakpoint Instruction BRK
  • HLT Halt Instruction //停止指令
  • HVC
  • SMC
  • SVC

(2)、異常返回指令

  • ERET

(3)、debug的異常指令

DCPS1 Debug switch to Exception level 1
DCPS2 Debug switch to Exception level 2
DCPS3 Debug switch to Exception level 3
DRPS Debug restore PE state

5、系統訪問指令

  • 系統寄存器訪問指令 : 1個
  • 系統操作指令 : 6個

(1)、系統寄存器訪問指令

  • MRS
  • MSR

(2)、系統操作指令

  • SYS
  • SYSL
  • IC
  • DC
  • AT
  • TLBI

6、提示指令Hint instructions

提示指令Hint instructions : 8個

  • NOP
  • YIELD
  • WFE
  • WFI
  • SEV
  • SEVL
  • HINT
  • DGH

7、Barriers指令

Barriers指令 : 4個

  • CLREX // Clear Exclusives monitor
  • DMB
  • DSB
  • ISB

還有一些特殊的barriers指令,如果未實現,則等效于 NOP
CSDB
ESB
PSB
PSSB
SB
SSBB
TSB

7、指針授權指令:Pointer authentication instructions

有很多寄存器,目前(2020)基本沒有使用,暫不介紹

8、存取指令 : Loads and stores

(1)、存取指令的尋址模式


[Rn, offset]! 前變址尋址
最終訪問內存的地址 = Rn+offset
操作后Rn的值 = Rn+offset

[Rn], offset 后變址尋址
最終訪問內存的地址 = Rn
操作后Rn的值 = Rn+offset

[Rn, offset] 偏移尋址
最終訪問內存的地址 = Rn+offset
操作后Rn的值不變

注意:對于偏移尋址,還可以使用寄存器偏移尋址、擴展寄存器偏移尋址[base,Xm{,LSL #imm}][base,Wm,(S|U)XTW {#imm}]

示例:
(1)、在進程切換調用的cpu_switch_to函數中,使用到了后變址尋址

ENTRY(cpu_switch_to)mov x10, #THREAD_CPU_CONTEXTadd x8, x0, x10mov x9, spstp x19, x20, [x8], #16 // store callee-saved registersstp x21, x22, [x8], #16stp x23, x24, [x8], #16stp x25, x26, [x8], #16stp x27, x28, [x8], #16stp x29, x9, [x8], #16str lr, [x8]add x8, x1, x10ldp x19, x20, [x8], #16 // restore callee-saved registersldp x21, x22, [x8], #16ldp x23, x24, [x8], #16ldp x25, x26, [x8], #16ldp x27, x28, [x8], #16ldp x29, x9, [x8], #16ldr lr, [x8]mov sp, x9 #ifdef CONFIG_THREAD_INFO_IN_TASKmsr sp_el0, x1 #elseand x9, x9, #~(THREAD_SIZE - 1)msr sp_el0, x9 #endifret ENDPROC(cpu_switch_to)

(2)、load/store指令的介紹

術語:

sign-extends :符號擴展,前面補符合位和0 zero-extends :0擴展,即前面補0S : sign-extends B : byte H : half-word R :register P : pair 雙字操作
a、Load-Store Pair
LDP Wt1, Wt2, addr //從addr處讀取兩個word到Wt1和Wt2 LDP Xt1, Xt2, addr //從addr處讀取兩個double-word到Xt1和Xt2 LDPSW Xt1, Xt2, addr //從addr處讀取兩個word到Xt1和Xt2, sign-extends STP Wt1, Wt2, addr //將Wt1和Wt2寫入addr地址處 STP Xt1, Xt2, addr //將Xt1和Xt2寫入addr地址處
b、LDNP and STNP 非暫存指令

非暫存指令(Non-temporal),不會加載到cache

LDNP Wt1, Wt2, [base,#imm] LDNP Xt1, Xt2, [base,#imm] STNP Wt1, Wt2, [base,#imm] STNP Xt1, Xt2, [base,#imm]
c、Load-Store Unprivileged

在EL1中執行數據的加載和寫入,權限等是按照EL0的配置來執行

LDTR Wt, [base,#simm9] LDTR Xt, [base,#simm9] LDTRB Wt, [base,#simm9] 加載一個字節并sign-extends擴展到Wt, 在EL1下執行的,但是按照EL0的權限來執行 LDTRSB Wt, [base,#simm9] LDTRSB Xt, [base,#simm9] LDTRH Wt, [base,#simm9] LDTRSH Wt, [base,#simm9] LDTRSH Xt, [base,#simm9] LDTRSW Xt, [base,#simm9] STTR Wt, [base,#simm9] STTR Xt, [base,#simm9] STTRB Wt, [base,#simm9] STTRH Wt, [base,#simm9]
d、Load-Store Exclusive

【補充armv8的exclusive操作】

為了解決多核情況下的鎖競爭問題,arm引入了exclusive操作,并添加了相應的指令。
exclusive的操作的核心,就是會將鎖,用一個狀態機進行維護,該狀態機有2種狀態,open狀態和exclusive狀態。要想成功的對鎖進行上鎖,狀態必須要從exclusive狀態切換到open狀態,其他狀態,都是失敗的。
LDXR指令,將狀態從open狀態切換到exclusive狀態,STXR指令,將狀態從exclusive狀態切換到open狀態

術語 : (R-register, P-pair) LDXR Wt, [base{,#0}] LDXR Xt, [base{,#0}] LDXRB Wt, [base{,#0}] LDXRH Wt, [base{,#0}] LDXP Wt, Wt2, [base{,#0}] LDXP Xt, Xt2, [base{,#0}] STXR Ws, Wt, [base{,#0}] STXR Ws, Xt, [base{,#0}] STXRB Ws, Wt, [base{,#0}] STXRH Ws, Wt, [base{,#0}] STXP Ws, Wt, Wt2, [base{,#0}] STXP Ws, Xt, Xt2, [base{,#0}]
e、Load-Acquire / Store-Release

標記物理地址為非獨占訪問

(Non-exclusive)

LDAR Wt, [base{,#0}] LDAR Xt, [base{,#0}] LDARB Wt, [base{,#0}] LDARH Wt, [base{,#0}] STLR Wt, [base{,#0}] STLR Xt, [base{,#0}] STLRB Wt, [base{,#0}] STLRH Wt, [base{,#0}]

(Exclusive)

LDAXR Wt, [base{,#0}] LDAXR Xt, [base{,#0}] LDAXRB Wt, [base{,#0}] LDAXRH Wt, [base{,#0}] LDAXP Wt, Wt2, [base{,#0}] LDAXP Xt, Xt2, [base{,#0}] STLXR Ws, Wt, [base{,#0}] STLXR Ws, Xt, [base{,#0}] STLXRB Ws, Wt, [base{,#0}] STLXRH Ws, Xt|Wt, [base{,#0}] STLXP Ws, Wt, Wt2, [base{,#0}] STLXP Ws, Xt, Xt2, [base{,#0}]

總結

以上是生活随笔為你收集整理的[ARM-assembly]-ARMv8-A64指令集总结和学习的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。