Cdiff src/hotspot/cpu/aarch64/assembler

src/hotspot/cpu/aarch64/assembler_aarch64.hpp

*** 137,10 ***
--- 137,13 ---
  // Dispatch table base
  REGISTER_DECLARATION(Register, rdispatch, r21);
  // Java stack pointer
  REGISTER_DECLARATION(Register, esp,      r20);
  
+ // Preserved predicate register with all elements set TRUE.
+ REGISTER_DECLARATION(PRegister, ptrue, p7);
+ 
  #define assert_cond(ARG1) assert(ARG1, #ARG1)
  
  namespace asm_util {
    uint32_t encode_logical_immediate(bool is32, uint64_t imm);
  };

*** 561,10 ***
--- 564,22 ---
    }
  
    void lea(MacroAssembler *, Register) const;
  
    static bool offset_ok_for_immed(int64_t offset, uint shift);
+ 
+   static bool offset_ok_for_sve_immed(long offset, int shift, int vl /* sve vector length */) {
+     if (offset % vl == 0) {
+       // Convert address offset into sve imm offset (MUL VL).
+       int sve_offset = offset / vl;
+       if (((-(1 << (shift - 1))) <= sve_offset) && (sve_offset < (1 << (shift - 1)))) {
+         // sve_offset can be encoded
+         return true;
+       }
+     }
+     return false;
+   }
  };
  
  // Convience classes
  class RuntimeAddress: public Address {

*** 2464,17 ***
      assert(T != Q, "invalid register variant");
      f(0b01101110000, 31, 21), f(((didx<<1)|1)<<(int)T, 20, 16), f(0, 15);
      f(sidx<<(int)T, 14, 11), f(1, 10), rf(Vn, 5), rf(Vd, 0);
    }
  
!   void umov(Register Rd, FloatRegister Vn, SIMD_RegVariant T, int idx) {
!     starti;
!     f(0, 31), f(T==D ? 1:0, 30), f(0b001110000, 29, 21);
!     f(((idx<<1)|1)<<(int)T, 20, 16), f(0b001111, 15, 10);
!     rf(Vn, 5), rf(Rd, 0);
    }
  
  #define INSN(NAME, opc, opc2, isSHR)                                    \
    void NAME(FloatRegister Vd, SIMD_Arrangement T, FloatRegister Vn, int shift){ \
      starti;                                                             \
      /* The encodings for the immh:immb fields (bits 22:16) in *SHR are  \
       *   0001 xxx       8B/16B, shift = 16  - UInt(immh:immb)           \
--- 2479,22 ---
      assert(T != Q, "invalid register variant");
      f(0b01101110000, 31, 21), f(((didx<<1)|1)<<(int)T, 20, 16), f(0, 15);
      f(sidx<<(int)T, 14, 11), f(1, 10), rf(Vn, 5), rf(Vd, 0);
    }
  
! #define INSN(NAME, op)                                                     \
!   void NAME(Register Rd, FloatRegister Vn, SIMD_RegVariant T, int idx) {   \
!     starti;                                                                \
!     f(0, 31), f(T==D ? 1:0, 30), f(0b001110000, 29, 21);                   \
!     f(((idx<<1)|1)<<(int)T, 20, 16), f(op, 15, 10);                        \
+     rf(Vn, 5), rf(Rd, 0);                                                  \
    }
  
+   INSN(umov, 0b001111);
+   INSN(smov, 0b001011);
+ #undef INSN
+ 
  #define INSN(NAME, opc, opc2, isSHR)                                    \
    void NAME(FloatRegister Vd, SIMD_Arrangement T, FloatRegister Vn, int shift){ \
      starti;                                                             \
      /* The encodings for the immh:immb fields (bits 22:16) in *SHR are  \
       *   0001 xxx       8B/16B, shift = 16  - UInt(immh:immb)           \

*** 2698,15 ***
      f(0, 31), f((int)T & 1, 30), f(0b101110000, 29, 21);
      rf(Vm, 16), f(0, 15), f(index, 14, 11);
      f(0, 10), rf(Vn, 5), rf(Vd, 0);
    }
  
!   void sve_inc(Register Xdn, SIMD_RegVariant T, unsigned imm4 = 1, int pattern = 0b11111) {
      starti;
      assert(T != Q, "invalid size");
!     f(0b00000100,31, 24), f(T, 23, 22), f(0b11, 21, 20);
!     f(imm4 - 1, 19, 16), f(0b111000, 15, 10), f(pattern, 9, 5), rf(Xdn, 0);
    }
  
    Assembler(CodeBuffer* code) : AbstractAssembler(code) {
    }
  
--- 2718,294 ---
      f(0, 31), f((int)T & 1, 30), f(0b101110000, 29, 21);
      rf(Vm, 16), f(0, 15), f(index, 14, 11);
      f(0, 10), rf(Vn, 5), rf(Vd, 0);
    }
  
! // SVE arithmetics - unpredicated
+ #define INSN(NAME, opcode)                                                             \
+   void NAME(FloatRegister Zd, SIMD_RegVariant T, FloatRegister Zn, FloatRegister Zm) { \
+     starti;                                                                            \
+     assert(T != Q, "invalid register variant");                                        \
+     f(0b00000100, 31, 24), f(T, 23, 22), f(1, 21),                                     \
+     rf(Zm, 16), f(0, 15, 13), f(opcode, 12, 10), rf(Zn, 5), rf(Zd, 0);                 \
+   }
+   INSN(sve_add, 0b000);
+   INSN(sve_sub, 0b001);
+ #undef INSN
+ 
+ // SVE floating-point arithmetic - unpredicated
+ #define INSN(NAME, opcode)                                                             \
+   void NAME(FloatRegister Zd, SIMD_RegVariant T, FloatRegister Zn, FloatRegister Zm) { \
+     starti;                                                                            \
+     assert(T == S || T == D, "invalid register variant");                              \
+     f(0b01100101, 31, 24), f(T, 23, 22), f(0, 21),                                     \
+     rf(Zm, 16), f(0, 15, 13), f(opcode, 12, 10), rf(Zn, 5), rf(Zd, 0);                 \
+   }
+ 
+   INSN(sve_fadd, 0b000);
+   INSN(sve_fmul, 0b010);
+   INSN(sve_fsub, 0b001);
+ #undef INSN
+ 
+ private:
+   void sve_predicate_reg_insn(unsigned op24, unsigned op13,
+                               FloatRegister Zd_or_Vd, SIMD_RegVariant T,
+                               PRegister Pg, FloatRegister Zn_or_Vn) {
+     starti;
+     f(op24, 31, 24), f(T, 23, 22), f(op13, 21, 13);
+     pgrf(Pg, 10), rf(Zn_or_Vn, 5), rf(Zd_or_Vd, 0);
+   }
+ 
+ public:
+ 
+ // SVE integer arithmetics - predicate
+ #define INSN(NAME, op1, op2)                                                                            \
+   void NAME(FloatRegister Zdn_or_Zd_or_Vd, SIMD_RegVariant T, PRegister Pg, FloatRegister Znm_or_Vn) {  \
+     assert(T != Q, "invalid register variant");                                                         \
+     sve_predicate_reg_insn(op1, op2, Zdn_or_Zd_or_Vd, T, Pg, Znm_or_Vn);                                \
+   }
+ 
+   INSN(sve_abs,  0b00000100, 0b010110101); // vector abs, unary
+   INSN(sve_add,  0b00000100, 0b000000000); // vector add
+   INSN(sve_andv, 0b00000100, 0b011010001); // bitwise and reduction to scalar
+   INSN(sve_asr,  0b00000100, 0b010000100); // vector arithmetic shift right
+   INSN(sve_cnt,  0b00000100, 0b011010101)  // count non-zero bits
+   INSN(sve_cpy,  0b00000101, 0b100000100); // copy scalar to each active vector element
+   INSN(sve_eorv, 0b00000100, 0b011001001); // bitwise xor reduction to scalar
+   INSN(sve_lsl,  0b00000100, 0b010011100); // vector logical shift left
+   INSN(sve_lsr,  0b00000100, 0b010001100); // vector logical shift right
+   INSN(sve_mul,  0b00000100, 0b010000000); // vector mul
+   INSN(sve_neg,  0b00000100, 0b010111101); // vector neg, unary
+   INSN(sve_not,  0b00000100, 0b011110101); // bitwise invert vector, unary
+   INSN(sve_orv,  0b00000100, 0b011000001); // bitwise or reduction to scalar
+   INSN(sve_smax, 0b00000100, 0b001000000); // signed maximum vectors
+   INSN(sve_smaxv, 0b00000100, 0b001000001); // signed maximum reduction to scalar
+   INSN(sve_smin,  0b00000100, 0b001010000); // signed minimum vectors
+   INSN(sve_sminv, 0b00000100, 0b001010001); // signed minimum reduction to scalar
+   INSN(sve_sub,   0b00000100, 0b000001000); // vector sub
+   INSN(sve_uaddv, 0b00000100, 0b000001001); // unsigned add reduction to scalar
+ #undef INSN
+ 
+ // SVE floating-point arithmetics - predicate
+ #define INSN(NAME, op1, op2)                                                                          \
+   void NAME(FloatRegister Zd_or_Zdn_or_Vd, SIMD_RegVariant T, PRegister Pg, FloatRegister Zn_or_Zm) { \
+     assert(T == S || T == D, "invalid register variant");                                             \
+     sve_predicate_reg_insn(op1, op2, Zd_or_Zdn_or_Vd, T, Pg, Zn_or_Zm);                               \
+   }
+ 
+   INSN(sve_fabs,    0b00000100, 0b011100101);
+   INSN(sve_fadd,    0b01100101, 0b000000100);
+   INSN(sve_fadda,   0b01100101, 0b011000001); // add strictly-ordered reduction to scalar Vd
+   INSN(sve_fdiv,    0b01100101, 0b001101100);
+   INSN(sve_fmax,    0b01100101, 0b000110100); // floating-point maximum
+   INSN(sve_fmaxv,   0b01100101, 0b000110001); // floating-point maximum recursive reduction to scalar
+   INSN(sve_fmin,    0b01100101, 0b000111100); // floating-point minimum
+   INSN(sve_fminv,   0b01100101, 0b000111001); // floating-point minimum recursive reduction to scalar
+   INSN(sve_fmul,    0b01100101, 0b000010100);
+   INSN(sve_fneg,    0b00000100, 0b011101101);
+   INSN(sve_frintm,  0b01100101, 0b000010101); // floating-point round to integral value, toward minus infinity
+   INSN(sve_frintn,  0b01100101, 0b000000101); // floating-point round to integral value, nearest with ties to even
+   INSN(sve_frintp,  0b01100101, 0b000001101); // floating-point round to integral value, toward plus infinity
+   INSN(sve_fsqrt,   0b01100101, 0b001101101);
+   INSN(sve_fsub,    0b01100101, 0b000001100);
+ #undef INSN
+ 
+   // SVE multiple-add/sub - predicated
+ #define INSN(NAME, op0, op1, op2)                                                                     \
+   void NAME(FloatRegister Zda, SIMD_RegVariant T, PRegister Pg, FloatRegister Zn, FloatRegister Zm) { \
+     starti;                                                                                           \
+     assert(T != Q, "invalid size");                                                                   \
+     f(op0, 31, 24), f(T, 23, 22), f(op1, 21), rf(Zm, 16);                                             \
+     f(op2, 15, 13), pgrf(Pg, 10), rf(Zn, 5), rf(Zda, 0);                                              \
+   }
+ 
+   INSN(sve_fmla,  0b01100101, 1, 0b000); // floating-point fused multiply-add: Zda = Zda + Zn * Zm
+   INSN(sve_fmls,  0b01100101, 1, 0b001); // floating-point fused multiply-subtract: Zda = Zda + -Zn * Zm
+   INSN(sve_fnmla, 0b01100101, 1, 0b010); // floating-point negated fused multiply-add: Zda = -Zda + -Zn * Zm
+   INSN(sve_fnmls, 0b01100101, 1, 0b011); // floating-point negated fused multiply-subtract: Zda = -Zda + Zn * Zm
+   INSN(sve_mla,   0b00000100, 0, 0b010); // multiply-add: Zda = Zda + Zn*Zm
+   INSN(sve_mls,   0b00000100, 0, 0b011); // multiply-subtract: Zda = Zda + -Zn*Zm
+ #undef INSN
+ 
+ // SVE bitwise logical - unpredicated
+ #define INSN(NAME, opc)                                              \
+   void NAME(FloatRegister Zd, FloatRegister Zn, FloatRegister Zm) {  \
+     starti;                                                          \
+     f(0b00000100, 31, 24), f(opc, 23, 22), f(1, 21),                 \
+     rf(Zm, 16), f(0b001100, 15, 10), rf(Zn, 5), rf(Zd, 0);           \
+   }
+   INSN(sve_and, 0b00);
+   INSN(sve_eor, 0b10);
+   INSN(sve_orr, 0b01);
+ #undef INSN
+ 
+ // SVE shift immediate - unpredicated
+ #define INSN(NAME, opc, isSHR)                                                  \
+   void NAME(FloatRegister Zd, SIMD_RegVariant T, FloatRegister Zn, int shift) { \
+     starti;                                                                     \
+     /* The encodings for the tszh:tszl:imm3 fields (bits 23:22 20:19 18:16)     \
+      * for shift right is calculated as:                                        \
+      *   0001 xxx       B, shift = 16  - UInt(tszh:tszl:imm3)                   \
+      *   001x xxx       H, shift = 32  - UInt(tszh:tszl:imm3)                   \
+      *   01xx xxx       S, shift = 64  - UInt(tszh:tszl:imm3)                   \
+      *   1xxx xxx       D, shift = 128 - UInt(tszh:tszl:imm3)                   \
+      * for shift left is calculated as:                                         \
+      *   0001 xxx       B, shift = UInt(tszh:tszl:imm3) - 8                     \
+      *   001x xxx       H, shift = UInt(tszh:tszl:imm3) - 16                    \
+      *   01xx xxx       S, shift = UInt(tszh:tszl:imm3) - 32                    \
+      *   1xxx xxx       D, shift = UInt(tszh:tszl:imm3) - 64                    \
+      */                                                                         \
+     assert(T != Q, "Invalid register variant");                                 \
+     if (isSHR) {                                                                \
+       assert(((1 << (T + 3)) >= shift) && (shift > 0) , "Invalid shift value"); \
+     } else {                                                                    \
+       assert(((1 << (T + 3)) > shift) && (shift >= 0) , "Invalid shift value"); \
+     }                                                                           \
+     int cVal = (1 << ((T + 3) + (isSHR ? 1 : 0)));                              \
+     int encodedShift = isSHR ? cVal - shift : cVal + shift;                     \
+     int tszh = encodedShift >> 5;                                               \
+     int tszl_imm = encodedShift & 0x1f;                                         \
+     f(0b00000100, 31, 24);                                                      \
+     f(tszh, 23, 22), f(1,21), f(tszl_imm, 20, 16);                              \
+     f(0b100, 15, 13), f(opc, 12, 10), rf(Zn, 5), rf(Zd, 0);                     \
+   }
+ 
+   INSN(sve_asr, 0b100, /* isSHR = */ true);
+   INSN(sve_lsl, 0b111, /* isSHR = */ false);
+   INSN(sve_lsr, 0b101, /* isSHR = */ true);
+ #undef INSN
+ 
+ private:
+ 
+   // Scalar base + immediate index
+   void sve_ld_st1(FloatRegister Zt, Register Xn, int imm, PRegister Pg,
+               SIMD_RegVariant T, int op1, int type, int op2) {
+     starti;
+     assert_cond(T >= type);
+     f(op1, 31, 25), f(type, 24, 23), f(T, 22, 21);
+     f(0, 20), sf(imm, 19, 16), f(op2, 15, 13);
+     pgrf(Pg, 10), srf(Xn, 5), rf(Zt, 0);
+   }
+ 
+   // Scalar base + scalar index
+   void sve_ld_st1(FloatRegister Zt, Register Xn, Register Xm, PRegister Pg,
+               SIMD_RegVariant T, int op1, int type, int op2) {
+     starti;
+     assert_cond(T >= type);
+     f(op1, 31, 25), f(type, 24, 23), f(T, 22, 21);
+     rf(Xm, 16), f(op2, 15, 13);
+     pgrf(Pg, 10), srf(Xn, 5), rf(Zt, 0);
+   }
+ 
+   void sve_ld_st1(FloatRegister Zt, PRegister Pg,
+               SIMD_RegVariant T, const Address &a,
+               int op1, int type, int imm_op2, int scalar_op2) {
+     switch (a.getMode()) {
+     case Address::base_plus_offset:
+       sve_ld_st1(Zt, a.base(), a.offset(), Pg, T, op1, type, imm_op2);
+       break;
+     case Address::base_plus_offset_reg:
+       sve_ld_st1(Zt, a.base(), a.index(), Pg, T, op1, type, scalar_op2);
+       break;
+     default:
+       ShouldNotReachHere();
+     }
+   }
+ 
+ public:
+ 
+ // SVE load/store - predicated
+ #define INSN(NAME, op1, type, imm_op2, scalar_op2)                                   \
+   void NAME(FloatRegister Zt, SIMD_RegVariant T, PRegister Pg, const Address &a) {   \
+     assert(T != Q, "invalid register variant");                                      \
+     sve_ld_st1(Zt, Pg, T, a, op1, type, imm_op2, scalar_op2);                        \
+   }
+ 
+   INSN(sve_ld1b, 0b1010010, 0b00, 0b101, 0b010);
+   INSN(sve_st1b, 0b1110010, 0b00, 0b111, 0b010);
+   INSN(sve_ld1h, 0b1010010, 0b01, 0b101, 0b010);
+   INSN(sve_st1h, 0b1110010, 0b01, 0b111, 0b010);
+   INSN(sve_ld1w, 0b1010010, 0b10, 0b101, 0b010);
+   INSN(sve_st1w, 0b1110010, 0b10, 0b111, 0b010);
+   INSN(sve_ld1d, 0b1010010, 0b11, 0b101, 0b010);
+   INSN(sve_st1d, 0b1110010, 0b11, 0b111, 0b010);
+ #undef INSN
+ 
+ // SVE load/store - unpredicated
+ #define INSN(NAME, op1)                                                         \
+   void NAME(FloatRegister Zt, const Address &a)  {                              \
+     starti;                                                                     \
+     assert(a.index() == noreg, "invalid address variant");                      \
+     f(op1, 31, 29), f(0b0010110, 28, 22), sf(a.offset() >> 3, 21, 16),          \
+     f(0b010, 15, 13), f(a.offset() & 0x7, 12, 10), srf(a.base(), 5), rf(Zt, 0); \
+   }
+ 
+   INSN(sve_ldr, 0b100); // LDR (vector)
+   INSN(sve_str, 0b111); // STR (vector)
+ #undef INSN
+ 
+ #define INSN(NAME, op) \
+   void NAME(Register Xd, Register Xn, int imm6) {                 \
+     starti;                                                       \
+     f(0b000001000, 31, 23), f(op, 22, 21);                        \
+     srf(Xn, 16), f(0b01010, 15, 11), sf(imm6, 10, 5), srf(Xd, 0); \
+   }
+ 
+   INSN(sve_addvl, 0b01);
+   INSN(sve_addpl, 0b11);
+ #undef INSN
+ 
+ // SVE inc/dec register by element count
+ #define INSN(NAME, op) \
+   void NAME(Register Xdn, SIMD_RegVariant T, unsigned imm4 = 1, int pattern = 0b11111) { \
+     starti;                                                                              \
+     assert(T != Q, "invalid size");                                                      \
+     f(0b00000100,31, 24), f(T, 23, 22), f(0b11, 21, 20);                                 \
+     f(imm4 - 1, 19, 16), f(0b11100, 15, 11), f(op, 10), f(pattern, 9, 5), rf(Xdn, 0);    \
+   }
+ 
+   INSN(sve_inc, 0);
+   INSN(sve_dec, 1);
+ #undef INSN
+ 
+   // SVE predicate count
+   void sve_cntp(Register Xd, SIMD_RegVariant T, PRegister Pg, PRegister Pn) {
+     starti;
+     assert(T != Q, "invalid size");
+     f(0b00100101, 31, 24), f(T, 23, 22), f(0b10000010, 21, 14);
+     prf(Pg, 10), f(0, 9), prf(Pn, 5), rf(Xd, 0);
+   }
+ 
+   // SVE dup scalar
+   void sve_dup(FloatRegister Zd, SIMD_RegVariant T, Register Rn) {
      starti;
      assert(T != Q, "invalid size");
!     f(0b00000101, 31, 24), f(T, 23, 22), f(0b100000001110, 21, 10);
!     srf(Rn, 5), rf(Zd, 0);
+   }
+ 
+   // SVE dup imm
+   void sve_dup(FloatRegister Zd, SIMD_RegVariant T, int imm8) {
+     starti;
+     assert(T != Q, "invalid size");
+     int sh = 0;
+     if (imm8 <= 127 && imm8 >= -128) {
+       sh = 0;
+     } else if (T != B && imm8 <= 32512 && imm8 >= -32768 && (imm8 & 0xff) == 0) {
+       sh = 1;
+       imm8 = (imm8 >> 8);
+     } else {
+       guarantee(false, "invalid immediate");
+     }
+     f(0b00100101, 31, 24), f(T, 23, 22), f(0b11100011, 21, 14);
+     f(sh, 13), sf(imm8, 12, 5), rf(Zd, 0);
+   }
+ 
+   void sve_ptrue(PRegister pd, SIMD_RegVariant esize, int pattern = 0b11111) {
+     starti;
+     f(0b00100101, 31, 24), f(esize, 23, 22), f(0b011000111000, 21, 10);
+     f(pattern, 9, 5), f(0b0, 4), prf(pd, 0);
    }
  
    Assembler(CodeBuffer* code) : AbstractAssembler(code) {
    }

< prev index next >