New src/hotspot/cpu/aarch64/aarch64_sve

   1 //
   2 // Copyright (c) 2020, Oracle and/or its affiliates. All rights reserved.
   3 // Copyright (c) 2020, Arm Ltd. All rights reserved.
   4 // DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
   5 //
   6 // This code is free software; you can redistribute it and/or modify it
   7 // under the terms of the GNU General Public License version 2 only, as
   8 // published by the Free Software Foundation.
   9 //
  10 // This code is distributed in the hope that it will be useful, but WITHOUT
  11 // ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
  12 // FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
  13 // version 2 for more details (a copy is included in the LICENSE file that
  14 // accompanied this code).
  15 //
  16 // You should have received a copy of the GNU General Public License version
  17 // 2 along with this work; if not, write to the Free Software Foundation,
  18 // Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.
  19 //
  20 // Please contact Oracle, 500 Oracle Parkway, Redwood Shores, CA 94065 USA
  21 // or visit www.oracle.com if you need additional information or have any
  22 // questions.
  23 //
  24 //
  25 
  26 dnl Generate the warning
  27 // This file is automatically generated by running "m4 aarch64_sve_ad.m4". Do not edit ----
  28 dnl
  29 
  30 // AArch64 SVE Architecture Description File
  31 
  32 dnl
  33 dnl OPERAND_VMEMORYA_IMMEDIATE_OFFSET($1,            $2,       $3     )
  34 dnl OPERAND_VMEMORYA_IMMEDIATE_OFFSET(imm_type_abbr, imm_type, imm_len)
  35 define(`OPERAND_VMEMORYA_IMMEDIATE_OFFSET', `
  36 operand vmemA_imm$1Offset$3()
  37 %{
  38   predicate(Address::offset_ok_for_sve_immed(n->get_$2(), $3,
  39             Matcher::scalable_vector_reg_size(T_BYTE)));
  40   match(Con$1);
  41 
  42   op_cost(0);
  43   format %{ %}
  44   interface(CONST_INTER);
  45 %}')
  46 dnl
  47 // 4 bit signed offset -- for predicated load/store
  48 OPERAND_VMEMORYA_IMMEDIATE_OFFSET(I, int,  4)
  49 OPERAND_VMEMORYA_IMMEDIATE_OFFSET(L, long, 4)
  50 dnl
  51 dnl OPERAND_VMEMORYA_INDIRECT_OFFSET($1,            $2     )
  52 dnl OPERAND_VMEMORYA_INDIRECT_OFFSET(imm_type_abbr, imm_len)
  53 define(`OPERAND_VMEMORYA_INDIRECT_OFFSET', `
  54 operand vmemA_indOff$1$2(iRegP reg, vmemA_imm$1Offset$2 off)
  55 %{
  56   constraint(ALLOC_IN_RC(ptr_reg));
  57   match(AddP reg off);
  58   op_cost(0);
  59   format %{ "[$reg, $off, MUL VL]" %}
  60   interface(MEMORY_INTER) %{
  61     base($reg);
  62     `index'(0xffffffff);
  63     scale(0x0);
  64     disp($off);
  65   %}
  66 %}')
  67 dnl
  68 OPERAND_VMEMORYA_INDIRECT_OFFSET(I, 4)
  69 OPERAND_VMEMORYA_INDIRECT_OFFSET(L, 4)
  70 
  71 opclass vmemA(indirect, vmemA_indOffI4, vmemA_indOffL4);
  72 
  73 source_hpp %{
  74   bool op_sve_supported(int opcode);
  75 %}
  76 
  77 source %{
  78 
  79   static inline BasicType vector_element_basic_type(const MachNode* n) {
  80     const TypeVect* vt = n->bottom_type()->is_vect();
  81     return vt->element_basic_type();
  82   }
  83 
  84   static inline BasicType vector_element_basic_type(const MachNode* use, const MachOper* opnd) {
  85     int def_idx = use->operand_index(opnd);
  86     Node* def = use->in(def_idx);
  87     const TypeVect* vt = def->bottom_type()->is_vect();
  88     return vt->element_basic_type();
  89   }
  90 
  91   typedef void (C2_MacroAssembler::* sve_mem_insn_predicate)(FloatRegister Rt, Assembler::SIMD_RegVariant T,
  92                                                              PRegister Pg, const Address &adr);
  93 
  94   // Predicated load/store, with optional ptrue to all elements of given predicate register.
  95   static void loadStoreA_predicate(C2_MacroAssembler masm, bool is_store,
  96                                    FloatRegister reg, PRegister pg, BasicType bt,
  97                                    int opcode, Register base, int index, int size, int disp) {
  98     sve_mem_insn_predicate insn;
  99     Assembler::SIMD_RegVariant type;
 100     int esize = type2aelembytes(bt);
 101     if (index == -1) {
 102       assert(size == 0, "unsupported address mode: scale size = %d", size);
 103       switch(esize) {
 104       case 1:
 105         insn = is_store ? &C2_MacroAssembler::sve_st1b : &C2_MacroAssembler::sve_ld1b;
 106         type = Assembler::B;
 107         break;
 108       case 2:
 109         insn = is_store ? &C2_MacroAssembler::sve_st1h : &C2_MacroAssembler::sve_ld1h;
 110         type = Assembler::H;
 111         break;
 112       case 4:
 113         insn = is_store ? &C2_MacroAssembler::sve_st1w : &C2_MacroAssembler::sve_ld1w;
 114         type = Assembler::S;
 115         break;
 116       case 8:
 117         insn = is_store ? &C2_MacroAssembler::sve_st1d : &C2_MacroAssembler::sve_ld1d;
 118         type = Assembler::D;
 119         break;
 120       default:
 121         assert(false, "unsupported");
 122         ShouldNotReachHere();
 123       }
 124       (masm.*insn)(reg, type, pg, Address(base, disp / Matcher::scalable_vector_reg_size(T_BYTE)));
 125     } else {
 126       assert(false, "unimplemented");
 127       ShouldNotReachHere();
 128     }
 129   }
 130 
 131   bool op_sve_supported(int opcode) {
 132     switch (opcode) {
 133       case Op_MulAddVS2VI:
 134         // No multiply reduction instructions
 135       case Op_MulReductionVD:
 136       case Op_MulReductionVF:
 137       case Op_MulReductionVI:
 138       case Op_MulReductionVL:
 139         // Others
 140       case Op_Extract:
 141       case Op_ExtractB:
 142       case Op_ExtractC:
 143       case Op_ExtractD:
 144       case Op_ExtractF:
 145       case Op_ExtractI:
 146       case Op_ExtractL:
 147       case Op_ExtractS:
 148       case Op_ExtractUB:
 149         return false;
 150       default:
 151         return true;
 152     }
 153   }
 154 
 155 %}
 156 
 157 definitions %{
 158   int_def SVE_COST             (200, 200);
 159 %}
 160 
 161 
 162 dnl
 163 dnl ELEMENT_SHORT_CHART($1, $2)
 164 dnl ELEMENT_SHORT_CHART(etype, node)
 165 define(`ELEMENT_SHORT_CHAR',`ifelse(`$1', `T_SHORT',
 166   `($2->bottom_type()->is_vect()->element_basic_type() == T_SHORT ||
 167             ($2->bottom_type()->is_vect()->element_basic_type() == T_CHAR))',
 168    `($2->bottom_type()->is_vect()->element_basic_type() == $1)')')
 169 dnl
 170 
 171 // All SVE instructions
 172 
 173 // sve vector load/store
 174 
 175 // Use predicated vector load/store
 176 instruct loadVA(vecA dst, vmemA mem) %{
 177   predicate(UseSVE > 0 && n->as_LoadVector()->memory_size() >= 16);
 178   match(Set dst (LoadVector mem));
 179   ins_cost(SVE_COST);
 180   format %{ "sve_ldr $dst, $mem\t # vector (sve)" %}
 181   ins_encode %{
 182     FloatRegister dst_reg = as_FloatRegister($dst$$reg);
 183     loadStoreA_predicate(C2_MacroAssembler(&cbuf), false, dst_reg, ptrue,
 184                          vector_element_basic_type(this), $mem->opcode(),
 185                          as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp);
 186   %}
 187   ins_pipe(pipe_slow);
 188 %}
 189 
 190 instruct storeVA(vecA src, vmemA mem) %{
 191   predicate(UseSVE > 0 && n->as_StoreVector()->memory_size() >= 16);
 192   match(Set mem (StoreVector mem src));
 193   ins_cost(SVE_COST);
 194   format %{ "sve_str $mem, $src\t # vector (sve)" %}
 195   ins_encode %{
 196     FloatRegister src_reg = as_FloatRegister($src$$reg);
 197     loadStoreA_predicate(C2_MacroAssembler(&cbuf), true, src_reg, ptrue,
 198                          vector_element_basic_type(this, $src), $mem->opcode(),
 199                          as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp);
 200   %}
 201   ins_pipe(pipe_slow);
 202 %}
 203 
 204 dnl
 205 dnl UNARY_OP_TRUE_PREDICATE_ETYPE($1,        $2,      $3,           $4,   $5,          %6  )
 206 dnl UNARY_OP_TRUE_PREDICATE_ETYPE(insn_name, op_name, element_type, size, min_vec_len, insn)
 207 define(`UNARY_OP_TRUE_PREDICATE_ETYPE', `
 208 instruct $1(vecA dst, vecA src) %{
 209   predicate(UseSVE > 0 && n->as_Vector()->length() >= $5 &&
 210             n->bottom_type()->is_vect()->element_basic_type() == $3);
 211   match(Set dst ($2 src));
 212   ins_cost(SVE_COST);
 213   format %{ "$6 $dst, $src\t# vector (sve) ($4)" %}
 214   ins_encode %{
 215     __ $6(as_FloatRegister($dst$$reg), __ $4,
 216          ptrue, as_FloatRegister($src$$reg));
 217   %}
 218   ins_pipe(pipe_slow);
 219 %}')dnl
 220 
 221 // sve abs
 222 UNARY_OP_TRUE_PREDICATE_ETYPE(vabsAB, AbsVB, T_BYTE,   B, 16, sve_abs)
 223 UNARY_OP_TRUE_PREDICATE_ETYPE(vabsAS, AbsVS, T_SHORT,  H, 8,  sve_abs)
 224 UNARY_OP_TRUE_PREDICATE_ETYPE(vabsAI, AbsVI, T_INT,    S, 4,  sve_abs)
 225 UNARY_OP_TRUE_PREDICATE_ETYPE(vabsAL, AbsVL, T_LONG,   D, 2,  sve_abs)
 226 UNARY_OP_TRUE_PREDICATE_ETYPE(vabsAF, AbsVF, T_FLOAT,  S, 4,  sve_fabs)
 227 UNARY_OP_TRUE_PREDICATE_ETYPE(vabsAD, AbsVD, T_DOUBLE, D, 2,  sve_fabs)
 228 dnl
 229 dnl BINARY_OP_UNPREDICATED($1,        $2       $3,   $4           $5  )
 230 dnl BINARY_OP_UNPREDICATED(insn_name, op_name, size, min_vec_len, insn)
 231 define(`BINARY_OP_UNPREDICATED', `
 232 instruct $1(vecA dst, vecA src1, vecA src2) %{
 233   predicate(UseSVE > 0 && n->as_Vector()->length() >= $4);
 234   match(Set dst ($2 src1 src2));
 235   ins_cost(SVE_COST);
 236   format %{ "$5 $dst, $src1, $src2\t # vector (sve) ($3)" %}
 237   ins_encode %{
 238     __ $5(as_FloatRegister($dst$$reg), __ $3,
 239          as_FloatRegister($src1$$reg),
 240          as_FloatRegister($src2$$reg));
 241   %}
 242   ins_pipe(pipe_slow);
 243 %}')dnl
 244 
 245 // sve add
 246 BINARY_OP_UNPREDICATED(vaddAB, AddVB, B, 16, sve_add)
 247 BINARY_OP_UNPREDICATED(vaddAS, AddVS, H, 8,  sve_add)
 248 BINARY_OP_UNPREDICATED(vaddAI, AddVI, S, 4,  sve_add)
 249 BINARY_OP_UNPREDICATED(vaddAL, AddVL, D, 2,  sve_add)
 250 BINARY_OP_UNPREDICATED(vaddAF, AddVF, S, 4,  sve_fadd)
 251 BINARY_OP_UNPREDICATED(vaddAD, AddVD, D, 2,  sve_fadd)
 252 dnl
 253 dnl BINARY_OP_UNSIZED($1,        $2,      $3,          $4  )
 254 dnl BINARY_OP_UNSIZED(insn_name, op_name, min_vec_len, insn)
 255 define(`BINARY_OP_UNSIZED', `
 256 instruct $1(vecA dst, vecA src1, vecA src2) %{
 257   predicate(UseSVE > 0 && n->as_Vector()->length_in_bytes() >= $3);
 258   match(Set dst ($2 src1 src2));
 259   ins_cost(SVE_COST);
 260   format %{ "$4  $dst, $src1, $src2\t# vector (sve)" %}
 261   ins_encode %{
 262     __ $4(as_FloatRegister($dst$$reg),
 263          as_FloatRegister($src1$$reg),
 264          as_FloatRegister($src2$$reg));
 265   %}
 266   ins_pipe(pipe_slow);
 267 %}')dnl
 268 
 269 // sve and
 270 BINARY_OP_UNSIZED(vandA, AndV, 16, sve_and)
 271 
 272 // sve or
 273 BINARY_OP_UNSIZED(vorA, OrV, 16, sve_orr)
 274 
 275 // sve xor
 276 BINARY_OP_UNSIZED(vxorA, XorV, 16, sve_eor)
 277 dnl
 278 dnl VDIVF($1,          $2  , $3         )
 279 dnl VDIVF(name_suffix, size, min_vec_len)
 280 define(`VDIVF', `
 281 instruct vdivA$1(vecA dst_src1, vecA src2) %{
 282   predicate(UseSVE > 0 && n->as_Vector()->length() >= $3);
 283   match(Set dst_src1 (DivV$1 dst_src1 src2));
 284   ins_cost(SVE_COST);
 285   format %{ "sve_fdiv  $dst_src1, $dst_src1, $src2\t# vector (sve) ($2)" %}
 286   ins_encode %{
 287     __ sve_fdiv(as_FloatRegister($dst_src1$$reg), __ $2,
 288          ptrue, as_FloatRegister($src2$$reg));
 289   %}
 290   ins_pipe(pipe_slow);
 291 %}')dnl
 292 
 293 // sve float div
 294 VDIVF(F, S, 4)
 295 VDIVF(D, D, 2)
 296 
 297 dnl
 298 dnl BINARY_OP_TRUE_PREDICATE_ETYPE($1,        $2,      $3,           $4,   $5,          $6  )
 299 dnl BINARY_OP_TRUE_PREDICATE_ETYPE(insn_name, op_name, element_type, size, min_vec_len, insn)
 300 define(`BINARY_OP_TRUE_PREDICATE_ETYPE', `
 301 instruct $1(vecA dst_src1, vecA src2) %{
 302   predicate(UseSVE > 0 && n->as_Vector()->length() >= $5 &&
 303             n->bottom_type()->is_vect()->element_basic_type() == $3);
 304   match(Set dst_src1 ($2 dst_src1 src2));
 305   ins_cost(SVE_COST);
 306   format %{ "$6 $dst_src1, $dst_src1, $src2\t # vector (sve) ($4)" %}
 307   ins_encode %{
 308     __ $6(as_FloatRegister($dst_src1$$reg), __ $4,
 309          ptrue, as_FloatRegister($src2$$reg));
 310   %}
 311   ins_pipe(pipe_slow);
 312 %}')dnl
 313 dnl
 314 // sve max
 315 BINARY_OP_TRUE_PREDICATE_ETYPE(vmaxAF, MaxV, T_FLOAT,  S, 4,  sve_fmax)
 316 BINARY_OP_TRUE_PREDICATE_ETYPE(vmaxAD, MaxV, T_DOUBLE, D, 2,  sve_fmax)
 317 BINARY_OP_TRUE_PREDICATE_ETYPE(vminAF, MinV, T_FLOAT,  S, 4,  sve_fmin)
 318 BINARY_OP_TRUE_PREDICATE_ETYPE(vminAD, MinV, T_DOUBLE, D, 2,  sve_fmin)
 319 
 320 dnl
 321 dnl VFMLA($1           $2    $3         )
 322 dnl VFMLA(name_suffix, size, min_vec_len)
 323 define(`VFMLA', `
 324 // dst_src1 = dst_src1 + src2 * src3
 325 instruct vfmlaA$1(vecA dst_src1, vecA src2, vecA src3) %{
 326   predicate(UseFMA && UseSVE > 0 && n->as_Vector()->length() >= $3);
 327   match(Set dst_src1 (FmaV$1 dst_src1 (Binary src2 src3)));
 328   ins_cost(SVE_COST);
 329   format %{ "sve_fmla $dst_src1, $src2, $src3\t # vector (sve) ($2)" %}
 330   ins_encode %{
 331     __ sve_fmla(as_FloatRegister($dst_src1$$reg), __ $2,
 332          ptrue, as_FloatRegister($src2$$reg), as_FloatRegister($src3$$reg));
 333   %}
 334   ins_pipe(pipe_slow);
 335 %}')dnl
 336 dnl
 337 // sve fmla
 338 VFMLA(F, S, 4)
 339 VFMLA(D, D, 2)
 340 
 341 dnl
 342 dnl VFMLS($1           $2    $3         )
 343 dnl VFMLS(name_suffix, size, min_vec_len)
 344 define(`VFMLS', `
 345 // dst_src1 = dst_src1 + -src2 * src3
 346 // dst_src1 = dst_src1 + src2 * -src3
 347 instruct vfmlsA$1(vecA dst_src1, vecA src2, vecA src3) %{
 348   predicate(UseFMA && UseSVE > 0 && n->as_Vector()->length() >= $3);
 349   match(Set dst_src1 (FmaV$1 dst_src1 (Binary (NegV$1 src2) src3)));
 350   match(Set dst_src1 (FmaV$1 dst_src1 (Binary src2 (NegV$1 src3))));
 351   ins_cost(SVE_COST);
 352   format %{ "sve_fmls $dst_src1, $src2, $src3\t # vector (sve) ($2)" %}
 353   ins_encode %{
 354     __ sve_fmls(as_FloatRegister($dst_src1$$reg), __ $2,
 355          ptrue, as_FloatRegister($src2$$reg), as_FloatRegister($src3$$reg));
 356   %}
 357   ins_pipe(pipe_slow);
 358 %}')dnl
 359 dnl
 360 // sve fmls
 361 VFMLS(F, S, 4)
 362 VFMLS(D, D, 2)
 363 
 364 dnl
 365 dnl VFNMLA($1           $2    $3         )
 366 dnl VFNMLA(name_suffix, size, min_vec_len)
 367 define(`VFNMLA', `
 368 // dst_src1 = -dst_src1 + -src2 * src3
 369 // dst_src1 = -dst_src1 + src2 * -src3
 370 instruct vfnmlaA$1(vecA dst_src1, vecA src2, vecA src3) %{
 371   predicate(UseFMA && UseSVE > 0 && n->as_Vector()->length() >= $3);
 372   match(Set dst_src1 (FmaV$1 (NegV$1 dst_src1) (Binary (NegV$1 src2) src3)));
 373   match(Set dst_src1 (FmaV$1 (NegV$1 dst_src1) (Binary src2 (NegV$1 src3))));
 374   ins_cost(SVE_COST);
 375   format %{ "sve_fnmla $dst_src1, $src2, $src3\t # vector (sve) ($2)" %}
 376   ins_encode %{
 377     __ sve_fnmla(as_FloatRegister($dst_src1$$reg), __ $2,
 378          ptrue, as_FloatRegister($src2$$reg), as_FloatRegister($src3$$reg));
 379   %}
 380   ins_pipe(pipe_slow);
 381 %}')dnl
 382 dnl
 383 // sve fnmla
 384 VFNMLA(F, S, 4)
 385 VFNMLA(D, D, 2)
 386 
 387 dnl
 388 dnl VFNMLS($1           $2    $3         )
 389 dnl VFNMLS(name_suffix, size, min_vec_len)
 390 define(`VFNMLS', `
 391 // dst_src1 = -dst_src1 + src2 * src3
 392 instruct vfnmlsA$1(vecA dst_src1, vecA src2, vecA src3) %{
 393   predicate(UseFMA && UseSVE > 0 && n->as_Vector()->length() >= $3);
 394   match(Set dst_src1 (FmaV$1 (NegV$1 dst_src1) (Binary src2 src3)));
 395   ins_cost(SVE_COST);
 396   format %{ "sve_fnmls $dst_src1, $src2, $src3\t # vector (sve) ($2)" %}
 397   ins_encode %{
 398     __ sve_fnmls(as_FloatRegister($dst_src1$$reg), __ $2,
 399          ptrue, as_FloatRegister($src2$$reg), as_FloatRegister($src3$$reg));
 400   %}
 401   ins_pipe(pipe_slow);
 402 %}')dnl
 403 dnl
 404 // sve fnmls
 405 VFNMLS(F, S, 4)
 406 VFNMLS(D, D, 2)
 407 
 408 dnl
 409 dnl VMLA($1           $2    $3         )
 410 dnl VMLA(name_suffix, size, min_vec_len)
 411 define(`VMLA', `
 412 // dst_src1 = dst_src1 + src2 * src3
 413 instruct vmlaA$1(vecA dst_src1, vecA src2, vecA src3)
 414 %{
 415   predicate(UseSVE > 0 && n->as_Vector()->length() >= $3);
 416   match(Set dst_src1 (AddV$1 dst_src1 (MulV$1 src2 src3)));
 417   ins_cost(SVE_COST);
 418   format %{ "sve_mla $dst_src1, src2, src3\t # vector (sve) ($2)" %}
 419   ins_encode %{
 420     __ sve_mla(as_FloatRegister($dst_src1$$reg), __ $2,
 421       ptrue, as_FloatRegister($src2$$reg), as_FloatRegister($src3$$reg));
 422   %}
 423   ins_pipe(pipe_slow);
 424 %}')dnl
 425 dnl
 426 // sve mla
 427 VMLA(B, B, 16)
 428 VMLA(S, H, 8)
 429 VMLA(I, S, 4)
 430 VMLA(L, D, 2)
 431 
 432 dnl
 433 dnl VMLS($1           $2    $3         )
 434 dnl VMLS(name_suffix, size, min_vec_len)
 435 define(`VMLS', `
 436 // dst_src1 = dst_src1 - src2 * src3
 437 instruct vmlsA$1(vecA dst_src1, vecA src2, vecA src3)
 438 %{
 439   predicate(UseSVE > 0 && n->as_Vector()->length() >= $3);
 440   match(Set dst_src1 (SubV$1 dst_src1 (MulV$1 src2 src3)));
 441   ins_cost(SVE_COST);
 442   format %{ "sve_mls $dst_src1, src2, src3\t # vector (sve) ($2)" %}
 443   ins_encode %{
 444     __ sve_mls(as_FloatRegister($dst_src1$$reg), __ $2,
 445       ptrue, as_FloatRegister($src2$$reg), as_FloatRegister($src3$$reg));
 446   %}
 447   ins_pipe(pipe_slow);
 448 %}')dnl
 449 dnl
 450 // sve mls
 451 VMLS(B, B, 16)
 452 VMLS(S, H, 8)
 453 VMLS(I, S, 4)
 454 VMLS(L, D, 2)
 455 
 456 dnl
 457 dnl BINARY_OP_TRUE_PREDICATE($1,        $2,      $3,   $4,          $5  )
 458 dnl BINARY_OP_TRUE_PREDICATE(insn_name, op_name, size, min_vec_len, insn)
 459 define(`BINARY_OP_TRUE_PREDICATE', `
 460 instruct $1(vecA dst_src1, vecA src2) %{
 461   predicate(UseSVE > 0 && n->as_Vector()->length() >= $4);
 462   match(Set dst_src1 ($2 dst_src1 src2));
 463   ins_cost(SVE_COST);
 464   format %{ "$5 $dst_src1, $dst_src1, $src2\t # vector (sve) ($3)" %}
 465   ins_encode %{
 466     __ $5(as_FloatRegister($dst_src1$$reg), __ $3,
 467          ptrue, as_FloatRegister($src2$$reg));
 468   %}
 469   ins_pipe(pipe_slow);
 470 %}')dnl
 471 
 472 // sve mul
 473 BINARY_OP_TRUE_PREDICATE(vmulAB, MulVB, B, 16, sve_mul)
 474 BINARY_OP_TRUE_PREDICATE(vmulAS, MulVS, H, 8,  sve_mul)
 475 BINARY_OP_TRUE_PREDICATE(vmulAI, MulVI, S, 4,  sve_mul)
 476 BINARY_OP_TRUE_PREDICATE(vmulAL, MulVL, D, 2,  sve_mul)
 477 BINARY_OP_UNPREDICATED(vmulAF, MulVF, S, 4, sve_fmul)
 478 BINARY_OP_UNPREDICATED(vmulAD, MulVD, D, 2, sve_fmul)
 479 
 480 dnl
 481 dnl UNARY_OP_TRUE_PREDICATE($1,        $2,      $3,   $4,            $5  )
 482 dnl UNARY_OP_TRUE_PREDICATE(insn_name, op_name, size, min_vec_bytes, insn)
 483 define(`UNARY_OP_TRUE_PREDICATE', `
 484 instruct $1(vecA dst, vecA src) %{
 485   predicate(UseSVE > 0 && n->as_Vector()->length_in_bytes() >= $4);
 486   match(Set dst ($2 src));
 487   ins_cost(SVE_COST);
 488   format %{ "$5 $dst, $src\t# vector (sve) ($3)" %}
 489   ins_encode %{
 490     __ $5(as_FloatRegister($dst$$reg), __ $3,
 491          ptrue, as_FloatRegister($src$$reg));
 492   %}
 493   ins_pipe(pipe_slow);
 494 %}')dnl
 495 dnl
 496 // sve fneg
 497 UNARY_OP_TRUE_PREDICATE(vnegAF, NegVF, S, 16, sve_fneg)
 498 UNARY_OP_TRUE_PREDICATE(vnegAD, NegVD, D, 16, sve_fneg)
 499 
 500 // sve popcount vector
 501 
 502 instruct vpopcountAI(vecA dst, vecA src) %{
 503   predicate(UseSVE > 0 && n->as_Vector()->length() >= 4);
 504   match(Set dst (PopCountVI src));
 505   format %{ "sve_cnt $dst, $src\t# vector (sve) (S)\n\t"  %}
 506   ins_encode %{
 507      __ sve_cnt(as_FloatRegister($dst$$reg), __ S, ptrue, as_FloatRegister($src$$reg));
 508   %}
 509   ins_pipe(pipe_slow);
 510 %}
 511 
 512 dnl
 513 dnl REDUCE_ADD($1,        $2,      $3,      $4,      $5,   $6,        $7   )
 514 dnl REDUCE_ADD(insn_name, op_name, reg_dst, reg_src, size, elem_type, insn1)
 515 define(`REDUCE_ADD', `
 516 instruct $1($3 dst, $4 src1, vecA src2, vRegD tmp) %{
 517   predicate(UseSVE > 0 && n->in(2)->bottom_type()->is_vect()->length_in_bytes() >= 16 &&
 518             ELEMENT_SHORT_CHAR($6, n->in(2)));
 519   match(Set dst ($2 src1 src2));
 520   effect(TEMP_DEF dst, TEMP tmp);
 521   ins_cost(SVE_COST);
 522   format %{ "sve_uaddv $tmp, $src2\t# vector (sve) ($5)\n\t"
 523             "umov  $dst, $tmp, $5, 0\n\t"
 524             "$7  $dst, $dst, $src1\t # add reduction $5" %}
 525   ins_encode %{
 526     __ sve_uaddv(as_FloatRegister($tmp$$reg), __ $5,
 527          ptrue, as_FloatRegister($src2$$reg));
 528     __ umov($dst$$Register, as_FloatRegister($tmp$$reg), __ $5, 0);
 529     __ $7($dst$$Register, $dst$$Register, $src1$$Register);
 530   %}
 531   ins_pipe(pipe_slow);
 532 %}')dnl
 533 dnl
 534 dnl REDUCE_ADDF($1,        $2,      $3,      $4  )
 535 dnl REDUCE_ADDF(insn_name, op_name, reg_dst, size)
 536 define(`REDUCE_ADDF', `
 537 instruct $1($3 src1_dst, vecA src2) %{
 538   predicate(UseSVE > 0 && n->in(2)->bottom_type()->is_vect()->length_in_bytes() >= 16);
 539   match(Set src1_dst ($2 src1_dst src2));
 540   ins_cost(SVE_COST);
 541   format %{ "sve_fadda $src1_dst, $src1_dst, $src2\t# vector (sve) ($4)" %}
 542   ins_encode %{
 543     __ sve_fadda(as_FloatRegister($src1_dst$$reg), __ $4,
 544          ptrue, as_FloatRegister($src2$$reg));
 545   %}
 546   ins_pipe(pipe_slow);
 547 %}')dnl
 548 dnl
 549 // sve add reduction
 550 REDUCE_ADD(reduce_addAI, AddReductionVI, iRegINoSp, iRegIorL2I, S, T_INT, addw)
 551 REDUCE_ADD(reduce_addAL, AddReductionVL, iRegLNoSp, iRegL, D, T_LONG, add)
 552 REDUCE_ADDF(reduce_addAF, AddReductionVF, vRegF, S)
 553 REDUCE_ADDF(reduce_addAD, AddReductionVD, vRegD, D)
 554 
 555 dnl
 556 dnl REDUCE_FMINMAX($1,      $2,          $3,           $4,   $5         )
 557 dnl REDUCE_FMINMAX(min_max, name_suffix, element_type, size, reg_src_dst)
 558 define(`REDUCE_FMINMAX', `
 559 instruct reduce_$1A$2($5 dst, $5 src1, vecA src2) %{
 560   predicate(UseSVE > 0 && n->in(2)->bottom_type()->is_vect()->element_basic_type() == $3 &&
 561             n->in(2)->bottom_type()->is_vect()->length_in_bytes() >= 16);
 562   match(Set dst (translit($1, `m', `M')ReductionV src1 src2));
 563   ins_cost(INSN_COST);
 564   effect(TEMP_DEF dst);
 565   format %{ "sve_f$1v $dst, $src2 # vector (sve) (S)\n\t"
 566             "f$1s $dst, $dst, $src1\t # $1 reduction $2" %}
 567   ins_encode %{
 568     __ sve_f$1v(as_FloatRegister($dst$$reg), __ $4,
 569          ptrue, as_FloatRegister($src2$$reg));
 570     __ f`$1'translit($4, `SD', `sd')(as_FloatRegister($dst$$reg), as_FloatRegister($dst$$reg), as_FloatRegister($src1$$reg));
 571   %}
 572   ins_pipe(pipe_slow);
 573 %}')dnl
 574 // sve max reduction
 575 REDUCE_FMINMAX(max, F, T_FLOAT,  S, vRegF)
 576 REDUCE_FMINMAX(max, D, T_DOUBLE, D, vRegD)
 577 
 578 // sve min reduction
 579 REDUCE_FMINMAX(min, F, T_FLOAT,  S, vRegF)
 580 REDUCE_FMINMAX(min, D, T_DOUBLE, D, vRegD)
 581 
 582 // sve vector Math.rint, floor, ceil
 583 
 584 instruct vroundAD(vecA dst, vecA src, immI rmode) %{
 585   predicate(UseSVE > 0 && n->as_Vector()->length() >= 2 &&
 586             n->bottom_type()->is_vect()->element_basic_type() == T_DOUBLE);
 587   match(Set dst (RoundDoubleModeV src rmode));
 588   format %{ "sve_frint $dst, $src, $rmode\t# vector (sve) (D)" %}
 589   ins_encode %{
 590     switch ($rmode$$constant) {
 591       case RoundDoubleModeNode::rmode_rint:
 592         __ sve_frintn(as_FloatRegister($dst$$reg), __ D,
 593              ptrue, as_FloatRegister($src$$reg));
 594         break;
 595       case RoundDoubleModeNode::rmode_floor:
 596         __ sve_frintm(as_FloatRegister($dst$$reg), __ D,
 597              ptrue, as_FloatRegister($src$$reg));
 598         break;
 599       case RoundDoubleModeNode::rmode_ceil:
 600         __ sve_frintp(as_FloatRegister($dst$$reg), __ D,
 601              ptrue, as_FloatRegister($src$$reg));
 602         break;
 603     }
 604   %}
 605   ins_pipe(pipe_slow);
 606 %}
 607 dnl
 608 dnl REPLICATE($1,        $2,      $3,      $4,   $5         )
 609 dnl REPLICATE(insn_name, op_name, reg_src, size, min_vec_len)
 610 define(`REPLICATE', `
 611 instruct $1(vecA dst, $3 src) %{
 612   predicate(UseSVE > 0 && n->as_Vector()->length() >= $5);
 613   match(Set dst ($2 src));
 614   ins_cost(SVE_COST);
 615   format %{ "sve_dup  $dst, $src\t# vector (sve) ($4)" %}
 616   ins_encode %{
 617     __ sve_dup(as_FloatRegister($dst$$reg), __ $4, as_Register($src$$reg));
 618   %}
 619   ins_pipe(pipe_slow);
 620 %}')dnl
 621 dnl
 622 dnl REPLICATE_IMM8($1,        $2,      $3,       $4,   $5         )
 623 dnl REPLICATE_IMM8(insn_name, op_name, imm_type, size, min_vec_len)
 624 define(`REPLICATE_IMM8', `
 625 instruct $1(vecA dst, $3 con) %{
 626   predicate(UseSVE > 0 && n->as_Vector()->length() >= $5);
 627   match(Set dst ($2 con));
 628   ins_cost(SVE_COST);
 629   format %{ "sve_dup  $dst, $con\t# vector (sve) ($4)" %}
 630   ins_encode %{
 631     __ sve_dup(as_FloatRegister($dst$$reg), __ $4, $con$$constant);
 632   %}
 633   ins_pipe(pipe_slow);
 634 %}')dnl
 635 dnl
 636 dnl FREPLICATE($1,        $2,      $3,      $4,   $5         )
 637 dnl FREPLICATE(insn_name, op_name, reg_src, size, min_vec_len)
 638 define(`FREPLICATE', `
 639 instruct $1(vecA dst, $3 src) %{
 640   predicate(UseSVE > 0 && n->as_Vector()->length() >= $5);
 641   match(Set dst ($2 src));
 642   ins_cost(SVE_COST);
 643   format %{ "sve_cpy  $dst, $src\t# vector (sve) ($4)" %}
 644   ins_encode %{
 645     __ sve_cpy(as_FloatRegister($dst$$reg), __ $4,
 646          ptrue, as_FloatRegister($src$$reg));
 647   %}
 648   ins_pipe(pipe_slow);
 649 %}')dnl
 650 
 651 // sve replicate
 652 REPLICATE(replicateAB, ReplicateB, iRegIorL2I, B, 16)
 653 REPLICATE(replicateAS, ReplicateS, iRegIorL2I, H, 8)
 654 REPLICATE(replicateAI, ReplicateI, iRegIorL2I, S, 4)
 655 REPLICATE(replicateAL, ReplicateL, iRegL,      D, 2)
 656 
 657 REPLICATE_IMM8(replicateAB_imm8, ReplicateB, immI8,        B, 16)
 658 REPLICATE_IMM8(replicateAS_imm8, ReplicateS, immI8_shift8, H, 8)
 659 REPLICATE_IMM8(replicateAI_imm8, ReplicateI, immI8_shift8, S, 4)
 660 REPLICATE_IMM8(replicateAL_imm8, ReplicateL, immL8_shift8, D, 2)
 661 
 662 FREPLICATE(replicateAF, ReplicateF, vRegF, S, 4)
 663 FREPLICATE(replicateAD, ReplicateD, vRegD, D, 2)
 664 dnl
 665 dnl VSHIFT_TRUE_PREDICATE($1,        $2,      $3,   $4,          $5  )
 666 dnl VSHIFT_TRUE_PREDICATE(insn_name, op_name, size, min_vec_len, insn)
 667 define(`VSHIFT_TRUE_PREDICATE', `
 668 instruct $1(vecA dst, vecA shift) %{
 669   predicate(UseSVE > 0 && n->as_Vector()->length() >= $4);
 670   match(Set dst ($2 dst shift));
 671   ins_cost(SVE_COST);
 672   format %{ "$5 $dst, $dst, $shift\t# vector (sve) ($3)" %}
 673   ins_encode %{
 674     __ $5(as_FloatRegister($dst$$reg), __ $3,
 675          ptrue, as_FloatRegister($shift$$reg));
 676   %}
 677   ins_pipe(pipe_slow);
 678 %}')dnl
 679 dnl
 680 dnl VSHIFT_IMM_UNPREDICATE($1,        $2,      $3,   $4,          $5  )
 681 dnl VSHIFT_IMM_UNPREDICATE(insn_name, op_name, size, min_vec_len, insn)
 682 define(`VSHIFT_IMM_UNPREDICATE', `
 683 instruct $1(vecA dst, vecA src, immI shift) %{
 684   predicate(UseSVE > 0 && n->as_Vector()->length() >= $4);
 685   match(Set dst ($2 src shift));
 686   ins_cost(SVE_COST);
 687   format %{ "$5 $dst, $src, $shift\t# vector (sve) ($3)" %}
 688   ins_encode %{
 689     int con = (int)$shift$$constant;dnl
 690 ifelse(eval(index(`$1', `vasr') == 0 || index(`$1', `vlsr') == 0), 1, `
 691     if (con == 0) {
 692       __ sve_orr(as_FloatRegister($dst$$reg), as_FloatRegister($src$$reg),
 693            as_FloatRegister($src$$reg));
 694       return;
 695     }')dnl
 696 ifelse(eval(index(`$1', `vasr') == 0), 1, `ifelse(eval(index(`$3', `B') == 0), 1, `
 697     if (con >= 8) con = 7;')ifelse(eval(index(`$3', `H') == 0), 1, `
 698     if (con >= 16) con = 15;')')dnl
 699 ifelse(eval((index(`$1', `vlsl') == 0 || index(`$1', `vlsr') == 0) && (index(`$3', `B') == 0 || index(`$3', `H') == 0)), 1, `
 700     if (con >= 8) {
 701       __ sve_eor(as_FloatRegister($dst$$reg), as_FloatRegister($src$$reg),
 702            as_FloatRegister($src$$reg));
 703       return;
 704     }')
 705     __ $5(as_FloatRegister($dst$$reg), __ $3,
 706          as_FloatRegister($src$$reg), con);
 707   %}
 708   ins_pipe(pipe_slow);
 709 %}')dnl
 710 dnl
 711 dnl VSHIFT_COUNT($1,        $2,   $3,          $4  )
 712 dnl VSHIFT_COUNT(insn_name, size, min_vec_len, type)
 713 define(`VSHIFT_COUNT', `
 714 instruct $1(vecA dst, iRegIorL2I cnt) %{
 715   predicate(UseSVE > 0 && n->as_Vector()->length() >= $3 &&
 716             ELEMENT_SHORT_CHAR($4, n));
 717   match(Set dst (LShiftCntV cnt));
 718   match(Set dst (RShiftCntV cnt));
 719   format %{ "sve_dup $dst, $cnt\t# vector shift count (sve) ($2)" %}
 720   ins_encode %{
 721     __ sve_dup(as_FloatRegister($dst$$reg), __ $2, as_Register($cnt$$reg));
 722   %}
 723   ins_pipe(pipe_slow);
 724 %}')dnl
 725 
 726 // sve shift
 727 VSHIFT_TRUE_PREDICATE(vasrAB, RShiftVB,  B, 16, sve_asr)
 728 VSHIFT_TRUE_PREDICATE(vasrAS, RShiftVS,  H,  8, sve_asr)
 729 VSHIFT_TRUE_PREDICATE(vasrAI, RShiftVI,  S,  4, sve_asr)
 730 VSHIFT_TRUE_PREDICATE(vasrAL, RShiftVL,  D,  2, sve_asr)
 731 VSHIFT_TRUE_PREDICATE(vlslAB, LShiftVB,  B, 16, sve_lsl)
 732 VSHIFT_TRUE_PREDICATE(vlslAS, LShiftVS,  H,  8, sve_lsl)
 733 VSHIFT_TRUE_PREDICATE(vlslAI, LShiftVI,  S,  4, sve_lsl)
 734 VSHIFT_TRUE_PREDICATE(vlslAL, LShiftVL,  D,  2, sve_lsl)
 735 VSHIFT_TRUE_PREDICATE(vlsrAB, URShiftVB, B, 16, sve_lsr)
 736 VSHIFT_TRUE_PREDICATE(vlsrAS, URShiftVS, H,  8, sve_lsr)
 737 VSHIFT_TRUE_PREDICATE(vlsrAI, URShiftVI, S,  4, sve_lsr)
 738 VSHIFT_TRUE_PREDICATE(vlsrAL, URShiftVL, D,  2, sve_lsr)
 739 VSHIFT_IMM_UNPREDICATE(vasrAB_imm, RShiftVB,  B, 16, sve_asr)
 740 VSHIFT_IMM_UNPREDICATE(vasrAS_imm, RShiftVS,  H,  8, sve_asr)
 741 VSHIFT_IMM_UNPREDICATE(vasrAI_imm, RShiftVI,  S,  4, sve_asr)
 742 VSHIFT_IMM_UNPREDICATE(vasrAL_imm, RShiftVL,  D,  2, sve_asr)
 743 VSHIFT_IMM_UNPREDICATE(vlsrAB_imm, URShiftVB, B, 16, sve_lsr)
 744 VSHIFT_IMM_UNPREDICATE(vlsrAS_imm, URShiftVS, H,  8, sve_lsr)
 745 VSHIFT_IMM_UNPREDICATE(vlsrAI_imm, URShiftVI, S,  4, sve_lsr)
 746 VSHIFT_IMM_UNPREDICATE(vlsrAL_imm, URShiftVL, D,  2, sve_lsr)
 747 VSHIFT_IMM_UNPREDICATE(vlslAB_imm, LShiftVB,  B, 16, sve_lsl)
 748 VSHIFT_IMM_UNPREDICATE(vlslAS_imm, LShiftVS,  H,  8, sve_lsl)
 749 VSHIFT_IMM_UNPREDICATE(vlslAI_imm, LShiftVI,  S,  4, sve_lsl)
 750 VSHIFT_IMM_UNPREDICATE(vlslAL_imm, LShiftVL,  D,  2, sve_lsl)
 751 VSHIFT_COUNT(vshiftcntAB, B, 16, T_BYTE)
 752 VSHIFT_COUNT(vshiftcntAS, H,  8, T_SHORT)
 753 VSHIFT_COUNT(vshiftcntAI, S,  4, T_INT)
 754 VSHIFT_COUNT(vshiftcntAL, D,  2, T_LONG)
 755 
 756 // sve sqrt
 757 UNARY_OP_TRUE_PREDICATE(vsqrtAF, SqrtVF, S, 16, sve_fsqrt)
 758 UNARY_OP_TRUE_PREDICATE(vsqrtAD, SqrtVD, D, 16, sve_fsqrt)
 759 
 760 // sve sub
 761 BINARY_OP_UNPREDICATED(vsubAB, SubVB, B, 16, sve_sub)
 762 BINARY_OP_UNPREDICATED(vsubAS, SubVS, H, 8, sve_sub)
 763 BINARY_OP_UNPREDICATED(vsubAI, SubVI, S, 4, sve_sub)
 764 BINARY_OP_UNPREDICATED(vsubAL, SubVL, D, 2, sve_sub)
 765 BINARY_OP_UNPREDICATED(vsubAF, SubVF, S, 4, sve_fsub)
 766 BINARY_OP_UNPREDICATED(vsubAD, SubVD, D, 2, sve_fsub)
 767