New src/hotspot/cpu/aarch64/aarch64.ad

   1 //
   2 // Copyright (c) 2003, 2020, Oracle and/or its affiliates. All rights reserved.
   3 // Copyright (c) 2014, 2020, Red Hat, Inc. All rights reserved.
   4 // DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
   5 //
   6 // This code is free software; you can redistribute it and/or modify it
   7 // under the terms of the GNU General Public License version 2 only, as
   8 // published by the Free Software Foundation.
   9 //
  10 // This code is distributed in the hope that it will be useful, but WITHOUT
  11 // ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
  12 // FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
  13 // version 2 for more details (a copy is included in the LICENSE file that
  14 // accompanied this code).
  15 //
  16 // You should have received a copy of the GNU General Public License version
  17 // 2 along with this work; if not, write to the Free Software Foundation,
  18 // Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.
  19 //
  20 // Please contact Oracle, 500 Oracle Parkway, Redwood Shores, CA 94065 USA
  21 // or visit www.oracle.com if you need additional information or have any
  22 // questions.
  23 //
  24 //
  25 
  26 // AArch64 Architecture Description File
  27 
  28 //----------REGISTER DEFINITION BLOCK------------------------------------------
  29 // This information is used by the matcher and the register allocator to
  30 // describe individual registers and classes of registers within the target
  31 // archtecture.
  32 
  33 register %{
  34 //----------Architecture Description Register Definitions----------------------
  35 // General Registers
  36 // "reg_def"  name ( register save type, C convention save type,
  37 //                   ideal register type, encoding );
  38 // Register Save Types:
  39 //
  40 // NS  = No-Save:       The register allocator assumes that these registers
  41 //                      can be used without saving upon entry to the method, &
  42 //                      that they do not need to be saved at call sites.
  43 //
  44 // SOC = Save-On-Call:  The register allocator assumes that these registers
  45 //                      can be used without saving upon entry to the method,
  46 //                      but that they must be saved at call sites.
  47 //
  48 // SOE = Save-On-Entry: The register allocator assumes that these registers
  49 //                      must be saved before using them upon entry to the
  50 //                      method, but they do not need to be saved at call
  51 //                      sites.
  52 //
  53 // AS  = Always-Save:   The register allocator assumes that these registers
  54 //                      must be saved before using them upon entry to the
  55 //                      method, & that they must be saved at call sites.
  56 //
  57 // Ideal Register Type is used to determine how to save & restore a
  58 // register.  Op_RegI will get spilled with LoadI/StoreI, Op_RegP will get
  59 // spilled with LoadP/StoreP.  If the register supports both, use Op_RegI.
  60 //
  61 // The encoding number is the actual bit-pattern placed into the opcodes.
  62 
  63 // We must define the 64 bit int registers in two 32 bit halves, the
  64 // real lower register and a virtual upper half register. upper halves
  65 // are used by the register allocator but are not actually supplied as
  66 // operands to memory ops.
  67 //
  68 // follow the C1 compiler in making registers
  69 //
  70 //   r0-r7,r10-r26 volatile (caller save)
  71 //   r27-r32 system (no save, no allocate)
  72 //   r8-r9 invisible to the allocator (so we can use them as scratch regs)
  73 //
  74 // as regards Java usage. we don't use any callee save registers
  75 // because this makes it difficult to de-optimise a frame (see comment
  76 // in x86 implementation of Deoptimization::unwind_callee_save_values)
  77 //
  78 
  79 // General Registers
  80 
  81 reg_def R0      ( SOC, SOC, Op_RegI,  0, r0->as_VMReg()         );
  82 reg_def R0_H    ( SOC, SOC, Op_RegI,  0, r0->as_VMReg()->next() );
  83 reg_def R1      ( SOC, SOC, Op_RegI,  1, r1->as_VMReg()         );
  84 reg_def R1_H    ( SOC, SOC, Op_RegI,  1, r1->as_VMReg()->next() );
  85 reg_def R2      ( SOC, SOC, Op_RegI,  2, r2->as_VMReg()         );
  86 reg_def R2_H    ( SOC, SOC, Op_RegI,  2, r2->as_VMReg()->next() );
  87 reg_def R3      ( SOC, SOC, Op_RegI,  3, r3->as_VMReg()         );
  88 reg_def R3_H    ( SOC, SOC, Op_RegI,  3, r3->as_VMReg()->next() );
  89 reg_def R4      ( SOC, SOC, Op_RegI,  4, r4->as_VMReg()         );
  90 reg_def R4_H    ( SOC, SOC, Op_RegI,  4, r4->as_VMReg()->next() );
  91 reg_def R5      ( SOC, SOC, Op_RegI,  5, r5->as_VMReg()         );
  92 reg_def R5_H    ( SOC, SOC, Op_RegI,  5, r5->as_VMReg()->next() );
  93 reg_def R6      ( SOC, SOC, Op_RegI,  6, r6->as_VMReg()         );
  94 reg_def R6_H    ( SOC, SOC, Op_RegI,  6, r6->as_VMReg()->next() );
  95 reg_def R7      ( SOC, SOC, Op_RegI,  7, r7->as_VMReg()         );
  96 reg_def R7_H    ( SOC, SOC, Op_RegI,  7, r7->as_VMReg()->next() );
  97 reg_def R10     ( SOC, SOC, Op_RegI, 10, r10->as_VMReg()        );
  98 reg_def R10_H   ( SOC, SOC, Op_RegI, 10, r10->as_VMReg()->next());
  99 reg_def R11     ( SOC, SOC, Op_RegI, 11, r11->as_VMReg()        );
 100 reg_def R11_H   ( SOC, SOC, Op_RegI, 11, r11->as_VMReg()->next());
 101 reg_def R12     ( SOC, SOC, Op_RegI, 12, r12->as_VMReg()        );
 102 reg_def R12_H   ( SOC, SOC, Op_RegI, 12, r12->as_VMReg()->next());
 103 reg_def R13     ( SOC, SOC, Op_RegI, 13, r13->as_VMReg()        );
 104 reg_def R13_H   ( SOC, SOC, Op_RegI, 13, r13->as_VMReg()->next());
 105 reg_def R14     ( SOC, SOC, Op_RegI, 14, r14->as_VMReg()        );
 106 reg_def R14_H   ( SOC, SOC, Op_RegI, 14, r14->as_VMReg()->next());
 107 reg_def R15     ( SOC, SOC, Op_RegI, 15, r15->as_VMReg()        );
 108 reg_def R15_H   ( SOC, SOC, Op_RegI, 15, r15->as_VMReg()->next());
 109 reg_def R16     ( SOC, SOC, Op_RegI, 16, r16->as_VMReg()        );
 110 reg_def R16_H   ( SOC, SOC, Op_RegI, 16, r16->as_VMReg()->next());
 111 reg_def R17     ( SOC, SOC, Op_RegI, 17, r17->as_VMReg()        );
 112 reg_def R17_H   ( SOC, SOC, Op_RegI, 17, r17->as_VMReg()->next());
 113 reg_def R18     ( SOC, SOC, Op_RegI, 18, r18->as_VMReg()        );
 114 reg_def R18_H   ( SOC, SOC, Op_RegI, 18, r18->as_VMReg()->next());
 115 reg_def R19     ( SOC, SOE, Op_RegI, 19, r19->as_VMReg()        );
 116 reg_def R19_H   ( SOC, SOE, Op_RegI, 19, r19->as_VMReg()->next());
 117 reg_def R20     ( SOC, SOE, Op_RegI, 20, r20->as_VMReg()        ); // caller esp
 118 reg_def R20_H   ( SOC, SOE, Op_RegI, 20, r20->as_VMReg()->next());
 119 reg_def R21     ( SOC, SOE, Op_RegI, 21, r21->as_VMReg()        );
 120 reg_def R21_H   ( SOC, SOE, Op_RegI, 21, r21->as_VMReg()->next());
 121 reg_def R22     ( SOC, SOE, Op_RegI, 22, r22->as_VMReg()        );
 122 reg_def R22_H   ( SOC, SOE, Op_RegI, 22, r22->as_VMReg()->next());
 123 reg_def R23     ( SOC, SOE, Op_RegI, 23, r23->as_VMReg()        );
 124 reg_def R23_H   ( SOC, SOE, Op_RegI, 23, r23->as_VMReg()->next());
 125 reg_def R24     ( SOC, SOE, Op_RegI, 24, r24->as_VMReg()        );
 126 reg_def R24_H   ( SOC, SOE, Op_RegI, 24, r24->as_VMReg()->next());
 127 reg_def R25     ( SOC, SOE, Op_RegI, 25, r25->as_VMReg()        );
 128 reg_def R25_H   ( SOC, SOE, Op_RegI, 25, r25->as_VMReg()->next());
 129 reg_def R26     ( SOC, SOE, Op_RegI, 26, r26->as_VMReg()        );
 130 reg_def R26_H   ( SOC, SOE, Op_RegI, 26, r26->as_VMReg()->next());
 131 reg_def R27     ( SOC, SOE, Op_RegI, 27, r27->as_VMReg()        ); // heapbase
 132 reg_def R27_H   ( SOC, SOE, Op_RegI, 27, r27->as_VMReg()->next());
 133 reg_def R28     (  NS, SOE, Op_RegI, 28, r28->as_VMReg()        ); // thread
 134 reg_def R28_H   (  NS, SOE, Op_RegI, 28, r28->as_VMReg()->next());
 135 reg_def R29     (  NS,  NS, Op_RegI, 29, r29->as_VMReg()        ); // fp
 136 reg_def R29_H   (  NS,  NS, Op_RegI, 29, r29->as_VMReg()->next());
 137 reg_def R30     (  NS,  NS, Op_RegI, 30, r30->as_VMReg()        ); // lr
 138 reg_def R30_H   (  NS,  NS, Op_RegI, 30, r30->as_VMReg()->next());
 139 reg_def R31     (  NS,  NS, Op_RegI, 31, r31_sp->as_VMReg()     ); // sp
 140 reg_def R31_H   (  NS,  NS, Op_RegI, 31, r31_sp->as_VMReg()->next());
 141 
 142 // ----------------------------
 143 // Float/Double Registers
 144 // ----------------------------
 145 
 146 // Double Registers
 147 
 148 // The rules of ADL require that double registers be defined in pairs.
 149 // Each pair must be two 32-bit values, but not necessarily a pair of
 150 // single float registers. In each pair, ADLC-assigned register numbers
 151 // must be adjacent, with the lower number even. Finally, when the
 152 // CPU stores such a register pair to memory, the word associated with
 153 // the lower ADLC-assigned number must be stored to the lower address.
 154 
 155 // AArch64 has 32 floating-point registers. Each can store a vector of
 156 // single or double precision floating-point values up to 8 * 32
 157 // floats, 4 * 64 bit floats or 2 * 128 bit floats.  We currently only
 158 // use the first float or double element of the vector.
 159 
 160 // for Java use float registers v0-v15 are always save on call whereas
 161 // the platform ABI treats v8-v15 as callee save). float registers
 162 // v16-v31 are SOC as per the platform spec
 163 
 164   reg_def V0   ( SOC, SOC, Op_RegF,  0, v0->as_VMReg()          );
 165   reg_def V0_H ( SOC, SOC, Op_RegF,  0, v0->as_VMReg()->next()  );
 166   reg_def V0_J ( SOC, SOC, Op_RegF,  0, v0->as_VMReg()->next(2) );
 167   reg_def V0_K ( SOC, SOC, Op_RegF,  0, v0->as_VMReg()->next(3) );
 168 
 169   reg_def V1   ( SOC, SOC, Op_RegF,  1, v1->as_VMReg()          );
 170   reg_def V1_H ( SOC, SOC, Op_RegF,  1, v1->as_VMReg()->next()  );
 171   reg_def V1_J ( SOC, SOC, Op_RegF,  1, v1->as_VMReg()->next(2) );
 172   reg_def V1_K ( SOC, SOC, Op_RegF,  1, v1->as_VMReg()->next(3) );
 173 
 174   reg_def V2   ( SOC, SOC, Op_RegF,  2, v2->as_VMReg()          );
 175   reg_def V2_H ( SOC, SOC, Op_RegF,  2, v2->as_VMReg()->next()  );
 176   reg_def V2_J ( SOC, SOC, Op_RegF,  2, v2->as_VMReg()->next(2) );
 177   reg_def V2_K ( SOC, SOC, Op_RegF,  2, v2->as_VMReg()->next(3) );
 178 
 179   reg_def V3   ( SOC, SOC, Op_RegF,  3, v3->as_VMReg()          );
 180   reg_def V3_H ( SOC, SOC, Op_RegF,  3, v3->as_VMReg()->next()  );
 181   reg_def V3_J ( SOC, SOC, Op_RegF,  3, v3->as_VMReg()->next(2) );
 182   reg_def V3_K ( SOC, SOC, Op_RegF,  3, v3->as_VMReg()->next(3) );
 183 
 184   reg_def V4   ( SOC, SOC, Op_RegF,  4, v4->as_VMReg()          );
 185   reg_def V4_H ( SOC, SOC, Op_RegF,  4, v4->as_VMReg()->next()  );
 186   reg_def V4_J ( SOC, SOC, Op_RegF,  4, v4->as_VMReg()->next(2) );
 187   reg_def V4_K ( SOC, SOC, Op_RegF,  4, v4->as_VMReg()->next(3) );
 188 
 189   reg_def V5   ( SOC, SOC, Op_RegF,  5, v5->as_VMReg()          );
 190   reg_def V5_H ( SOC, SOC, Op_RegF,  5, v5->as_VMReg()->next()  );
 191   reg_def V5_J ( SOC, SOC, Op_RegF,  5, v5->as_VMReg()->next(2) );
 192   reg_def V5_K ( SOC, SOC, Op_RegF,  5, v5->as_VMReg()->next(3) );
 193 
 194   reg_def V6   ( SOC, SOC, Op_RegF,  6, v6->as_VMReg()          );
 195   reg_def V6_H ( SOC, SOC, Op_RegF,  6, v6->as_VMReg()->next()  );
 196   reg_def V6_J ( SOC, SOC, Op_RegF,  6, v6->as_VMReg()->next(2) );
 197   reg_def V6_K ( SOC, SOC, Op_RegF,  6, v6->as_VMReg()->next(3) );
 198 
 199   reg_def V7   ( SOC, SOC, Op_RegF,  7, v7->as_VMReg()          );
 200   reg_def V7_H ( SOC, SOC, Op_RegF,  7, v7->as_VMReg()->next()  );
 201   reg_def V7_J ( SOC, SOC, Op_RegF,  7, v7->as_VMReg()->next(2) );
 202   reg_def V7_K ( SOC, SOC, Op_RegF,  7, v7->as_VMReg()->next(3) );
 203 
 204   reg_def V8   ( SOC, SOC, Op_RegF,  8, v8->as_VMReg()          );
 205   reg_def V8_H ( SOC, SOC, Op_RegF,  8, v8->as_VMReg()->next()  );
 206   reg_def V8_J ( SOC, SOC, Op_RegF,  8, v8->as_VMReg()->next(2) );
 207   reg_def V8_K ( SOC, SOC, Op_RegF,  8, v8->as_VMReg()->next(3) );
 208 
 209   reg_def V9   ( SOC, SOC, Op_RegF,  9, v9->as_VMReg()          );
 210   reg_def V9_H ( SOC, SOC, Op_RegF,  9, v9->as_VMReg()->next()  );
 211   reg_def V9_J ( SOC, SOC, Op_RegF,  9, v9->as_VMReg()->next(2) );
 212   reg_def V9_K ( SOC, SOC, Op_RegF,  9, v9->as_VMReg()->next(3) );
 213 
 214   reg_def V10  ( SOC, SOC, Op_RegF, 10, v10->as_VMReg()         );
 215   reg_def V10_H( SOC, SOC, Op_RegF, 10, v10->as_VMReg()->next() );
 216   reg_def V10_J( SOC, SOC, Op_RegF, 10, v10->as_VMReg()->next(2));
 217   reg_def V10_K( SOC, SOC, Op_RegF, 10, v10->as_VMReg()->next(3));
 218 
 219   reg_def V11  ( SOC, SOC, Op_RegF, 11, v11->as_VMReg()         );
 220   reg_def V11_H( SOC, SOC, Op_RegF, 11, v11->as_VMReg()->next() );
 221   reg_def V11_J( SOC, SOC, Op_RegF, 11, v11->as_VMReg()->next(2));
 222   reg_def V11_K( SOC, SOC, Op_RegF, 11, v11->as_VMReg()->next(3));
 223 
 224   reg_def V12  ( SOC, SOC, Op_RegF, 12, v12->as_VMReg()         );
 225   reg_def V12_H( SOC, SOC, Op_RegF, 12, v12->as_VMReg()->next() );
 226   reg_def V12_J( SOC, SOC, Op_RegF, 12, v12->as_VMReg()->next(2));
 227   reg_def V12_K( SOC, SOC, Op_RegF, 12, v12->as_VMReg()->next(3));
 228 
 229   reg_def V13  ( SOC, SOC, Op_RegF, 13, v13->as_VMReg()         );
 230   reg_def V13_H( SOC, SOC, Op_RegF, 13, v13->as_VMReg()->next() );
 231   reg_def V13_J( SOC, SOC, Op_RegF, 13, v13->as_VMReg()->next(2));
 232   reg_def V13_K( SOC, SOC, Op_RegF, 13, v13->as_VMReg()->next(3));
 233 
 234   reg_def V14  ( SOC, SOC, Op_RegF, 14, v14->as_VMReg()         );
 235   reg_def V14_H( SOC, SOC, Op_RegF, 14, v14->as_VMReg()->next() );
 236   reg_def V14_J( SOC, SOC, Op_RegF, 14, v14->as_VMReg()->next(2));
 237   reg_def V14_K( SOC, SOC, Op_RegF, 14, v14->as_VMReg()->next(3));
 238 
 239   reg_def V15  ( SOC, SOC, Op_RegF, 15, v15->as_VMReg()         );
 240   reg_def V15_H( SOC, SOC, Op_RegF, 15, v15->as_VMReg()->next() );
 241   reg_def V15_J( SOC, SOC, Op_RegF, 15, v15->as_VMReg()->next(2));
 242   reg_def V15_K( SOC, SOC, Op_RegF, 15, v15->as_VMReg()->next(3));
 243 
 244   reg_def V16  ( SOC, SOC, Op_RegF, 16, v16->as_VMReg()         );
 245   reg_def V16_H( SOC, SOC, Op_RegF, 16, v16->as_VMReg()->next() );
 246   reg_def V16_J( SOC, SOC, Op_RegF, 16, v16->as_VMReg()->next(2));
 247   reg_def V16_K( SOC, SOC, Op_RegF, 16, v16->as_VMReg()->next(3));
 248 
 249   reg_def V17  ( SOC, SOC, Op_RegF, 17, v17->as_VMReg()         );
 250   reg_def V17_H( SOC, SOC, Op_RegF, 17, v17->as_VMReg()->next() );
 251   reg_def V17_J( SOC, SOC, Op_RegF, 17, v17->as_VMReg()->next(2));
 252   reg_def V17_K( SOC, SOC, Op_RegF, 17, v17->as_VMReg()->next(3));
 253 
 254   reg_def V18  ( SOC, SOC, Op_RegF, 18, v18->as_VMReg()         );
 255   reg_def V18_H( SOC, SOC, Op_RegF, 18, v18->as_VMReg()->next() );
 256   reg_def V18_J( SOC, SOC, Op_RegF, 18, v18->as_VMReg()->next(2));
 257   reg_def V18_K( SOC, SOC, Op_RegF, 18, v18->as_VMReg()->next(3));
 258 
 259   reg_def V19  ( SOC, SOC, Op_RegF, 19, v19->as_VMReg()         );
 260   reg_def V19_H( SOC, SOC, Op_RegF, 19, v19->as_VMReg()->next() );
 261   reg_def V19_J( SOC, SOC, Op_RegF, 19, v19->as_VMReg()->next(2));
 262   reg_def V19_K( SOC, SOC, Op_RegF, 19, v19->as_VMReg()->next(3));
 263 
 264   reg_def V20  ( SOC, SOC, Op_RegF, 20, v20->as_VMReg()         );
 265   reg_def V20_H( SOC, SOC, Op_RegF, 20, v20->as_VMReg()->next() );
 266   reg_def V20_J( SOC, SOC, Op_RegF, 20, v20->as_VMReg()->next(2));
 267   reg_def V20_K( SOC, SOC, Op_RegF, 20, v20->as_VMReg()->next(3));
 268 
 269   reg_def V21  ( SOC, SOC, Op_RegF, 21, v21->as_VMReg()         );
 270   reg_def V21_H( SOC, SOC, Op_RegF, 21, v21->as_VMReg()->next() );
 271   reg_def V21_J( SOC, SOC, Op_RegF, 21, v21->as_VMReg()->next(2));
 272   reg_def V21_K( SOC, SOC, Op_RegF, 21, v21->as_VMReg()->next(3));
 273 
 274   reg_def V22  ( SOC, SOC, Op_RegF, 22, v22->as_VMReg()         );
 275   reg_def V22_H( SOC, SOC, Op_RegF, 22, v22->as_VMReg()->next() );
 276   reg_def V22_J( SOC, SOC, Op_RegF, 22, v22->as_VMReg()->next(2));
 277   reg_def V22_K( SOC, SOC, Op_RegF, 22, v22->as_VMReg()->next(3));
 278 
 279   reg_def V23  ( SOC, SOC, Op_RegF, 23, v23->as_VMReg()         );
 280   reg_def V23_H( SOC, SOC, Op_RegF, 23, v23->as_VMReg()->next() );
 281   reg_def V23_J( SOC, SOC, Op_RegF, 23, v23->as_VMReg()->next(2));
 282   reg_def V23_K( SOC, SOC, Op_RegF, 23, v23->as_VMReg()->next(3));
 283 
 284   reg_def V24  ( SOC, SOC, Op_RegF, 24, v24->as_VMReg()         );
 285   reg_def V24_H( SOC, SOC, Op_RegF, 24, v24->as_VMReg()->next() );
 286   reg_def V24_J( SOC, SOC, Op_RegF, 24, v24->as_VMReg()->next(2));
 287   reg_def V24_K( SOC, SOC, Op_RegF, 24, v24->as_VMReg()->next(3));
 288 
 289   reg_def V25  ( SOC, SOC, Op_RegF, 25, v25->as_VMReg()         );
 290   reg_def V25_H( SOC, SOC, Op_RegF, 25, v25->as_VMReg()->next() );
 291   reg_def V25_J( SOC, SOC, Op_RegF, 25, v25->as_VMReg()->next(2));
 292   reg_def V25_K( SOC, SOC, Op_RegF, 25, v25->as_VMReg()->next(3));
 293 
 294   reg_def V26  ( SOC, SOC, Op_RegF, 26, v26->as_VMReg()         );
 295   reg_def V26_H( SOC, SOC, Op_RegF, 26, v26->as_VMReg()->next() );
 296   reg_def V26_J( SOC, SOC, Op_RegF, 26, v26->as_VMReg()->next(2));
 297   reg_def V26_K( SOC, SOC, Op_RegF, 26, v26->as_VMReg()->next(3));
 298 
 299   reg_def V27  ( SOC, SOC, Op_RegF, 27, v27->as_VMReg()         );
 300   reg_def V27_H( SOC, SOC, Op_RegF, 27, v27->as_VMReg()->next() );
 301   reg_def V27_J( SOC, SOC, Op_RegF, 27, v27->as_VMReg()->next(2));
 302   reg_def V27_K( SOC, SOC, Op_RegF, 27, v27->as_VMReg()->next(3));
 303 
 304   reg_def V28  ( SOC, SOC, Op_RegF, 28, v28->as_VMReg()         );
 305   reg_def V28_H( SOC, SOC, Op_RegF, 28, v28->as_VMReg()->next() );
 306   reg_def V28_J( SOC, SOC, Op_RegF, 28, v28->as_VMReg()->next(2));
 307   reg_def V28_K( SOC, SOC, Op_RegF, 28, v28->as_VMReg()->next(3));
 308 
 309   reg_def V29  ( SOC, SOC, Op_RegF, 29, v29->as_VMReg()         );
 310   reg_def V29_H( SOC, SOC, Op_RegF, 29, v29->as_VMReg()->next() );
 311   reg_def V29_J( SOC, SOC, Op_RegF, 29, v29->as_VMReg()->next(2));
 312   reg_def V29_K( SOC, SOC, Op_RegF, 29, v29->as_VMReg()->next(3));
 313 
 314   reg_def V30  ( SOC, SOC, Op_RegF, 30, v30->as_VMReg()         );
 315   reg_def V30_H( SOC, SOC, Op_RegF, 30, v30->as_VMReg()->next() );
 316   reg_def V30_J( SOC, SOC, Op_RegF, 30, v30->as_VMReg()->next(2));
 317   reg_def V30_K( SOC, SOC, Op_RegF, 30, v30->as_VMReg()->next(3));
 318 
 319   reg_def V31  ( SOC, SOC, Op_RegF, 31, v31->as_VMReg()         );
 320   reg_def V31_H( SOC, SOC, Op_RegF, 31, v31->as_VMReg()->next() );
 321   reg_def V31_J( SOC, SOC, Op_RegF, 31, v31->as_VMReg()->next(2));
 322   reg_def V31_K( SOC, SOC, Op_RegF, 31, v31->as_VMReg()->next(3));
 323 
 324 // ----------------------------
 325 // Special Registers
 326 // ----------------------------
 327 
 328 // the AArch64 CSPR status flag register is not directly acessible as
 329 // instruction operand. the FPSR status flag register is a system
 330 // register which can be written/read using MSR/MRS but again does not
 331 // appear as an operand (a code identifying the FSPR occurs as an
 332 // immediate value in the instruction).
 333 
 334 reg_def RFLAGS(SOC, SOC, 0, 32, VMRegImpl::Bad());
 335 
 336 
 337 // Specify priority of register selection within phases of register
 338 // allocation.  Highest priority is first.  A useful heuristic is to
 339 // give registers a low priority when they are required by machine
 340 // instructions, like EAX and EDX on I486, and choose no-save registers
 341 // before save-on-call, & save-on-call before save-on-entry.  Registers
 342 // which participate in fixed calling sequences should come last.
 343 // Registers which are used as pairs must fall on an even boundary.
 344 
 345 alloc_class chunk0(
 346     // volatiles
 347     R10, R10_H,
 348     R11, R11_H,
 349     R12, R12_H,
 350     R13, R13_H,
 351     R14, R14_H,
 352     R15, R15_H,
 353     R16, R16_H,
 354     R17, R17_H,
 355     R18, R18_H,
 356 
 357     // arg registers
 358     R0, R0_H,
 359     R1, R1_H,
 360     R2, R2_H,
 361     R3, R3_H,
 362     R4, R4_H,
 363     R5, R5_H,
 364     R6, R6_H,
 365     R7, R7_H,
 366 
 367     // non-volatiles
 368     R19, R19_H,
 369     R20, R20_H,
 370     R21, R21_H,
 371     R22, R22_H,
 372     R23, R23_H,
 373     R24, R24_H,
 374     R25, R25_H,
 375     R26, R26_H,
 376 
 377     // non-allocatable registers
 378 
 379     R27, R27_H, // heapbase
 380     R28, R28_H, // thread
 381     R29, R29_H, // fp
 382     R30, R30_H, // lr
 383     R31, R31_H, // sp
 384 );
 385 
 386 alloc_class chunk1(
 387 
 388     // no save
 389     V16, V16_H, V16_J, V16_K,
 390     V17, V17_H, V17_J, V17_K,
 391     V18, V18_H, V18_J, V18_K,
 392     V19, V19_H, V19_J, V19_K,
 393     V20, V20_H, V20_J, V20_K,
 394     V21, V21_H, V21_J, V21_K,
 395     V22, V22_H, V22_J, V22_K,
 396     V23, V23_H, V23_J, V23_K,
 397     V24, V24_H, V24_J, V24_K,
 398     V25, V25_H, V25_J, V25_K,
 399     V26, V26_H, V26_J, V26_K,
 400     V27, V27_H, V27_J, V27_K,
 401     V28, V28_H, V28_J, V28_K,
 402     V29, V29_H, V29_J, V29_K,
 403     V30, V30_H, V30_J, V30_K,
 404     V31, V31_H, V31_J, V31_K,
 405 
 406     // arg registers
 407     V0, V0_H, V0_J, V0_K,
 408     V1, V1_H, V1_J, V1_K,
 409     V2, V2_H, V2_J, V2_K,
 410     V3, V3_H, V3_J, V3_K,
 411     V4, V4_H, V4_J, V4_K,
 412     V5, V5_H, V5_J, V5_K,
 413     V6, V6_H, V6_J, V6_K,
 414     V7, V7_H, V7_J, V7_K,
 415 
 416     // non-volatiles
 417     V8, V8_H, V8_J, V8_K,
 418     V9, V9_H, V9_J, V9_K,
 419     V10, V10_H, V10_J, V10_K,
 420     V11, V11_H, V11_J, V11_K,
 421     V12, V12_H, V12_J, V12_K,
 422     V13, V13_H, V13_J, V13_K,
 423     V14, V14_H, V14_J, V14_K,
 424     V15, V15_H, V15_J, V15_K,
 425 );
 426 
 427 alloc_class chunk2(RFLAGS);
 428 
 429 //----------Architecture Description Register Classes--------------------------
 430 // Several register classes are automatically defined based upon information in
 431 // this architecture description.
 432 // 1) reg_class inline_cache_reg           ( /* as def'd in frame section */ )
 433 // 2) reg_class compiler_method_oop_reg    ( /* as def'd in frame section */ )
 434 // 2) reg_class interpreter_method_oop_reg ( /* as def'd in frame section */ )
 435 // 3) reg_class stack_slots( /* one chunk of stack-based "registers" */ )
 436 //
 437 
 438 // Class for all 32 bit general purpose registers
 439 reg_class all_reg32(
 440     R0,
 441     R1,
 442     R2,
 443     R3,
 444     R4,
 445     R5,
 446     R6,
 447     R7,
 448     R10,
 449     R11,
 450     R12,
 451     R13,
 452     R14,
 453     R15,
 454     R16,
 455     R17,
 456     R18,
 457     R19,
 458     R20,
 459     R21,
 460     R22,
 461     R23,
 462     R24,
 463     R25,
 464     R26,
 465     R27,
 466     R28,
 467     R29,
 468     R30,
 469     R31
 470 );
 471 
 472 
 473 // Class for all 32 bit integer registers (excluding SP which
 474 // will never be used as an integer register)
 475 reg_class any_reg32 %{
 476   return _ANY_REG32_mask;
 477 %}
 478 
 479 // Singleton class for R0 int register
 480 reg_class int_r0_reg(R0);
 481 
 482 // Singleton class for R2 int register
 483 reg_class int_r2_reg(R2);
 484 
 485 // Singleton class for R3 int register
 486 reg_class int_r3_reg(R3);
 487 
 488 // Singleton class for R4 int register
 489 reg_class int_r4_reg(R4);
 490 
 491 // Singleton class for R31 int register
 492 reg_class int_r31_reg(R31);
 493 
 494 // Class for all 64 bit general purpose registers
 495 reg_class all_reg(
 496     R0, R0_H,
 497     R1, R1_H,
 498     R2, R2_H,
 499     R3, R3_H,
 500     R4, R4_H,
 501     R5, R5_H,
 502     R6, R6_H,
 503     R7, R7_H,
 504     R10, R10_H,
 505     R11, R11_H,
 506     R12, R12_H,
 507     R13, R13_H,
 508     R14, R14_H,
 509     R15, R15_H,
 510     R16, R16_H,
 511     R17, R17_H,
 512     R18, R18_H,
 513     R19, R19_H,
 514     R20, R20_H,
 515     R21, R21_H,
 516     R22, R22_H,
 517     R23, R23_H,
 518     R24, R24_H,
 519     R25, R25_H,
 520     R26, R26_H,
 521     R27, R27_H,
 522     R28, R28_H,
 523     R29, R29_H,
 524     R30, R30_H,
 525     R31, R31_H
 526 );
 527 
 528 // Class for all long integer registers (including SP)
 529 reg_class any_reg %{
 530   return _ANY_REG_mask;
 531 %}
 532 
 533 // Class for non-allocatable 32 bit registers
 534 reg_class non_allocatable_reg32(
 535     R28,                        // thread
 536     R30,                        // lr
 537     R31                         // sp
 538 );
 539 
 540 // Class for non-allocatable 64 bit registers
 541 reg_class non_allocatable_reg(
 542     R28, R28_H,                 // thread
 543     R30, R30_H,                 // lr
 544     R31, R31_H                  // sp
 545 );
 546 
 547 // Class for all non-special integer registers
 548 reg_class no_special_reg32 %{
 549   return _NO_SPECIAL_REG32_mask;
 550 %}
 551 
 552 // Class for all non-special long integer registers
 553 reg_class no_special_reg %{
 554   return _NO_SPECIAL_REG_mask;
 555 %}
 556 
 557 // Class for 64 bit register r0
 558 reg_class r0_reg(
 559     R0, R0_H
 560 );
 561 
 562 // Class for 64 bit register r1
 563 reg_class r1_reg(
 564     R1, R1_H
 565 );
 566 
 567 // Class for 64 bit register r2
 568 reg_class r2_reg(
 569     R2, R2_H
 570 );
 571 
 572 // Class for 64 bit register r3
 573 reg_class r3_reg(
 574     R3, R3_H
 575 );
 576 
 577 // Class for 64 bit register r4
 578 reg_class r4_reg(
 579     R4, R4_H
 580 );
 581 
 582 // Class for 64 bit register r5
 583 reg_class r5_reg(
 584     R5, R5_H
 585 );
 586 
 587 // Class for 64 bit register r10
 588 reg_class r10_reg(
 589     R10, R10_H
 590 );
 591 
 592 // Class for 64 bit register r11
 593 reg_class r11_reg(
 594     R11, R11_H
 595 );
 596 
 597 // Class for method register
 598 reg_class method_reg(
 599     R12, R12_H
 600 );
 601 
 602 // Class for heapbase register
 603 reg_class heapbase_reg(
 604     R27, R27_H
 605 );
 606 
 607 // Class for thread register
 608 reg_class thread_reg(
 609     R28, R28_H
 610 );
 611 
 612 // Class for frame pointer register
 613 reg_class fp_reg(
 614     R29, R29_H
 615 );
 616 
 617 // Class for link register
 618 reg_class lr_reg(
 619     R30, R30_H
 620 );
 621 
 622 // Class for long sp register
 623 reg_class sp_reg(
 624   R31, R31_H
 625 );
 626 
 627 // Class for all pointer registers
 628 reg_class ptr_reg %{
 629   return _PTR_REG_mask;
 630 %}
 631 
 632 // Class for all non_special pointer registers
 633 reg_class no_special_ptr_reg %{
 634   return _NO_SPECIAL_PTR_REG_mask;
 635 %}
 636 
 637 // Class for all float registers
 638 reg_class float_reg(
 639     V0,
 640     V1,
 641     V2,
 642     V3,
 643     V4,
 644     V5,
 645     V6,
 646     V7,
 647     V8,
 648     V9,
 649     V10,
 650     V11,
 651     V12,
 652     V13,
 653     V14,
 654     V15,
 655     V16,
 656     V17,
 657     V18,
 658     V19,
 659     V20,
 660     V21,
 661     V22,
 662     V23,
 663     V24,
 664     V25,
 665     V26,
 666     V27,
 667     V28,
 668     V29,
 669     V30,
 670     V31
 671 );
 672 
 673 // Double precision float registers have virtual `high halves' that
 674 // are needed by the allocator.
 675 // Class for all double registers
 676 reg_class double_reg(
 677     V0, V0_H,
 678     V1, V1_H,
 679     V2, V2_H,
 680     V3, V3_H,
 681     V4, V4_H,
 682     V5, V5_H,
 683     V6, V6_H,
 684     V7, V7_H,
 685     V8, V8_H,
 686     V9, V9_H,
 687     V10, V10_H,
 688     V11, V11_H,
 689     V12, V12_H,
 690     V13, V13_H,
 691     V14, V14_H,
 692     V15, V15_H,
 693     V16, V16_H,
 694     V17, V17_H,
 695     V18, V18_H,
 696     V19, V19_H,
 697     V20, V20_H,
 698     V21, V21_H,
 699     V22, V22_H,
 700     V23, V23_H,
 701     V24, V24_H,
 702     V25, V25_H,
 703     V26, V26_H,
 704     V27, V27_H,
 705     V28, V28_H,
 706     V29, V29_H,
 707     V30, V30_H,
 708     V31, V31_H
 709 );
 710 
 711 // Class for all 64bit vector registers
 712 reg_class vectord_reg(
 713     V0, V0_H,
 714     V1, V1_H,
 715     V2, V2_H,
 716     V3, V3_H,
 717     V4, V4_H,
 718     V5, V5_H,
 719     V6, V6_H,
 720     V7, V7_H,
 721     V8, V8_H,
 722     V9, V9_H,
 723     V10, V10_H,
 724     V11, V11_H,
 725     V12, V12_H,
 726     V13, V13_H,
 727     V14, V14_H,
 728     V15, V15_H,
 729     V16, V16_H,
 730     V17, V17_H,
 731     V18, V18_H,
 732     V19, V19_H,
 733     V20, V20_H,
 734     V21, V21_H,
 735     V22, V22_H,
 736     V23, V23_H,
 737     V24, V24_H,
 738     V25, V25_H,
 739     V26, V26_H,
 740     V27, V27_H,
 741     V28, V28_H,
 742     V29, V29_H,
 743     V30, V30_H,
 744     V31, V31_H
 745 );
 746 
 747 // Class for all 128bit vector registers
 748 reg_class vectorx_reg(
 749     V0, V0_H, V0_J, V0_K,
 750     V1, V1_H, V1_J, V1_K,
 751     V2, V2_H, V2_J, V2_K,
 752     V3, V3_H, V3_J, V3_K,
 753     V4, V4_H, V4_J, V4_K,
 754     V5, V5_H, V5_J, V5_K,
 755     V6, V6_H, V6_J, V6_K,
 756     V7, V7_H, V7_J, V7_K,
 757     V8, V8_H, V8_J, V8_K,
 758     V9, V9_H, V9_J, V9_K,
 759     V10, V10_H, V10_J, V10_K,
 760     V11, V11_H, V11_J, V11_K,
 761     V12, V12_H, V12_J, V12_K,
 762     V13, V13_H, V13_J, V13_K,
 763     V14, V14_H, V14_J, V14_K,
 764     V15, V15_H, V15_J, V15_K,
 765     V16, V16_H, V16_J, V16_K,
 766     V17, V17_H, V17_J, V17_K,
 767     V18, V18_H, V18_J, V18_K,
 768     V19, V19_H, V19_J, V19_K,
 769     V20, V20_H, V20_J, V20_K,
 770     V21, V21_H, V21_J, V21_K,
 771     V22, V22_H, V22_J, V22_K,
 772     V23, V23_H, V23_J, V23_K,
 773     V24, V24_H, V24_J, V24_K,
 774     V25, V25_H, V25_J, V25_K,
 775     V26, V26_H, V26_J, V26_K,
 776     V27, V27_H, V27_J, V27_K,
 777     V28, V28_H, V28_J, V28_K,
 778     V29, V29_H, V29_J, V29_K,
 779     V30, V30_H, V30_J, V30_K,
 780     V31, V31_H, V31_J, V31_K
 781 );
 782 
 783 // Class for 128 bit register v0
 784 reg_class v0_reg(
 785     V0, V0_H
 786 );
 787 
 788 // Class for 128 bit register v1
 789 reg_class v1_reg(
 790     V1, V1_H
 791 );
 792 
 793 // Class for 128 bit register v2
 794 reg_class v2_reg(
 795     V2, V2_H
 796 );
 797 
 798 // Class for 128 bit register v3
 799 reg_class v3_reg(
 800     V3, V3_H
 801 );
 802 
 803 // Class for 128 bit register v4
 804 reg_class v4_reg(
 805     V4, V4_H
 806 );
 807 
 808 // Class for 128 bit register v5
 809 reg_class v5_reg(
 810     V5, V5_H
 811 );
 812 
 813 // Class for 128 bit register v6
 814 reg_class v6_reg(
 815     V6, V6_H
 816 );
 817 
 818 // Class for 128 bit register v7
 819 reg_class v7_reg(
 820     V7, V7_H
 821 );
 822 
 823 // Class for 128 bit register v8
 824 reg_class v8_reg(
 825     V8, V8_H
 826 );
 827 
 828 // Class for 128 bit register v9
 829 reg_class v9_reg(
 830     V9, V9_H
 831 );
 832 
 833 // Class for 128 bit register v10
 834 reg_class v10_reg(
 835     V10, V10_H
 836 );
 837 
 838 // Class for 128 bit register v11
 839 reg_class v11_reg(
 840     V11, V11_H
 841 );
 842 
 843 // Class for 128 bit register v12
 844 reg_class v12_reg(
 845     V12, V12_H
 846 );
 847 
 848 // Class for 128 bit register v13
 849 reg_class v13_reg(
 850     V13, V13_H
 851 );
 852 
 853 // Class for 128 bit register v14
 854 reg_class v14_reg(
 855     V14, V14_H
 856 );
 857 
 858 // Class for 128 bit register v15
 859 reg_class v15_reg(
 860     V15, V15_H
 861 );
 862 
 863 // Class for 128 bit register v16
 864 reg_class v16_reg(
 865     V16, V16_H
 866 );
 867 
 868 // Class for 128 bit register v17
 869 reg_class v17_reg(
 870     V17, V17_H
 871 );
 872 
 873 // Class for 128 bit register v18
 874 reg_class v18_reg(
 875     V18, V18_H
 876 );
 877 
 878 // Class for 128 bit register v19
 879 reg_class v19_reg(
 880     V19, V19_H
 881 );
 882 
 883 // Class for 128 bit register v20
 884 reg_class v20_reg(
 885     V20, V20_H
 886 );
 887 
 888 // Class for 128 bit register v21
 889 reg_class v21_reg(
 890     V21, V21_H
 891 );
 892 
 893 // Class for 128 bit register v22
 894 reg_class v22_reg(
 895     V22, V22_H
 896 );
 897 
 898 // Class for 128 bit register v23
 899 reg_class v23_reg(
 900     V23, V23_H
 901 );
 902 
 903 // Class for 128 bit register v24
 904 reg_class v24_reg(
 905     V24, V24_H
 906 );
 907 
 908 // Class for 128 bit register v25
 909 reg_class v25_reg(
 910     V25, V25_H
 911 );
 912 
 913 // Class for 128 bit register v26
 914 reg_class v26_reg(
 915     V26, V26_H
 916 );
 917 
 918 // Class for 128 bit register v27
 919 reg_class v27_reg(
 920     V27, V27_H
 921 );
 922 
 923 // Class for 128 bit register v28
 924 reg_class v28_reg(
 925     V28, V28_H
 926 );
 927 
 928 // Class for 128 bit register v29
 929 reg_class v29_reg(
 930     V29, V29_H
 931 );
 932 
 933 // Class for 128 bit register v30
 934 reg_class v30_reg(
 935     V30, V30_H
 936 );
 937 
 938 // Class for 128 bit register v31
 939 reg_class v31_reg(
 940     V31, V31_H
 941 );
 942 
 943 // Singleton class for condition codes
 944 reg_class int_flags(RFLAGS);
 945 
 946 %}
 947 
 948 //----------DEFINITION BLOCK---------------------------------------------------
 949 // Define name --> value mappings to inform the ADLC of an integer valued name
 950 // Current support includes integer values in the range [0, 0x7FFFFFFF]
 951 // Format:
 952 //        int_def  <name>         ( <int_value>, <expression>);
 953 // Generated Code in ad_<arch>.hpp
 954 //        #define  <name>   (<expression>)
 955 //        // value == <int_value>
 956 // Generated code in ad_<arch>.cpp adlc_verification()
 957 //        assert( <name> == <int_value>, "Expect (<expression>) to equal <int_value>");
 958 //
 959 
 960 // we follow the ppc-aix port in using a simple cost model which ranks
 961 // register operations as cheap, memory ops as more expensive and
 962 // branches as most expensive. the first two have a low as well as a
 963 // normal cost. huge cost appears to be a way of saying don't do
 964 // something
 965 
 966 definitions %{
 967   // The default cost (of a register move instruction).
 968   int_def INSN_COST            (    100,     100);
 969   int_def BRANCH_COST          (    200,     2 * INSN_COST);
 970   int_def CALL_COST            (    200,     2 * INSN_COST);
 971   int_def VOLATILE_REF_COST    (   1000,     10 * INSN_COST);
 972 %}
 973 
 974 
 975 //----------SOURCE BLOCK-------------------------------------------------------
 976 // This is a block of C++ code which provides values, functions, and
 977 // definitions necessary in the rest of the architecture description
 978 
 979 source_hpp %{
 980 
 981 #include "asm/macroAssembler.hpp"
 982 #include "gc/shared/cardTable.hpp"
 983 #include "gc/shared/cardTableBarrierSet.hpp"
 984 #include "gc/shared/collectedHeap.hpp"
 985 #include "opto/addnode.hpp"
 986 #include "opto/convertnode.hpp"
 987 
 988 extern RegMask _ANY_REG32_mask;
 989 extern RegMask _ANY_REG_mask;
 990 extern RegMask _PTR_REG_mask;
 991 extern RegMask _NO_SPECIAL_REG32_mask;
 992 extern RegMask _NO_SPECIAL_REG_mask;
 993 extern RegMask _NO_SPECIAL_PTR_REG_mask;
 994 
 995 class CallStubImpl {
 996 
 997   //--------------------------------------------------------------
 998   //---<  Used for optimization in Compile::shorten_branches  >---
 999   //--------------------------------------------------------------
1000 
1001  public:
1002   // Size of call trampoline stub.
1003   static uint size_call_trampoline() {
1004     return 0; // no call trampolines on this platform
1005   }
1006 
1007   // number of relocations needed by a call trampoline stub
1008   static uint reloc_call_trampoline() {
1009     return 0; // no call trampolines on this platform
1010   }
1011 };
1012 
1013 class HandlerImpl {
1014 
1015  public:
1016 
1017   static int emit_exception_handler(CodeBuffer &cbuf);
1018   static int emit_deopt_handler(CodeBuffer& cbuf);
1019 
1020   static uint size_exception_handler() {
1021     return MacroAssembler::far_branch_size();
1022   }
1023 
1024   static uint size_deopt_handler() {
1025     // count one adr and one far branch instruction
1026     return 4 * NativeInstruction::instruction_size;
1027   }
1028 };
1029 
1030 class Node::PD {
1031 public:
1032   enum NodeFlags {
1033     _last_flag = Node::_last_flag
1034   };
1035 };
1036 
1037  bool is_CAS(int opcode, bool maybe_volatile);
1038 
1039   // predicates controlling emit of ldr<x>/ldar<x> and associated dmb
1040 
1041   bool unnecessary_acquire(const Node *barrier);
1042   bool needs_acquiring_load(const Node *load);
1043 
1044   // predicates controlling emit of str<x>/stlr<x> and associated dmbs
1045 
1046   bool unnecessary_release(const Node *barrier);
1047   bool unnecessary_volatile(const Node *barrier);
1048   bool needs_releasing_store(const Node *store);
1049 
1050   // predicate controlling translation of CompareAndSwapX
1051   bool needs_acquiring_load_exclusive(const Node *load);
1052 
1053   // predicate controlling addressing modes
1054   bool size_fits_all_mem_uses(AddPNode* addp, int shift);
1055 %}
1056 
1057 source %{
1058 
1059   // Derived RegMask with conditionally allocatable registers
1060 
1061   void PhaseOutput::pd_perform_mach_node_analysis() {
1062   }
1063 
1064   int MachNode::pd_alignment_required() const {
1065     return 1;
1066   }
1067 
1068   int MachNode::compute_padding(int current_offset) const {
1069     return 0;
1070   }
1071 
1072   RegMask _ANY_REG32_mask;
1073   RegMask _ANY_REG_mask;
1074   RegMask _PTR_REG_mask;
1075   RegMask _NO_SPECIAL_REG32_mask;
1076   RegMask _NO_SPECIAL_REG_mask;
1077   RegMask _NO_SPECIAL_PTR_REG_mask;
1078 
1079   void reg_mask_init() {
1080     // We derive below RegMask(s) from the ones which are auto-generated from
1081     // adlc register classes to make AArch64 rheapbase (r27) and rfp (r29)
1082     // registers conditionally reserved.
1083 
1084     _ANY_REG32_mask = _ALL_REG32_mask;
1085     _ANY_REG32_mask.Remove(OptoReg::as_OptoReg(r31_sp->as_VMReg()));
1086 
1087     _ANY_REG_mask = _ALL_REG_mask;
1088 
1089     _PTR_REG_mask = _ALL_REG_mask;
1090 
1091     _NO_SPECIAL_REG32_mask = _ALL_REG32_mask;
1092     _NO_SPECIAL_REG32_mask.SUBTRACT(_NON_ALLOCATABLE_REG32_mask);
1093 
1094     _NO_SPECIAL_REG_mask = _ALL_REG_mask;
1095     _NO_SPECIAL_REG_mask.SUBTRACT(_NON_ALLOCATABLE_REG_mask);
1096 
1097     _NO_SPECIAL_PTR_REG_mask = _ALL_REG_mask;
1098     _NO_SPECIAL_PTR_REG_mask.SUBTRACT(_NON_ALLOCATABLE_REG_mask);
1099 
1100     // r27 is not allocatable when compressed oops is on and heapbase is not
1101     // zero, compressed klass pointers doesn't use r27 after JDK-8234794
1102     if (UseCompressedOops && CompressedOops::ptrs_base() != NULL) {
1103       _NO_SPECIAL_REG32_mask.Remove(OptoReg::as_OptoReg(r27->as_VMReg()));
1104       _NO_SPECIAL_REG_mask.SUBTRACT(_HEAPBASE_REG_mask);
1105       _NO_SPECIAL_PTR_REG_mask.SUBTRACT(_HEAPBASE_REG_mask);
1106     }
1107 
1108     // r29 is not allocatable when PreserveFramePointer is on
1109     if (PreserveFramePointer) {
1110       _NO_SPECIAL_REG32_mask.Remove(OptoReg::as_OptoReg(r29->as_VMReg()));
1111       _NO_SPECIAL_REG_mask.SUBTRACT(_FP_REG_mask);
1112       _NO_SPECIAL_PTR_REG_mask.SUBTRACT(_FP_REG_mask);
1113     }
1114   }
1115 
1116   // Optimizaton of volatile gets and puts
1117   // -------------------------------------
1118   //
1119   // AArch64 has ldar<x> and stlr<x> instructions which we can safely
1120   // use to implement volatile reads and writes. For a volatile read
1121   // we simply need
1122   //
1123   //   ldar<x>
1124   //
1125   // and for a volatile write we need
1126   //
1127   //   stlr<x>
1128   //
1129   // Alternatively, we can implement them by pairing a normal
1130   // load/store with a memory barrier. For a volatile read we need
1131   //
1132   //   ldr<x>
1133   //   dmb ishld
1134   //
1135   // for a volatile write
1136   //
1137   //   dmb ish
1138   //   str<x>
1139   //   dmb ish
1140   //
1141   // We can also use ldaxr and stlxr to implement compare and swap CAS
1142   // sequences. These are normally translated to an instruction
1143   // sequence like the following
1144   //
1145   //   dmb      ish
1146   // retry:
1147   //   ldxr<x>   rval raddr
1148   //   cmp       rval rold
1149   //   b.ne done
1150   //   stlxr<x>  rval, rnew, rold
1151   //   cbnz      rval retry
1152   // done:
1153   //   cset      r0, eq
1154   //   dmb ishld
1155   //
1156   // Note that the exclusive store is already using an stlxr
1157   // instruction. That is required to ensure visibility to other
1158   // threads of the exclusive write (assuming it succeeds) before that
1159   // of any subsequent writes.
1160   //
1161   // The following instruction sequence is an improvement on the above
1162   //
1163   // retry:
1164   //   ldaxr<x>  rval raddr
1165   //   cmp       rval rold
1166   //   b.ne done
1167   //   stlxr<x>  rval, rnew, rold
1168   //   cbnz      rval retry
1169   // done:
1170   //   cset      r0, eq
1171   //
1172   // We don't need the leading dmb ish since the stlxr guarantees
1173   // visibility of prior writes in the case that the swap is
1174   // successful. Crucially we don't have to worry about the case where
1175   // the swap is not successful since no valid program should be
1176   // relying on visibility of prior changes by the attempting thread
1177   // in the case where the CAS fails.
1178   //
1179   // Similarly, we don't need the trailing dmb ishld if we substitute
1180   // an ldaxr instruction since that will provide all the guarantees we
1181   // require regarding observation of changes made by other threads
1182   // before any change to the CAS address observed by the load.
1183   //
1184   // In order to generate the desired instruction sequence we need to
1185   // be able to identify specific 'signature' ideal graph node
1186   // sequences which i) occur as a translation of a volatile reads or
1187   // writes or CAS operations and ii) do not occur through any other
1188   // translation or graph transformation. We can then provide
1189   // alternative aldc matching rules which translate these node
1190   // sequences to the desired machine code sequences. Selection of the
1191   // alternative rules can be implemented by predicates which identify
1192   // the relevant node sequences.
1193   //
1194   // The ideal graph generator translates a volatile read to the node
1195   // sequence
1196   //
1197   //   LoadX[mo_acquire]
1198   //   MemBarAcquire
1199   //
1200   // As a special case when using the compressed oops optimization we
1201   // may also see this variant
1202   //
1203   //   LoadN[mo_acquire]
1204   //   DecodeN
1205   //   MemBarAcquire
1206   //
1207   // A volatile write is translated to the node sequence
1208   //
1209   //   MemBarRelease
1210   //   StoreX[mo_release] {CardMark}-optional
1211   //   MemBarVolatile
1212   //
1213   // n.b. the above node patterns are generated with a strict
1214   // 'signature' configuration of input and output dependencies (see
1215   // the predicates below for exact details). The card mark may be as
1216   // simple as a few extra nodes or, in a few GC configurations, may
1217   // include more complex control flow between the leading and
1218   // trailing memory barriers. However, whatever the card mark
1219   // configuration these signatures are unique to translated volatile
1220   // reads/stores -- they will not appear as a result of any other
1221   // bytecode translation or inlining nor as a consequence of
1222   // optimizing transforms.
1223   //
1224   // We also want to catch inlined unsafe volatile gets and puts and
1225   // be able to implement them using either ldar<x>/stlr<x> or some
1226   // combination of ldr<x>/stlr<x> and dmb instructions.
1227   //
1228   // Inlined unsafe volatiles puts manifest as a minor variant of the
1229   // normal volatile put node sequence containing an extra cpuorder
1230   // membar
1231   //
1232   //   MemBarRelease
1233   //   MemBarCPUOrder
1234   //   StoreX[mo_release] {CardMark}-optional
1235   //   MemBarCPUOrder
1236   //   MemBarVolatile
1237   //
1238   // n.b. as an aside, a cpuorder membar is not itself subject to
1239   // matching and translation by adlc rules.  However, the rule
1240   // predicates need to detect its presence in order to correctly
1241   // select the desired adlc rules.
1242   //
1243   // Inlined unsafe volatile gets manifest as a slightly different
1244   // node sequence to a normal volatile get because of the
1245   // introduction of some CPUOrder memory barriers to bracket the
1246   // Load. However, but the same basic skeleton of a LoadX feeding a
1247   // MemBarAcquire, possibly thorugh an optional DecodeN, is still
1248   // present
1249   //
1250   //   MemBarCPUOrder
1251   //        ||       \\
1252   //   MemBarCPUOrder LoadX[mo_acquire]
1253   //        ||            |
1254   //        ||       {DecodeN} optional
1255   //        ||       /
1256   //     MemBarAcquire
1257   //
1258   // In this case the acquire membar does not directly depend on the
1259   // load. However, we can be sure that the load is generated from an
1260   // inlined unsafe volatile get if we see it dependent on this unique
1261   // sequence of membar nodes. Similarly, given an acquire membar we
1262   // can know that it was added because of an inlined unsafe volatile
1263   // get if it is fed and feeds a cpuorder membar and if its feed
1264   // membar also feeds an acquiring load.
1265   //
1266   // Finally an inlined (Unsafe) CAS operation is translated to the
1267   // following ideal graph
1268   //
1269   //   MemBarRelease
1270   //   MemBarCPUOrder
1271   //   CompareAndSwapX {CardMark}-optional
1272   //   MemBarCPUOrder
1273   //   MemBarAcquire
1274   //
1275   // So, where we can identify these volatile read and write
1276   // signatures we can choose to plant either of the above two code
1277   // sequences. For a volatile read we can simply plant a normal
1278   // ldr<x> and translate the MemBarAcquire to a dmb. However, we can
1279   // also choose to inhibit translation of the MemBarAcquire and
1280   // inhibit planting of the ldr<x>, instead planting an ldar<x>.
1281   //
1282   // When we recognise a volatile store signature we can choose to
1283   // plant at a dmb ish as a translation for the MemBarRelease, a
1284   // normal str<x> and then a dmb ish for the MemBarVolatile.
1285   // Alternatively, we can inhibit translation of the MemBarRelease
1286   // and MemBarVolatile and instead plant a simple stlr<x>
1287   // instruction.
1288   //
1289   // when we recognise a CAS signature we can choose to plant a dmb
1290   // ish as a translation for the MemBarRelease, the conventional
1291   // macro-instruction sequence for the CompareAndSwap node (which
1292   // uses ldxr<x>) and then a dmb ishld for the MemBarAcquire.
1293   // Alternatively, we can elide generation of the dmb instructions
1294   // and plant the alternative CompareAndSwap macro-instruction
1295   // sequence (which uses ldaxr<x>).
1296   //
1297   // Of course, the above only applies when we see these signature
1298   // configurations. We still want to plant dmb instructions in any
1299   // other cases where we may see a MemBarAcquire, MemBarRelease or
1300   // MemBarVolatile. For example, at the end of a constructor which
1301   // writes final/volatile fields we will see a MemBarRelease
1302   // instruction and this needs a 'dmb ish' lest we risk the
1303   // constructed object being visible without making the
1304   // final/volatile field writes visible.
1305   //
1306   // n.b. the translation rules below which rely on detection of the
1307   // volatile signatures and insert ldar<x> or stlr<x> are failsafe.
1308   // If we see anything other than the signature configurations we
1309   // always just translate the loads and stores to ldr<x> and str<x>
1310   // and translate acquire, release and volatile membars to the
1311   // relevant dmb instructions.
1312   //
1313 
1314   // is_CAS(int opcode, bool maybe_volatile)
1315   //
1316   // return true if opcode is one of the possible CompareAndSwapX
1317   // values otherwise false.
1318 
1319   bool is_CAS(int opcode, bool maybe_volatile)
1320   {
1321     switch(opcode) {
1322       // We handle these
1323     case Op_CompareAndSwapI:
1324     case Op_CompareAndSwapL:
1325     case Op_CompareAndSwapP:
1326     case Op_CompareAndSwapN:
1327     case Op_ShenandoahCompareAndSwapP:
1328     case Op_ShenandoahCompareAndSwapN:
1329     case Op_CompareAndSwapB:
1330     case Op_CompareAndSwapS:
1331     case Op_GetAndSetI:
1332     case Op_GetAndSetL:
1333     case Op_GetAndSetP:
1334     case Op_GetAndSetN:
1335     case Op_GetAndAddI:
1336     case Op_GetAndAddL:
1337       return true;
1338     case Op_CompareAndExchangeI:
1339     case Op_CompareAndExchangeN:
1340     case Op_CompareAndExchangeB:
1341     case Op_CompareAndExchangeS:
1342     case Op_CompareAndExchangeL:
1343     case Op_CompareAndExchangeP:
1344     case Op_WeakCompareAndSwapB:
1345     case Op_WeakCompareAndSwapS:
1346     case Op_WeakCompareAndSwapI:
1347     case Op_WeakCompareAndSwapL:
1348     case Op_WeakCompareAndSwapP:
1349     case Op_WeakCompareAndSwapN:
1350     case Op_ShenandoahWeakCompareAndSwapP:
1351     case Op_ShenandoahWeakCompareAndSwapN:
1352     case Op_ShenandoahCompareAndExchangeP:
1353     case Op_ShenandoahCompareAndExchangeN:
1354       return maybe_volatile;
1355     default:
1356       return false;
1357     }
1358   }
1359 
1360   // helper to determine the maximum number of Phi nodes we may need to
1361   // traverse when searching from a card mark membar for the merge mem
1362   // feeding a trailing membar or vice versa
1363 
1364 // predicates controlling emit of ldr<x>/ldar<x>
1365 
1366 bool unnecessary_acquire(const Node *barrier)
1367 {
1368   assert(barrier->is_MemBar(), "expecting a membar");
1369 
1370   MemBarNode* mb = barrier->as_MemBar();
1371 
1372   if (mb->trailing_load()) {
1373     return true;
1374   }
1375 
1376   if (mb->trailing_load_store()) {
1377     Node* load_store = mb->in(MemBarNode::Precedent);
1378     assert(load_store->is_LoadStore(), "unexpected graph shape");
1379     return is_CAS(load_store->Opcode(), true);
1380   }
1381 
1382   return false;
1383 }
1384 
1385 bool needs_acquiring_load(const Node *n)
1386 {
1387   assert(n->is_Load(), "expecting a load");
1388   LoadNode *ld = n->as_Load();
1389   return ld->is_acquire();
1390 }
1391 
1392 bool unnecessary_release(const Node *n)
1393 {
1394   assert((n->is_MemBar() &&
1395           n->Opcode() == Op_MemBarRelease),
1396          "expecting a release membar");
1397 
1398   MemBarNode *barrier = n->as_MemBar();
1399   if (!barrier->leading()) {
1400     return false;
1401   } else {
1402     Node* trailing = barrier->trailing_membar();
1403     MemBarNode* trailing_mb = trailing->as_MemBar();
1404     assert(trailing_mb->trailing(), "Not a trailing membar?");
1405     assert(trailing_mb->leading_membar() == n, "inconsistent leading/trailing membars");
1406 
1407     Node* mem = trailing_mb->in(MemBarNode::Precedent);
1408     if (mem->is_Store()) {
1409       assert(mem->as_Store()->is_release(), "");
1410       assert(trailing_mb->Opcode() == Op_MemBarVolatile, "");
1411       return true;
1412     } else {
1413       assert(mem->is_LoadStore(), "");
1414       assert(trailing_mb->Opcode() == Op_MemBarAcquire, "");
1415       return is_CAS(mem->Opcode(), true);
1416     }
1417   }
1418   return false;
1419 }
1420 
1421 bool unnecessary_volatile(const Node *n)
1422 {
1423   // assert n->is_MemBar();
1424   MemBarNode *mbvol = n->as_MemBar();
1425 
1426   bool release = mbvol->trailing_store();
1427   assert(!release || (mbvol->in(MemBarNode::Precedent)->is_Store() && mbvol->in(MemBarNode::Precedent)->as_Store()->is_release()), "");
1428 #ifdef ASSERT
1429   if (release) {
1430     Node* leading = mbvol->leading_membar();
1431     assert(leading->Opcode() == Op_MemBarRelease, "");
1432     assert(leading->as_MemBar()->leading_store(), "");
1433     assert(leading->as_MemBar()->trailing_membar() == mbvol, "");
1434   }
1435 #endif
1436 
1437   return release;
1438 }
1439 
1440 // predicates controlling emit of str<x>/stlr<x>
1441 
1442 bool needs_releasing_store(const Node *n)
1443 {
1444   // assert n->is_Store();
1445   StoreNode *st = n->as_Store();
1446   return st->trailing_membar() != NULL;
1447 }
1448 
1449 // predicate controlling translation of CAS
1450 //
1451 // returns true if CAS needs to use an acquiring load otherwise false
1452 
1453 bool needs_acquiring_load_exclusive(const Node *n)
1454 {
1455   assert(is_CAS(n->Opcode(), true), "expecting a compare and swap");
1456   LoadStoreNode* ldst = n->as_LoadStore();
1457   if (is_CAS(n->Opcode(), false)) {
1458     assert(ldst->trailing_membar() != NULL, "expected trailing membar");
1459   } else {
1460     return ldst->trailing_membar() != NULL;
1461   }
1462 
1463   // so we can just return true here
1464   return true;
1465 }
1466 
1467 #define __ _masm.
1468 
1469 // advance declarations for helper functions to convert register
1470 // indices to register objects
1471 
1472 // the ad file has to provide implementations of certain methods
1473 // expected by the generic code
1474 //
1475 // REQUIRED FUNCTIONALITY
1476 
1477 //=============================================================================
1478 
1479 // !!!!! Special hack to get all types of calls to specify the byte offset
1480 //       from the start of the call to the point where the return address
1481 //       will point.
1482 
1483 int MachCallStaticJavaNode::ret_addr_offset()
1484 {
1485   // call should be a simple bl
1486   int off = 4;
1487   return off;
1488 }
1489 
1490 int MachCallDynamicJavaNode::ret_addr_offset()
1491 {
1492   return 16; // movz, movk, movk, bl
1493 }
1494 
1495 int MachCallRuntimeNode::ret_addr_offset() {
1496   // for generated stubs the call will be
1497   //   far_call(addr)
1498   // for real runtime callouts it will be six instructions
1499   // see aarch64_enc_java_to_runtime
1500   //   adr(rscratch2, retaddr)
1501   //   lea(rscratch1, RuntimeAddress(addr)
1502   //   stp(zr, rscratch2, Address(__ pre(sp, -2 * wordSize)))
1503   //   blr(rscratch1)
1504   CodeBlob *cb = CodeCache::find_blob(_entry_point);
1505   if (cb) {
1506     return MacroAssembler::far_branch_size();
1507   } else {
1508     return 6 * NativeInstruction::instruction_size;
1509   }
1510 }
1511 
1512 // Indicate if the safepoint node needs the polling page as an input
1513 
1514 // the shared code plants the oop data at the start of the generated
1515 // code for the safepoint node and that needs ot be at the load
1516 // instruction itself. so we cannot plant a mov of the safepoint poll
1517 // address followed by a load. setting this to true means the mov is
1518 // scheduled as a prior instruction. that's better for scheduling
1519 // anyway.
1520 
1521 bool SafePointNode::needs_polling_address_input()
1522 {
1523   return true;
1524 }
1525 
1526 //=============================================================================
1527 
1528 #ifndef PRODUCT
1529 void MachBreakpointNode::format(PhaseRegAlloc *ra_, outputStream *st) const {
1530   st->print("BREAKPOINT");
1531 }
1532 #endif
1533 
1534 void MachBreakpointNode::emit(CodeBuffer &cbuf, PhaseRegAlloc *ra_) const {
1535   C2_MacroAssembler _masm(&cbuf);
1536   __ brk(0);
1537 }
1538 
1539 uint MachBreakpointNode::size(PhaseRegAlloc *ra_) const {
1540   return MachNode::size(ra_);
1541 }
1542 
1543 //=============================================================================
1544 
1545 #ifndef PRODUCT
1546   void MachNopNode::format(PhaseRegAlloc*, outputStream* st) const {
1547     st->print("nop \t# %d bytes pad for loops and calls", _count);
1548   }
1549 #endif
1550 
1551   void MachNopNode::emit(CodeBuffer &cbuf, PhaseRegAlloc*) const {
1552     C2_MacroAssembler _masm(&cbuf);
1553     for (int i = 0; i < _count; i++) {
1554       __ nop();
1555     }
1556   }
1557 
1558   uint MachNopNode::size(PhaseRegAlloc*) const {
1559     return _count * NativeInstruction::instruction_size;
1560   }
1561 
1562 //=============================================================================
1563 const RegMask& MachConstantBaseNode::_out_RegMask = RegMask::Empty;
1564 
1565 int ConstantTable::calculate_table_base_offset() const {
1566   return 0;  // absolute addressing, no offset
1567 }
1568 
1569 bool MachConstantBaseNode::requires_postalloc_expand() const { return false; }
1570 void MachConstantBaseNode::postalloc_expand(GrowableArray <Node *> *nodes, PhaseRegAlloc *ra_) {
1571   ShouldNotReachHere();
1572 }
1573 
1574 void MachConstantBaseNode::emit(CodeBuffer& cbuf, PhaseRegAlloc* ra_) const {
1575   // Empty encoding
1576 }
1577 
1578 uint MachConstantBaseNode::size(PhaseRegAlloc* ra_) const {
1579   return 0;
1580 }
1581 
1582 #ifndef PRODUCT
1583 void MachConstantBaseNode::format(PhaseRegAlloc* ra_, outputStream* st) const {
1584   st->print("-- \t// MachConstantBaseNode (empty encoding)");
1585 }
1586 #endif
1587 
1588 #ifndef PRODUCT
1589 void MachPrologNode::format(PhaseRegAlloc *ra_, outputStream *st) const {
1590   Compile* C = ra_->C;
1591 
1592   int framesize = C->output()->frame_slots() << LogBytesPerInt;
1593 
1594   if (C->output()->need_stack_bang(framesize))
1595     st->print("# stack bang size=%d\n\t", framesize);
1596 
1597   if (framesize < ((1 << 9) + 2 * wordSize)) {
1598     st->print("sub  sp, sp, #%d\n\t", framesize);
1599     st->print("stp  rfp, lr, [sp, #%d]", framesize - 2 * wordSize);
1600     if (PreserveFramePointer) st->print("\n\tadd  rfp, sp, #%d", framesize - 2 * wordSize);
1601   } else {
1602     st->print("stp  lr, rfp, [sp, #%d]!\n\t", -(2 * wordSize));
1603     if (PreserveFramePointer) st->print("mov  rfp, sp\n\t");
1604     st->print("mov  rscratch1, #%d\n\t", framesize - 2 * wordSize);
1605     st->print("sub  sp, sp, rscratch1");
1606   }
1607   if (C->stub_function() == NULL && BarrierSet::barrier_set()->barrier_set_nmethod() != NULL) {
1608     st->print("\n\t");
1609     st->print("ldr  rscratch1, [guard]\n\t");
1610     st->print("dmb ishld\n\t");
1611     st->print("ldr  rscratch2, [rthread, #thread_disarmed_offset]\n\t");
1612     st->print("cmp  rscratch1, rscratch2\n\t");
1613     st->print("b.eq skip");
1614     st->print("\n\t");
1615     st->print("blr #nmethod_entry_barrier_stub\n\t");
1616     st->print("b skip\n\t");
1617     st->print("guard: int\n\t");
1618     st->print("\n\t");
1619     st->print("skip:\n\t");
1620   }
1621 }
1622 #endif
1623 
1624 void MachPrologNode::emit(CodeBuffer &cbuf, PhaseRegAlloc *ra_) const {
1625   Compile* C = ra_->C;
1626   C2_MacroAssembler _masm(&cbuf);
1627 
1628   // n.b. frame size includes space for return pc and rfp
1629   const long framesize = C->output()->frame_size_in_bytes();
1630   assert(framesize%(2*wordSize) == 0, "must preserve 2*wordSize alignment");
1631 
1632   // insert a nop at the start of the prolog so we can patch in a
1633   // branch if we need to invalidate the method later
1634   __ nop();
1635 
1636   if (C->clinit_barrier_on_entry()) {
1637     assert(!C->method()->holder()->is_not_initialized(), "initialization should have been started");
1638 
1639     Label L_skip_barrier;
1640 
1641     __ mov_metadata(rscratch2, C->method()->holder()->constant_encoding());
1642     __ clinit_barrier(rscratch2, rscratch1, &L_skip_barrier);
1643     __ far_jump(RuntimeAddress(SharedRuntime::get_handle_wrong_method_stub()));
1644     __ bind(L_skip_barrier);
1645   }
1646 
1647   int bangsize = C->output()->bang_size_in_bytes();
1648   if (C->output()->need_stack_bang(bangsize) && UseStackBanging)
1649     __ generate_stack_overflow_check(bangsize);
1650 
1651   __ build_frame(framesize);
1652 
1653   if (C->stub_function() == NULL) {
1654     BarrierSetAssembler* bs = BarrierSet::barrier_set()->barrier_set_assembler();
1655     bs->nmethod_entry_barrier(&_masm);
1656   }
1657 
1658   if (VerifyStackAtCalls) {
1659     Unimplemented();
1660   }
1661 
1662   C->output()->set_frame_complete(cbuf.insts_size());
1663 
1664   if (C->has_mach_constant_base_node()) {
1665     // NOTE: We set the table base offset here because users might be
1666     // emitted before MachConstantBaseNode.
1667     ConstantTable& constant_table = C->output()->constant_table();
1668     constant_table.set_table_base_offset(constant_table.calculate_table_base_offset());
1669   }
1670 }
1671 
1672 uint MachPrologNode::size(PhaseRegAlloc* ra_) const
1673 {
1674   return MachNode::size(ra_); // too many variables; just compute it
1675                               // the hard way
1676 }
1677 
1678 int MachPrologNode::reloc() const
1679 {
1680   return 0;
1681 }
1682 
1683 //=============================================================================
1684 
1685 #ifndef PRODUCT
1686 void MachEpilogNode::format(PhaseRegAlloc *ra_, outputStream *st) const {
1687   Compile* C = ra_->C;
1688   int framesize = C->output()->frame_slots() << LogBytesPerInt;
1689 
1690   st->print("# pop frame %d\n\t",framesize);
1691 
1692   if (framesize == 0) {
1693     st->print("ldp  lr, rfp, [sp],#%d\n\t", (2 * wordSize));
1694   } else if (framesize < ((1 << 9) + 2 * wordSize)) {
1695     st->print("ldp  lr, rfp, [sp,#%d]\n\t", framesize - 2 * wordSize);
1696     st->print("add  sp, sp, #%d\n\t", framesize);
1697   } else {
1698     st->print("mov  rscratch1, #%d\n\t", framesize - 2 * wordSize);
1699     st->print("add  sp, sp, rscratch1\n\t");
1700     st->print("ldp  lr, rfp, [sp],#%d\n\t", (2 * wordSize));
1701   }
1702 
1703   if (do_polling() && C->is_method_compilation()) {
1704     st->print("# touch polling page\n\t");
1705     st->print("ldr rscratch1, [rthread],#polling_page_offset\n\t");
1706     st->print("ldr zr, [rscratch1]");
1707   }
1708 }
1709 #endif
1710 
1711 void MachEpilogNode::emit(CodeBuffer &cbuf, PhaseRegAlloc *ra_) const {
1712   Compile* C = ra_->C;
1713   C2_MacroAssembler _masm(&cbuf);
1714   int framesize = C->output()->frame_slots() << LogBytesPerInt;
1715 
1716   __ remove_frame(framesize);
1717 
1718   if (StackReservedPages > 0 && C->has_reserved_stack_access()) {
1719     __ reserved_stack_check();
1720   }
1721 
1722   if (do_polling() && C->is_method_compilation()) {
1723     __ fetch_and_read_polling_page(rscratch1, relocInfo::poll_return_type);
1724   }
1725 }
1726 
1727 uint MachEpilogNode::size(PhaseRegAlloc *ra_) const {
1728   // Variable size. Determine dynamically.
1729   return MachNode::size(ra_);
1730 }
1731 
1732 int MachEpilogNode::reloc() const {
1733   // Return number of relocatable values contained in this instruction.
1734   return 1; // 1 for polling page.
1735 }
1736 
1737 const Pipeline * MachEpilogNode::pipeline() const {
1738   return MachNode::pipeline_class();
1739 }
1740 
1741 //=============================================================================
1742 
1743 // Figure out which register class each belongs in: rc_int, rc_float or
1744 // rc_stack.
1745 enum RC { rc_bad, rc_int, rc_float, rc_stack };
1746 
1747 static enum RC rc_class(OptoReg::Name reg) {
1748 
1749   if (reg == OptoReg::Bad) {
1750     return rc_bad;
1751   }
1752 
1753   // we have 30 int registers * 2 halves
1754   // (rscratch1 and rscratch2 are omitted)
1755   int slots_of_int_registers = RegisterImpl::max_slots_per_register * (RegisterImpl::number_of_registers - 2);
1756 
1757   if (reg < slots_of_int_registers) {
1758     return rc_int;
1759   }
1760 
1761   // we have 32 float register * 4 halves
1762   if (reg < slots_of_int_registers + FloatRegisterImpl::max_slots_per_register * FloatRegisterImpl::number_of_registers) {
1763     return rc_float;
1764   }
1765 
1766   // Between float regs & stack is the flags regs.
1767   assert(OptoReg::is_stack(reg), "blow up if spilling flags");
1768 
1769   return rc_stack;
1770 }
1771 
1772 uint MachSpillCopyNode::implementation(CodeBuffer *cbuf, PhaseRegAlloc *ra_, bool do_size, outputStream *st) const {
1773   Compile* C = ra_->C;
1774 
1775   // Get registers to move.
1776   OptoReg::Name src_hi = ra_->get_reg_second(in(1));
1777   OptoReg::Name src_lo = ra_->get_reg_first(in(1));
1778   OptoReg::Name dst_hi = ra_->get_reg_second(this);
1779   OptoReg::Name dst_lo = ra_->get_reg_first(this);
1780 
1781   enum RC src_hi_rc = rc_class(src_hi);
1782   enum RC src_lo_rc = rc_class(src_lo);
1783   enum RC dst_hi_rc = rc_class(dst_hi);
1784   enum RC dst_lo_rc = rc_class(dst_lo);
1785 
1786   assert(src_lo != OptoReg::Bad && dst_lo != OptoReg::Bad, "must move at least 1 register");
1787 
1788   if (src_hi != OptoReg::Bad) {
1789     assert((src_lo&1)==0 && src_lo+1==src_hi &&
1790            (dst_lo&1)==0 && dst_lo+1==dst_hi,
1791            "expected aligned-adjacent pairs");
1792   }
1793 
1794   if (src_lo == dst_lo && src_hi == dst_hi) {
1795     return 0;            // Self copy, no move.
1796   }
1797 
1798   bool is64 = (src_lo & 1) == 0 && src_lo + 1 == src_hi &&
1799               (dst_lo & 1) == 0 && dst_lo + 1 == dst_hi;
1800   int src_offset = ra_->reg2offset(src_lo);
1801   int dst_offset = ra_->reg2offset(dst_lo);
1802 
1803   if (bottom_type()->isa_vect() != NULL) {
1804     uint ireg = ideal_reg();
1805     assert(ireg == Op_VecD || ireg == Op_VecX, "must be 64 bit or 128 bit vector");
1806     if (cbuf) {
1807       C2_MacroAssembler _masm(cbuf);
1808       assert((src_lo_rc != rc_int && dst_lo_rc != rc_int), "sanity");
1809       if (src_lo_rc == rc_stack && dst_lo_rc == rc_stack) {
1810         // stack->stack
1811         assert((src_offset & 7) == 0 && (dst_offset & 7) == 0, "unaligned stack offset");
1812         if (ireg == Op_VecD) {
1813           __ unspill(rscratch1, true, src_offset);
1814           __ spill(rscratch1, true, dst_offset);
1815         } else {
1816           __ spill_copy128(src_offset, dst_offset);
1817         }
1818       } else if (src_lo_rc == rc_float && dst_lo_rc == rc_float) {
1819         __ mov(as_FloatRegister(Matcher::_regEncode[dst_lo]),
1820                ireg == Op_VecD ? __ T8B : __ T16B,
1821                as_FloatRegister(Matcher::_regEncode[src_lo]));
1822       } else if (src_lo_rc == rc_float && dst_lo_rc == rc_stack) {
1823         __ spill(as_FloatRegister(Matcher::_regEncode[src_lo]),
1824                        ireg == Op_VecD ? __ D : __ Q,
1825                        ra_->reg2offset(dst_lo));
1826       } else if (src_lo_rc == rc_stack && dst_lo_rc == rc_float) {
1827         __ unspill(as_FloatRegister(Matcher::_regEncode[dst_lo]),
1828                        ireg == Op_VecD ? __ D : __ Q,
1829                        ra_->reg2offset(src_lo));
1830       } else {
1831         ShouldNotReachHere();
1832       }
1833     }
1834   } else if (cbuf) {
1835     C2_MacroAssembler _masm(cbuf);
1836     switch (src_lo_rc) {
1837     case rc_int:
1838       if (dst_lo_rc == rc_int) {  // gpr --> gpr copy
1839         if (is64) {
1840             __ mov(as_Register(Matcher::_regEncode[dst_lo]),
1841                    as_Register(Matcher::_regEncode[src_lo]));
1842         } else {
1843             C2_MacroAssembler _masm(cbuf);
1844             __ movw(as_Register(Matcher::_regEncode[dst_lo]),
1845                     as_Register(Matcher::_regEncode[src_lo]));
1846         }
1847       } else if (dst_lo_rc == rc_float) { // gpr --> fpr copy
1848         if (is64) {
1849             __ fmovd(as_FloatRegister(Matcher::_regEncode[dst_lo]),
1850                      as_Register(Matcher::_regEncode[src_lo]));
1851         } else {
1852             __ fmovs(as_FloatRegister(Matcher::_regEncode[dst_lo]),
1853                      as_Register(Matcher::_regEncode[src_lo]));
1854         }
1855       } else {                    // gpr --> stack spill
1856         assert(dst_lo_rc == rc_stack, "spill to bad register class");
1857         __ spill(as_Register(Matcher::_regEncode[src_lo]), is64, dst_offset);
1858       }
1859       break;
1860     case rc_float:
1861       if (dst_lo_rc == rc_int) {  // fpr --> gpr copy
1862         if (is64) {
1863             __ fmovd(as_Register(Matcher::_regEncode[dst_lo]),
1864                      as_FloatRegister(Matcher::_regEncode[src_lo]));
1865         } else {
1866             __ fmovs(as_Register(Matcher::_regEncode[dst_lo]),
1867                      as_FloatRegister(Matcher::_regEncode[src_lo]));
1868         }
1869       } else if (dst_lo_rc == rc_float) { // fpr --> fpr copy
1870           if (cbuf) {
1871             __ fmovd(as_FloatRegister(Matcher::_regEncode[dst_lo]),
1872                      as_FloatRegister(Matcher::_regEncode[src_lo]));
1873         } else {
1874             __ fmovs(as_FloatRegister(Matcher::_regEncode[dst_lo]),
1875                      as_FloatRegister(Matcher::_regEncode[src_lo]));
1876         }
1877       } else {                    // fpr --> stack spill
1878         assert(dst_lo_rc == rc_stack, "spill to bad register class");
1879         __ spill(as_FloatRegister(Matcher::_regEncode[src_lo]),
1880                  is64 ? __ D : __ S, dst_offset);
1881       }
1882       break;
1883     case rc_stack:
1884       if (dst_lo_rc == rc_int) {  // stack --> gpr load
1885         __ unspill(as_Register(Matcher::_regEncode[dst_lo]), is64, src_offset);
1886       } else if (dst_lo_rc == rc_float) { // stack --> fpr load
1887         __ unspill(as_FloatRegister(Matcher::_regEncode[dst_lo]),
1888                    is64 ? __ D : __ S, src_offset);
1889       } else {                    // stack --> stack copy
1890         assert(dst_lo_rc == rc_stack, "spill to bad register class");
1891         __ unspill(rscratch1, is64, src_offset);
1892         __ spill(rscratch1, is64, dst_offset);
1893       }
1894       break;
1895     default:
1896       assert(false, "bad rc_class for spill");
1897       ShouldNotReachHere();
1898     }
1899   }
1900 
1901   if (st) {
1902     st->print("spill ");
1903     if (src_lo_rc == rc_stack) {
1904       st->print("[sp, #%d] -> ", ra_->reg2offset(src_lo));
1905     } else {
1906       st->print("%s -> ", Matcher::regName[src_lo]);
1907     }
1908     if (dst_lo_rc == rc_stack) {
1909       st->print("[sp, #%d]", ra_->reg2offset(dst_lo));
1910     } else {
1911       st->print("%s", Matcher::regName[dst_lo]);
1912     }
1913     if (bottom_type()->isa_vect() != NULL) {
1914       st->print("\t# vector spill size = %d", ideal_reg()==Op_VecD ? 64:128);
1915     } else {
1916       st->print("\t# spill size = %d", is64 ? 64:32);
1917     }
1918   }
1919 
1920   return 0;
1921 
1922 }
1923 
1924 #ifndef PRODUCT
1925 void MachSpillCopyNode::format(PhaseRegAlloc *ra_, outputStream *st) const {
1926   if (!ra_)
1927     st->print("N%d = SpillCopy(N%d)", _idx, in(1)->_idx);
1928   else
1929     implementation(NULL, ra_, false, st);
1930 }
1931 #endif
1932 
1933 void MachSpillCopyNode::emit(CodeBuffer &cbuf, PhaseRegAlloc *ra_) const {
1934   implementation(&cbuf, ra_, false, NULL);
1935 }
1936 
1937 uint MachSpillCopyNode::size(PhaseRegAlloc *ra_) const {
1938   return MachNode::size(ra_);
1939 }
1940 
1941 //=============================================================================
1942 
1943 #ifndef PRODUCT
1944 void BoxLockNode::format(PhaseRegAlloc *ra_, outputStream *st) const {
1945   int offset = ra_->reg2offset(in_RegMask(0).find_first_elem());
1946   int reg = ra_->get_reg_first(this);
1947   st->print("add %s, rsp, #%d]\t# box lock",
1948             Matcher::regName[reg], offset);
1949 }
1950 #endif
1951 
1952 void BoxLockNode::emit(CodeBuffer &cbuf, PhaseRegAlloc *ra_) const {
1953   C2_MacroAssembler _masm(&cbuf);
1954 
1955   int offset = ra_->reg2offset(in_RegMask(0).find_first_elem());
1956   int reg    = ra_->get_encode(this);
1957 
1958   if (Assembler::operand_valid_for_add_sub_immediate(offset)) {
1959     __ add(as_Register(reg), sp, offset);
1960   } else {
1961     ShouldNotReachHere();
1962   }
1963 }
1964 
1965 uint BoxLockNode::size(PhaseRegAlloc *ra_) const {
1966   // BoxLockNode is not a MachNode, so we can't just call MachNode::size(ra_).
1967   return 4;
1968 }
1969 
1970 //=============================================================================
1971 
1972 #ifndef PRODUCT
1973 void MachUEPNode::format(PhaseRegAlloc* ra_, outputStream* st) const
1974 {
1975   st->print_cr("# MachUEPNode");
1976   if (UseCompressedClassPointers) {
1977     st->print_cr("\tldrw rscratch1, j_rarg0 + oopDesc::klass_offset_in_bytes()]\t# compressed klass");
1978     if (CompressedKlassPointers::shift() != 0) {
1979       st->print_cr("\tdecode_klass_not_null rscratch1, rscratch1");
1980     }
1981   } else {
1982    st->print_cr("\tldr rscratch1, j_rarg0 + oopDesc::klass_offset_in_bytes()]\t# compressed klass");
1983   }
1984   st->print_cr("\tcmp r0, rscratch1\t # Inline cache check");
1985   st->print_cr("\tbne, SharedRuntime::_ic_miss_stub");
1986 }
1987 #endif
1988 
1989 void MachUEPNode::emit(CodeBuffer& cbuf, PhaseRegAlloc* ra_) const
1990 {
1991   // This is the unverified entry point.
1992   C2_MacroAssembler _masm(&cbuf);
1993 
1994   __ cmp_klass(j_rarg0, rscratch2, rscratch1);
1995   Label skip;
1996   // TODO
1997   // can we avoid this skip and still use a reloc?
1998   __ br(Assembler::EQ, skip);
1999   __ far_jump(RuntimeAddress(SharedRuntime::get_ic_miss_stub()));
2000   __ bind(skip);
2001 }
2002 
2003 uint MachUEPNode::size(PhaseRegAlloc* ra_) const
2004 {
2005   return MachNode::size(ra_);
2006 }
2007 
2008 // REQUIRED EMIT CODE
2009 
2010 //=============================================================================
2011 
2012 // Emit exception handler code.
2013 int HandlerImpl::emit_exception_handler(CodeBuffer& cbuf)
2014 {
2015   // mov rscratch1 #exception_blob_entry_point
2016   // br rscratch1
2017   // Note that the code buffer's insts_mark is always relative to insts.
2018   // That's why we must use the macroassembler to generate a handler.
2019   C2_MacroAssembler _masm(&cbuf);
2020   address base = __ start_a_stub(size_exception_handler());
2021   if (base == NULL) {
2022     ciEnv::current()->record_failure("CodeCache is full");
2023     return 0;  // CodeBuffer::expand failed
2024   }
2025   int offset = __ offset();
2026   __ far_jump(RuntimeAddress(OptoRuntime::exception_blob()->entry_point()));
2027   assert(__ offset() - offset <= (int) size_exception_handler(), "overflow");
2028   __ end_a_stub();
2029   return offset;
2030 }
2031 
2032 // Emit deopt handler code.
2033 int HandlerImpl::emit_deopt_handler(CodeBuffer& cbuf)
2034 {
2035   // Note that the code buffer's insts_mark is always relative to insts.
2036   // That's why we must use the macroassembler to generate a handler.
2037   C2_MacroAssembler _masm(&cbuf);
2038   address base = __ start_a_stub(size_deopt_handler());
2039   if (base == NULL) {
2040     ciEnv::current()->record_failure("CodeCache is full");
2041     return 0;  // CodeBuffer::expand failed
2042   }
2043   int offset = __ offset();
2044 
2045   __ adr(lr, __ pc());
2046   __ far_jump(RuntimeAddress(SharedRuntime::deopt_blob()->unpack()));
2047 
2048   assert(__ offset() - offset <= (int) size_deopt_handler(), "overflow");
2049   __ end_a_stub();
2050   return offset;
2051 }
2052 
2053 // REQUIRED MATCHER CODE
2054 
2055 //=============================================================================
2056 
2057 const bool Matcher::match_rule_supported(int opcode) {
2058   if (!has_match_rule(opcode))
2059     return false;
2060 
2061   bool ret_value = true;
2062   switch (opcode) {
2063     case Op_CacheWB:
2064     case Op_CacheWBPreSync:
2065     case Op_CacheWBPostSync:
2066       if (!VM_Version::supports_data_cache_line_flush()) {
2067         ret_value = false;
2068       }
2069       break;
2070   }
2071 
2072   return ret_value; // Per default match rules are supported.
2073 }
2074 
2075 // Identify extra cases that we might want to provide match rules for vector nodes and
2076 // other intrinsics guarded with vector length (vlen) and element type (bt).
2077 const bool Matcher::match_rule_supported_vector(int opcode, int vlen, BasicType bt) {
2078   if (!match_rule_supported(opcode)) {
2079     return false;
2080   }
2081 
2082   // Special cases which require vector length
2083   switch (opcode) {
2084     case Op_MulAddVS2VI: {
2085       if (vlen != 4) {
2086         return false;
2087       }
2088       break;
2089     }
2090   }
2091 
2092   return true; // Per default match rules are supported.
2093 }
2094 
2095 const bool Matcher::has_predicated_vectors(void) {
2096   return false;
2097 }
2098 
2099 const int Matcher::float_pressure(int default_pressure_threshold) {
2100   return default_pressure_threshold;
2101 }
2102 
2103 int Matcher::regnum_to_fpu_offset(int regnum)
2104 {
2105   Unimplemented();
2106   return 0;
2107 }
2108 
2109 // Is this branch offset short enough that a short branch can be used?
2110 //
2111 // NOTE: If the platform does not provide any short branch variants, then
2112 //       this method should return false for offset 0.
2113 bool Matcher::is_short_branch_offset(int rule, int br_size, int offset) {
2114   // The passed offset is relative to address of the branch.
2115 
2116   return (-32768 <= offset && offset < 32768);
2117 }
2118 
2119 const bool Matcher::isSimpleConstant64(jlong value) {
2120   // Will one (StoreL ConL) be cheaper than two (StoreI ConI)?.
2121   // Probably always true, even if a temp register is required.
2122   return true;
2123 }
2124 
2125 // true just means we have fast l2f conversion
2126 const bool Matcher::convL2FSupported(void) {
2127   return true;
2128 }
2129 
2130 // Vector width in bytes.
2131 const int Matcher::vector_width_in_bytes(BasicType bt) {
2132   int size = MIN2(16,(int)MaxVectorSize);
2133   // Minimum 2 values in vector
2134   if (size < 2*type2aelembytes(bt)) size = 0;
2135   // But never < 4
2136   if (size < 4) size = 0;
2137   return size;
2138 }
2139 
2140 // Limits on vector size (number of elements) loaded into vector.
2141 const int Matcher::max_vector_size(const BasicType bt) {
2142   return vector_width_in_bytes(bt)/type2aelembytes(bt);
2143 }
2144 const int Matcher::min_vector_size(const BasicType bt) {
2145 //  For the moment limit the vector size to 8 bytes
2146     int size = 8 / type2aelembytes(bt);
2147     if (size < 2) size = 2;
2148     return size;
2149 }
2150 
2151 // Vector ideal reg.
2152 const uint Matcher::vector_ideal_reg(int len) {
2153   switch(len) {
2154     case  8: return Op_VecD;
2155     case 16: return Op_VecX;
2156   }
2157   ShouldNotReachHere();
2158   return 0;
2159 }
2160 
2161 // AES support not yet implemented
2162 const bool Matcher::pass_original_key_for_aes() {
2163   return false;
2164 }
2165 
2166 // aarch64 supports misaligned vectors store/load.
2167 const bool Matcher::misaligned_vectors_ok() {
2168   return true;
2169 }
2170 
2171 // false => size gets scaled to BytesPerLong, ok.
2172 const bool Matcher::init_array_count_is_in_bytes = false;
2173 
2174 // Use conditional move (CMOVL)
2175 const int Matcher::long_cmove_cost() {
2176   // long cmoves are no more expensive than int cmoves
2177   return 0;
2178 }
2179 
2180 const int Matcher::float_cmove_cost() {
2181   // float cmoves are no more expensive than int cmoves
2182   return 0;
2183 }
2184 
2185 // Does the CPU require late expand (see block.cpp for description of late expand)?
2186 const bool Matcher::require_postalloc_expand = false;
2187 
2188 // Do we need to mask the count passed to shift instructions or does
2189 // the cpu only look at the lower 5/6 bits anyway?
2190 const bool Matcher::need_masked_shift_count = false;
2191 
2192 // No support for generic vector operands.
2193 const bool Matcher::supports_generic_vector_operands  = false;
2194 
2195 MachOper* Matcher::pd_specialize_generic_vector_operand(MachOper* original_opnd, uint ideal_reg, bool is_temp) {
2196   ShouldNotReachHere(); // generic vector operands not supported
2197   return NULL;
2198 }
2199 
2200 bool Matcher::is_generic_reg2reg_move(MachNode* m) {
2201   ShouldNotReachHere();  // generic vector operands not supported
2202   return false;
2203 }
2204 
2205 bool Matcher::is_generic_vector(MachOper* opnd)  {
2206   ShouldNotReachHere();  // generic vector operands not supported
2207   return false;
2208 }
2209 
2210 // This affects two different things:
2211 //  - how Decode nodes are matched
2212 //  - how ImplicitNullCheck opportunities are recognized
2213 // If true, the matcher will try to remove all Decodes and match them
2214 // (as operands) into nodes. NullChecks are not prepared to deal with
2215 // Decodes by final_graph_reshaping().
2216 // If false, final_graph_reshaping() forces the decode behind the Cmp
2217 // for a NullCheck. The matcher matches the Decode node into a register.
2218 // Implicit_null_check optimization moves the Decode along with the
2219 // memory operation back up before the NullCheck.
2220 bool Matcher::narrow_oop_use_complex_address() {
2221   return CompressedOops::shift() == 0;
2222 }
2223 
2224 bool Matcher::narrow_klass_use_complex_address() {
2225 // TODO
2226 // decide whether we need to set this to true
2227   return false;
2228 }
2229 
2230 bool Matcher::const_oop_prefer_decode() {
2231   // Prefer ConN+DecodeN over ConP in simple compressed oops mode.
2232   return CompressedOops::base() == NULL;
2233 }
2234 
2235 bool Matcher::const_klass_prefer_decode() {
2236   // Prefer ConNKlass+DecodeNKlass over ConP in simple compressed klass mode.
2237   return CompressedKlassPointers::base() == NULL;
2238 }
2239 
2240 // Is it better to copy float constants, or load them directly from
2241 // memory?  Intel can load a float constant from a direct address,
2242 // requiring no extra registers.  Most RISCs will have to materialize
2243 // an address into a register first, so they would do better to copy
2244 // the constant from stack.
2245 const bool Matcher::rematerialize_float_constants = false;
2246 
2247 // If CPU can load and store mis-aligned doubles directly then no
2248 // fixup is needed.  Else we split the double into 2 integer pieces
2249 // and move it piece-by-piece.  Only happens when passing doubles into
2250 // C code as the Java calling convention forces doubles to be aligned.
2251 const bool Matcher::misaligned_doubles_ok = true;
2252 
2253 // No-op on amd64
2254 void Matcher::pd_implicit_null_fixup(MachNode *node, uint idx) {
2255   Unimplemented();
2256 }
2257 
2258 // Advertise here if the CPU requires explicit rounding operations to implement strictfp mode.
2259 const bool Matcher::strict_fp_requires_explicit_rounding = false;
2260 
2261 // Are floats converted to double when stored to stack during
2262 // deoptimization?
2263 bool Matcher::float_in_double() { return false; }
2264 
2265 // Do ints take an entire long register or just half?
2266 // The relevant question is how the int is callee-saved:
2267 // the whole long is written but de-opt'ing will have to extract
2268 // the relevant 32 bits.
2269 const bool Matcher::int_in_long = true;
2270 
2271 // Return whether or not this register is ever used as an argument.
2272 // This function is used on startup to build the trampoline stubs in
2273 // generateOptoStub.  Registers not mentioned will be killed by the VM
2274 // call in the trampoline, and arguments in those registers not be
2275 // available to the callee.
2276 bool Matcher::can_be_java_arg(int reg)
2277 {
2278   return
2279     reg ==  R0_num || reg == R0_H_num ||
2280     reg ==  R1_num || reg == R1_H_num ||
2281     reg ==  R2_num || reg == R2_H_num ||
2282     reg ==  R3_num || reg == R3_H_num ||
2283     reg ==  R4_num || reg == R4_H_num ||
2284     reg ==  R5_num || reg == R5_H_num ||
2285     reg ==  R6_num || reg == R6_H_num ||
2286     reg ==  R7_num || reg == R7_H_num ||
2287     reg ==  V0_num || reg == V0_H_num ||
2288     reg ==  V1_num || reg == V1_H_num ||
2289     reg ==  V2_num || reg == V2_H_num ||
2290     reg ==  V3_num || reg == V3_H_num ||
2291     reg ==  V4_num || reg == V4_H_num ||
2292     reg ==  V5_num || reg == V5_H_num ||
2293     reg ==  V6_num || reg == V6_H_num ||
2294     reg ==  V7_num || reg == V7_H_num;
2295 }
2296 
2297 bool Matcher::is_spillable_arg(int reg)
2298 {
2299   return can_be_java_arg(reg);
2300 }
2301 
2302 bool Matcher::use_asm_for_ldiv_by_con(jlong divisor) {
2303   return false;
2304 }
2305 
2306 RegMask Matcher::divI_proj_mask() {
2307   ShouldNotReachHere();
2308   return RegMask();
2309 }
2310 
2311 // Register for MODI projection of divmodI.
2312 RegMask Matcher::modI_proj_mask() {
2313   ShouldNotReachHere();
2314   return RegMask();
2315 }
2316 
2317 // Register for DIVL projection of divmodL.
2318 RegMask Matcher::divL_proj_mask() {
2319   ShouldNotReachHere();
2320   return RegMask();
2321 }
2322 
2323 // Register for MODL projection of divmodL.
2324 RegMask Matcher::modL_proj_mask() {
2325   ShouldNotReachHere();
2326   return RegMask();
2327 }
2328 
2329 const RegMask Matcher::method_handle_invoke_SP_save_mask() {
2330   return FP_REG_mask();
2331 }
2332 
2333 bool size_fits_all_mem_uses(AddPNode* addp, int shift) {
2334   for (DUIterator_Fast imax, i = addp->fast_outs(imax); i < imax; i++) {
2335     Node* u = addp->fast_out(i);
2336     if (u->is_Mem()) {
2337       int opsize = u->as_Mem()->memory_size();
2338       assert(opsize > 0, "unexpected memory operand size");
2339       if (u->as_Mem()->memory_size() != (1<<shift)) {
2340         return false;
2341       }
2342     }
2343   }
2344   return true;
2345 }
2346 
2347 const bool Matcher::convi2l_type_required = false;
2348 
2349 // Should the matcher clone input 'm' of node 'n'?
2350 bool Matcher::pd_clone_node(Node* n, Node* m, Matcher::MStack& mstack) {
2351   if (is_vshift_con_pattern(n, m)) { // ShiftV src (ShiftCntV con)
2352     mstack.push(m, Visit);           // m = ShiftCntV
2353     return true;
2354   }
2355   return false;
2356 }
2357 
2358 // Should the Matcher clone shifts on addressing modes, expecting them
2359 // to be subsumed into complex addressing expressions or compute them
2360 // into registers?
2361 bool Matcher::pd_clone_address_expressions(AddPNode* m, Matcher::MStack& mstack, VectorSet& address_visited) {
2362   if (clone_base_plus_offset_address(m, mstack, address_visited)) {
2363     return true;
2364   }
2365 
2366   Node *off = m->in(AddPNode::Offset);
2367   if (off->Opcode() == Op_LShiftL && off->in(2)->is_Con() &&
2368       size_fits_all_mem_uses(m, off->in(2)->get_int()) &&
2369       // Are there other uses besides address expressions?
2370       !is_visited(off)) {
2371     address_visited.set(off->_idx); // Flag as address_visited
2372     mstack.push(off->in(2), Visit);
2373     Node *conv = off->in(1);
2374     if (conv->Opcode() == Op_ConvI2L &&
2375         // Are there other uses besides address expressions?
2376         !is_visited(conv)) {
2377       address_visited.set(conv->_idx); // Flag as address_visited
2378       mstack.push(conv->in(1), Pre_Visit);
2379     } else {
2380       mstack.push(conv, Pre_Visit);
2381     }
2382     address_visited.test_set(m->_idx); // Flag as address_visited
2383     mstack.push(m->in(AddPNode::Address), Pre_Visit);
2384     mstack.push(m->in(AddPNode::Base), Pre_Visit);
2385     return true;
2386   } else if (off->Opcode() == Op_ConvI2L &&
2387              // Are there other uses besides address expressions?
2388              !is_visited(off)) {
2389     address_visited.test_set(m->_idx); // Flag as address_visited
2390     address_visited.set(off->_idx); // Flag as address_visited
2391     mstack.push(off->in(1), Pre_Visit);
2392     mstack.push(m->in(AddPNode::Address), Pre_Visit);
2393     mstack.push(m->in(AddPNode::Base), Pre_Visit);
2394     return true;
2395   }
2396   return false;
2397 }
2398 
2399 void Compile::reshape_address(AddPNode* addp) {
2400 }
2401 
2402 
2403 #define MOV_VOLATILE(REG, BASE, INDEX, SCALE, DISP, SCRATCH, INSN)      \
2404   C2_MacroAssembler _masm(&cbuf);                                       \
2405   {                                                                     \
2406     guarantee(INDEX == -1, "mode not permitted for volatile");          \
2407     guarantee(DISP == 0, "mode not permitted for volatile");            \
2408     guarantee(SCALE == 0, "mode not permitted for volatile");           \
2409     __ INSN(REG, as_Register(BASE));                                    \
2410   }
2411 
2412 
2413 static Address mem2address(int opcode, Register base, int index, int size, int disp)
2414   {
2415     Address::extend scale;
2416 
2417     // Hooboy, this is fugly.  We need a way to communicate to the
2418     // encoder that the index needs to be sign extended, so we have to
2419     // enumerate all the cases.
2420     switch (opcode) {
2421     case INDINDEXSCALEDI2L:
2422     case INDINDEXSCALEDI2LN:
2423     case INDINDEXI2L:
2424     case INDINDEXI2LN:
2425       scale = Address::sxtw(size);
2426       break;
2427     default:
2428       scale = Address::lsl(size);
2429     }
2430 
2431     if (index == -1) {
2432       return Address(base, disp);
2433     } else {
2434       assert(disp == 0, "unsupported address mode: disp = %d", disp);
2435       return Address(base, as_Register(index), scale);
2436     }
2437   }
2438 
2439 
2440 typedef void (MacroAssembler::* mem_insn)(Register Rt, const Address &adr);
2441 typedef void (MacroAssembler::* mem_insn2)(Register Rt, Register adr);
2442 typedef void (MacroAssembler::* mem_float_insn)(FloatRegister Rt, const Address &adr);
2443 typedef void (MacroAssembler::* mem_vector_insn)(FloatRegister Rt,
2444                                   MacroAssembler::SIMD_RegVariant T, const Address &adr);
2445 
2446   // Used for all non-volatile memory accesses.  The use of
2447   // $mem->opcode() to discover whether this pattern uses sign-extended
2448   // offsets is something of a kludge.
2449   static void loadStore(C2_MacroAssembler masm, mem_insn insn,
2450                         Register reg, int opcode,
2451                         Register base, int index, int scale, int disp,
2452                         int size_in_memory)
2453   {
2454     Address addr = mem2address(opcode, base, index, scale, disp);
2455     if (addr.getMode() == Address::base_plus_offset) {
2456       /* If we get an out-of-range offset it is a bug in the compiler,
2457          so we assert here. */
2458       assert(Address::offset_ok_for_immed(addr.offset(), exact_log2(size_in_memory)),
2459              "c2 compiler bug");
2460       /* Fix up any out-of-range offsets. */
2461       assert_different_registers(rscratch1, base);
2462       assert_different_registers(rscratch1, reg);
2463       addr = masm.legitimize_address(addr, size_in_memory, rscratch1);
2464     }
2465     (masm.*insn)(reg, addr);
2466   }
2467 
2468   static void loadStore(C2_MacroAssembler masm, mem_float_insn insn,
2469                         FloatRegister reg, int opcode,
2470                         Register base, int index, int size, int disp,
2471                         int size_in_memory)
2472   {
2473     Address::extend scale;
2474 
2475     switch (opcode) {
2476     case INDINDEXSCALEDI2L:
2477     case INDINDEXSCALEDI2LN:
2478       scale = Address::sxtw(size);
2479       break;
2480     default:
2481       scale = Address::lsl(size);
2482     }
2483 
2484     if (index == -1) {
2485       /* If we get an out-of-range offset it is a bug in the compiler,
2486          so we assert here. */
2487       assert(Address::offset_ok_for_immed(disp, exact_log2(size_in_memory)), "c2 compiler bug");
2488       /* Fix up any out-of-range offsets. */
2489       assert_different_registers(rscratch1, base);
2490       Address addr = Address(base, disp);
2491       addr = masm.legitimize_address(addr, size_in_memory, rscratch1);
2492       (masm.*insn)(reg, addr);
2493     } else {
2494       assert(disp == 0, "unsupported address mode: disp = %d", disp);
2495       (masm.*insn)(reg, Address(base, as_Register(index), scale));
2496     }
2497   }
2498 
2499   static void loadStore(C2_MacroAssembler masm, mem_vector_insn insn,
2500                         FloatRegister reg, MacroAssembler::SIMD_RegVariant T,
2501                         int opcode, Register base, int index, int size, int disp)
2502   {
2503     if (index == -1) {
2504       (masm.*insn)(reg, T, Address(base, disp));
2505     } else {
2506       assert(disp == 0, "unsupported address mode");
2507       (masm.*insn)(reg, T, Address(base, as_Register(index), Address::lsl(size)));
2508     }
2509   }
2510 
2511 %}
2512 
2513 
2514 
2515 //----------ENCODING BLOCK-----------------------------------------------------
2516 // This block specifies the encoding classes used by the compiler to
2517 // output byte streams.  Encoding classes are parameterized macros
2518 // used by Machine Instruction Nodes in order to generate the bit
2519 // encoding of the instruction.  Operands specify their base encoding
2520 // interface with the interface keyword.  There are currently
2521 // supported four interfaces, REG_INTER, CONST_INTER, MEMORY_INTER, &
2522 // COND_INTER.  REG_INTER causes an operand to generate a function
2523 // which returns its register number when queried.  CONST_INTER causes
2524 // an operand to generate a function which returns the value of the
2525 // constant when queried.  MEMORY_INTER causes an operand to generate
2526 // four functions which return the Base Register, the Index Register,
2527 // the Scale Value, and the Offset Value of the operand when queried.
2528 // COND_INTER causes an operand to generate six functions which return
2529 // the encoding code (ie - encoding bits for the instruction)
2530 // associated with each basic boolean condition for a conditional
2531 // instruction.
2532 //
2533 // Instructions specify two basic values for encoding.  Again, a
2534 // function is available to check if the constant displacement is an
2535 // oop. They use the ins_encode keyword to specify their encoding
2536 // classes (which must be a sequence of enc_class names, and their
2537 // parameters, specified in the encoding block), and they use the
2538 // opcode keyword to specify, in order, their primary, secondary, and
2539 // tertiary opcode.  Only the opcode sections which a particular
2540 // instruction needs for encoding need to be specified.
2541 encode %{
2542   // Build emit functions for each basic byte or larger field in the
2543   // intel encoding scheme (opcode, rm, sib, immediate), and call them
2544   // from C++ code in the enc_class source block.  Emit functions will
2545   // live in the main source block for now.  In future, we can
2546   // generalize this by adding a syntax that specifies the sizes of
2547   // fields in an order, so that the adlc can build the emit functions
2548   // automagically
2549 
2550   // catch all for unimplemented encodings
2551   enc_class enc_unimplemented %{
2552     C2_MacroAssembler _masm(&cbuf);
2553     __ unimplemented("C2 catch all");
2554   %}
2555 
2556   // BEGIN Non-volatile memory access
2557 
2558   // This encoding class is generated automatically from ad_encode.m4.
2559   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2560   enc_class aarch64_enc_ldrsbw(iRegI dst, memory1 mem) %{
2561     Register dst_reg = as_Register($dst$$reg);
2562     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrsbw, dst_reg, $mem->opcode(),
2563                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 1);
2564   %}
2565 
2566   // This encoding class is generated automatically from ad_encode.m4.
2567   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2568   enc_class aarch64_enc_ldrsb(iRegI dst, memory1 mem) %{
2569     Register dst_reg = as_Register($dst$$reg);
2570     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrsb, dst_reg, $mem->opcode(),
2571                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 1);
2572   %}
2573 
2574   // This encoding class is generated automatically from ad_encode.m4.
2575   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2576   enc_class aarch64_enc_ldrb(iRegI dst, memory1 mem) %{
2577     Register dst_reg = as_Register($dst$$reg);
2578     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrb, dst_reg, $mem->opcode(),
2579                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 1);
2580   %}
2581 
2582   // This encoding class is generated automatically from ad_encode.m4.
2583   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2584   enc_class aarch64_enc_ldrb(iRegL dst, memory1 mem) %{
2585     Register dst_reg = as_Register($dst$$reg);
2586     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrb, dst_reg, $mem->opcode(),
2587                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 1);
2588   %}
2589 
2590   // This encoding class is generated automatically from ad_encode.m4.
2591   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2592   enc_class aarch64_enc_ldrshw(iRegI dst, memory2 mem) %{
2593     Register dst_reg = as_Register($dst$$reg);
2594     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrshw, dst_reg, $mem->opcode(),
2595                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 2);
2596   %}
2597 
2598   // This encoding class is generated automatically from ad_encode.m4.
2599   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2600   enc_class aarch64_enc_ldrsh(iRegI dst, memory2 mem) %{
2601     Register dst_reg = as_Register($dst$$reg);
2602     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrsh, dst_reg, $mem->opcode(),
2603                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 2);
2604   %}
2605 
2606   // This encoding class is generated automatically from ad_encode.m4.
2607   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2608   enc_class aarch64_enc_ldrh(iRegI dst, memory2 mem) %{
2609     Register dst_reg = as_Register($dst$$reg);
2610     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrh, dst_reg, $mem->opcode(),
2611                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 2);
2612   %}
2613 
2614   // This encoding class is generated automatically from ad_encode.m4.
2615   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2616   enc_class aarch64_enc_ldrh(iRegL dst, memory2 mem) %{
2617     Register dst_reg = as_Register($dst$$reg);
2618     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrh, dst_reg, $mem->opcode(),
2619                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 2);
2620   %}
2621 
2622   // This encoding class is generated automatically from ad_encode.m4.
2623   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2624   enc_class aarch64_enc_ldrw(iRegI dst, memory4 mem) %{
2625     Register dst_reg = as_Register($dst$$reg);
2626     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrw, dst_reg, $mem->opcode(),
2627                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2628   %}
2629 
2630   // This encoding class is generated automatically from ad_encode.m4.
2631   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2632   enc_class aarch64_enc_ldrw(iRegL dst, memory4 mem) %{
2633     Register dst_reg = as_Register($dst$$reg);
2634     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrw, dst_reg, $mem->opcode(),
2635                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2636   %}
2637 
2638   // This encoding class is generated automatically from ad_encode.m4.
2639   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2640   enc_class aarch64_enc_ldrsw(iRegL dst, memory4 mem) %{
2641     Register dst_reg = as_Register($dst$$reg);
2642     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrsw, dst_reg, $mem->opcode(),
2643                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2644   %}
2645 
2646   // This encoding class is generated automatically from ad_encode.m4.
2647   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2648   enc_class aarch64_enc_ldr(iRegL dst, memory8 mem) %{
2649     Register dst_reg = as_Register($dst$$reg);
2650     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldr, dst_reg, $mem->opcode(),
2651                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 8);
2652   %}
2653 
2654   // This encoding class is generated automatically from ad_encode.m4.
2655   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2656   enc_class aarch64_enc_ldrs(vRegF dst, memory4 mem) %{
2657     FloatRegister dst_reg = as_FloatRegister($dst$$reg);
2658     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrs, dst_reg, $mem->opcode(),
2659                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2660   %}
2661 
2662   // This encoding class is generated automatically from ad_encode.m4.
2663   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2664   enc_class aarch64_enc_ldrd(vRegD dst, memory8 mem) %{
2665     FloatRegister dst_reg = as_FloatRegister($dst$$reg);
2666     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrd, dst_reg, $mem->opcode(),
2667                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 8);
2668   %}
2669 
2670   // This encoding class is generated automatically from ad_encode.m4.
2671   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2672   enc_class aarch64_enc_strb(iRegI src, memory1 mem) %{
2673     Register src_reg = as_Register($src$$reg);
2674     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::strb, src_reg, $mem->opcode(),
2675                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 1);
2676   %}
2677 
2678   // This encoding class is generated automatically from ad_encode.m4.
2679   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2680   enc_class aarch64_enc_strb0(memory1 mem) %{
2681     C2_MacroAssembler _masm(&cbuf);
2682     loadStore(_masm, &MacroAssembler::strb, zr, $mem->opcode(),
2683                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 1);
2684   %}
2685 
2686   // This encoding class is generated automatically from ad_encode.m4.
2687   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2688   enc_class aarch64_enc_strh(iRegI src, memory2 mem) %{
2689     Register src_reg = as_Register($src$$reg);
2690     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::strh, src_reg, $mem->opcode(),
2691                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 2);
2692   %}
2693 
2694   // This encoding class is generated automatically from ad_encode.m4.
2695   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2696   enc_class aarch64_enc_strh0(memory2 mem) %{
2697     C2_MacroAssembler _masm(&cbuf);
2698     loadStore(_masm, &MacroAssembler::strh, zr, $mem->opcode(),
2699                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 2);
2700   %}
2701 
2702   // This encoding class is generated automatically from ad_encode.m4.
2703   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2704   enc_class aarch64_enc_strw(iRegI src, memory4 mem) %{
2705     Register src_reg = as_Register($src$$reg);
2706     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::strw, src_reg, $mem->opcode(),
2707                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2708   %}
2709 
2710   // This encoding class is generated automatically from ad_encode.m4.
2711   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2712   enc_class aarch64_enc_strw0(memory4 mem) %{
2713     C2_MacroAssembler _masm(&cbuf);
2714     loadStore(_masm, &MacroAssembler::strw, zr, $mem->opcode(),
2715                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2716   %}
2717 
2718   // This encoding class is generated automatically from ad_encode.m4.
2719   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2720   enc_class aarch64_enc_str(iRegL src, memory8 mem) %{
2721     Register src_reg = as_Register($src$$reg);
2722     // we sometimes get asked to store the stack pointer into the
2723     // current thread -- we cannot do that directly on AArch64
2724     if (src_reg == r31_sp) {
2725       C2_MacroAssembler _masm(&cbuf);
2726       assert(as_Register($mem$$base) == rthread, "unexpected store for sp");
2727       __ mov(rscratch2, sp);
2728       src_reg = rscratch2;
2729     }
2730     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::str, src_reg, $mem->opcode(),
2731                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 8);
2732   %}
2733 
2734   // This encoding class is generated automatically from ad_encode.m4.
2735   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2736   enc_class aarch64_enc_str0(memory8 mem) %{
2737     C2_MacroAssembler _masm(&cbuf);
2738     loadStore(_masm, &MacroAssembler::str, zr, $mem->opcode(),
2739                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 8);
2740   %}
2741 
2742   // This encoding class is generated automatically from ad_encode.m4.
2743   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2744   enc_class aarch64_enc_strs(vRegF src, memory4 mem) %{
2745     FloatRegister src_reg = as_FloatRegister($src$$reg);
2746     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::strs, src_reg, $mem->opcode(),
2747                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2748   %}
2749 
2750   // This encoding class is generated automatically from ad_encode.m4.
2751   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2752   enc_class aarch64_enc_strd(vRegD src, memory8 mem) %{
2753     FloatRegister src_reg = as_FloatRegister($src$$reg);
2754     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::strd, src_reg, $mem->opcode(),
2755                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 8);
2756   %}
2757 
2758   // This encoding class is generated automatically from ad_encode.m4.
2759   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2760   enc_class aarch64_enc_strw_immn(immN src, memory1 mem) %{
2761     C2_MacroAssembler _masm(&cbuf);
2762     address con = (address)$src$$constant;
2763     // need to do this the hard way until we can manage relocs
2764     // for 32 bit constants
2765     __ movoop(rscratch2, (jobject)con);
2766     if (con) __ encode_heap_oop_not_null(rscratch2);
2767     loadStore(_masm, &MacroAssembler::strw, rscratch2, $mem->opcode(),
2768                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2769   %}
2770 
2771   // This encoding class is generated automatically from ad_encode.m4.
2772   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2773   enc_class aarch64_enc_strw_immnk(immN src, memory4 mem) %{
2774     C2_MacroAssembler _masm(&cbuf);
2775     address con = (address)$src$$constant;
2776     // need to do this the hard way until we can manage relocs
2777     // for 32 bit constants
2778     __ movoop(rscratch2, (jobject)con);
2779     __ encode_klass_not_null(rscratch2);
2780     loadStore(_masm, &MacroAssembler::strw, rscratch2, $mem->opcode(),
2781                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
2782   %}
2783 
2784   // This encoding class is generated automatically from ad_encode.m4.
2785   // DO NOT EDIT ANYTHING IN THIS SECTION OF THE FILE
2786   enc_class aarch64_enc_strb0_ordered(memory4 mem) %{
2787       C2_MacroAssembler _masm(&cbuf);
2788       __ membar(Assembler::StoreStore);
2789       loadStore(_masm, &MacroAssembler::strb, zr, $mem->opcode(),
2790                as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 1);
2791   %}
2792 
2793   // END Non-volatile memory access
2794 
2795   // Vector loads and stores
2796   enc_class aarch64_enc_ldrvS(vecD dst, memory mem) %{
2797     FloatRegister dst_reg = as_FloatRegister($dst$$reg);
2798     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldr, dst_reg, MacroAssembler::S,
2799        $mem->opcode(), as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp);
2800   %}
2801 
2802   enc_class aarch64_enc_ldrvD(vecD dst, memory mem) %{
2803     FloatRegister dst_reg = as_FloatRegister($dst$$reg);
2804     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldr, dst_reg, MacroAssembler::D,
2805        $mem->opcode(), as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp);
2806   %}
2807 
2808   enc_class aarch64_enc_ldrvQ(vecX dst, memory mem) %{
2809     FloatRegister dst_reg = as_FloatRegister($dst$$reg);
2810     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldr, dst_reg, MacroAssembler::Q,
2811        $mem->opcode(), as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp);
2812   %}
2813 
2814   enc_class aarch64_enc_strvS(vecD src, memory mem) %{
2815     FloatRegister src_reg = as_FloatRegister($src$$reg);
2816     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::str, src_reg, MacroAssembler::S,
2817        $mem->opcode(), as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp);
2818   %}
2819 
2820   enc_class aarch64_enc_strvD(vecD src, memory mem) %{
2821     FloatRegister src_reg = as_FloatRegister($src$$reg);
2822     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::str, src_reg, MacroAssembler::D,
2823        $mem->opcode(), as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp);
2824   %}
2825 
2826   enc_class aarch64_enc_strvQ(vecX src, memory mem) %{
2827     FloatRegister src_reg = as_FloatRegister($src$$reg);
2828     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::str, src_reg, MacroAssembler::Q,
2829        $mem->opcode(), as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp);
2830   %}
2831 
2832   // volatile loads and stores
2833 
2834   enc_class aarch64_enc_stlrb(iRegI src, memory mem) %{
2835     MOV_VOLATILE(as_Register($src$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2836                  rscratch1, stlrb);
2837   %}
2838 
2839   enc_class aarch64_enc_stlrh(iRegI src, memory mem) %{
2840     MOV_VOLATILE(as_Register($src$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2841                  rscratch1, stlrh);
2842   %}
2843 
2844   enc_class aarch64_enc_stlrw(iRegI src, memory mem) %{
2845     MOV_VOLATILE(as_Register($src$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2846                  rscratch1, stlrw);
2847   %}
2848 
2849 
2850   enc_class aarch64_enc_ldarsbw(iRegI dst, memory mem) %{
2851     Register dst_reg = as_Register($dst$$reg);
2852     MOV_VOLATILE(dst_reg, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2853              rscratch1, ldarb);
2854     __ sxtbw(dst_reg, dst_reg);
2855   %}
2856 
2857   enc_class aarch64_enc_ldarsb(iRegL dst, memory mem) %{
2858     Register dst_reg = as_Register($dst$$reg);
2859     MOV_VOLATILE(dst_reg, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2860              rscratch1, ldarb);
2861     __ sxtb(dst_reg, dst_reg);
2862   %}
2863 
2864   enc_class aarch64_enc_ldarbw(iRegI dst, memory mem) %{
2865     MOV_VOLATILE(as_Register($dst$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2866              rscratch1, ldarb);
2867   %}
2868 
2869   enc_class aarch64_enc_ldarb(iRegL dst, memory mem) %{
2870     MOV_VOLATILE(as_Register($dst$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2871              rscratch1, ldarb);
2872   %}
2873 
2874   enc_class aarch64_enc_ldarshw(iRegI dst, memory mem) %{
2875     Register dst_reg = as_Register($dst$$reg);
2876     MOV_VOLATILE(dst_reg, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2877              rscratch1, ldarh);
2878     __ sxthw(dst_reg, dst_reg);
2879   %}
2880 
2881   enc_class aarch64_enc_ldarsh(iRegL dst, memory mem) %{
2882     Register dst_reg = as_Register($dst$$reg);
2883     MOV_VOLATILE(dst_reg, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2884              rscratch1, ldarh);
2885     __ sxth(dst_reg, dst_reg);
2886   %}
2887 
2888   enc_class aarch64_enc_ldarhw(iRegI dst, memory mem) %{
2889     MOV_VOLATILE(as_Register($dst$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2890              rscratch1, ldarh);
2891   %}
2892 
2893   enc_class aarch64_enc_ldarh(iRegL dst, memory mem) %{
2894     MOV_VOLATILE(as_Register($dst$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2895              rscratch1, ldarh);
2896   %}
2897 
2898   enc_class aarch64_enc_ldarw(iRegI dst, memory mem) %{
2899     MOV_VOLATILE(as_Register($dst$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2900              rscratch1, ldarw);
2901   %}
2902 
2903   enc_class aarch64_enc_ldarw(iRegL dst, memory mem) %{
2904     MOV_VOLATILE(as_Register($dst$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2905              rscratch1, ldarw);
2906   %}
2907 
2908   enc_class aarch64_enc_ldar(iRegL dst, memory mem) %{
2909     MOV_VOLATILE(as_Register($dst$$reg), $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2910              rscratch1, ldar);
2911   %}
2912 
2913   enc_class aarch64_enc_fldars(vRegF dst, memory mem) %{
2914     MOV_VOLATILE(rscratch1, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2915              rscratch1, ldarw);
2916     __ fmovs(as_FloatRegister($dst$$reg), rscratch1);
2917   %}
2918 
2919   enc_class aarch64_enc_fldard(vRegD dst, memory mem) %{
2920     MOV_VOLATILE(rscratch1, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2921              rscratch1, ldar);
2922     __ fmovd(as_FloatRegister($dst$$reg), rscratch1);
2923   %}
2924 
2925   enc_class aarch64_enc_stlr(iRegL src, memory mem) %{
2926     Register src_reg = as_Register($src$$reg);
2927     // we sometimes get asked to store the stack pointer into the
2928     // current thread -- we cannot do that directly on AArch64
2929     if (src_reg == r31_sp) {
2930       C2_MacroAssembler _masm(&cbuf);
2931       assert(as_Register($mem$$base) == rthread, "unexpected store for sp");
2932       __ mov(rscratch2, sp);
2933       src_reg = rscratch2;
2934     }
2935     MOV_VOLATILE(src_reg, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2936                  rscratch1, stlr);
2937   %}
2938 
2939   enc_class aarch64_enc_fstlrs(vRegF src, memory mem) %{
2940     {
2941       C2_MacroAssembler _masm(&cbuf);
2942       FloatRegister src_reg = as_FloatRegister($src$$reg);
2943       __ fmovs(rscratch2, src_reg);
2944     }
2945     MOV_VOLATILE(rscratch2, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2946                  rscratch1, stlrw);
2947   %}
2948 
2949   enc_class aarch64_enc_fstlrd(vRegD src, memory mem) %{
2950     {
2951       C2_MacroAssembler _masm(&cbuf);
2952       FloatRegister src_reg = as_FloatRegister($src$$reg);
2953       __ fmovd(rscratch2, src_reg);
2954     }
2955     MOV_VOLATILE(rscratch2, $mem$$base, $mem$$index, $mem$$scale, $mem$$disp,
2956                  rscratch1, stlr);
2957   %}
2958 
2959   // synchronized read/update encodings
2960 
2961   enc_class aarch64_enc_ldaxr(iRegL dst, memory8 mem) %{
2962     C2_MacroAssembler _masm(&cbuf);
2963     Register dst_reg = as_Register($dst$$reg);
2964     Register base = as_Register($mem$$base);
2965     int index = $mem$$index;
2966     int scale = $mem$$scale;
2967     int disp = $mem$$disp;
2968     if (index == -1) {
2969        if (disp != 0) {
2970         __ lea(rscratch1, Address(base, disp));
2971         __ ldaxr(dst_reg, rscratch1);
2972       } else {
2973         // TODO
2974         // should we ever get anything other than this case?
2975         __ ldaxr(dst_reg, base);
2976       }
2977     } else {
2978       Register index_reg = as_Register(index);
2979       if (disp == 0) {
2980         __ lea(rscratch1, Address(base, index_reg, Address::lsl(scale)));
2981         __ ldaxr(dst_reg, rscratch1);
2982       } else {
2983         __ lea(rscratch1, Address(base, disp));
2984         __ lea(rscratch1, Address(rscratch1, index_reg, Address::lsl(scale)));
2985         __ ldaxr(dst_reg, rscratch1);
2986       }
2987     }
2988   %}
2989 
2990   enc_class aarch64_enc_stlxr(iRegLNoSp src, memory8 mem) %{
2991     C2_MacroAssembler _masm(&cbuf);
2992     Register src_reg = as_Register($src$$reg);
2993     Register base = as_Register($mem$$base);
2994     int index = $mem$$index;
2995     int scale = $mem$$scale;
2996     int disp = $mem$$disp;
2997     if (index == -1) {
2998        if (disp != 0) {
2999         __ lea(rscratch2, Address(base, disp));
3000         __ stlxr(rscratch1, src_reg, rscratch2);
3001       } else {
3002         // TODO
3003         // should we ever get anything other than this case?
3004         __ stlxr(rscratch1, src_reg, base);
3005       }
3006     } else {
3007       Register index_reg = as_Register(index);
3008       if (disp == 0) {
3009         __ lea(rscratch2, Address(base, index_reg, Address::lsl(scale)));
3010         __ stlxr(rscratch1, src_reg, rscratch2);
3011       } else {
3012         __ lea(rscratch2, Address(base, disp));
3013         __ lea(rscratch2, Address(rscratch2, index_reg, Address::lsl(scale)));
3014         __ stlxr(rscratch1, src_reg, rscratch2);
3015       }
3016     }
3017     __ cmpw(rscratch1, zr);
3018   %}
3019 
3020   enc_class aarch64_enc_cmpxchg(memory mem, iRegLNoSp oldval, iRegLNoSp newval) %{
3021     C2_MacroAssembler _masm(&cbuf);
3022     guarantee($mem$$index == -1 && $mem$$disp == 0, "impossible encoding");
3023     __ cmpxchg($mem$$base$$Register, $oldval$$Register, $newval$$Register,
3024                Assembler::xword, /*acquire*/ false, /*release*/ true,
3025                /*weak*/ false, noreg);
3026   %}
3027 
3028   enc_class aarch64_enc_cmpxchgw(memory mem, iRegINoSp oldval, iRegINoSp newval) %{
3029     C2_MacroAssembler _masm(&cbuf);
3030     guarantee($mem$$index == -1 && $mem$$disp == 0, "impossible encoding");
3031     __ cmpxchg($mem$$base$$Register, $oldval$$Register, $newval$$Register,
3032                Assembler::word, /*acquire*/ false, /*release*/ true,
3033                /*weak*/ false, noreg);
3034   %}
3035 
3036   enc_class aarch64_enc_cmpxchgs(memory mem, iRegINoSp oldval, iRegINoSp newval) %{
3037     C2_MacroAssembler _masm(&cbuf);
3038     guarantee($mem$$index == -1 && $mem$$disp == 0, "impossible encoding");
3039     __ cmpxchg($mem$$base$$Register, $oldval$$Register, $newval$$Register,
3040                Assembler::halfword, /*acquire*/ false, /*release*/ true,
3041                /*weak*/ false, noreg);
3042   %}
3043 
3044   enc_class aarch64_enc_cmpxchgb(memory mem, iRegINoSp oldval, iRegINoSp newval) %{
3045     C2_MacroAssembler _masm(&cbuf);
3046     guarantee($mem$$index == -1 && $mem$$disp == 0, "impossible encoding");
3047     __ cmpxchg($mem$$base$$Register, $oldval$$Register, $newval$$Register,
3048                Assembler::byte, /*acquire*/ false, /*release*/ true,
3049                /*weak*/ false, noreg);
3050   %}
3051 
3052 
3053   // The only difference between aarch64_enc_cmpxchg and
3054   // aarch64_enc_cmpxchg_acq is that we use load-acquire in the
3055   // CompareAndSwap sequence to serve as a barrier on acquiring a
3056   // lock.
3057   enc_class aarch64_enc_cmpxchg_acq(memory mem, iRegLNoSp oldval, iRegLNoSp newval) %{
3058     C2_MacroAssembler _masm(&cbuf);
3059     guarantee($mem$$index == -1 && $mem$$disp == 0, "impossible encoding");
3060     __ cmpxchg($mem$$base$$Register, $oldval$$Register, $newval$$Register,
3061                Assembler::xword, /*acquire*/ true, /*release*/ true,
3062                /*weak*/ false, noreg);
3063   %}
3064 
3065   enc_class aarch64_enc_cmpxchgw_acq(memory mem, iRegINoSp oldval, iRegINoSp newval) %{
3066     C2_MacroAssembler _masm(&cbuf);
3067     guarantee($mem$$index == -1 && $mem$$disp == 0, "impossible encoding");
3068     __ cmpxchg($mem$$base$$Register, $oldval$$Register, $newval$$Register,
3069                Assembler::word, /*acquire*/ true, /*release*/ true,
3070                /*weak*/ false, noreg);
3071   %}
3072 
3073   enc_class aarch64_enc_cmpxchgs_acq(memory mem, iRegINoSp oldval, iRegINoSp newval) %{
3074     C2_MacroAssembler _masm(&cbuf);
3075     guarantee($mem$$index == -1 && $mem$$disp == 0, "impossible encoding");
3076     __ cmpxchg($mem$$base$$Register, $oldval$$Register, $newval$$Register,
3077                Assembler::halfword, /*acquire*/ true, /*release*/ true,
3078                /*weak*/ false, noreg);
3079   %}
3080 
3081   enc_class aarch64_enc_cmpxchgb_acq(memory mem, iRegINoSp oldval, iRegINoSp newval) %{
3082     C2_MacroAssembler _masm(&cbuf);
3083     guarantee($mem$$index == -1 && $mem$$disp == 0, "impossible encoding");
3084     __ cmpxchg($mem$$base$$Register, $oldval$$Register, $newval$$Register,
3085                Assembler::byte, /*acquire*/ true, /*release*/ true,
3086                /*weak*/ false, noreg);
3087   %}
3088 
3089   // auxiliary used for CompareAndSwapX to set result register
3090   enc_class aarch64_enc_cset_eq(iRegINoSp res) %{
3091     C2_MacroAssembler _masm(&cbuf);
3092     Register res_reg = as_Register($res$$reg);
3093     __ cset(res_reg, Assembler::EQ);
3094   %}
3095 
3096   // prefetch encodings
3097 
3098   enc_class aarch64_enc_prefetchw(memory mem) %{
3099     C2_MacroAssembler _masm(&cbuf);
3100     Register base = as_Register($mem$$base);
3101     int index = $mem$$index;
3102     int scale = $mem$$scale;
3103     int disp = $mem$$disp;
3104     if (index == -1) {
3105       __ prfm(Address(base, disp), PSTL1KEEP);
3106     } else {
3107       Register index_reg = as_Register(index);
3108       if (disp == 0) {
3109         __ prfm(Address(base, index_reg, Address::lsl(scale)), PSTL1KEEP);
3110       } else {
3111         __ lea(rscratch1, Address(base, disp));
3112         __ prfm(Address(rscratch1, index_reg, Address::lsl(scale)), PSTL1KEEP);
3113       }
3114     }
3115   %}
3116 
3117   /// mov envcodings
3118 
3119   enc_class aarch64_enc_movw_imm(iRegI dst, immI src) %{
3120     C2_MacroAssembler _masm(&cbuf);
3121     u_int32_t con = (u_int32_t)$src$$constant;
3122     Register dst_reg = as_Register($dst$$reg);
3123     if (con == 0) {
3124       __ movw(dst_reg, zr);
3125     } else {
3126       __ movw(dst_reg, con);
3127     }
3128   %}
3129 
3130   enc_class aarch64_enc_mov_imm(iRegL dst, immL src) %{
3131     C2_MacroAssembler _masm(&cbuf);
3132     Register dst_reg = as_Register($dst$$reg);
3133     u_int64_t con = (u_int64_t)$src$$constant;
3134     if (con == 0) {
3135       __ mov(dst_reg, zr);
3136     } else {
3137       __ mov(dst_reg, con);
3138     }
3139   %}
3140 
3141   enc_class aarch64_enc_mov_p(iRegP dst, immP src) %{
3142     C2_MacroAssembler _masm(&cbuf);
3143     Register dst_reg = as_Register($dst$$reg);
3144     address con = (address)$src$$constant;
3145     if (con == NULL || con == (address)1) {
3146       ShouldNotReachHere();
3147     } else {
3148       relocInfo::relocType rtype = $src->constant_reloc();
3149       if (rtype == relocInfo::oop_type) {
3150         __ movoop(dst_reg, (jobject)con, /*immediate*/true);
3151       } else if (rtype == relocInfo::metadata_type) {
3152         __ mov_metadata(dst_reg, (Metadata*)con);
3153       } else {
3154         assert(rtype == relocInfo::none, "unexpected reloc type");
3155         if (con < (address)(uintptr_t)os::vm_page_size()) {
3156           __ mov(dst_reg, con);
3157         } else {
3158           unsigned long offset;
3159           __ adrp(dst_reg, con, offset);
3160           __ add(dst_reg, dst_reg, offset);
3161         }
3162       }
3163     }
3164   %}
3165 
3166   enc_class aarch64_enc_mov_p0(iRegP dst, immP0 src) %{
3167     C2_MacroAssembler _masm(&cbuf);
3168     Register dst_reg = as_Register($dst$$reg);
3169     __ mov(dst_reg, zr);
3170   %}
3171 
3172   enc_class aarch64_enc_mov_p1(iRegP dst, immP_1 src) %{
3173     C2_MacroAssembler _masm(&cbuf);
3174     Register dst_reg = as_Register($dst$$reg);
3175     __ mov(dst_reg, (u_int64_t)1);
3176   %}
3177 
3178   enc_class aarch64_enc_mov_byte_map_base(iRegP dst, immByteMapBase src) %{
3179     C2_MacroAssembler _masm(&cbuf);
3180     __ load_byte_map_base($dst$$Register);
3181   %}
3182 
3183   enc_class aarch64_enc_mov_n(iRegN dst, immN src) %{
3184     C2_MacroAssembler _masm(&cbuf);
3185     Register dst_reg = as_Register($dst$$reg);
3186     address con = (address)$src$$constant;
3187     if (con == NULL) {
3188       ShouldNotReachHere();
3189     } else {
3190       relocInfo::relocType rtype = $src->constant_reloc();
3191       assert(rtype == relocInfo::oop_type, "unexpected reloc type");
3192       __ set_narrow_oop(dst_reg, (jobject)con);
3193     }
3194   %}
3195 
3196   enc_class aarch64_enc_mov_n0(iRegN dst, immN0 src) %{
3197     C2_MacroAssembler _masm(&cbuf);
3198     Register dst_reg = as_Register($dst$$reg);
3199     __ mov(dst_reg, zr);
3200   %}
3201 
3202   enc_class aarch64_enc_mov_nk(iRegN dst, immNKlass src) %{
3203     C2_MacroAssembler _masm(&cbuf);
3204     Register dst_reg = as_Register($dst$$reg);
3205     address con = (address)$src$$constant;
3206     if (con == NULL) {
3207       ShouldNotReachHere();
3208     } else {
3209       relocInfo::relocType rtype = $src->constant_reloc();
3210       assert(rtype == relocInfo::metadata_type, "unexpected reloc type");
3211       __ set_narrow_klass(dst_reg, (Klass *)con);
3212     }
3213   %}
3214 
3215   // arithmetic encodings
3216 
3217   enc_class aarch64_enc_addsubw_imm(iRegI dst, iRegI src1, immIAddSub src2) %{
3218     C2_MacroAssembler _masm(&cbuf);
3219     Register dst_reg = as_Register($dst$$reg);
3220     Register src_reg = as_Register($src1$$reg);
3221     int32_t con = (int32_t)$src2$$constant;
3222     // add has primary == 0, subtract has primary == 1
3223     if ($primary) { con = -con; }
3224     if (con < 0) {
3225       __ subw(dst_reg, src_reg, -con);
3226     } else {
3227       __ addw(dst_reg, src_reg, con);
3228     }
3229   %}
3230 
3231   enc_class aarch64_enc_addsub_imm(iRegL dst, iRegL src1, immLAddSub src2) %{
3232     C2_MacroAssembler _masm(&cbuf);
3233     Register dst_reg = as_Register($dst$$reg);
3234     Register src_reg = as_Register($src1$$reg);
3235     int32_t con = (int32_t)$src2$$constant;
3236     // add has primary == 0, subtract has primary == 1
3237     if ($primary) { con = -con; }
3238     if (con < 0) {
3239       __ sub(dst_reg, src_reg, -con);
3240     } else {
3241       __ add(dst_reg, src_reg, con);
3242     }
3243   %}
3244 
3245   enc_class aarch64_enc_divw(iRegI dst, iRegI src1, iRegI src2) %{
3246     C2_MacroAssembler _masm(&cbuf);
3247    Register dst_reg = as_Register($dst$$reg);
3248    Register src1_reg = as_Register($src1$$reg);
3249    Register src2_reg = as_Register($src2$$reg);
3250     __ corrected_idivl(dst_reg, src1_reg, src2_reg, false, rscratch1);
3251   %}
3252 
3253   enc_class aarch64_enc_div(iRegI dst, iRegI src1, iRegI src2) %{
3254     C2_MacroAssembler _masm(&cbuf);
3255    Register dst_reg = as_Register($dst$$reg);
3256    Register src1_reg = as_Register($src1$$reg);
3257    Register src2_reg = as_Register($src2$$reg);
3258     __ corrected_idivq(dst_reg, src1_reg, src2_reg, false, rscratch1);
3259   %}
3260 
3261   enc_class aarch64_enc_modw(iRegI dst, iRegI src1, iRegI src2) %{
3262     C2_MacroAssembler _masm(&cbuf);
3263    Register dst_reg = as_Register($dst$$reg);
3264    Register src1_reg = as_Register($src1$$reg);
3265    Register src2_reg = as_Register($src2$$reg);
3266     __ corrected_idivl(dst_reg, src1_reg, src2_reg, true, rscratch1);
3267   %}
3268 
3269   enc_class aarch64_enc_mod(iRegI dst, iRegI src1, iRegI src2) %{
3270     C2_MacroAssembler _masm(&cbuf);
3271    Register dst_reg = as_Register($dst$$reg);
3272    Register src1_reg = as_Register($src1$$reg);
3273    Register src2_reg = as_Register($src2$$reg);
3274     __ corrected_idivq(dst_reg, src1_reg, src2_reg, true, rscratch1);
3275   %}
3276 
3277   // compare instruction encodings
3278 
3279   enc_class aarch64_enc_cmpw(iRegI src1, iRegI src2) %{
3280     C2_MacroAssembler _masm(&cbuf);
3281     Register reg1 = as_Register($src1$$reg);
3282     Register reg2 = as_Register($src2$$reg);
3283     __ cmpw(reg1, reg2);
3284   %}
3285 
3286   enc_class aarch64_enc_cmpw_imm_addsub(iRegI src1, immIAddSub src2) %{
3287     C2_MacroAssembler _masm(&cbuf);
3288     Register reg = as_Register($src1$$reg);
3289     int32_t val = $src2$$constant;
3290     if (val >= 0) {
3291       __ subsw(zr, reg, val);
3292     } else {
3293       __ addsw(zr, reg, -val);
3294     }
3295   %}
3296 
3297   enc_class aarch64_enc_cmpw_imm(iRegI src1, immI src2) %{
3298     C2_MacroAssembler _masm(&cbuf);
3299     Register reg1 = as_Register($src1$$reg);
3300     u_int32_t val = (u_int32_t)$src2$$constant;
3301     __ movw(rscratch1, val);
3302     __ cmpw(reg1, rscratch1);
3303   %}
3304 
3305   enc_class aarch64_enc_cmp(iRegL src1, iRegL src2) %{
3306     C2_MacroAssembler _masm(&cbuf);
3307     Register reg1 = as_Register($src1$$reg);
3308     Register reg2 = as_Register($src2$$reg);
3309     __ cmp(reg1, reg2);
3310   %}
3311 
3312   enc_class aarch64_enc_cmp_imm_addsub(iRegL src1, immL12 src2) %{
3313     C2_MacroAssembler _masm(&cbuf);
3314     Register reg = as_Register($src1$$reg);
3315     int64_t val = $src2$$constant;
3316     if (val >= 0) {
3317       __ subs(zr, reg, val);
3318     } else if (val != -val) {
3319       __ adds(zr, reg, -val);
3320     } else {
3321     // aargh, Long.MIN_VALUE is a special case
3322       __ orr(rscratch1, zr, (u_int64_t)val);
3323       __ subs(zr, reg, rscratch1);
3324     }
3325   %}
3326 
3327   enc_class aarch64_enc_cmp_imm(iRegL src1, immL src2) %{
3328     C2_MacroAssembler _masm(&cbuf);
3329     Register reg1 = as_Register($src1$$reg);
3330     u_int64_t val = (u_int64_t)$src2$$constant;
3331     __ mov(rscratch1, val);
3332     __ cmp(reg1, rscratch1);
3333   %}
3334 
3335   enc_class aarch64_enc_cmpp(iRegP src1, iRegP src2) %{
3336     C2_MacroAssembler _masm(&cbuf);
3337     Register reg1 = as_Register($src1$$reg);
3338     Register reg2 = as_Register($src2$$reg);
3339     __ cmp(reg1, reg2);
3340   %}
3341 
3342   enc_class aarch64_enc_cmpn(iRegN src1, iRegN src2) %{
3343     C2_MacroAssembler _masm(&cbuf);
3344     Register reg1 = as_Register($src1$$reg);
3345     Register reg2 = as_Register($src2$$reg);
3346     __ cmpw(reg1, reg2);
3347   %}
3348 
3349   enc_class aarch64_enc_testp(iRegP src) %{
3350     C2_MacroAssembler _masm(&cbuf);
3351     Register reg = as_Register($src$$reg);
3352     __ cmp(reg, zr);
3353   %}
3354 
3355   enc_class aarch64_enc_testn(iRegN src) %{
3356     C2_MacroAssembler _masm(&cbuf);
3357     Register reg = as_Register($src$$reg);
3358     __ cmpw(reg, zr);
3359   %}
3360 
3361   enc_class aarch64_enc_b(label lbl) %{
3362     C2_MacroAssembler _masm(&cbuf);
3363     Label *L = $lbl$$label;
3364     __ b(*L);
3365   %}
3366 
3367   enc_class aarch64_enc_br_con(cmpOp cmp, label lbl) %{
3368     C2_MacroAssembler _masm(&cbuf);
3369     Label *L = $lbl$$label;
3370     __ br ((Assembler::Condition)$cmp$$cmpcode, *L);
3371   %}
3372 
3373   enc_class aarch64_enc_br_conU(cmpOpU cmp, label lbl) %{
3374     C2_MacroAssembler _masm(&cbuf);
3375     Label *L = $lbl$$label;
3376     __ br ((Assembler::Condition)$cmp$$cmpcode, *L);
3377   %}
3378 
3379   enc_class aarch64_enc_partial_subtype_check(iRegP sub, iRegP super, iRegP temp, iRegP result)
3380   %{
3381      Register sub_reg = as_Register($sub$$reg);
3382      Register super_reg = as_Register($super$$reg);
3383      Register temp_reg = as_Register($temp$$reg);
3384      Register result_reg = as_Register($result$$reg);
3385 
3386      Label miss;
3387      C2_MacroAssembler _masm(&cbuf);
3388      __ check_klass_subtype_slow_path(sub_reg, super_reg, temp_reg, result_reg,
3389                                      NULL, &miss,
3390                                      /*set_cond_codes:*/ true);
3391      if ($primary) {
3392        __ mov(result_reg, zr);
3393      }
3394      __ bind(miss);
3395   %}
3396 
3397   enc_class aarch64_enc_java_static_call(method meth) %{
3398     C2_MacroAssembler _masm(&cbuf);
3399 
3400     address addr = (address)$meth$$method;
3401     address call;
3402     if (!_method) {
3403       // A call to a runtime wrapper, e.g. new, new_typeArray_Java, uncommon_trap.
3404       call = __ trampoline_call(Address(addr, relocInfo::runtime_call_type), &cbuf);
3405     } else {
3406       int method_index = resolved_method_index(cbuf);
3407       RelocationHolder rspec = _optimized_virtual ? opt_virtual_call_Relocation::spec(method_index)
3408                                                   : static_call_Relocation::spec(method_index);
3409       call = __ trampoline_call(Address(addr, rspec), &cbuf);
3410 
3411       // Emit stub for static call
3412       address stub = CompiledStaticCall::emit_to_interp_stub(cbuf);
3413       if (stub == NULL) {
3414         ciEnv::current()->record_failure("CodeCache is full");
3415         return;
3416       }
3417     }
3418     if (call == NULL) {
3419       ciEnv::current()->record_failure("CodeCache is full");
3420       return;
3421     }
3422   %}
3423 
3424   enc_class aarch64_enc_java_dynamic_call(method meth) %{
3425     C2_MacroAssembler _masm(&cbuf);
3426     int method_index = resolved_method_index(cbuf);
3427     address call = __ ic_call((address)$meth$$method, method_index);
3428     if (call == NULL) {
3429       ciEnv::current()->record_failure("CodeCache is full");
3430       return;
3431     }
3432   %}
3433 
3434   enc_class aarch64_enc_call_epilog() %{
3435     C2_MacroAssembler _masm(&cbuf);
3436     if (VerifyStackAtCalls) {
3437       // Check that stack depth is unchanged: find majik cookie on stack
3438       __ call_Unimplemented();
3439     }
3440   %}
3441 
3442   enc_class aarch64_enc_java_to_runtime(method meth) %{
3443     C2_MacroAssembler _masm(&cbuf);
3444 
3445     // some calls to generated routines (arraycopy code) are scheduled
3446     // by C2 as runtime calls. if so we can call them using a br (they
3447     // will be in a reachable segment) otherwise we have to use a blr
3448     // which loads the absolute address into a register.
3449     address entry = (address)$meth$$method;
3450     CodeBlob *cb = CodeCache::find_blob(entry);
3451     if (cb) {
3452       address call = __ trampoline_call(Address(entry, relocInfo::runtime_call_type));
3453       if (call == NULL) {
3454         ciEnv::current()->record_failure("CodeCache is full");
3455         return;
3456       }
3457     } else {
3458       Label retaddr;
3459       __ adr(rscratch2, retaddr);
3460       __ lea(rscratch1, RuntimeAddress(entry));
3461       // Leave a breadcrumb for JavaFrameAnchor::capture_last_Java_pc()
3462       __ stp(zr, rscratch2, Address(__ pre(sp, -2 * wordSize)));
3463       __ blr(rscratch1);
3464       __ bind(retaddr);
3465       __ add(sp, sp, 2 * wordSize);
3466     }
3467   %}
3468 
3469   enc_class aarch64_enc_rethrow() %{
3470     C2_MacroAssembler _masm(&cbuf);
3471     __ far_jump(RuntimeAddress(OptoRuntime::rethrow_stub()));
3472   %}
3473 
3474   enc_class aarch64_enc_ret() %{
3475     C2_MacroAssembler _masm(&cbuf);
3476     __ ret(lr);
3477   %}
3478 
3479   enc_class aarch64_enc_tail_call(iRegP jump_target) %{
3480     C2_MacroAssembler _masm(&cbuf);
3481     Register target_reg = as_Register($jump_target$$reg);
3482     __ br(target_reg);
3483   %}
3484 
3485   enc_class aarch64_enc_tail_jmp(iRegP jump_target) %{
3486     C2_MacroAssembler _masm(&cbuf);
3487     Register target_reg = as_Register($jump_target$$reg);
3488     // exception oop should be in r0
3489     // ret addr has been popped into lr
3490     // callee expects it in r3
3491     __ mov(r3, lr);
3492     __ br(target_reg);
3493   %}
3494 
3495   enc_class aarch64_enc_fast_lock(iRegP object, iRegP box, iRegP tmp, iRegP tmp2) %{
3496     C2_MacroAssembler _masm(&cbuf);
3497     Register oop = as_Register($object$$reg);
3498     Register box = as_Register($box$$reg);
3499     Register disp_hdr = as_Register($tmp$$reg);
3500     Register tmp = as_Register($tmp2$$reg);
3501     Label cont;
3502     Label object_has_monitor;
3503     Label cas_failed;
3504 
3505     assert_different_registers(oop, box, tmp, disp_hdr);
3506 
3507     // Load markWord from object into displaced_header.
3508     __ ldr(disp_hdr, Address(oop, oopDesc::mark_offset_in_bytes()));
3509 
3510     if (UseBiasedLocking && !UseOptoBiasInlining) {
3511       __ biased_locking_enter(box, oop, disp_hdr, tmp, true, cont);
3512     }
3513 
3514     // Check for existing monitor
3515     __ tbnz(disp_hdr, exact_log2(markWord::monitor_value), object_has_monitor);
3516 
3517     // Set tmp to be (markWord of object | UNLOCK_VALUE).
3518     __ orr(tmp, disp_hdr, markWord::unlocked_value);
3519 
3520     // Initialize the box. (Must happen before we update the object mark!)
3521     __ str(tmp, Address(box, BasicLock::displaced_header_offset_in_bytes()));
3522 
3523     // Compare object markWord with an unlocked value (tmp) and if
3524     // equal exchange the stack address of our box with object markWord.
3525     // On failure disp_hdr contains the possibly locked markWord.
3526     __ cmpxchg(oop, tmp, box, Assembler::xword, /*acquire*/ true,
3527                /*release*/ true, /*weak*/ false, disp_hdr);
3528     __ br(Assembler::EQ, cont);
3529 
3530     assert(oopDesc::mark_offset_in_bytes() == 0, "offset of _mark is not 0");
3531 
3532     // If the compare-and-exchange succeeded, then we found an unlocked
3533     // object, will have now locked it will continue at label cont
3534 
3535     __ bind(cas_failed);
3536     // We did not see an unlocked object so try the fast recursive case.
3537 
3538     // Check if the owner is self by comparing the value in the
3539     // markWord of object (disp_hdr) with the stack pointer.
3540     __ mov(rscratch1, sp);
3541     __ sub(disp_hdr, disp_hdr, rscratch1);
3542     __ mov(tmp, (address) (~(os::vm_page_size()-1) | markWord::lock_mask_in_place));
3543     // If condition is true we are cont and hence we can store 0 as the
3544     // displaced header in the box, which indicates that it is a recursive lock.
3545     __ ands(tmp/*==0?*/, disp_hdr, tmp);   // Sets flags for result
3546     __ str(tmp/*==0, perhaps*/, Address(box, BasicLock::displaced_header_offset_in_bytes()));
3547 
3548     __ b(cont);
3549 
3550     // Handle existing monitor.
3551     __ bind(object_has_monitor);
3552 
3553     // The object's monitor m is unlocked iff m->owner == NULL,
3554     // otherwise m->owner may contain a thread or a stack address.
3555     //
3556     // Try to CAS m->owner from NULL to current thread.
3557     __ add(tmp, disp_hdr, (ObjectMonitor::owner_offset_in_bytes()-markWord::monitor_value));
3558     __ cmpxchg(tmp, zr, rthread, Assembler::xword, /*acquire*/ true,
3559                /*release*/ true, /*weak*/ false, noreg); // Sets flags for result
3560 
3561     // Store a non-null value into the box to avoid looking like a re-entrant
3562     // lock. The fast-path monitor unlock code checks for
3563     // markWord::monitor_value so use markWord::unused_mark which has the
3564     // relevant bit set, and also matches ObjectSynchronizer::enter.
3565     __ mov(tmp, (address)markWord::unused_mark().value());
3566     __ str(tmp, Address(box, BasicLock::displaced_header_offset_in_bytes()));
3567 
3568     __ bind(cont);
3569     // flag == EQ indicates success
3570     // flag == NE indicates failure
3571   %}
3572 
3573   enc_class aarch64_enc_fast_unlock(iRegP object, iRegP box, iRegP tmp, iRegP tmp2) %{
3574     C2_MacroAssembler _masm(&cbuf);
3575     Register oop = as_Register($object$$reg);
3576     Register box = as_Register($box$$reg);
3577     Register disp_hdr = as_Register($tmp$$reg);
3578     Register tmp = as_Register($tmp2$$reg);
3579     Label cont;
3580     Label object_has_monitor;
3581 
3582     assert_different_registers(oop, box, tmp, disp_hdr);
3583 
3584     if (UseBiasedLocking && !UseOptoBiasInlining) {
3585       __ biased_locking_exit(oop, tmp, cont);
3586     }
3587 
3588     // Find the lock address and load the displaced header from the stack.
3589     __ ldr(disp_hdr, Address(box, BasicLock::displaced_header_offset_in_bytes()));
3590 
3591     // If the displaced header is 0, we have a recursive unlock.
3592     __ cmp(disp_hdr, zr);
3593     __ br(Assembler::EQ, cont);
3594 
3595     // Handle existing monitor.
3596     __ ldr(tmp, Address(oop, oopDesc::mark_offset_in_bytes()));
3597     __ tbnz(disp_hdr, exact_log2(markWord::monitor_value), object_has_monitor);
3598 
3599     // Check if it is still a light weight lock, this is is true if we
3600     // see the stack address of the basicLock in the markWord of the
3601     // object.
3602 
3603     __ cmpxchg(oop, box, disp_hdr, Assembler::xword, /*acquire*/ false,
3604                /*release*/ true, /*weak*/ false, tmp);
3605     __ b(cont);
3606 
3607     assert(oopDesc::mark_offset_in_bytes() == 0, "offset of _mark is not 0");
3608 
3609     // Handle existing monitor.
3610     __ bind(object_has_monitor);
3611     STATIC_ASSERT(markWord::monitor_value <= INT_MAX);
3612     __ add(tmp, tmp, -(int)markWord::monitor_value); // monitor
3613     __ ldr(rscratch1, Address(tmp, ObjectMonitor::owner_offset_in_bytes()));
3614     __ ldr(disp_hdr, Address(tmp, ObjectMonitor::recursions_offset_in_bytes()));
3615     __ eor(rscratch1, rscratch1, rthread); // Will be 0 if we are the owner.
3616     __ orr(rscratch1, rscratch1, disp_hdr); // Will be 0 if there are 0 recursions
3617     __ cmp(rscratch1, zr); // Sets flags for result
3618     __ br(Assembler::NE, cont);
3619 
3620     __ ldr(rscratch1, Address(tmp, ObjectMonitor::EntryList_offset_in_bytes()));
3621     __ ldr(disp_hdr, Address(tmp, ObjectMonitor::cxq_offset_in_bytes()));
3622     __ orr(rscratch1, rscratch1, disp_hdr); // Will be 0 if both are 0.
3623     __ cmp(rscratch1, zr); // Sets flags for result
3624     __ cbnz(rscratch1, cont);
3625     // need a release store here
3626     __ lea(tmp, Address(tmp, ObjectMonitor::owner_offset_in_bytes()));
3627     __ stlr(zr, tmp); // set unowned
3628 
3629     __ bind(cont);
3630     // flag == EQ indicates success
3631     // flag == NE indicates failure
3632   %}
3633 
3634 %}
3635 
3636 //----------FRAME--------------------------------------------------------------
3637 // Definition of frame structure and management information.
3638 //
3639 //  S T A C K   L A Y O U T    Allocators stack-slot number
3640 //                             |   (to get allocators register number
3641 //  G  Owned by    |        |  v    add OptoReg::stack0())
3642 //  r   CALLER     |        |
3643 //  o     |        +--------+      pad to even-align allocators stack-slot
3644 //  w     V        |  pad0  |        numbers; owned by CALLER
3645 //  t   -----------+--------+----> Matcher::_in_arg_limit, unaligned
3646 //  h     ^        |   in   |  5
3647 //        |        |  args  |  4   Holes in incoming args owned by SELF
3648 //  |     |        |        |  3
3649 //  |     |        +--------+
3650 //  V     |        | old out|      Empty on Intel, window on Sparc
3651 //        |    old |preserve|      Must be even aligned.
3652 //        |     SP-+--------+----> Matcher::_old_SP, even aligned
3653 //        |        |   in   |  3   area for Intel ret address
3654 //     Owned by    |preserve|      Empty on Sparc.
3655 //       SELF      +--------+
3656 //        |        |  pad2  |  2   pad to align old SP
3657 //        |        +--------+  1
3658 //        |        | locks  |  0
3659 //        |        +--------+----> OptoReg::stack0(), even aligned
3660 //        |        |  pad1  | 11   pad to align new SP
3661 //        |        +--------+
3662 //        |        |        | 10
3663 //        |        | spills |  9   spills
3664 //        V        |        |  8   (pad0 slot for callee)
3665 //      -----------+--------+----> Matcher::_out_arg_limit, unaligned
3666 //        ^        |  out   |  7
3667 //        |        |  args  |  6   Holes in outgoing args owned by CALLEE
3668 //     Owned by    +--------+
3669 //      CALLEE     | new out|  6   Empty on Intel, window on Sparc
3670 //        |    new |preserve|      Must be even-aligned.
3671 //        |     SP-+--------+----> Matcher::_new_SP, even aligned
3672 //        |        |        |
3673 //
3674 // Note 1: Only region 8-11 is determined by the allocator.  Region 0-5 is
3675 //         known from SELF's arguments and the Java calling convention.
3676 //         Region 6-7 is determined per call site.
3677 // Note 2: If the calling convention leaves holes in the incoming argument
3678 //         area, those holes are owned by SELF.  Holes in the outgoing area
3679 //         are owned by the CALLEE.  Holes should not be nessecary in the
3680 //         incoming area, as the Java calling convention is completely under
3681 //         the control of the AD file.  Doubles can be sorted and packed to
3682 //         avoid holes.  Holes in the outgoing arguments may be nessecary for
3683 //         varargs C calling conventions.
3684 // Note 3: Region 0-3 is even aligned, with pad2 as needed.  Region 3-5 is
3685 //         even aligned with pad0 as needed.
3686 //         Region 6 is even aligned.  Region 6-7 is NOT even aligned;
3687 //           (the latter is true on Intel but is it false on AArch64?)
3688 //         region 6-11 is even aligned; it may be padded out more so that
3689 //         the region from SP to FP meets the minimum stack alignment.
3690 // Note 4: For I2C adapters, the incoming FP may not meet the minimum stack
3691 //         alignment.  Region 11, pad1, may be dynamically extended so that
3692 //         SP meets the minimum alignment.
3693 
3694 frame %{
3695   // What direction does stack grow in (assumed to be same for C & Java)
3696   stack_direction(TOWARDS_LOW);
3697 
3698   // These three registers define part of the calling convention
3699   // between compiled code and the interpreter.
3700 
3701   // Inline Cache Register or methodOop for I2C.
3702   inline_cache_reg(R12);
3703 
3704   // Method Oop Register when calling interpreter.
3705   interpreter_method_oop_reg(R12);
3706 
3707   // Number of stack slots consumed by locking an object
3708   sync_stack_slots(2);
3709 
3710   // Compiled code's Frame Pointer
3711   frame_pointer(R31);
3712 
3713   // Interpreter stores its frame pointer in a register which is
3714   // stored to the stack by I2CAdaptors.
3715   // I2CAdaptors convert from interpreted java to compiled java.
3716   interpreter_frame_pointer(R29);
3717 
3718   // Stack alignment requirement
3719   stack_alignment(StackAlignmentInBytes); // Alignment size in bytes (128-bit -> 16 bytes)
3720 
3721   // Number of stack slots between incoming argument block and the start of
3722   // a new frame.  The PROLOG must add this many slots to the stack.  The
3723   // EPILOG must remove this many slots. aarch64 needs two slots for
3724   // return address and fp.
3725   // TODO think this is correct but check
3726   in_preserve_stack_slots(4);
3727 
3728   // Number of outgoing stack slots killed above the out_preserve_stack_slots
3729   // for calls to C.  Supports the var-args backing area for register parms.
3730   varargs_C_out_slots_killed(frame::arg_reg_save_area_bytes/BytesPerInt);
3731 
3732   // The after-PROLOG location of the return address.  Location of
3733   // return address specifies a type (REG or STACK) and a number
3734   // representing the register number (i.e. - use a register name) or
3735   // stack slot.
3736   // Ret Addr is on stack in slot 0 if no locks or verification or alignment.
3737   // Otherwise, it is above the locks and verification slot and alignment word
3738   // TODO this may well be correct but need to check why that - 2 is there
3739   // ppc port uses 0 but we definitely need to allow for fixed_slots
3740   // which folds in the space used for monitors
3741   return_addr(STACK - 2 +
3742               align_up((Compile::current()->in_preserve_stack_slots() +
3743                         Compile::current()->fixed_slots()),
3744                        stack_alignment_in_slots()));
3745 
3746   // Body of function which returns an integer array locating
3747   // arguments either in registers or in stack slots.  Passed an array
3748   // of ideal registers called "sig" and a "length" count.  Stack-slot
3749   // offsets are based on outgoing arguments, i.e. a CALLER setting up
3750   // arguments for a CALLEE.  Incoming stack arguments are
3751   // automatically biased by the preserve_stack_slots field above.
3752 
3753   calling_convention
3754   %{
3755     // No difference between ingoing/outgoing just pass false
3756     SharedRuntime::java_calling_convention(sig_bt, regs, length, false);
3757   %}
3758 
3759   c_calling_convention
3760   %{
3761     // This is obviously always outgoing
3762     (void) SharedRuntime::c_calling_convention(sig_bt, regs, NULL, length);
3763   %}
3764 
3765   // Location of compiled Java return values.  Same as C for now.
3766   return_value
3767   %{
3768     // TODO do we allow ideal_reg == Op_RegN???
3769     assert(ideal_reg >= Op_RegI && ideal_reg <= Op_RegL,
3770            "only return normal values");
3771 
3772     static const int lo[Op_RegL + 1] = { // enum name
3773       0,                                 // Op_Node
3774       0,                                 // Op_Set
3775       R0_num,                            // Op_RegN
3776       R0_num,                            // Op_RegI
3777       R0_num,                            // Op_RegP
3778       V0_num,                            // Op_RegF
3779       V0_num,                            // Op_RegD
3780       R0_num                             // Op_RegL
3781     };
3782 
3783     static const int hi[Op_RegL + 1] = { // enum name
3784       0,                                 // Op_Node
3785       0,                                 // Op_Set
3786       OptoReg::Bad,                      // Op_RegN
3787       OptoReg::Bad,                      // Op_RegI
3788       R0_H_num,                          // Op_RegP
3789       OptoReg::Bad,                      // Op_RegF
3790       V0_H_num,                          // Op_RegD
3791       R0_H_num                           // Op_RegL
3792     };
3793 
3794     return OptoRegPair(hi[ideal_reg], lo[ideal_reg]);
3795   %}
3796 %}
3797 
3798 //----------ATTRIBUTES---------------------------------------------------------
3799 //----------Operand Attributes-------------------------------------------------
3800 op_attrib op_cost(1);        // Required cost attribute
3801 
3802 //----------Instruction Attributes---------------------------------------------
3803 ins_attrib ins_cost(INSN_COST); // Required cost attribute
3804 ins_attrib ins_size(32);        // Required size attribute (in bits)
3805 ins_attrib ins_short_branch(0); // Required flag: is this instruction
3806                                 // a non-matching short branch variant
3807                                 // of some long branch?
3808 ins_attrib ins_alignment(4);    // Required alignment attribute (must
3809                                 // be a power of 2) specifies the
3810                                 // alignment that some part of the
3811                                 // instruction (not necessarily the
3812                                 // start) requires.  If > 1, a
3813                                 // compute_padding() function must be
3814                                 // provided for the instruction
3815 
3816 //----------OPERANDS-----------------------------------------------------------
3817 // Operand definitions must precede instruction definitions for correct parsing
3818 // in the ADLC because operands constitute user defined types which are used in
3819 // instruction definitions.
3820 
3821 //----------Simple Operands----------------------------------------------------
3822 
3823 // Integer operands 32 bit
3824 // 32 bit immediate
3825 operand immI()
3826 %{
3827   match(ConI);
3828 
3829   op_cost(0);
3830   format %{ %}
3831   interface(CONST_INTER);
3832 %}
3833 
3834 // 32 bit zero
3835 operand immI0()
3836 %{
3837   predicate(n->get_int() == 0);
3838   match(ConI);
3839 
3840   op_cost(0);
3841   format %{ %}
3842   interface(CONST_INTER);
3843 %}
3844 
3845 // 32 bit unit increment
3846 operand immI_1()
3847 %{
3848   predicate(n->get_int() == 1);
3849   match(ConI);
3850 
3851   op_cost(0);
3852   format %{ %}
3853   interface(CONST_INTER);
3854 %}
3855 
3856 // 32 bit unit decrement
3857 operand immI_M1()
3858 %{
3859   predicate(n->get_int() == -1);
3860   match(ConI);
3861 
3862   op_cost(0);
3863   format %{ %}
3864   interface(CONST_INTER);
3865 %}
3866 
3867 // Shift values for add/sub extension shift
3868 operand immIExt()
3869 %{
3870   predicate(0 <= n->get_int() && (n->get_int() <= 4));
3871   match(ConI);
3872 
3873   op_cost(0);
3874   format %{ %}
3875   interface(CONST_INTER);
3876 %}
3877 
3878 operand immI_le_4()
3879 %{
3880   predicate(n->get_int() <= 4);
3881   match(ConI);
3882 
3883   op_cost(0);
3884   format %{ %}
3885   interface(CONST_INTER);
3886 %}
3887 
3888 operand immI_31()
3889 %{
3890   predicate(n->get_int() == 31);
3891   match(ConI);
3892 
3893   op_cost(0);
3894   format %{ %}
3895   interface(CONST_INTER);
3896 %}
3897 
3898 operand immI_8()
3899 %{
3900   predicate(n->get_int() == 8);
3901   match(ConI);
3902 
3903   op_cost(0);
3904   format %{ %}
3905   interface(CONST_INTER);
3906 %}
3907 
3908 operand immI_16()
3909 %{
3910   predicate(n->get_int() == 16);
3911   match(ConI);
3912 
3913   op_cost(0);
3914   format %{ %}
3915   interface(CONST_INTER);
3916 %}
3917 
3918 operand immI_24()
3919 %{
3920   predicate(n->get_int() == 24);
3921   match(ConI);
3922 
3923   op_cost(0);
3924   format %{ %}
3925   interface(CONST_INTER);
3926 %}
3927 
3928 operand immI_32()
3929 %{
3930   predicate(n->get_int() == 32);
3931   match(ConI);
3932 
3933   op_cost(0);
3934   format %{ %}
3935   interface(CONST_INTER);
3936 %}
3937 
3938 operand immI_48()
3939 %{
3940   predicate(n->get_int() == 48);
3941   match(ConI);
3942 
3943   op_cost(0);
3944   format %{ %}
3945   interface(CONST_INTER);
3946 %}
3947 
3948 operand immI_56()
3949 %{
3950   predicate(n->get_int() == 56);
3951   match(ConI);
3952 
3953   op_cost(0);
3954   format %{ %}
3955   interface(CONST_INTER);
3956 %}
3957 
3958 operand immI_63()
3959 %{
3960   predicate(n->get_int() == 63);
3961   match(ConI);
3962 
3963   op_cost(0);
3964   format %{ %}
3965   interface(CONST_INTER);
3966 %}
3967 
3968 operand immI_64()
3969 %{
3970   predicate(n->get_int() == 64);
3971   match(ConI);
3972 
3973   op_cost(0);
3974   format %{ %}
3975   interface(CONST_INTER);
3976 %}
3977 
3978 operand immI_255()
3979 %{
3980   predicate(n->get_int() == 255);
3981   match(ConI);
3982 
3983   op_cost(0);
3984   format %{ %}
3985   interface(CONST_INTER);
3986 %}
3987 
3988 operand immI_65535()
3989 %{
3990   predicate(n->get_int() == 65535);
3991   match(ConI);
3992 
3993   op_cost(0);
3994   format %{ %}
3995   interface(CONST_INTER);
3996 %}
3997 
3998 operand immL_255()
3999 %{
4000   predicate(n->get_long() == 255L);
4001   match(ConL);
4002 
4003   op_cost(0);
4004   format %{ %}
4005   interface(CONST_INTER);
4006 %}
4007 
4008 operand immL_65535()
4009 %{
4010   predicate(n->get_long() == 65535L);
4011   match(ConL);
4012 
4013   op_cost(0);
4014   format %{ %}
4015   interface(CONST_INTER);
4016 %}
4017 
4018 operand immL_4294967295()
4019 %{
4020   predicate(n->get_long() == 4294967295L);
4021   match(ConL);
4022 
4023   op_cost(0);
4024   format %{ %}
4025   interface(CONST_INTER);
4026 %}
4027 
4028 operand immL_bitmask()
4029 %{
4030   predicate((n->get_long() != 0)
4031             && ((n->get_long() & 0xc000000000000000l) == 0)
4032             && is_power_of_2(n->get_long() + 1));
4033   match(ConL);
4034 
4035   op_cost(0);
4036   format %{ %}
4037   interface(CONST_INTER);
4038 %}
4039 
4040 operand immI_bitmask()
4041 %{
4042   predicate((n->get_int() != 0)
4043             && ((n->get_int() & 0xc0000000) == 0)
4044             && is_power_of_2(n->get_int() + 1));
4045   match(ConI);
4046 
4047   op_cost(0);
4048   format %{ %}
4049   interface(CONST_INTER);
4050 %}
4051 
4052 // Scale values for scaled offset addressing modes (up to long but not quad)
4053 operand immIScale()
4054 %{
4055   predicate(0 <= n->get_int() && (n->get_int() <= 3));
4056   match(ConI);
4057 
4058   op_cost(0);
4059   format %{ %}
4060   interface(CONST_INTER);
4061 %}
4062 
4063 // 26 bit signed offset -- for pc-relative branches
4064 operand immI26()
4065 %{
4066   predicate(((-(1 << 25)) <= n->get_int()) && (n->get_int() < (1 << 25)));
4067   match(ConI);
4068 
4069   op_cost(0);
4070   format %{ %}
4071   interface(CONST_INTER);
4072 %}
4073 
4074 // 19 bit signed offset -- for pc-relative loads
4075 operand immI19()
4076 %{
4077   predicate(((-(1 << 18)) <= n->get_int()) && (n->get_int() < (1 << 18)));
4078   match(ConI);
4079 
4080   op_cost(0);
4081   format %{ %}
4082   interface(CONST_INTER);
4083 %}
4084 
4085 // 12 bit unsigned offset -- for base plus immediate loads
4086 operand immIU12()
4087 %{
4088   predicate((0 <= n->get_int()) && (n->get_int() < (1 << 12)));
4089   match(ConI);
4090 
4091   op_cost(0);
4092   format %{ %}
4093   interface(CONST_INTER);
4094 %}
4095 
4096 operand immLU12()
4097 %{
4098   predicate((0 <= n->get_long()) && (n->get_long() < (1 << 12)));
4099   match(ConL);
4100 
4101   op_cost(0);
4102   format %{ %}
4103   interface(CONST_INTER);
4104 %}
4105 
4106 // Offset for scaled or unscaled immediate loads and stores
4107 operand immIOffset()
4108 %{
4109   predicate(Address::offset_ok_for_immed(n->get_int(), 0));
4110   match(ConI);
4111 
4112   op_cost(0);
4113   format %{ %}
4114   interface(CONST_INTER);
4115 %}
4116 
4117 operand immIOffset1()
4118 %{
4119   predicate(Address::offset_ok_for_immed(n->get_int(), 0));
4120   match(ConI);
4121 
4122   op_cost(0);
4123   format %{ %}
4124   interface(CONST_INTER);
4125 %}
4126 
4127 operand immIOffset2()
4128 %{
4129   predicate(Address::offset_ok_for_immed(n->get_int(), 1));
4130   match(ConI);
4131 
4132   op_cost(0);
4133   format %{ %}
4134   interface(CONST_INTER);
4135 %}
4136 
4137 operand immIOffset4()
4138 %{
4139   predicate(Address::offset_ok_for_immed(n->get_int(), 2));
4140   match(ConI);
4141 
4142   op_cost(0);
4143   format %{ %}
4144   interface(CONST_INTER);
4145 %}
4146 
4147 operand immIOffset8()
4148 %{
4149   predicate(Address::offset_ok_for_immed(n->get_int(), 3));
4150   match(ConI);
4151 
4152   op_cost(0);
4153   format %{ %}
4154   interface(CONST_INTER);
4155 %}
4156 
4157 operand immIOffset16()
4158 %{
4159   predicate(Address::offset_ok_for_immed(n->get_int(), 4));
4160   match(ConI);
4161 
4162   op_cost(0);
4163   format %{ %}
4164   interface(CONST_INTER);
4165 %}
4166 
4167 operand immLoffset()
4168 %{
4169   predicate(Address::offset_ok_for_immed(n->get_long(), 0));
4170   match(ConL);
4171 
4172   op_cost(0);
4173   format %{ %}
4174   interface(CONST_INTER);
4175 %}
4176 
4177 operand immLoffset1()
4178 %{
4179   predicate(Address::offset_ok_for_immed(n->get_long(), 0));
4180   match(ConL);
4181 
4182   op_cost(0);
4183   format %{ %}
4184   interface(CONST_INTER);
4185 %}
4186 
4187 operand immLoffset2()
4188 %{
4189   predicate(Address::offset_ok_for_immed(n->get_long(), 1));
4190   match(ConL);
4191 
4192   op_cost(0);
4193   format %{ %}
4194   interface(CONST_INTER);
4195 %}
4196 
4197 operand immLoffset4()
4198 %{
4199   predicate(Address::offset_ok_for_immed(n->get_long(), 2));
4200   match(ConL);
4201 
4202   op_cost(0);
4203   format %{ %}
4204   interface(CONST_INTER);
4205 %}
4206 
4207 operand immLoffset8()
4208 %{
4209   predicate(Address::offset_ok_for_immed(n->get_long(), 3));
4210   match(ConL);
4211 
4212   op_cost(0);
4213   format %{ %}
4214   interface(CONST_INTER);
4215 %}
4216 
4217 operand immLoffset16()
4218 %{
4219   predicate(Address::offset_ok_for_immed(n->get_long(), 4));
4220   match(ConL);
4221 
4222   op_cost(0);
4223   format %{ %}
4224   interface(CONST_INTER);
4225 %}
4226 
4227 // 32 bit integer valid for add sub immediate
4228 operand immIAddSub()
4229 %{
4230   predicate(Assembler::operand_valid_for_add_sub_immediate((long)n->get_int()));
4231   match(ConI);
4232   op_cost(0);
4233   format %{ %}
4234   interface(CONST_INTER);
4235 %}
4236 
4237 // 32 bit unsigned integer valid for logical immediate
4238 // TODO -- check this is right when e.g the mask is 0x80000000
4239 operand immILog()
4240 %{
4241   predicate(Assembler::operand_valid_for_logical_immediate(/*is32*/true, (unsigned long)n->get_int()));
4242   match(ConI);
4243 
4244   op_cost(0);
4245   format %{ %}
4246   interface(CONST_INTER);
4247 %}
4248 
4249 // Integer operands 64 bit
4250 // 64 bit immediate
4251 operand immL()
4252 %{
4253   match(ConL);
4254 
4255   op_cost(0);
4256   format %{ %}
4257   interface(CONST_INTER);
4258 %}
4259 
4260 // 64 bit zero
4261 operand immL0()
4262 %{
4263   predicate(n->get_long() == 0);
4264   match(ConL);
4265 
4266   op_cost(0);
4267   format %{ %}
4268   interface(CONST_INTER);
4269 %}
4270 
4271 // 64 bit unit increment
4272 operand immL_1()
4273 %{
4274   predicate(n->get_long() == 1);
4275   match(ConL);
4276 
4277   op_cost(0);
4278   format %{ %}
4279   interface(CONST_INTER);
4280 %}
4281 
4282 // 64 bit unit decrement
4283 operand immL_M1()
4284 %{
4285   predicate(n->get_long() == -1);
4286   match(ConL);
4287 
4288   op_cost(0);
4289   format %{ %}
4290   interface(CONST_INTER);
4291 %}
4292 
4293 // 32 bit offset of pc in thread anchor
4294 
4295 operand immL_pc_off()
4296 %{
4297   predicate(n->get_long() == in_bytes(JavaThread::frame_anchor_offset()) +
4298                              in_bytes(JavaFrameAnchor::last_Java_pc_offset()));
4299   match(ConL);
4300 
4301   op_cost(0);
4302   format %{ %}
4303   interface(CONST_INTER);
4304 %}
4305 
4306 // 64 bit integer valid for add sub immediate
4307 operand immLAddSub()
4308 %{
4309   predicate(Assembler::operand_valid_for_add_sub_immediate(n->get_long()));
4310   match(ConL);
4311   op_cost(0);
4312   format %{ %}
4313   interface(CONST_INTER);
4314 %}
4315 
4316 // 64 bit integer valid for logical immediate
4317 operand immLLog()
4318 %{
4319   predicate(Assembler::operand_valid_for_logical_immediate(/*is32*/false, (unsigned long)n->get_long()));
4320   match(ConL);
4321   op_cost(0);
4322   format %{ %}
4323   interface(CONST_INTER);
4324 %}
4325 
4326 // Long Immediate: low 32-bit mask
4327 operand immL_32bits()
4328 %{
4329   predicate(n->get_long() == 0xFFFFFFFFL);
4330   match(ConL);
4331   op_cost(0);
4332   format %{ %}
4333   interface(CONST_INTER);
4334 %}
4335 
4336 // Pointer operands
4337 // Pointer Immediate
4338 operand immP()
4339 %{
4340   match(ConP);
4341 
4342   op_cost(0);
4343   format %{ %}
4344   interface(CONST_INTER);
4345 %}
4346 
4347 // NULL Pointer Immediate
4348 operand immP0()
4349 %{
4350   predicate(n->get_ptr() == 0);
4351   match(ConP);
4352 
4353   op_cost(0);
4354   format %{ %}
4355   interface(CONST_INTER);
4356 %}
4357 
4358 // Pointer Immediate One
4359 // this is used in object initialization (initial object header)
4360 operand immP_1()
4361 %{
4362   predicate(n->get_ptr() == 1);
4363   match(ConP);
4364 
4365   op_cost(0);
4366   format %{ %}
4367   interface(CONST_INTER);
4368 %}
4369 
4370 // Card Table Byte Map Base
4371 operand immByteMapBase()
4372 %{
4373   // Get base of card map
4374   predicate(BarrierSet::barrier_set()->is_a(BarrierSet::CardTableBarrierSet) &&
4375             (CardTable::CardValue*)n->get_ptr() == ((CardTableBarrierSet*)(BarrierSet::barrier_set()))->card_table()->byte_map_base());
4376   match(ConP);
4377 
4378   op_cost(0);
4379   format %{ %}
4380   interface(CONST_INTER);
4381 %}
4382 
4383 // Pointer Immediate Minus One
4384 // this is used when we want to write the current PC to the thread anchor
4385 operand immP_M1()
4386 %{
4387   predicate(n->get_ptr() == -1);
4388   match(ConP);
4389 
4390   op_cost(0);
4391   format %{ %}
4392   interface(CONST_INTER);
4393 %}
4394 
4395 // Pointer Immediate Minus Two
4396 // this is used when we want to write the current PC to the thread anchor
4397 operand immP_M2()
4398 %{
4399   predicate(n->get_ptr() == -2);
4400   match(ConP);
4401 
4402   op_cost(0);
4403   format %{ %}
4404   interface(CONST_INTER);
4405 %}
4406 
4407 // Float and Double operands
4408 // Double Immediate
4409 operand immD()
4410 %{
4411   match(ConD);
4412   op_cost(0);
4413   format %{ %}
4414   interface(CONST_INTER);
4415 %}
4416 
4417 // Double Immediate: +0.0d
4418 operand immD0()
4419 %{
4420   predicate(jlong_cast(n->getd()) == 0);
4421   match(ConD);
4422 
4423   op_cost(0);
4424   format %{ %}
4425   interface(CONST_INTER);
4426 %}
4427 
4428 // constant 'double +0.0'.
4429 operand immDPacked()
4430 %{
4431   predicate(Assembler::operand_valid_for_float_immediate(n->getd()));
4432   match(ConD);
4433   op_cost(0);
4434   format %{ %}
4435   interface(CONST_INTER);
4436 %}
4437 
4438 // Float Immediate
4439 operand immF()
4440 %{
4441   match(ConF);
4442   op_cost(0);
4443   format %{ %}
4444   interface(CONST_INTER);
4445 %}
4446 
4447 // Float Immediate: +0.0f.
4448 operand immF0()
4449 %{
4450   predicate(jint_cast(n->getf()) == 0);
4451   match(ConF);
4452 
4453   op_cost(0);
4454   format %{ %}
4455   interface(CONST_INTER);
4456 %}
4457 
4458 //
4459 operand immFPacked()
4460 %{
4461   predicate(Assembler::operand_valid_for_float_immediate((double)n->getf()));
4462   match(ConF);
4463   op_cost(0);
4464   format %{ %}
4465   interface(CONST_INTER);
4466 %}
4467 
4468 // Narrow pointer operands
4469 // Narrow Pointer Immediate
4470 operand immN()
4471 %{
4472   match(ConN);
4473 
4474   op_cost(0);
4475   format %{ %}
4476   interface(CONST_INTER);
4477 %}
4478 
4479 // Narrow NULL Pointer Immediate
4480 operand immN0()
4481 %{
4482   predicate(n->get_narrowcon() == 0);
4483   match(ConN);
4484 
4485   op_cost(0);
4486   format %{ %}
4487   interface(CONST_INTER);
4488 %}
4489 
4490 operand immNKlass()
4491 %{
4492   match(ConNKlass);
4493 
4494   op_cost(0);
4495   format %{ %}
4496   interface(CONST_INTER);
4497 %}
4498 
4499 // Integer 32 bit Register Operands
4500 // Integer 32 bitRegister (excludes SP)
4501 operand iRegI()
4502 %{
4503   constraint(ALLOC_IN_RC(any_reg32));
4504   match(RegI);
4505   match(iRegINoSp);
4506   op_cost(0);
4507   format %{ %}
4508   interface(REG_INTER);
4509 %}
4510 
4511 // Integer 32 bit Register not Special
4512 operand iRegINoSp()
4513 %{
4514   constraint(ALLOC_IN_RC(no_special_reg32));
4515   match(RegI);
4516   op_cost(0);
4517   format %{ %}
4518   interface(REG_INTER);
4519 %}
4520 
4521 // Integer 64 bit Register Operands
4522 // Integer 64 bit Register (includes SP)
4523 operand iRegL()
4524 %{
4525   constraint(ALLOC_IN_RC(any_reg));
4526   match(RegL);
4527   match(iRegLNoSp);
4528   op_cost(0);
4529   format %{ %}
4530   interface(REG_INTER);
4531 %}
4532 
4533 // Integer 64 bit Register not Special
4534 operand iRegLNoSp()
4535 %{
4536   constraint(ALLOC_IN_RC(no_special_reg));
4537   match(RegL);
4538   match(iRegL_R0);
4539   format %{ %}
4540   interface(REG_INTER);
4541 %}
4542 
4543 // Pointer Register Operands
4544 // Pointer Register
4545 operand iRegP()
4546 %{
4547   constraint(ALLOC_IN_RC(ptr_reg));
4548   match(RegP);
4549   match(iRegPNoSp);
4550   match(iRegP_R0);
4551   //match(iRegP_R2);
4552   //match(iRegP_R4);
4553   //match(iRegP_R5);
4554   match(thread_RegP);
4555   op_cost(0);
4556   format %{ %}
4557   interface(REG_INTER);
4558 %}
4559 
4560 // Pointer 64 bit Register not Special
4561 operand iRegPNoSp()
4562 %{
4563   constraint(ALLOC_IN_RC(no_special_ptr_reg));
4564   match(RegP);
4565   // match(iRegP);
4566   // match(iRegP_R0);
4567   // match(iRegP_R2);
4568   // match(iRegP_R4);
4569   // match(iRegP_R5);
4570   // match(thread_RegP);
4571   op_cost(0);
4572   format %{ %}
4573   interface(REG_INTER);
4574 %}
4575 
4576 // Pointer 64 bit Register R0 only
4577 operand iRegP_R0()
4578 %{
4579   constraint(ALLOC_IN_RC(r0_reg));
4580   match(RegP);
4581   // match(iRegP);
4582   match(iRegPNoSp);
4583   op_cost(0);
4584   format %{ %}
4585   interface(REG_INTER);
4586 %}
4587 
4588 // Pointer 64 bit Register R1 only
4589 operand iRegP_R1()
4590 %{
4591   constraint(ALLOC_IN_RC(r1_reg));
4592   match(RegP);
4593   // match(iRegP);
4594   match(iRegPNoSp);
4595   op_cost(0);
4596   format %{ %}
4597   interface(REG_INTER);
4598 %}
4599 
4600 // Pointer 64 bit Register R2 only
4601 operand iRegP_R2()
4602 %{
4603   constraint(ALLOC_IN_RC(r2_reg));
4604   match(RegP);
4605   // match(iRegP);
4606   match(iRegPNoSp);
4607   op_cost(0);
4608   format %{ %}
4609   interface(REG_INTER);
4610 %}
4611 
4612 // Pointer 64 bit Register R3 only
4613 operand iRegP_R3()
4614 %{
4615   constraint(ALLOC_IN_RC(r3_reg));
4616   match(RegP);
4617   // match(iRegP);
4618   match(iRegPNoSp);
4619   op_cost(0);
4620   format %{ %}
4621   interface(REG_INTER);
4622 %}
4623 
4624 // Pointer 64 bit Register R4 only
4625 operand iRegP_R4()
4626 %{
4627   constraint(ALLOC_IN_RC(r4_reg));
4628   match(RegP);
4629   // match(iRegP);
4630   match(iRegPNoSp);
4631   op_cost(0);
4632   format %{ %}
4633   interface(REG_INTER);
4634 %}
4635 
4636 // Pointer 64 bit Register R5 only
4637 operand iRegP_R5()
4638 %{
4639   constraint(ALLOC_IN_RC(r5_reg));
4640   match(RegP);
4641   // match(iRegP);
4642   match(iRegPNoSp);
4643   op_cost(0);
4644   format %{ %}
4645   interface(REG_INTER);
4646 %}
4647 
4648 // Pointer 64 bit Register R10 only
4649 operand iRegP_R10()
4650 %{
4651   constraint(ALLOC_IN_RC(r10_reg));
4652   match(RegP);
4653   // match(iRegP);
4654   match(iRegPNoSp);
4655   op_cost(0);
4656   format %{ %}
4657   interface(REG_INTER);
4658 %}
4659 
4660 // Long 64 bit Register R0 only
4661 operand iRegL_R0()
4662 %{
4663   constraint(ALLOC_IN_RC(r0_reg));
4664   match(RegL);
4665   match(iRegLNoSp);
4666   op_cost(0);
4667   format %{ %}
4668   interface(REG_INTER);
4669 %}
4670 
4671 // Long 64 bit Register R2 only
4672 operand iRegL_R2()
4673 %{
4674   constraint(ALLOC_IN_RC(r2_reg));
4675   match(RegL);
4676   match(iRegLNoSp);
4677   op_cost(0);
4678   format %{ %}
4679   interface(REG_INTER);
4680 %}
4681 
4682 // Long 64 bit Register R3 only
4683 operand iRegL_R3()
4684 %{
4685   constraint(ALLOC_IN_RC(r3_reg));
4686   match(RegL);
4687   match(iRegLNoSp);
4688   op_cost(0);
4689   format %{ %}
4690   interface(REG_INTER);
4691 %}
4692 
4693 // Long 64 bit Register R11 only
4694 operand iRegL_R11()
4695 %{
4696   constraint(ALLOC_IN_RC(r11_reg));
4697   match(RegL);
4698   match(iRegLNoSp);
4699   op_cost(0);
4700   format %{ %}
4701   interface(REG_INTER);
4702 %}
4703 
4704 // Pointer 64 bit Register FP only
4705 operand iRegP_FP()
4706 %{
4707   constraint(ALLOC_IN_RC(fp_reg));
4708   match(RegP);
4709   // match(iRegP);
4710   op_cost(0);
4711   format %{ %}
4712   interface(REG_INTER);
4713 %}
4714 
4715 // Register R0 only
4716 operand iRegI_R0()
4717 %{
4718   constraint(ALLOC_IN_RC(int_r0_reg));
4719   match(RegI);
4720   match(iRegINoSp);
4721   op_cost(0);
4722   format %{ %}
4723   interface(REG_INTER);
4724 %}
4725 
4726 // Register R2 only
4727 operand iRegI_R2()
4728 %{
4729   constraint(ALLOC_IN_RC(int_r2_reg));
4730   match(RegI);
4731   match(iRegINoSp);
4732   op_cost(0);
4733   format %{ %}
4734   interface(REG_INTER);
4735 %}
4736 
4737 // Register R3 only
4738 operand iRegI_R3()
4739 %{
4740   constraint(ALLOC_IN_RC(int_r3_reg));
4741   match(RegI);
4742   match(iRegINoSp);
4743   op_cost(0);
4744   format %{ %}
4745   interface(REG_INTER);
4746 %}
4747 
4748 
4749 // Register R4 only
4750 operand iRegI_R4()
4751 %{
4752   constraint(ALLOC_IN_RC(int_r4_reg));
4753   match(RegI);
4754   match(iRegINoSp);
4755   op_cost(0);
4756   format %{ %}
4757   interface(REG_INTER);
4758 %}
4759 
4760 
4761 // Pointer Register Operands
4762 // Narrow Pointer Register
4763 operand iRegN()
4764 %{
4765   constraint(ALLOC_IN_RC(any_reg32));
4766   match(RegN);
4767   match(iRegNNoSp);
4768   op_cost(0);
4769   format %{ %}
4770   interface(REG_INTER);
4771 %}
4772 
4773 operand iRegN_R0()
4774 %{
4775   constraint(ALLOC_IN_RC(r0_reg));
4776   match(iRegN);
4777   op_cost(0);
4778   format %{ %}
4779   interface(REG_INTER);
4780 %}
4781 
4782 operand iRegN_R2()
4783 %{
4784   constraint(ALLOC_IN_RC(r2_reg));
4785   match(iRegN);
4786   op_cost(0);
4787   format %{ %}
4788   interface(REG_INTER);
4789 %}
4790 
4791 operand iRegN_R3()
4792 %{
4793   constraint(ALLOC_IN_RC(r3_reg));
4794   match(iRegN);
4795   op_cost(0);
4796   format %{ %}
4797   interface(REG_INTER);
4798 %}
4799 
4800 // Integer 64 bit Register not Special
4801 operand iRegNNoSp()
4802 %{
4803   constraint(ALLOC_IN_RC(no_special_reg32));
4804   match(RegN);
4805   op_cost(0);
4806   format %{ %}
4807   interface(REG_INTER);
4808 %}
4809 
4810 // heap base register -- used for encoding immN0
4811 
4812 operand iRegIHeapbase()
4813 %{
4814   constraint(ALLOC_IN_RC(heapbase_reg));
4815   match(RegI);
4816   op_cost(0);
4817   format %{ %}
4818   interface(REG_INTER);
4819 %}
4820 
4821 // Float Register
4822 // Float register operands
4823 operand vRegF()
4824 %{
4825   constraint(ALLOC_IN_RC(float_reg));
4826   match(RegF);
4827 
4828   op_cost(0);
4829   format %{ %}
4830   interface(REG_INTER);
4831 %}
4832 
4833 // Double Register
4834 // Double register operands
4835 operand vRegD()
4836 %{
4837   constraint(ALLOC_IN_RC(double_reg));
4838   match(RegD);
4839 
4840   op_cost(0);
4841   format %{ %}
4842   interface(REG_INTER);
4843 %}
4844 
4845 operand vecD()
4846 %{
4847   constraint(ALLOC_IN_RC(vectord_reg));
4848   match(VecD);
4849 
4850   op_cost(0);
4851   format %{ %}
4852   interface(REG_INTER);
4853 %}
4854 
4855 operand vecX()
4856 %{
4857   constraint(ALLOC_IN_RC(vectorx_reg));
4858   match(VecX);
4859 
4860   op_cost(0);
4861   format %{ %}
4862   interface(REG_INTER);
4863 %}
4864 
4865 operand vRegD_V0()
4866 %{
4867   constraint(ALLOC_IN_RC(v0_reg));
4868   match(RegD);
4869   op_cost(0);
4870   format %{ %}
4871   interface(REG_INTER);
4872 %}
4873 
4874 operand vRegD_V1()
4875 %{
4876   constraint(ALLOC_IN_RC(v1_reg));
4877   match(RegD);
4878   op_cost(0);
4879   format %{ %}
4880   interface(REG_INTER);
4881 %}
4882 
4883 operand vRegD_V2()
4884 %{
4885   constraint(ALLOC_IN_RC(v2_reg));
4886   match(RegD);
4887   op_cost(0);
4888   format %{ %}
4889   interface(REG_INTER);
4890 %}
4891 
4892 operand vRegD_V3()
4893 %{
4894   constraint(ALLOC_IN_RC(v3_reg));
4895   match(RegD);
4896   op_cost(0);
4897   format %{ %}
4898   interface(REG_INTER);
4899 %}
4900 
4901 operand vRegD_V4()
4902 %{
4903   constraint(ALLOC_IN_RC(v4_reg));
4904   match(RegD);
4905   op_cost(0);
4906   format %{ %}
4907   interface(REG_INTER);
4908 %}
4909 
4910 operand vRegD_V5()
4911 %{
4912   constraint(ALLOC_IN_RC(v5_reg));
4913   match(RegD);
4914   op_cost(0);
4915   format %{ %}
4916   interface(REG_INTER);
4917 %}
4918 
4919 operand vRegD_V6()
4920 %{
4921   constraint(ALLOC_IN_RC(v6_reg));
4922   match(RegD);
4923   op_cost(0);
4924   format %{ %}
4925   interface(REG_INTER);
4926 %}
4927 
4928 operand vRegD_V7()
4929 %{
4930   constraint(ALLOC_IN_RC(v7_reg));
4931   match(RegD);
4932   op_cost(0);
4933   format %{ %}
4934   interface(REG_INTER);
4935 %}
4936 
4937 operand vRegD_V8()
4938 %{
4939   constraint(ALLOC_IN_RC(v8_reg));
4940   match(RegD);
4941   op_cost(0);
4942   format %{ %}
4943   interface(REG_INTER);
4944 %}
4945 
4946 operand vRegD_V9()
4947 %{
4948   constraint(ALLOC_IN_RC(v9_reg));
4949   match(RegD);
4950   op_cost(0);
4951   format %{ %}
4952   interface(REG_INTER);
4953 %}
4954 
4955 operand vRegD_V10()
4956 %{
4957   constraint(ALLOC_IN_RC(v10_reg));
4958   match(RegD);
4959   op_cost(0);
4960   format %{ %}
4961   interface(REG_INTER);
4962 %}
4963 
4964 operand vRegD_V11()
4965 %{
4966   constraint(ALLOC_IN_RC(v11_reg));
4967   match(RegD);
4968   op_cost(0);
4969   format %{ %}
4970   interface(REG_INTER);
4971 %}
4972 
4973 operand vRegD_V12()
4974 %{
4975   constraint(ALLOC_IN_RC(v12_reg));
4976   match(RegD);
4977   op_cost(0);
4978   format %{ %}
4979   interface(REG_INTER);
4980 %}
4981 
4982 operand vRegD_V13()
4983 %{
4984   constraint(ALLOC_IN_RC(v13_reg));
4985   match(RegD);
4986   op_cost(0);
4987   format %{ %}
4988   interface(REG_INTER);
4989 %}
4990 
4991 operand vRegD_V14()
4992 %{
4993   constraint(ALLOC_IN_RC(v14_reg));
4994   match(RegD);
4995   op_cost(0);
4996   format %{ %}
4997   interface(REG_INTER);
4998 %}
4999 
5000 operand vRegD_V15()
5001 %{
5002   constraint(ALLOC_IN_RC(v15_reg));
5003   match(RegD);
5004   op_cost(0);
5005   format %{ %}
5006   interface(REG_INTER);
5007 %}
5008 
5009 operand vRegD_V16()
5010 %{
5011   constraint(ALLOC_IN_RC(v16_reg));
5012   match(RegD);
5013   op_cost(0);
5014   format %{ %}
5015   interface(REG_INTER);
5016 %}
5017 
5018 operand vRegD_V17()
5019 %{
5020   constraint(ALLOC_IN_RC(v17_reg));
5021   match(RegD);
5022   op_cost(0);
5023   format %{ %}
5024   interface(REG_INTER);
5025 %}
5026 
5027 operand vRegD_V18()
5028 %{
5029   constraint(ALLOC_IN_RC(v18_reg));
5030   match(RegD);
5031   op_cost(0);
5032   format %{ %}
5033   interface(REG_INTER);
5034 %}
5035 
5036 operand vRegD_V19()
5037 %{
5038   constraint(ALLOC_IN_RC(v19_reg));
5039   match(RegD);
5040   op_cost(0);
5041   format %{ %}
5042   interface(REG_INTER);
5043 %}
5044 
5045 operand vRegD_V20()
5046 %{
5047   constraint(ALLOC_IN_RC(v20_reg));
5048   match(RegD);
5049   op_cost(0);
5050   format %{ %}
5051   interface(REG_INTER);
5052 %}
5053 
5054 operand vRegD_V21()
5055 %{
5056   constraint(ALLOC_IN_RC(v21_reg));
5057   match(RegD);
5058   op_cost(0);
5059   format %{ %}
5060   interface(REG_INTER);
5061 %}
5062 
5063 operand vRegD_V22()
5064 %{
5065   constraint(ALLOC_IN_RC(v22_reg));
5066   match(RegD);
5067   op_cost(0);
5068   format %{ %}
5069   interface(REG_INTER);
5070 %}
5071 
5072 operand vRegD_V23()
5073 %{
5074   constraint(ALLOC_IN_RC(v23_reg));
5075   match(RegD);
5076   op_cost(0);
5077   format %{ %}
5078   interface(REG_INTER);
5079 %}
5080 
5081 operand vRegD_V24()
5082 %{
5083   constraint(ALLOC_IN_RC(v24_reg));
5084   match(RegD);
5085   op_cost(0);
5086   format %{ %}
5087   interface(REG_INTER);
5088 %}
5089 
5090 operand vRegD_V25()
5091 %{
5092   constraint(ALLOC_IN_RC(v25_reg));
5093   match(RegD);
5094   op_cost(0);
5095   format %{ %}
5096   interface(REG_INTER);
5097 %}
5098 
5099 operand vRegD_V26()
5100 %{
5101   constraint(ALLOC_IN_RC(v26_reg));
5102   match(RegD);
5103   op_cost(0);
5104   format %{ %}
5105   interface(REG_INTER);
5106 %}
5107 
5108 operand vRegD_V27()
5109 %{
5110   constraint(ALLOC_IN_RC(v27_reg));
5111   match(RegD);
5112   op_cost(0);
5113   format %{ %}
5114   interface(REG_INTER);
5115 %}
5116 
5117 operand vRegD_V28()
5118 %{
5119   constraint(ALLOC_IN_RC(v28_reg));
5120   match(RegD);
5121   op_cost(0);
5122   format %{ %}
5123   interface(REG_INTER);
5124 %}
5125 
5126 operand vRegD_V29()
5127 %{
5128   constraint(ALLOC_IN_RC(v29_reg));
5129   match(RegD);
5130   op_cost(0);
5131   format %{ %}
5132   interface(REG_INTER);
5133 %}
5134 
5135 operand vRegD_V30()
5136 %{
5137   constraint(ALLOC_IN_RC(v30_reg));
5138   match(RegD);
5139   op_cost(0);
5140   format %{ %}
5141   interface(REG_INTER);
5142 %}
5143 
5144 operand vRegD_V31()
5145 %{
5146   constraint(ALLOC_IN_RC(v31_reg));
5147   match(RegD);
5148   op_cost(0);
5149   format %{ %}
5150   interface(REG_INTER);
5151 %}
5152 
5153 // Flags register, used as output of signed compare instructions
5154 
5155 // note that on AArch64 we also use this register as the output for
5156 // for floating point compare instructions (CmpF CmpD). this ensures
5157 // that ordered inequality tests use GT, GE, LT or LE none of which
5158 // pass through cases where the result is unordered i.e. one or both
5159 // inputs to the compare is a NaN. this means that the ideal code can
5160 // replace e.g. a GT with an LE and not end up capturing the NaN case
5161 // (where the comparison should always fail). EQ and NE tests are
5162 // always generated in ideal code so that unordered folds into the NE
5163 // case, matching the behaviour of AArch64 NE.
5164 //
5165 // This differs from x86 where the outputs of FP compares use a
5166 // special FP flags registers and where compares based on this
5167 // register are distinguished into ordered inequalities (cmpOpUCF) and
5168 // EQ/NEQ tests (cmpOpUCF2). x86 has to special case the latter tests
5169 // to explicitly handle the unordered case in branches. x86 also has
5170 // to include extra CMoveX rules to accept a cmpOpUCF input.
5171 
5172 operand rFlagsReg()
5173 %{
5174   constraint(ALLOC_IN_RC(int_flags));
5175   match(RegFlags);
5176 
5177   op_cost(0);
5178   format %{ "RFLAGS" %}
5179   interface(REG_INTER);
5180 %}
5181 
5182 // Flags register, used as output of unsigned compare instructions
5183 operand rFlagsRegU()
5184 %{
5185   constraint(ALLOC_IN_RC(int_flags));
5186   match(RegFlags);
5187 
5188   op_cost(0);
5189   format %{ "RFLAGSU" %}
5190   interface(REG_INTER);
5191 %}
5192 
5193 // Special Registers
5194 
5195 // Method Register
5196 operand inline_cache_RegP(iRegP reg)
5197 %{
5198   constraint(ALLOC_IN_RC(method_reg)); // inline_cache_reg
5199   match(reg);
5200   match(iRegPNoSp);
5201   op_cost(0);
5202   format %{ %}
5203   interface(REG_INTER);
5204 %}
5205 
5206 operand interpreter_method_oop_RegP(iRegP reg)
5207 %{
5208   constraint(ALLOC_IN_RC(method_reg)); // interpreter_method_oop_reg
5209   match(reg);
5210   match(iRegPNoSp);
5211   op_cost(0);
5212   format %{ %}
5213   interface(REG_INTER);
5214 %}
5215 
5216 // Thread Register
5217 operand thread_RegP(iRegP reg)
5218 %{
5219   constraint(ALLOC_IN_RC(thread_reg)); // link_reg
5220   match(reg);
5221   op_cost(0);
5222   format %{ %}
5223   interface(REG_INTER);
5224 %}
5225 
5226 operand lr_RegP(iRegP reg)
5227 %{
5228   constraint(ALLOC_IN_RC(lr_reg)); // link_reg
5229   match(reg);
5230   op_cost(0);
5231   format %{ %}
5232   interface(REG_INTER);
5233 %}
5234 
5235 //----------Memory Operands----------------------------------------------------
5236 
5237 operand indirect(iRegP reg)
5238 %{
5239   constraint(ALLOC_IN_RC(ptr_reg));
5240   match(reg);
5241   op_cost(0);
5242   format %{ "[$reg]" %}
5243   interface(MEMORY_INTER) %{
5244     base($reg);
5245     index(0xffffffff);
5246     scale(0x0);
5247     disp(0x0);
5248   %}
5249 %}
5250 
5251 operand indIndexScaledI2L(iRegP reg, iRegI ireg, immIScale scale)
5252 %{
5253   constraint(ALLOC_IN_RC(ptr_reg));
5254   predicate(size_fits_all_mem_uses(n->as_AddP(), n->in(AddPNode::Offset)->in(2)->get_int()));
5255   match(AddP reg (LShiftL (ConvI2L ireg) scale));
5256   op_cost(0);
5257   format %{ "$reg, $ireg sxtw($scale), 0, I2L" %}
5258   interface(MEMORY_INTER) %{
5259     base($reg);
5260     index($ireg);
5261     scale($scale);
5262     disp(0x0);
5263   %}
5264 %}
5265 
5266 operand indIndexScaled(iRegP reg, iRegL lreg, immIScale scale)
5267 %{
5268   constraint(ALLOC_IN_RC(ptr_reg));
5269   predicate(size_fits_all_mem_uses(n->as_AddP(), n->in(AddPNode::Offset)->in(2)->get_int()));
5270   match(AddP reg (LShiftL lreg scale));
5271   op_cost(0);
5272   format %{ "$reg, $lreg lsl($scale)" %}
5273   interface(MEMORY_INTER) %{
5274     base($reg);
5275     index($lreg);
5276     scale($scale);
5277     disp(0x0);
5278   %}
5279 %}
5280 
5281 operand indIndexI2L(iRegP reg, iRegI ireg)
5282 %{
5283   constraint(ALLOC_IN_RC(ptr_reg));
5284   match(AddP reg (ConvI2L ireg));
5285   op_cost(0);
5286   format %{ "$reg, $ireg, 0, I2L" %}
5287   interface(MEMORY_INTER) %{
5288     base($reg);
5289     index($ireg);
5290     scale(0x0);
5291     disp(0x0);
5292   %}
5293 %}
5294 
5295 operand indIndex(iRegP reg, iRegL lreg)
5296 %{
5297   constraint(ALLOC_IN_RC(ptr_reg));
5298   match(AddP reg lreg);
5299   op_cost(0);
5300   format %{ "$reg, $lreg" %}
5301   interface(MEMORY_INTER) %{
5302     base($reg);
5303     index($lreg);
5304     scale(0x0);
5305     disp(0x0);
5306   %}
5307 %}
5308 
5309 operand indOffI(iRegP reg, immIOffset off)
5310 %{
5311   constraint(ALLOC_IN_RC(ptr_reg));
5312   match(AddP reg off);
5313   op_cost(0);
5314   format %{ "[$reg, $off]" %}
5315   interface(MEMORY_INTER) %{
5316     base($reg);
5317     index(0xffffffff);
5318     scale(0x0);
5319     disp($off);
5320   %}
5321 %}
5322 
5323 operand indOffI1(iRegP reg, immIOffset1 off)
5324 %{
5325   constraint(ALLOC_IN_RC(ptr_reg));
5326   match(AddP reg off);
5327   op_cost(0);
5328   format %{ "[$reg, $off]" %}
5329   interface(MEMORY_INTER) %{
5330     base($reg);
5331     index(0xffffffff);
5332     scale(0x0);
5333     disp($off);
5334   %}
5335 %}
5336 
5337 operand indOffI2(iRegP reg, immIOffset2 off)
5338 %{
5339   constraint(ALLOC_IN_RC(ptr_reg));
5340   match(AddP reg off);
5341   op_cost(0);
5342   format %{ "[$reg, $off]" %}
5343   interface(MEMORY_INTER) %{
5344     base($reg);
5345     index(0xffffffff);
5346     scale(0x0);
5347     disp($off);
5348   %}
5349 %}
5350 
5351 operand indOffI4(iRegP reg, immIOffset4 off)
5352 %{
5353   constraint(ALLOC_IN_RC(ptr_reg));
5354   match(AddP reg off);
5355   op_cost(0);
5356   format %{ "[$reg, $off]" %}
5357   interface(MEMORY_INTER) %{
5358     base($reg);
5359     index(0xffffffff);
5360     scale(0x0);
5361     disp($off);
5362   %}
5363 %}
5364 
5365 operand indOffI8(iRegP reg, immIOffset8 off)
5366 %{
5367   constraint(ALLOC_IN_RC(ptr_reg));
5368   match(AddP reg off);
5369   op_cost(0);
5370   format %{ "[$reg, $off]" %}
5371   interface(MEMORY_INTER) %{
5372     base($reg);
5373     index(0xffffffff);
5374     scale(0x0);
5375     disp($off);
5376   %}
5377 %}
5378 
5379 operand indOffI16(iRegP reg, immIOffset16 off)
5380 %{
5381   constraint(ALLOC_IN_RC(ptr_reg));
5382   match(AddP reg off);
5383   op_cost(0);
5384   format %{ "[$reg, $off]" %}
5385   interface(MEMORY_INTER) %{
5386     base($reg);
5387     index(0xffffffff);
5388     scale(0x0);
5389     disp($off);
5390   %}
5391 %}
5392 
5393 operand indOffL(iRegP reg, immLoffset off)
5394 %{
5395   constraint(ALLOC_IN_RC(ptr_reg));
5396   match(AddP reg off);
5397   op_cost(0);
5398   format %{ "[$reg, $off]" %}
5399   interface(MEMORY_INTER) %{
5400     base($reg);
5401     index(0xffffffff);
5402     scale(0x0);
5403     disp($off);
5404   %}
5405 %}
5406 
5407 operand indOffL1(iRegP reg, immLoffset1 off)
5408 %{
5409   constraint(ALLOC_IN_RC(ptr_reg));
5410   match(AddP reg off);
5411   op_cost(0);
5412   format %{ "[$reg, $off]" %}
5413   interface(MEMORY_INTER) %{
5414     base($reg);
5415     index(0xffffffff);
5416     scale(0x0);
5417     disp($off);
5418   %}
5419 %}
5420 
5421 operand indOffL2(iRegP reg, immLoffset2 off)
5422 %{
5423   constraint(ALLOC_IN_RC(ptr_reg));
5424   match(AddP reg off);
5425   op_cost(0);
5426   format %{ "[$reg, $off]" %}
5427   interface(MEMORY_INTER) %{
5428     base($reg);
5429     index(0xffffffff);
5430     scale(0x0);
5431     disp($off);
5432   %}
5433 %}
5434 
5435 operand indOffL4(iRegP reg, immLoffset4 off)
5436 %{
5437   constraint(ALLOC_IN_RC(ptr_reg));
5438   match(AddP reg off);
5439   op_cost(0);
5440   format %{ "[$reg, $off]" %}
5441   interface(MEMORY_INTER) %{
5442     base($reg);
5443     index(0xffffffff);
5444     scale(0x0);
5445     disp($off);
5446   %}
5447 %}
5448 
5449 operand indOffL8(iRegP reg, immLoffset8 off)
5450 %{
5451   constraint(ALLOC_IN_RC(ptr_reg));
5452   match(AddP reg off);
5453   op_cost(0);
5454   format %{ "[$reg, $off]" %}
5455   interface(MEMORY_INTER) %{
5456     base($reg);
5457     index(0xffffffff);
5458     scale(0x0);
5459     disp($off);
5460   %}
5461 %}
5462 
5463 operand indOffL16(iRegP reg, immLoffset16 off)
5464 %{
5465   constraint(ALLOC_IN_RC(ptr_reg));
5466   match(AddP reg off);
5467   op_cost(0);
5468   format %{ "[$reg, $off]" %}
5469   interface(MEMORY_INTER) %{
5470     base($reg);
5471     index(0xffffffff);
5472     scale(0x0);
5473     disp($off);
5474   %}
5475 %}
5476 
5477 operand indirectN(iRegN reg)
5478 %{
5479   predicate(CompressedOops::shift() == 0);
5480   constraint(ALLOC_IN_RC(ptr_reg));
5481   match(DecodeN reg);
5482   op_cost(0);
5483   format %{ "[$reg]\t# narrow" %}
5484   interface(MEMORY_INTER) %{
5485     base($reg);
5486     index(0xffffffff);
5487     scale(0x0);
5488     disp(0x0);
5489   %}
5490 %}
5491 
5492 operand indIndexScaledI2LN(iRegN reg, iRegI ireg, immIScale scale)
5493 %{
5494   predicate(CompressedOops::shift() == 0 && size_fits_all_mem_uses(n->as_AddP(), n->in(AddPNode::Offset)->in(2)->get_int()));
5495   constraint(ALLOC_IN_RC(ptr_reg));
5496   match(AddP (DecodeN reg) (LShiftL (ConvI2L ireg) scale));
5497   op_cost(0);
5498   format %{ "$reg, $ireg sxtw($scale), 0, I2L\t# narrow" %}
5499   interface(MEMORY_INTER) %{
5500     base($reg);
5501     index($ireg);
5502     scale($scale);
5503     disp(0x0);
5504   %}
5505 %}
5506 
5507 operand indIndexScaledN(iRegN reg, iRegL lreg, immIScale scale)
5508 %{
5509   predicate(CompressedOops::shift() == 0 && size_fits_all_mem_uses(n->as_AddP(), n->in(AddPNode::Offset)->in(2)->get_int()));
5510   constraint(ALLOC_IN_RC(ptr_reg));
5511   match(AddP (DecodeN reg) (LShiftL lreg scale));
5512   op_cost(0);
5513   format %{ "$reg, $lreg lsl($scale)\t# narrow" %}
5514   interface(MEMORY_INTER) %{
5515     base($reg);
5516     index($lreg);
5517     scale($scale);
5518     disp(0x0);
5519   %}
5520 %}
5521 
5522 operand indIndexI2LN(iRegN reg, iRegI ireg)
5523 %{
5524   predicate(CompressedOops::shift() == 0);
5525   constraint(ALLOC_IN_RC(ptr_reg));
5526   match(AddP (DecodeN reg) (ConvI2L ireg));
5527   op_cost(0);
5528   format %{ "$reg, $ireg, 0, I2L\t# narrow" %}
5529   interface(MEMORY_INTER) %{
5530     base($reg);
5531     index($ireg);
5532     scale(0x0);
5533     disp(0x0);
5534   %}
5535 %}
5536 
5537 operand indIndexN(iRegN reg, iRegL lreg)
5538 %{
5539   predicate(CompressedOops::shift() == 0);
5540   constraint(ALLOC_IN_RC(ptr_reg));
5541   match(AddP (DecodeN reg) lreg);
5542   op_cost(0);
5543   format %{ "$reg, $lreg\t# narrow" %}
5544   interface(MEMORY_INTER) %{
5545     base($reg);
5546     index($lreg);
5547     scale(0x0);
5548     disp(0x0);
5549   %}
5550 %}
5551 
5552 operand indOffIN(iRegN reg, immIOffset off)
5553 %{
5554   predicate(CompressedOops::shift() == 0);
5555   constraint(ALLOC_IN_RC(ptr_reg));
5556   match(AddP (DecodeN reg) off);
5557   op_cost(0);
5558   format %{ "[$reg, $off]\t# narrow" %}
5559   interface(MEMORY_INTER) %{
5560     base($reg);
5561     index(0xffffffff);
5562     scale(0x0);
5563     disp($off);
5564   %}
5565 %}
5566 
5567 operand indOffLN(iRegN reg, immLoffset off)
5568 %{
5569   predicate(CompressedOops::shift() == 0);
5570   constraint(ALLOC_IN_RC(ptr_reg));
5571   match(AddP (DecodeN reg) off);
5572   op_cost(0);
5573   format %{ "[$reg, $off]\t# narrow" %}
5574   interface(MEMORY_INTER) %{
5575     base($reg);
5576     index(0xffffffff);
5577     scale(0x0);
5578     disp($off);
5579   %}
5580 %}
5581 
5582 
5583 
5584 // AArch64 opto stubs need to write to the pc slot in the thread anchor
5585 operand thread_anchor_pc(thread_RegP reg, immL_pc_off off)
5586 %{
5587   constraint(ALLOC_IN_RC(ptr_reg));
5588   match(AddP reg off);
5589   op_cost(0);
5590   format %{ "[$reg, $off]" %}
5591   interface(MEMORY_INTER) %{
5592     base($reg);
5593     index(0xffffffff);
5594     scale(0x0);
5595     disp($off);
5596   %}
5597 %}
5598 
5599 //----------Special Memory Operands--------------------------------------------
5600 // Stack Slot Operand - This operand is used for loading and storing temporary
5601 //                      values on the stack where a match requires a value to
5602 //                      flow through memory.
5603 operand stackSlotP(sRegP reg)
5604 %{
5605   constraint(ALLOC_IN_RC(stack_slots));
5606   op_cost(100);
5607   // No match rule because this operand is only generated in matching
5608   // match(RegP);
5609   format %{ "[$reg]" %}
5610   interface(MEMORY_INTER) %{
5611     base(0x1e);  // RSP
5612     index(0x0);  // No Index
5613     scale(0x0);  // No Scale
5614     disp($reg);  // Stack Offset
5615   %}
5616 %}
5617 
5618 operand stackSlotI(sRegI reg)
5619 %{
5620   constraint(ALLOC_IN_RC(stack_slots));
5621   // No match rule because this operand is only generated in matching
5622   // match(RegI);
5623   format %{ "[$reg]" %}
5624   interface(MEMORY_INTER) %{
5625     base(0x1e);  // RSP
5626     index(0x0);  // No Index
5627     scale(0x0);  // No Scale
5628     disp($reg);  // Stack Offset
5629   %}
5630 %}
5631 
5632 operand stackSlotF(sRegF reg)
5633 %{
5634   constraint(ALLOC_IN_RC(stack_slots));
5635   // No match rule because this operand is only generated in matching
5636   // match(RegF);
5637   format %{ "[$reg]" %}
5638   interface(MEMORY_INTER) %{
5639     base(0x1e);  // RSP
5640     index(0x0);  // No Index
5641     scale(0x0);  // No Scale
5642     disp($reg);  // Stack Offset
5643   %}
5644 %}
5645 
5646 operand stackSlotD(sRegD reg)
5647 %{
5648   constraint(ALLOC_IN_RC(stack_slots));
5649   // No match rule because this operand is only generated in matching
5650   // match(RegD);
5651   format %{ "[$reg]" %}
5652   interface(MEMORY_INTER) %{
5653     base(0x1e);  // RSP
5654     index(0x0);  // No Index
5655     scale(0x0);  // No Scale
5656     disp($reg);  // Stack Offset
5657   %}
5658 %}
5659 
5660 operand stackSlotL(sRegL reg)
5661 %{
5662   constraint(ALLOC_IN_RC(stack_slots));
5663   // No match rule because this operand is only generated in matching
5664   // match(RegL);
5665   format %{ "[$reg]" %}
5666   interface(MEMORY_INTER) %{
5667     base(0x1e);  // RSP
5668     index(0x0);  // No Index
5669     scale(0x0);  // No Scale
5670     disp($reg);  // Stack Offset
5671   %}
5672 %}
5673 
5674 // Operands for expressing Control Flow
5675 // NOTE: Label is a predefined operand which should not be redefined in
5676 //       the AD file. It is generically handled within the ADLC.
5677 
5678 //----------Conditional Branch Operands----------------------------------------
5679 // Comparison Op  - This is the operation of the comparison, and is limited to
5680 //                  the following set of codes:
5681 //                  L (<), LE (<=), G (>), GE (>=), E (==), NE (!=)
5682 //
5683 // Other attributes of the comparison, such as unsignedness, are specified
5684 // by the comparison instruction that sets a condition code flags register.
5685 // That result is represented by a flags operand whose subtype is appropriate
5686 // to the unsignedness (etc.) of the comparison.
5687 //
5688 // Later, the instruction which matches both the Comparison Op (a Bool) and
5689 // the flags (produced by the Cmp) specifies the coding of the comparison op
5690 // by matching a specific subtype of Bool operand below, such as cmpOpU.
5691 
5692 // used for signed integral comparisons and fp comparisons
5693 
5694 operand cmpOp()
5695 %{
5696   match(Bool);
5697 
5698   format %{ "" %}
5699   interface(COND_INTER) %{
5700     equal(0x0, "eq");
5701     not_equal(0x1, "ne");
5702     less(0xb, "lt");
5703     greater_equal(0xa, "ge");
5704     less_equal(0xd, "le");
5705     greater(0xc, "gt");
5706     overflow(0x6, "vs");
5707     no_overflow(0x7, "vc");
5708   %}
5709 %}
5710 
5711 // used for unsigned integral comparisons
5712 
5713 operand cmpOpU()
5714 %{
5715   match(Bool);
5716 
5717   format %{ "" %}
5718   interface(COND_INTER) %{
5719     equal(0x0, "eq");
5720     not_equal(0x1, "ne");
5721     less(0x3, "lo");
5722     greater_equal(0x2, "hs");
5723     less_equal(0x9, "ls");
5724     greater(0x8, "hi");
5725     overflow(0x6, "vs");
5726     no_overflow(0x7, "vc");
5727   %}
5728 %}
5729 
5730 // used for certain integral comparisons which can be
5731 // converted to cbxx or tbxx instructions
5732 
5733 operand cmpOpEqNe()
5734 %{
5735   match(Bool);
5736   op_cost(0);
5737   predicate(n->as_Bool()->_test._test == BoolTest::ne
5738             || n->as_Bool()->_test._test == BoolTest::eq);
5739 
5740   format %{ "" %}
5741   interface(COND_INTER) %{
5742     equal(0x0, "eq");
5743     not_equal(0x1, "ne");
5744     less(0xb, "lt");
5745     greater_equal(0xa, "ge");
5746     less_equal(0xd, "le");
5747     greater(0xc, "gt");
5748     overflow(0x6, "vs");
5749     no_overflow(0x7, "vc");
5750   %}
5751 %}
5752 
5753 // used for certain integral comparisons which can be
5754 // converted to cbxx or tbxx instructions
5755 
5756 operand cmpOpLtGe()
5757 %{
5758   match(Bool);
5759   op_cost(0);
5760 
5761   predicate(n->as_Bool()->_test._test == BoolTest::lt
5762             || n->as_Bool()->_test._test == BoolTest::ge);
5763 
5764   format %{ "" %}
5765   interface(COND_INTER) %{
5766     equal(0x0, "eq");
5767     not_equal(0x1, "ne");
5768     less(0xb, "lt");
5769     greater_equal(0xa, "ge");
5770     less_equal(0xd, "le");
5771     greater(0xc, "gt");
5772     overflow(0x6, "vs");
5773     no_overflow(0x7, "vc");
5774   %}
5775 %}
5776 
5777 // used for certain unsigned integral comparisons which can be
5778 // converted to cbxx or tbxx instructions
5779 
5780 operand cmpOpUEqNeLtGe()
5781 %{
5782   match(Bool);
5783   op_cost(0);
5784 
5785   predicate(n->as_Bool()->_test._test == BoolTest::eq
5786             || n->as_Bool()->_test._test == BoolTest::ne
5787             || n->as_Bool()->_test._test == BoolTest::lt
5788             || n->as_Bool()->_test._test == BoolTest::ge);
5789 
5790   format %{ "" %}
5791   interface(COND_INTER) %{
5792     equal(0x0, "eq");
5793     not_equal(0x1, "ne");
5794     less(0xb, "lt");
5795     greater_equal(0xa, "ge");
5796     less_equal(0xd, "le");
5797     greater(0xc, "gt");
5798     overflow(0x6, "vs");
5799     no_overflow(0x7, "vc");
5800   %}
5801 %}
5802 
5803 // Special operand allowing long args to int ops to be truncated for free
5804 
5805 operand iRegL2I(iRegL reg) %{
5806 
5807   op_cost(0);
5808 
5809   match(ConvL2I reg);
5810 
5811   format %{ "l2i($reg)" %}
5812 
5813   interface(REG_INTER)
5814 %}
5815 
5816 opclass vmem4(indirect, indIndex, indOffI4, indOffL4);
5817 opclass vmem8(indirect, indIndex, indOffI8, indOffL8);
5818 opclass vmem16(indirect, indIndex, indOffI16, indOffL16);
5819 
5820 //----------OPERAND CLASSES----------------------------------------------------
5821 // Operand Classes are groups of operands that are used as to simplify
5822 // instruction definitions by not requiring the AD writer to specify
5823 // separate instructions for every form of operand when the
5824 // instruction accepts multiple operand types with the same basic
5825 // encoding and format. The classic case of this is memory operands.
5826 
5827 // memory is used to define read/write location for load/store
5828 // instruction defs. we can turn a memory op into an Address
5829 
5830 opclass memory1(indirect, indIndexScaled, indIndexScaledI2L, indIndexI2L, indIndex, indOffI1, indOffL1,
5831                indirectN, indIndexScaledN, indIndexScaledI2LN, indIndexI2LN, indIndexN);
5832 
5833 opclass memory2(indirect, indIndexScaled, indIndexScaledI2L, indIndexI2L, indIndex, indOffI2, indOffL2,
5834                indirectN, indIndexScaledN, indIndexScaledI2LN, indIndexI2LN, indIndexN);
5835 
5836 opclass memory4(indirect, indIndexScaled, indIndexScaledI2L, indIndexI2L, indIndex, indOffI4, indOffL4,
5837                indirectN, indIndexScaledN, indIndexScaledI2LN, indIndexI2LN, indIndexN, indOffIN, indOffLN);
5838 
5839 opclass memory8(indirect, indIndexScaled, indIndexScaledI2L, indIndexI2L, indIndex, indOffI8, indOffL8,
5840                indirectN, indIndexScaledN, indIndexScaledI2LN, indIndexI2LN, indIndexN, indOffIN, indOffLN);
5841 
5842 // All of the memory operands. For the pipeline description.
5843 opclass memory(indirect, indIndexScaled, indIndexScaledI2L, indIndexI2L, indIndex,
5844                indOffI1, indOffL1, indOffI2, indOffL2, indOffI4, indOffL4, indOffI8, indOffL8,
5845                indirectN, indIndexScaledN, indIndexScaledI2LN, indIndexI2LN, indIndexN, indOffIN, indOffLN);
5846 
5847 
5848 // iRegIorL2I is used for src inputs in rules for 32 bit int (I)
5849 // operations. it allows the src to be either an iRegI or a (ConvL2I
5850 // iRegL). in the latter case the l2i normally planted for a ConvL2I
5851 // can be elided because the 32-bit instruction will just employ the
5852 // lower 32 bits anyway.
5853 //
5854 // n.b. this does not elide all L2I conversions. if the truncated
5855 // value is consumed by more than one operation then the ConvL2I
5856 // cannot be bundled into the consuming nodes so an l2i gets planted
5857 // (actually a movw $dst $src) and the downstream instructions consume
5858 // the result of the l2i as an iRegI input. That's a shame since the
5859 // movw is actually redundant but its not too costly.
5860 
5861 opclass iRegIorL2I(iRegI, iRegL2I);
5862 
5863 //----------PIPELINE-----------------------------------------------------------
5864 // Rules which define the behavior of the target architectures pipeline.
5865 
5866 // For specific pipelines, eg A53, define the stages of that pipeline
5867 //pipe_desc(ISS, EX1, EX2, WR);
5868 #define ISS S0
5869 #define EX1 S1
5870 #define EX2 S2
5871 #define WR  S3
5872 
5873 // Integer ALU reg operation
5874 pipeline %{
5875 
5876 attributes %{
5877   // ARM instructions are of fixed length
5878   fixed_size_instructions;        // Fixed size instructions TODO does
5879   max_instructions_per_bundle = 2;   // A53 = 2, A57 = 4
5880   // ARM instructions come in 32-bit word units
5881   instruction_unit_size = 4;         // An instruction is 4 bytes long
5882   instruction_fetch_unit_size = 64;  // The processor fetches one line
5883   instruction_fetch_units = 1;       // of 64 bytes
5884 
5885   // List of nop instructions
5886   nops( MachNop );
5887 %}
5888 
5889 // We don't use an actual pipeline model so don't care about resources
5890 // or description. we do use pipeline classes to introduce fixed
5891 // latencies
5892 
5893 //----------RESOURCES----------------------------------------------------------
5894 // Resources are the functional units available to the machine
5895 
5896 resources( INS0, INS1, INS01 = INS0 | INS1,
5897            ALU0, ALU1, ALU = ALU0 | ALU1,
5898            MAC,
5899            DIV,
5900            BRANCH,
5901            LDST,
5902            NEON_FP);
5903 
5904 //----------PIPELINE DESCRIPTION-----------------------------------------------
5905 // Pipeline Description specifies the stages in the machine's pipeline
5906 
5907 // Define the pipeline as a generic 6 stage pipeline
5908 pipe_desc(S0, S1, S2, S3, S4, S5);
5909 
5910 //----------PIPELINE CLASSES---------------------------------------------------
5911 // Pipeline Classes describe the stages in which input and output are
5912 // referenced by the hardware pipeline.
5913 
5914 pipe_class fp_dop_reg_reg_s(vRegF dst, vRegF src1, vRegF src2)
5915 %{
5916   single_instruction;
5917   src1   : S1(read);
5918   src2   : S2(read);
5919   dst    : S5(write);
5920   INS01  : ISS;
5921   NEON_FP : S5;
5922 %}
5923 
5924 pipe_class fp_dop_reg_reg_d(vRegD dst, vRegD src1, vRegD src2)
5925 %{
5926   single_instruction;
5927   src1   : S1(read);
5928   src2   : S2(read);
5929   dst    : S5(write);
5930   INS01  : ISS;
5931   NEON_FP : S5;
5932 %}
5933 
5934 pipe_class fp_uop_s(vRegF dst, vRegF src)
5935 %{
5936   single_instruction;
5937   src    : S1(read);
5938   dst    : S5(write);
5939   INS01  : ISS;
5940   NEON_FP : S5;
5941 %}
5942 
5943 pipe_class fp_uop_d(vRegD dst, vRegD src)
5944 %{
5945   single_instruction;
5946   src    : S1(read);
5947   dst    : S5(write);
5948   INS01  : ISS;
5949   NEON_FP : S5;
5950 %}
5951 
5952 pipe_class fp_d2f(vRegF dst, vRegD src)
5953 %{
5954   single_instruction;
5955   src    : S1(read);
5956   dst    : S5(write);
5957   INS01  : ISS;
5958   NEON_FP : S5;
5959 %}
5960 
5961 pipe_class fp_f2d(vRegD dst, vRegF src)
5962 %{
5963   single_instruction;
5964   src    : S1(read);
5965   dst    : S5(write);
5966   INS01  : ISS;
5967   NEON_FP : S5;
5968 %}
5969 
5970 pipe_class fp_f2i(iRegINoSp dst, vRegF src)
5971 %{
5972   single_instruction;
5973   src    : S1(read);
5974   dst    : S5(write);
5975   INS01  : ISS;
5976   NEON_FP : S5;
5977 %}
5978 
5979 pipe_class fp_f2l(iRegLNoSp dst, vRegF src)
5980 %{
5981   single_instruction;
5982   src    : S1(read);
5983   dst    : S5(write);
5984   INS01  : ISS;
5985   NEON_FP : S5;
5986 %}
5987 
5988 pipe_class fp_i2f(vRegF dst, iRegIorL2I src)
5989 %{
5990   single_instruction;
5991   src    : S1(read);
5992   dst    : S5(write);
5993   INS01  : ISS;
5994   NEON_FP : S5;
5995 %}
5996 
5997 pipe_class fp_l2f(vRegF dst, iRegL src)
5998 %{
5999   single_instruction;
6000   src    : S1(read);
6001   dst    : S5(write);
6002   INS01  : ISS;
6003   NEON_FP : S5;
6004 %}
6005 
6006 pipe_class fp_d2i(iRegINoSp dst, vRegD src)
6007 %{
6008   single_instruction;
6009   src    : S1(read);
6010   dst    : S5(write);
6011   INS01  : ISS;
6012   NEON_FP : S5;
6013 %}
6014 
6015 pipe_class fp_d2l(iRegLNoSp dst, vRegD src)
6016 %{
6017   single_instruction;
6018   src    : S1(read);
6019   dst    : S5(write);
6020   INS01  : ISS;
6021   NEON_FP : S5;
6022 %}
6023 
6024 pipe_class fp_i2d(vRegD dst, iRegIorL2I src)
6025 %{
6026   single_instruction;
6027   src    : S1(read);
6028   dst    : S5(write);
6029   INS01  : ISS;
6030   NEON_FP : S5;
6031 %}
6032 
6033 pipe_class fp_l2d(vRegD dst, iRegIorL2I src)
6034 %{
6035   single_instruction;
6036   src    : S1(read);
6037   dst    : S5(write);
6038   INS01  : ISS;
6039   NEON_FP : S5;
6040 %}
6041 
6042 pipe_class fp_div_s(vRegF dst, vRegF src1, vRegF src2)
6043 %{
6044   single_instruction;
6045   src1   : S1(read);
6046   src2   : S2(read);
6047   dst    : S5(write);
6048   INS0   : ISS;
6049   NEON_FP : S5;
6050 %}
6051 
6052 pipe_class fp_div_d(vRegD dst, vRegD src1, vRegD src2)
6053 %{
6054   single_instruction;
6055   src1   : S1(read);
6056   src2   : S2(read);
6057   dst    : S5(write);
6058   INS0   : ISS;
6059   NEON_FP : S5;
6060 %}
6061 
6062 pipe_class fp_cond_reg_reg_s(vRegF dst, vRegF src1, vRegF src2, rFlagsReg cr)
6063 %{
6064   single_instruction;
6065   cr     : S1(read);
6066   src1   : S1(read);
6067   src2   : S1(read);
6068   dst    : S3(write);
6069   INS01  : ISS;
6070   NEON_FP : S3;
6071 %}
6072 
6073 pipe_class fp_cond_reg_reg_d(vRegD dst, vRegD src1, vRegD src2, rFlagsReg cr)
6074 %{
6075   single_instruction;
6076   cr     : S1(read);
6077   src1   : S1(read);
6078   src2   : S1(read);
6079   dst    : S3(write);
6080   INS01  : ISS;
6081   NEON_FP : S3;
6082 %}
6083 
6084 pipe_class fp_imm_s(vRegF dst)
6085 %{
6086   single_instruction;
6087   dst    : S3(write);
6088   INS01  : ISS;
6089   NEON_FP : S3;
6090 %}
6091 
6092 pipe_class fp_imm_d(vRegD dst)
6093 %{
6094   single_instruction;
6095   dst    : S3(write);
6096   INS01  : ISS;
6097   NEON_FP : S3;
6098 %}
6099 
6100 pipe_class fp_load_constant_s(vRegF dst)
6101 %{
6102   single_instruction;
6103   dst    : S4(write);
6104   INS01  : ISS;
6105   NEON_FP : S4;
6106 %}
6107 
6108 pipe_class fp_load_constant_d(vRegD dst)
6109 %{
6110   single_instruction;
6111   dst    : S4(write);
6112   INS01  : ISS;
6113   NEON_FP : S4;
6114 %}
6115 
6116 pipe_class vmul64(vecD dst, vecD src1, vecD src2)
6117 %{
6118   single_instruction;
6119   dst    : S5(write);
6120   src1   : S1(read);
6121   src2   : S1(read);
6122   INS01  : ISS;
6123   NEON_FP : S5;
6124 %}
6125 
6126 pipe_class vmul128(vecX dst, vecX src1, vecX src2)
6127 %{
6128   single_instruction;
6129   dst    : S5(write);
6130   src1   : S1(read);
6131   src2   : S1(read);
6132   INS0   : ISS;
6133   NEON_FP : S5;
6134 %}
6135 
6136 pipe_class vmla64(vecD dst, vecD src1, vecD src2)
6137 %{
6138   single_instruction;
6139   dst    : S5(write);
6140   src1   : S1(read);
6141   src2   : S1(read);
6142   dst    : S1(read);
6143   INS01  : ISS;
6144   NEON_FP : S5;
6145 %}
6146 
6147 pipe_class vmla128(vecX dst, vecX src1, vecX src2)
6148 %{
6149   single_instruction;
6150   dst    : S5(write);
6151   src1   : S1(read);
6152   src2   : S1(read);
6153   dst    : S1(read);
6154   INS0   : ISS;
6155   NEON_FP : S5;
6156 %}
6157 
6158 pipe_class vdop64(vecD dst, vecD src1, vecD src2)
6159 %{
6160   single_instruction;
6161   dst    : S4(write);
6162   src1   : S2(read);
6163   src2   : S2(read);
6164   INS01  : ISS;
6165   NEON_FP : S4;
6166 %}
6167 
6168 pipe_class vdop128(vecX dst, vecX src1, vecX src2)
6169 %{
6170   single_instruction;
6171   dst    : S4(write);
6172   src1   : S2(read);
6173   src2   : S2(read);
6174   INS0   : ISS;
6175   NEON_FP : S4;
6176 %}
6177 
6178 pipe_class vlogical64(vecD dst, vecD src1, vecD src2)
6179 %{
6180   single_instruction;
6181   dst    : S3(write);
6182   src1   : S2(read);
6183   src2   : S2(read);
6184   INS01  : ISS;
6185   NEON_FP : S3;
6186 %}
6187 
6188 pipe_class vlogical128(vecX dst, vecX src1, vecX src2)
6189 %{
6190   single_instruction;
6191   dst    : S3(write);
6192   src1   : S2(read);
6193   src2   : S2(read);
6194   INS0   : ISS;
6195   NEON_FP : S3;
6196 %}
6197 
6198 pipe_class vshift64(vecD dst, vecD src, vecX shift)
6199 %{
6200   single_instruction;
6201   dst    : S3(write);
6202   src    : S1(read);
6203   shift  : S1(read);
6204   INS01  : ISS;
6205   NEON_FP : S3;
6206 %}
6207 
6208 pipe_class vshift128(vecX dst, vecX src, vecX shift)
6209 %{
6210   single_instruction;
6211   dst    : S3(write);
6212   src    : S1(read);
6213   shift  : S1(read);
6214   INS0   : ISS;
6215   NEON_FP : S3;
6216 %}
6217 
6218 pipe_class vshift64_imm(vecD dst, vecD src, immI shift)
6219 %{
6220   single_instruction;
6221   dst    : S3(write);
6222   src    : S1(read);
6223   INS01  : ISS;
6224   NEON_FP : S3;
6225 %}
6226 
6227 pipe_class vshift128_imm(vecX dst, vecX src, immI shift)
6228 %{
6229   single_instruction;
6230   dst    : S3(write);
6231   src    : S1(read);
6232   INS0   : ISS;
6233   NEON_FP : S3;
6234 %}
6235 
6236 pipe_class vdop_fp64(vecD dst, vecD src1, vecD src2)
6237 %{
6238   single_instruction;
6239   dst    : S5(write);
6240   src1   : S1(read);
6241   src2   : S1(read);
6242   INS01  : ISS;
6243   NEON_FP : S5;
6244 %}
6245 
6246 pipe_class vdop_fp128(vecX dst, vecX src1, vecX src2)
6247 %{
6248   single_instruction;
6249   dst    : S5(write);
6250   src1   : S1(read);
6251   src2   : S1(read);
6252   INS0   : ISS;
6253   NEON_FP : S5;
6254 %}
6255 
6256 pipe_class vmuldiv_fp64(vecD dst, vecD src1, vecD src2)
6257 %{
6258   single_instruction;
6259   dst    : S5(write);
6260   src1   : S1(read);
6261   src2   : S1(read);
6262   INS0   : ISS;
6263   NEON_FP : S5;
6264 %}
6265 
6266 pipe_class vmuldiv_fp128(vecX dst, vecX src1, vecX src2)
6267 %{
6268   single_instruction;
6269   dst    : S5(write);
6270   src1   : S1(read);
6271   src2   : S1(read);
6272   INS0   : ISS;
6273   NEON_FP : S5;
6274 %}
6275 
6276 pipe_class vsqrt_fp128(vecX dst, vecX src)
6277 %{
6278   single_instruction;
6279   dst    : S5(write);
6280   src    : S1(read);
6281   INS0   : ISS;
6282   NEON_FP : S5;
6283 %}
6284 
6285 pipe_class vunop_fp64(vecD dst, vecD src)
6286 %{
6287   single_instruction;
6288   dst    : S5(write);
6289   src    : S1(read);
6290   INS01  : ISS;
6291   NEON_FP : S5;
6292 %}
6293 
6294 pipe_class vunop_fp128(vecX dst, vecX src)
6295 %{
6296   single_instruction;
6297   dst    : S5(write);
6298   src    : S1(read);
6299   INS0   : ISS;
6300   NEON_FP : S5;
6301 %}
6302 
6303 pipe_class vdup_reg_reg64(vecD dst, iRegI src)
6304 %{
6305   single_instruction;
6306   dst    : S3(write);
6307   src    : S1(read);
6308   INS01  : ISS;
6309   NEON_FP : S3;
6310 %}
6311 
6312 pipe_class vdup_reg_reg128(vecX dst, iRegI src)
6313 %{
6314   single_instruction;
6315   dst    : S3(write);
6316   src    : S1(read);
6317   INS01  : ISS;
6318   NEON_FP : S3;
6319 %}
6320 
6321 pipe_class vdup_reg_freg64(vecD dst, vRegF src)
6322 %{
6323   single_instruction;
6324   dst    : S3(write);
6325   src    : S1(read);
6326   INS01  : ISS;
6327   NEON_FP : S3;
6328 %}
6329 
6330 pipe_class vdup_reg_freg128(vecX dst, vRegF src)
6331 %{
6332   single_instruction;
6333   dst    : S3(write);
6334   src    : S1(read);
6335   INS01  : ISS;
6336   NEON_FP : S3;
6337 %}
6338 
6339 pipe_class vdup_reg_dreg128(vecX dst, vRegD src)
6340 %{
6341   single_instruction;
6342   dst    : S3(write);
6343   src    : S1(read);
6344   INS01  : ISS;
6345   NEON_FP : S3;
6346 %}
6347 
6348 pipe_class vmovi_reg_imm64(vecD dst)
6349 %{
6350   single_instruction;
6351   dst    : S3(write);
6352   INS01  : ISS;
6353   NEON_FP : S3;
6354 %}
6355 
6356 pipe_class vmovi_reg_imm128(vecX dst)
6357 %{
6358   single_instruction;
6359   dst    : S3(write);
6360   INS0   : ISS;
6361   NEON_FP : S3;
6362 %}
6363 
6364 pipe_class vload_reg_mem64(vecD dst, vmem8 mem)
6365 %{
6366   single_instruction;
6367   dst    : S5(write);
6368   mem    : ISS(read);
6369   INS01  : ISS;
6370   NEON_FP : S3;
6371 %}
6372 
6373 pipe_class vload_reg_mem128(vecX dst, vmem16 mem)
6374 %{
6375   single_instruction;
6376   dst    : S5(write);
6377   mem    : ISS(read);
6378   INS01  : ISS;
6379   NEON_FP : S3;
6380 %}
6381 
6382 pipe_class vstore_reg_mem64(vecD src, vmem8 mem)
6383 %{
6384   single_instruction;
6385   mem    : ISS(read);
6386   src    : S2(read);
6387   INS01  : ISS;
6388   NEON_FP : S3;
6389 %}
6390 
6391 pipe_class vstore_reg_mem128(vecD src, vmem16 mem)
6392 %{
6393   single_instruction;
6394   mem    : ISS(read);
6395   src    : S2(read);
6396   INS01  : ISS;
6397   NEON_FP : S3;
6398 %}
6399 
6400 //------- Integer ALU operations --------------------------
6401 
6402 // Integer ALU reg-reg operation
6403 // Operands needed in EX1, result generated in EX2
6404 // Eg.  ADD     x0, x1, x2
6405 pipe_class ialu_reg_reg(iRegI dst, iRegI src1, iRegI src2)
6406 %{
6407   single_instruction;
6408   dst    : EX2(write);
6409   src1   : EX1(read);
6410   src2   : EX1(read);
6411   INS01  : ISS; // Dual issue as instruction 0 or 1
6412   ALU    : EX2;
6413 %}
6414 
6415 // Integer ALU reg-reg operation with constant shift
6416 // Shifted register must be available in LATE_ISS instead of EX1
6417 // Eg.  ADD     x0, x1, x2, LSL #2
6418 pipe_class ialu_reg_reg_shift(iRegI dst, iRegI src1, iRegI src2, immI shift)
6419 %{
6420   single_instruction;
6421   dst    : EX2(write);
6422   src1   : EX1(read);
6423   src2   : ISS(read);
6424   INS01  : ISS;
6425   ALU    : EX2;
6426 %}
6427 
6428 // Integer ALU reg operation with constant shift
6429 // Eg.  LSL     x0, x1, #shift
6430 pipe_class ialu_reg_shift(iRegI dst, iRegI src1)
6431 %{
6432   single_instruction;
6433   dst    : EX2(write);
6434   src1   : ISS(read);
6435   INS01  : ISS;
6436   ALU    : EX2;
6437 %}
6438 
6439 // Integer ALU reg-reg operation with variable shift
6440 // Both operands must be available in LATE_ISS instead of EX1
6441 // Result is available in EX1 instead of EX2
6442 // Eg.  LSLV    x0, x1, x2
6443 pipe_class ialu_reg_reg_vshift(iRegI dst, iRegI src1, iRegI src2)
6444 %{
6445   single_instruction;
6446   dst    : EX1(write);
6447   src1   : ISS(read);
6448   src2   : ISS(read);
6449   INS01  : ISS;
6450   ALU    : EX1;
6451 %}
6452 
6453 // Integer ALU reg-reg operation with extract
6454 // As for _vshift above, but result generated in EX2
6455 // Eg.  EXTR    x0, x1, x2, #N
6456 pipe_class ialu_reg_reg_extr(iRegI dst, iRegI src1, iRegI src2)
6457 %{
6458   single_instruction;
6459   dst    : EX2(write);
6460   src1   : ISS(read);
6461   src2   : ISS(read);
6462   INS1   : ISS; // Can only dual issue as Instruction 1
6463   ALU    : EX1;
6464 %}
6465 
6466 // Integer ALU reg operation
6467 // Eg.  NEG     x0, x1
6468 pipe_class ialu_reg(iRegI dst, iRegI src)
6469 %{
6470   single_instruction;
6471   dst    : EX2(write);
6472   src    : EX1(read);
6473   INS01  : ISS;
6474   ALU    : EX2;
6475 %}
6476 
6477 // Integer ALU reg mmediate operation
6478 // Eg.  ADD     x0, x1, #N
6479 pipe_class ialu_reg_imm(iRegI dst, iRegI src1)
6480 %{
6481   single_instruction;
6482   dst    : EX2(write);
6483   src1   : EX1(read);
6484   INS01  : ISS;
6485   ALU    : EX2;
6486 %}
6487 
6488 // Integer ALU immediate operation (no source operands)
6489 // Eg.  MOV     x0, #N
6490 pipe_class ialu_imm(iRegI dst)
6491 %{
6492   single_instruction;
6493   dst    : EX1(write);
6494   INS01  : ISS;
6495   ALU    : EX1;
6496 %}
6497 
6498 //------- Compare operation -------------------------------
6499 
6500 // Compare reg-reg
6501 // Eg.  CMP     x0, x1
6502 pipe_class icmp_reg_reg(rFlagsReg cr, iRegI op1, iRegI op2)
6503 %{
6504   single_instruction;
6505 //  fixed_latency(16);
6506   cr     : EX2(write);
6507   op1    : EX1(read);
6508   op2    : EX1(read);
6509   INS01  : ISS;
6510   ALU    : EX2;
6511 %}
6512 
6513 // Compare reg-reg
6514 // Eg.  CMP     x0, #N
6515 pipe_class icmp_reg_imm(rFlagsReg cr, iRegI op1)
6516 %{
6517   single_instruction;
6518 //  fixed_latency(16);
6519   cr     : EX2(write);
6520   op1    : EX1(read);
6521   INS01  : ISS;
6522   ALU    : EX2;
6523 %}
6524 
6525 //------- Conditional instructions ------------------------
6526 
6527 // Conditional no operands
6528 // Eg.  CSINC   x0, zr, zr, <cond>
6529 pipe_class icond_none(iRegI dst, rFlagsReg cr)
6530 %{
6531   single_instruction;
6532   cr     : EX1(read);
6533   dst    : EX2(write);
6534   INS01  : ISS;
6535   ALU    : EX2;
6536 %}
6537 
6538 // Conditional 2 operand
6539 // EG.  CSEL    X0, X1, X2, <cond>
6540 pipe_class icond_reg_reg(iRegI dst, iRegI src1, iRegI src2, rFlagsReg cr)
6541 %{
6542   single_instruction;
6543   cr     : EX1(read);
6544   src1   : EX1(read);
6545   src2   : EX1(read);
6546   dst    : EX2(write);
6547   INS01  : ISS;
6548   ALU    : EX2;
6549 %}
6550 
6551 // Conditional 2 operand
6552 // EG.  CSEL    X0, X1, X2, <cond>
6553 pipe_class icond_reg(iRegI dst, iRegI src, rFlagsReg cr)
6554 %{
6555   single_instruction;
6556   cr     : EX1(read);
6557   src    : EX1(read);
6558   dst    : EX2(write);
6559   INS01  : ISS;
6560   ALU    : EX2;
6561 %}
6562 
6563 //------- Multiply pipeline operations --------------------
6564 
6565 // Multiply reg-reg
6566 // Eg.  MUL     w0, w1, w2
6567 pipe_class imul_reg_reg(iRegI dst, iRegI src1, iRegI src2)
6568 %{
6569   single_instruction;
6570   dst    : WR(write);
6571   src1   : ISS(read);
6572   src2   : ISS(read);
6573   INS01  : ISS;
6574   MAC    : WR;
6575 %}
6576 
6577 // Multiply accumulate
6578 // Eg.  MADD    w0, w1, w2, w3
6579 pipe_class imac_reg_reg(iRegI dst, iRegI src1, iRegI src2, iRegI src3)
6580 %{
6581   single_instruction;
6582   dst    : WR(write);
6583   src1   : ISS(read);
6584   src2   : ISS(read);
6585   src3   : ISS(read);
6586   INS01  : ISS;
6587   MAC    : WR;
6588 %}
6589 
6590 // Eg.  MUL     w0, w1, w2
6591 pipe_class lmul_reg_reg(iRegI dst, iRegI src1, iRegI src2)
6592 %{
6593   single_instruction;
6594   fixed_latency(3); // Maximum latency for 64 bit mul
6595   dst    : WR(write);
6596   src1   : ISS(read);
6597   src2   : ISS(read);
6598   INS01  : ISS;
6599   MAC    : WR;
6600 %}
6601 
6602 // Multiply accumulate
6603 // Eg.  MADD    w0, w1, w2, w3
6604 pipe_class lmac_reg_reg(iRegI dst, iRegI src1, iRegI src2, iRegI src3)
6605 %{
6606   single_instruction;
6607   fixed_latency(3); // Maximum latency for 64 bit mul
6608   dst    : WR(write);
6609   src1   : ISS(read);
6610   src2   : ISS(read);
6611   src3   : ISS(read);
6612   INS01  : ISS;
6613   MAC    : WR;
6614 %}
6615 
6616 //------- Divide pipeline operations --------------------
6617 
6618 // Eg.  SDIV    w0, w1, w2
6619 pipe_class idiv_reg_reg(iRegI dst, iRegI src1, iRegI src2)
6620 %{
6621   single_instruction;
6622   fixed_latency(8); // Maximum latency for 32 bit divide
6623   dst    : WR(write);
6624   src1   : ISS(read);
6625   src2   : ISS(read);
6626   INS0   : ISS; // Can only dual issue as instruction 0
6627   DIV    : WR;
6628 %}
6629 
6630 // Eg.  SDIV    x0, x1, x2
6631 pipe_class ldiv_reg_reg(iRegI dst, iRegI src1, iRegI src2)
6632 %{
6633   single_instruction;
6634   fixed_latency(16); // Maximum latency for 64 bit divide
6635   dst    : WR(write);
6636   src1   : ISS(read);
6637   src2   : ISS(read);
6638   INS0   : ISS; // Can only dual issue as instruction 0
6639   DIV    : WR;
6640 %}
6641 
6642 //------- Load pipeline operations ------------------------
6643 
6644 // Load - prefetch
6645 // Eg.  PFRM    <mem>
6646 pipe_class iload_prefetch(memory mem)
6647 %{
6648   single_instruction;
6649   mem    : ISS(read);
6650   INS01  : ISS;
6651   LDST   : WR;
6652 %}
6653 
6654 // Load - reg, mem
6655 // Eg.  LDR     x0, <mem>
6656 pipe_class iload_reg_mem(iRegI dst, memory mem)
6657 %{
6658   single_instruction;
6659   dst    : WR(write);
6660   mem    : ISS(read);
6661   INS01  : ISS;
6662   LDST   : WR;
6663 %}
6664 
6665 // Load - reg, reg
6666 // Eg.  LDR     x0, [sp, x1]
6667 pipe_class iload_reg_reg(iRegI dst, iRegI src)
6668 %{
6669   single_instruction;
6670   dst    : WR(write);
6671   src    : ISS(read);
6672   INS01  : ISS;
6673   LDST   : WR;
6674 %}
6675 
6676 //------- Store pipeline operations -----------------------
6677 
6678 // Store - zr, mem
6679 // Eg.  STR     zr, <mem>
6680 pipe_class istore_mem(memory mem)
6681 %{
6682   single_instruction;
6683   mem    : ISS(read);
6684   INS01  : ISS;
6685   LDST   : WR;
6686 %}
6687 
6688 // Store - reg, mem
6689 // Eg.  STR     x0, <mem>
6690 pipe_class istore_reg_mem(iRegI src, memory mem)
6691 %{
6692   single_instruction;
6693   mem    : ISS(read);
6694   src    : EX2(read);
6695   INS01  : ISS;
6696   LDST   : WR;
6697 %}
6698 
6699 // Store - reg, reg
6700 // Eg. STR      x0, [sp, x1]
6701 pipe_class istore_reg_reg(iRegI dst, iRegI src)
6702 %{
6703   single_instruction;
6704   dst    : ISS(read);
6705   src    : EX2(read);
6706   INS01  : ISS;
6707   LDST   : WR;
6708 %}
6709 
6710 //------- Store pipeline operations -----------------------
6711 
6712 // Branch
6713 pipe_class pipe_branch()
6714 %{
6715   single_instruction;
6716   INS01  : ISS;
6717   BRANCH : EX1;
6718 %}
6719 
6720 // Conditional branch
6721 pipe_class pipe_branch_cond(rFlagsReg cr)
6722 %{
6723   single_instruction;
6724   cr     : EX1(read);
6725   INS01  : ISS;
6726   BRANCH : EX1;
6727 %}
6728 
6729 // Compare & Branch
6730 // EG.  CBZ/CBNZ
6731 pipe_class pipe_cmp_branch(iRegI op1)
6732 %{
6733   single_instruction;
6734   op1    : EX1(read);
6735   INS01  : ISS;
6736   BRANCH : EX1;
6737 %}
6738 
6739 //------- Synchronisation operations ----------------------
6740 
6741 // Any operation requiring serialization.
6742 // EG.  DMB/Atomic Ops/Load Acquire/Str Release
6743 pipe_class pipe_serial()
6744 %{
6745   single_instruction;
6746   force_serialization;
6747   fixed_latency(16);
6748   INS01  : ISS(2); // Cannot dual issue with any other instruction
6749   LDST   : WR;
6750 %}
6751 
6752 // Generic big/slow expanded idiom - also serialized
6753 pipe_class pipe_slow()
6754 %{
6755   instruction_count(10);
6756   multiple_bundles;
6757   force_serialization;
6758   fixed_latency(16);
6759   INS01  : ISS(2); // Cannot dual issue with any other instruction
6760   LDST   : WR;
6761 %}
6762 
6763 // Empty pipeline class
6764 pipe_class pipe_class_empty()
6765 %{
6766   single_instruction;
6767   fixed_latency(0);
6768 %}
6769 
6770 // Default pipeline class.
6771 pipe_class pipe_class_default()
6772 %{
6773   single_instruction;
6774   fixed_latency(2);
6775 %}
6776 
6777 // Pipeline class for compares.
6778 pipe_class pipe_class_compare()
6779 %{
6780   single_instruction;
6781   fixed_latency(16);
6782 %}
6783 
6784 // Pipeline class for memory operations.
6785 pipe_class pipe_class_memory()
6786 %{
6787   single_instruction;
6788   fixed_latency(16);
6789 %}
6790 
6791 // Pipeline class for call.
6792 pipe_class pipe_class_call()
6793 %{
6794   single_instruction;
6795   fixed_latency(100);
6796 %}
6797 
6798 // Define the class for the Nop node.
6799 define %{
6800    MachNop = pipe_class_empty;
6801 %}
6802 
6803 %}
6804 //----------INSTRUCTIONS-------------------------------------------------------
6805 //
6806 // match      -- States which machine-independent subtree may be replaced
6807 //               by this instruction.
6808 // ins_cost   -- The estimated cost of this instruction is used by instruction
6809 //               selection to identify a minimum cost tree of machine
6810 //               instructions that matches a tree of machine-independent
6811 //               instructions.
6812 // format     -- A string providing the disassembly for this instruction.
6813 //               The value of an instruction's operand may be inserted
6814 //               by referring to it with a '$' prefix.
6815 // opcode     -- Three instruction opcodes may be provided.  These are referred
6816 //               to within an encode class as $primary, $secondary, and $tertiary
6817 //               rrspectively.  The primary opcode is commonly used to
6818 //               indicate the type of machine instruction, while secondary
6819 //               and tertiary are often used for prefix options or addressing
6820 //               modes.
6821 // ins_encode -- A list of encode classes with parameters. The encode class
6822 //               name must have been defined in an 'enc_class' specification
6823 //               in the encode section of the architecture description.
6824 
6825 // ============================================================================
6826 // Memory (Load/Store) Instructions
6827 
6828 // Load Instructions
6829 
6830 // Load Byte (8 bit signed)
6831 instruct loadB(iRegINoSp dst, memory1 mem)
6832 %{
6833   match(Set dst (LoadB mem));
6834   predicate(!needs_acquiring_load(n));
6835 
6836   ins_cost(4 * INSN_COST);
6837   format %{ "ldrsbw  $dst, $mem\t# byte" %}
6838 
6839   ins_encode(aarch64_enc_ldrsbw(dst, mem));
6840 
6841   ins_pipe(iload_reg_mem);
6842 %}
6843 
6844 // Load Byte (8 bit signed) into long
6845 instruct loadB2L(iRegLNoSp dst, memory1 mem)
6846 %{
6847   match(Set dst (ConvI2L (LoadB mem)));
6848   predicate(!needs_acquiring_load(n->in(1)));
6849 
6850   ins_cost(4 * INSN_COST);
6851   format %{ "ldrsb  $dst, $mem\t# byte" %}
6852 
6853   ins_encode(aarch64_enc_ldrsb(dst, mem));
6854 
6855   ins_pipe(iload_reg_mem);
6856 %}
6857 
6858 // Load Byte (8 bit unsigned)
6859 instruct loadUB(iRegINoSp dst, memory1 mem)
6860 %{
6861   match(Set dst (LoadUB mem));
6862   predicate(!needs_acquiring_load(n));
6863 
6864   ins_cost(4 * INSN_COST);
6865   format %{ "ldrbw  $dst, $mem\t# byte" %}
6866 
6867   ins_encode(aarch64_enc_ldrb(dst, mem));
6868 
6869   ins_pipe(iload_reg_mem);
6870 %}
6871 
6872 // Load Byte (8 bit unsigned) into long
6873 instruct loadUB2L(iRegLNoSp dst, memory1 mem)
6874 %{
6875   match(Set dst (ConvI2L (LoadUB mem)));
6876   predicate(!needs_acquiring_load(n->in(1)));
6877 
6878   ins_cost(4 * INSN_COST);
6879   format %{ "ldrb  $dst, $mem\t# byte" %}
6880 
6881   ins_encode(aarch64_enc_ldrb(dst, mem));
6882 
6883   ins_pipe(iload_reg_mem);
6884 %}
6885 
6886 // Load Short (16 bit signed)
6887 instruct loadS(iRegINoSp dst, memory2 mem)
6888 %{
6889   match(Set dst (LoadS mem));
6890   predicate(!needs_acquiring_load(n));
6891 
6892   ins_cost(4 * INSN_COST);
6893   format %{ "ldrshw  $dst, $mem\t# short" %}
6894 
6895   ins_encode(aarch64_enc_ldrshw(dst, mem));
6896 
6897   ins_pipe(iload_reg_mem);
6898 %}
6899 
6900 // Load Short (16 bit signed) into long
6901 instruct loadS2L(iRegLNoSp dst, memory2 mem)
6902 %{
6903   match(Set dst (ConvI2L (LoadS mem)));
6904   predicate(!needs_acquiring_load(n->in(1)));
6905 
6906   ins_cost(4 * INSN_COST);
6907   format %{ "ldrsh  $dst, $mem\t# short" %}
6908 
6909   ins_encode(aarch64_enc_ldrsh(dst, mem));
6910 
6911   ins_pipe(iload_reg_mem);
6912 %}
6913 
6914 // Load Char (16 bit unsigned)
6915 instruct loadUS(iRegINoSp dst, memory2 mem)
6916 %{
6917   match(Set dst (LoadUS mem));
6918   predicate(!needs_acquiring_load(n));
6919 
6920   ins_cost(4 * INSN_COST);
6921   format %{ "ldrh  $dst, $mem\t# short" %}
6922 
6923   ins_encode(aarch64_enc_ldrh(dst, mem));
6924 
6925   ins_pipe(iload_reg_mem);
6926 %}
6927 
6928 // Load Short/Char (16 bit unsigned) into long
6929 instruct loadUS2L(iRegLNoSp dst, memory2 mem)
6930 %{
6931   match(Set dst (ConvI2L (LoadUS mem)));
6932   predicate(!needs_acquiring_load(n->in(1)));
6933 
6934   ins_cost(4 * INSN_COST);
6935   format %{ "ldrh  $dst, $mem\t# short" %}
6936 
6937   ins_encode(aarch64_enc_ldrh(dst, mem));
6938 
6939   ins_pipe(iload_reg_mem);
6940 %}
6941 
6942 // Load Integer (32 bit signed)
6943 instruct loadI(iRegINoSp dst, memory4 mem)
6944 %{
6945   match(Set dst (LoadI mem));
6946   predicate(!needs_acquiring_load(n));
6947 
6948   ins_cost(4 * INSN_COST);
6949   format %{ "ldrw  $dst, $mem\t# int" %}
6950 
6951   ins_encode(aarch64_enc_ldrw(dst, mem));
6952 
6953   ins_pipe(iload_reg_mem);
6954 %}
6955 
6956 // Load Integer (32 bit signed) into long
6957 instruct loadI2L(iRegLNoSp dst, memory4 mem)
6958 %{
6959   match(Set dst (ConvI2L (LoadI mem)));
6960   predicate(!needs_acquiring_load(n->in(1)));
6961 
6962   ins_cost(4 * INSN_COST);
6963   format %{ "ldrsw  $dst, $mem\t# int" %}
6964 
6965   ins_encode(aarch64_enc_ldrsw(dst, mem));
6966 
6967   ins_pipe(iload_reg_mem);
6968 %}
6969 
6970 // Load Integer (32 bit unsigned) into long
6971 instruct loadUI2L(iRegLNoSp dst, memory4 mem, immL_32bits mask)
6972 %{
6973   match(Set dst (AndL (ConvI2L (LoadI mem)) mask));
6974   predicate(!needs_acquiring_load(n->in(1)->in(1)->as_Load()));
6975 
6976   ins_cost(4 * INSN_COST);
6977   format %{ "ldrw  $dst, $mem\t# int" %}
6978 
6979   ins_encode(aarch64_enc_ldrw(dst, mem));
6980 
6981   ins_pipe(iload_reg_mem);
6982 %}
6983 
6984 // Load Long (64 bit signed)
6985 instruct loadL(iRegLNoSp dst, memory8 mem)
6986 %{
6987   match(Set dst (LoadL mem));
6988   predicate(!needs_acquiring_load(n));
6989 
6990   ins_cost(4 * INSN_COST);
6991   format %{ "ldr  $dst, $mem\t# int" %}
6992 
6993   ins_encode(aarch64_enc_ldr(dst, mem));
6994 
6995   ins_pipe(iload_reg_mem);
6996 %}
6997 
6998 // Load Range
6999 instruct loadRange(iRegINoSp dst, memory4 mem)
7000 %{
7001   match(Set dst (LoadRange mem));
7002 
7003   ins_cost(4 * INSN_COST);
7004   format %{ "ldrw  $dst, $mem\t# range" %}
7005 
7006   ins_encode(aarch64_enc_ldrw(dst, mem));
7007 
7008   ins_pipe(iload_reg_mem);
7009 %}
7010 
7011 // Load Pointer
7012 instruct loadP(iRegPNoSp dst, memory8 mem)
7013 %{
7014   match(Set dst (LoadP mem));
7015   predicate(!needs_acquiring_load(n) && (n->as_Load()->barrier_data() == 0));
7016 
7017   ins_cost(4 * INSN_COST);
7018   format %{ "ldr  $dst, $mem\t# ptr" %}
7019 
7020   ins_encode(aarch64_enc_ldr(dst, mem));
7021 
7022   ins_pipe(iload_reg_mem);
7023 %}
7024 
7025 // Load Compressed Pointer
7026 instruct loadN(iRegNNoSp dst, memory4 mem)
7027 %{
7028   match(Set dst (LoadN mem));
7029   predicate(!needs_acquiring_load(n));
7030 
7031   ins_cost(4 * INSN_COST);
7032   format %{ "ldrw  $dst, $mem\t# compressed ptr" %}
7033 
7034   ins_encode(aarch64_enc_ldrw(dst, mem));
7035 
7036   ins_pipe(iload_reg_mem);
7037 %}
7038 
7039 // Load Klass Pointer
7040 instruct loadKlass(iRegPNoSp dst, memory8 mem)
7041 %{
7042   match(Set dst (LoadKlass mem));
7043   predicate(!needs_acquiring_load(n));
7044 
7045   ins_cost(4 * INSN_COST);
7046   format %{ "ldr  $dst, $mem\t# class" %}
7047 
7048   ins_encode(aarch64_enc_ldr(dst, mem));
7049 
7050   ins_pipe(iload_reg_mem);
7051 %}
7052 
7053 // Load Narrow Klass Pointer
7054 instruct loadNKlass(iRegNNoSp dst, memory4 mem)
7055 %{
7056   match(Set dst (LoadNKlass mem));
7057   predicate(!needs_acquiring_load(n));
7058 
7059   ins_cost(4 * INSN_COST);
7060   format %{ "ldrw  $dst, $mem\t# compressed class ptr" %}
7061 
7062   ins_encode(aarch64_enc_ldrw(dst, mem));
7063 
7064   ins_pipe(iload_reg_mem);
7065 %}
7066 
7067 // Load Float
7068 instruct loadF(vRegF dst, memory4 mem)
7069 %{
7070   match(Set dst (LoadF mem));
7071   predicate(!needs_acquiring_load(n));
7072 
7073   ins_cost(4 * INSN_COST);
7074   format %{ "ldrs  $dst, $mem\t# float" %}
7075 
7076   ins_encode( aarch64_enc_ldrs(dst, mem) );
7077 
7078   ins_pipe(pipe_class_memory);
7079 %}
7080 
7081 // Load Double
7082 instruct loadD(vRegD dst, memory8 mem)
7083 %{
7084   match(Set dst (LoadD mem));
7085   predicate(!needs_acquiring_load(n));
7086 
7087   ins_cost(4 * INSN_COST);
7088   format %{ "ldrd  $dst, $mem\t# double" %}
7089 
7090   ins_encode( aarch64_enc_ldrd(dst, mem) );
7091 
7092   ins_pipe(pipe_class_memory);
7093 %}
7094 
7095 
7096 // Load Int Constant
7097 instruct loadConI(iRegINoSp dst, immI src)
7098 %{
7099   match(Set dst src);
7100 
7101   ins_cost(INSN_COST);
7102   format %{ "mov $dst, $src\t# int" %}
7103 
7104   ins_encode( aarch64_enc_movw_imm(dst, src) );
7105 
7106   ins_pipe(ialu_imm);
7107 %}
7108 
7109 // Load Long Constant
7110 instruct loadConL(iRegLNoSp dst, immL src)
7111 %{
7112   match(Set dst src);
7113 
7114   ins_cost(INSN_COST);
7115   format %{ "mov $dst, $src\t# long" %}
7116 
7117   ins_encode( aarch64_enc_mov_imm(dst, src) );
7118 
7119   ins_pipe(ialu_imm);
7120 %}
7121 
7122 // Load Pointer Constant
7123 
7124 instruct loadConP(iRegPNoSp dst, immP con)
7125 %{
7126   match(Set dst con);
7127 
7128   ins_cost(INSN_COST * 4);
7129   format %{
7130     "mov  $dst, $con\t# ptr\n\t"
7131   %}
7132 
7133   ins_encode(aarch64_enc_mov_p(dst, con));
7134 
7135   ins_pipe(ialu_imm);
7136 %}
7137 
7138 // Load Null Pointer Constant
7139 
7140 instruct loadConP0(iRegPNoSp dst, immP0 con)
7141 %{
7142   match(Set dst con);
7143 
7144   ins_cost(INSN_COST);
7145   format %{ "mov  $dst, $con\t# NULL ptr" %}
7146 
7147   ins_encode(aarch64_enc_mov_p0(dst, con));
7148 
7149   ins_pipe(ialu_imm);
7150 %}
7151 
7152 // Load Pointer Constant One
7153 
7154 instruct loadConP1(iRegPNoSp dst, immP_1 con)
7155 %{
7156   match(Set dst con);
7157 
7158   ins_cost(INSN_COST);
7159   format %{ "mov  $dst, $con\t# NULL ptr" %}
7160 
7161   ins_encode(aarch64_enc_mov_p1(dst, con));
7162 
7163   ins_pipe(ialu_imm);
7164 %}
7165 
7166 // Load Byte Map Base Constant
7167 
7168 instruct loadByteMapBase(iRegPNoSp dst, immByteMapBase con)
7169 %{
7170   match(Set dst con);
7171 
7172   ins_cost(INSN_COST);
7173   format %{ "adr  $dst, $con\t# Byte Map Base" %}
7174 
7175   ins_encode(aarch64_enc_mov_byte_map_base(dst, con));
7176 
7177   ins_pipe(ialu_imm);
7178 %}
7179 
7180 // Load Narrow Pointer Constant
7181 
7182 instruct loadConN(iRegNNoSp dst, immN con)
7183 %{
7184   match(Set dst con);
7185 
7186   ins_cost(INSN_COST * 4);
7187   format %{ "mov  $dst, $con\t# compressed ptr" %}
7188 
7189   ins_encode(aarch64_enc_mov_n(dst, con));
7190 
7191   ins_pipe(ialu_imm);
7192 %}
7193 
7194 // Load Narrow Null Pointer Constant
7195 
7196 instruct loadConN0(iRegNNoSp dst, immN0 con)
7197 %{
7198   match(Set dst con);
7199 
7200   ins_cost(INSN_COST);
7201   format %{ "mov  $dst, $con\t# compressed NULL ptr" %}
7202 
7203   ins_encode(aarch64_enc_mov_n0(dst, con));
7204 
7205   ins_pipe(ialu_imm);
7206 %}
7207 
7208 // Load Narrow Klass Constant
7209 
7210 instruct loadConNKlass(iRegNNoSp dst, immNKlass con)
7211 %{
7212   match(Set dst con);
7213 
7214   ins_cost(INSN_COST);
7215   format %{ "mov  $dst, $con\t# compressed klass ptr" %}
7216 
7217   ins_encode(aarch64_enc_mov_nk(dst, con));
7218 
7219   ins_pipe(ialu_imm);
7220 %}
7221 
7222 // Load Packed Float Constant
7223 
7224 instruct loadConF_packed(vRegF dst, immFPacked con) %{
7225   match(Set dst con);
7226   ins_cost(INSN_COST * 4);
7227   format %{ "fmovs  $dst, $con"%}
7228   ins_encode %{
7229     __ fmovs(as_FloatRegister($dst$$reg), (double)$con$$constant);
7230   %}
7231 
7232   ins_pipe(fp_imm_s);
7233 %}
7234 
7235 // Load Float Constant
7236 
7237 instruct loadConF(vRegF dst, immF con) %{
7238   match(Set dst con);
7239 
7240   ins_cost(INSN_COST * 4);
7241 
7242   format %{
7243     "ldrs $dst, [$constantaddress]\t# load from constant table: float=$con\n\t"
7244   %}
7245 
7246   ins_encode %{
7247     __ ldrs(as_FloatRegister($dst$$reg), $constantaddress($con));
7248   %}
7249 
7250   ins_pipe(fp_load_constant_s);
7251 %}
7252 
7253 // Load Packed Double Constant
7254 
7255 instruct loadConD_packed(vRegD dst, immDPacked con) %{
7256   match(Set dst con);
7257   ins_cost(INSN_COST);
7258   format %{ "fmovd  $dst, $con"%}
7259   ins_encode %{
7260     __ fmovd(as_FloatRegister($dst$$reg), $con$$constant);
7261   %}
7262 
7263   ins_pipe(fp_imm_d);
7264 %}
7265 
7266 // Load Double Constant
7267 
7268 instruct loadConD(vRegD dst, immD con) %{
7269   match(Set dst con);
7270 
7271   ins_cost(INSN_COST * 5);
7272   format %{
7273     "ldrd $dst, [$constantaddress]\t# load from constant table: float=$con\n\t"
7274   %}
7275 
7276   ins_encode %{
7277     __ ldrd(as_FloatRegister($dst$$reg), $constantaddress($con));
7278   %}
7279 
7280   ins_pipe(fp_load_constant_d);
7281 %}
7282 
7283 // Store Instructions
7284 
7285 // Store CMS card-mark Immediate
7286 instruct storeimmCM0(immI0 zero, memory1 mem)
7287 %{
7288   match(Set mem (StoreCM mem zero));
7289 
7290   ins_cost(INSN_COST);
7291   format %{ "storestore (elided)\n\t"
7292             "strb zr, $mem\t# byte" %}
7293 
7294   ins_encode(aarch64_enc_strb0(mem));
7295 
7296   ins_pipe(istore_mem);
7297 %}
7298 
7299 // Store CMS card-mark Immediate with intervening StoreStore
7300 // needed when using CMS with no conditional card marking
7301 instruct storeimmCM0_ordered(immI0 zero, memory1 mem)
7302 %{
7303   match(Set mem (StoreCM mem zero));
7304 
7305   ins_cost(INSN_COST * 2);
7306   format %{ "storestore\n\t"
7307             "dmb ishst"
7308             "\n\tstrb zr, $mem\t# byte" %}
7309 
7310   ins_encode(aarch64_enc_strb0_ordered(mem));
7311 
7312   ins_pipe(istore_mem);
7313 %}
7314 
7315 // Store Byte
7316 instruct storeB(iRegIorL2I src, memory1 mem)
7317 %{
7318   match(Set mem (StoreB mem src));
7319   predicate(!needs_releasing_store(n));
7320 
7321   ins_cost(INSN_COST);
7322   format %{ "strb  $src, $mem\t# byte" %}
7323 
7324   ins_encode(aarch64_enc_strb(src, mem));
7325 
7326   ins_pipe(istore_reg_mem);
7327 %}
7328 
7329 
7330 instruct storeimmB0(immI0 zero, memory1 mem)
7331 %{
7332   match(Set mem (StoreB mem zero));
7333   predicate(!needs_releasing_store(n));
7334 
7335   ins_cost(INSN_COST);
7336   format %{ "strb rscractch2, $mem\t# byte" %}
7337 
7338   ins_encode(aarch64_enc_strb0(mem));
7339 
7340   ins_pipe(istore_mem);
7341 %}
7342 
7343 // Store Char/Short
7344 instruct storeC(iRegIorL2I src, memory2 mem)
7345 %{
7346   match(Set mem (StoreC mem src));
7347   predicate(!needs_releasing_store(n));
7348 
7349   ins_cost(INSN_COST);
7350   format %{ "strh  $src, $mem\t# short" %}
7351 
7352   ins_encode(aarch64_enc_strh(src, mem));
7353 
7354   ins_pipe(istore_reg_mem);
7355 %}
7356 
7357 instruct storeimmC0(immI0 zero, memory2 mem)
7358 %{
7359   match(Set mem (StoreC mem zero));
7360   predicate(!needs_releasing_store(n));
7361 
7362   ins_cost(INSN_COST);
7363   format %{ "strh  zr, $mem\t# short" %}
7364 
7365   ins_encode(aarch64_enc_strh0(mem));
7366 
7367   ins_pipe(istore_mem);
7368 %}
7369 
7370 // Store Integer
7371 
7372 instruct storeI(iRegIorL2I src, memory4 mem)
7373 %{
7374   match(Set mem(StoreI mem src));
7375   predicate(!needs_releasing_store(n));
7376 
7377   ins_cost(INSN_COST);
7378   format %{ "strw  $src, $mem\t# int" %}
7379 
7380   ins_encode(aarch64_enc_strw(src, mem));
7381 
7382   ins_pipe(istore_reg_mem);
7383 %}
7384 
7385 instruct storeimmI0(immI0 zero, memory4 mem)
7386 %{
7387   match(Set mem(StoreI mem zero));
7388   predicate(!needs_releasing_store(n));
7389 
7390   ins_cost(INSN_COST);
7391   format %{ "strw  zr, $mem\t# int" %}
7392 
7393   ins_encode(aarch64_enc_strw0(mem));
7394 
7395   ins_pipe(istore_mem);
7396 %}
7397 
7398 // Store Long (64 bit signed)
7399 instruct storeL(iRegL src, memory8 mem)
7400 %{
7401   match(Set mem (StoreL mem src));
7402   predicate(!needs_releasing_store(n));
7403 
7404   ins_cost(INSN_COST);
7405   format %{ "str  $src, $mem\t# int" %}
7406 
7407   ins_encode(aarch64_enc_str(src, mem));
7408 
7409   ins_pipe(istore_reg_mem);
7410 %}
7411 
7412 // Store Long (64 bit signed)
7413 instruct storeimmL0(immL0 zero, memory8 mem)
7414 %{
7415   match(Set mem (StoreL mem zero));
7416   predicate(!needs_releasing_store(n));
7417 
7418   ins_cost(INSN_COST);
7419   format %{ "str  zr, $mem\t# int" %}
7420 
7421   ins_encode(aarch64_enc_str0(mem));
7422 
7423   ins_pipe(istore_mem);
7424 %}
7425 
7426 // Store Pointer
7427 instruct storeP(iRegP src, memory8 mem)
7428 %{
7429   match(Set mem (StoreP mem src));
7430   predicate(!needs_releasing_store(n));
7431 
7432   ins_cost(INSN_COST);
7433   format %{ "str  $src, $mem\t# ptr" %}
7434 
7435   ins_encode(aarch64_enc_str(src, mem));
7436 
7437   ins_pipe(istore_reg_mem);
7438 %}
7439 
7440 // Store Pointer
7441 instruct storeimmP0(immP0 zero, memory8 mem)
7442 %{
7443   match(Set mem (StoreP mem zero));
7444   predicate(!needs_releasing_store(n));
7445 
7446   ins_cost(INSN_COST);
7447   format %{ "str zr, $mem\t# ptr" %}
7448 
7449   ins_encode(aarch64_enc_str0(mem));
7450 
7451   ins_pipe(istore_mem);
7452 %}
7453 
7454 // Store Compressed Pointer
7455 instruct storeN(iRegN src, memory4 mem)
7456 %{
7457   match(Set mem (StoreN mem src));
7458   predicate(!needs_releasing_store(n));
7459 
7460   ins_cost(INSN_COST);
7461   format %{ "strw  $src, $mem\t# compressed ptr" %}
7462 
7463   ins_encode(aarch64_enc_strw(src, mem));
7464 
7465   ins_pipe(istore_reg_mem);
7466 %}
7467 
7468 instruct storeImmN0(immN0 zero, memory4 mem)
7469 %{
7470   match(Set mem (StoreN mem zero));
7471   predicate(!needs_releasing_store(n));
7472 
7473   ins_cost(INSN_COST);
7474   format %{ "strw  zr, $mem\t# compressed ptr" %}
7475 
7476   ins_encode(aarch64_enc_strw0(mem));
7477 
7478   ins_pipe(istore_mem);
7479 %}
7480 
7481 // Store Float
7482 instruct storeF(vRegF src, memory4 mem)
7483 %{
7484   match(Set mem (StoreF mem src));
7485   predicate(!needs_releasing_store(n));
7486 
7487   ins_cost(INSN_COST);
7488   format %{ "strs  $src, $mem\t# float" %}
7489 
7490   ins_encode( aarch64_enc_strs(src, mem) );
7491 
7492   ins_pipe(pipe_class_memory);
7493 %}
7494 
7495 // TODO
7496 // implement storeImmF0 and storeFImmPacked
7497 
7498 // Store Double
7499 instruct storeD(vRegD src, memory8 mem)
7500 %{
7501   match(Set mem (StoreD mem src));
7502   predicate(!needs_releasing_store(n));
7503 
7504   ins_cost(INSN_COST);
7505   format %{ "strd  $src, $mem\t# double" %}
7506 
7507   ins_encode( aarch64_enc_strd(src, mem) );
7508 
7509   ins_pipe(pipe_class_memory);
7510 %}
7511 
7512 // Store Compressed Klass Pointer
7513 instruct storeNKlass(iRegN src, memory4 mem)
7514 %{
7515   predicate(!needs_releasing_store(n));
7516   match(Set mem (StoreNKlass mem src));
7517 
7518   ins_cost(INSN_COST);
7519   format %{ "strw  $src, $mem\t# compressed klass ptr" %}
7520 
7521   ins_encode(aarch64_enc_strw(src, mem));
7522 
7523   ins_pipe(istore_reg_mem);
7524 %}
7525 
7526 // TODO
7527 // implement storeImmD0 and storeDImmPacked
7528 
7529 // prefetch instructions
7530 // Must be safe to execute with invalid address (cannot fault).
7531 
7532 instruct prefetchalloc( memory8 mem ) %{
7533   match(PrefetchAllocation mem);
7534 
7535   ins_cost(INSN_COST);
7536   format %{ "prfm $mem, PSTL1KEEP\t# Prefetch into level 1 cache write keep" %}
7537 
7538   ins_encode( aarch64_enc_prefetchw(mem) );
7539 
7540   ins_pipe(iload_prefetch);
7541 %}
7542 
7543 //  ---------------- volatile loads and stores ----------------
7544 
7545 // Load Byte (8 bit signed)
7546 instruct loadB_volatile(iRegINoSp dst, /* sync_memory*/indirect mem)
7547 %{
7548   match(Set dst (LoadB mem));
7549 
7550   ins_cost(VOLATILE_REF_COST);
7551   format %{ "ldarsb  $dst, $mem\t# byte" %}
7552 
7553   ins_encode(aarch64_enc_ldarsb(dst, mem));
7554 
7555   ins_pipe(pipe_serial);
7556 %}
7557 
7558 // Load Byte (8 bit signed) into long
7559 instruct loadB2L_volatile(iRegLNoSp dst, /* sync_memory*/indirect mem)
7560 %{
7561   match(Set dst (ConvI2L (LoadB mem)));
7562 
7563   ins_cost(VOLATILE_REF_COST);
7564   format %{ "ldarsb  $dst, $mem\t# byte" %}
7565 
7566   ins_encode(aarch64_enc_ldarsb(dst, mem));
7567 
7568   ins_pipe(pipe_serial);
7569 %}
7570 
7571 // Load Byte (8 bit unsigned)
7572 instruct loadUB_volatile(iRegINoSp dst, /* sync_memory*/indirect mem)
7573 %{
7574   match(Set dst (LoadUB mem));
7575 
7576   ins_cost(VOLATILE_REF_COST);
7577   format %{ "ldarb  $dst, $mem\t# byte" %}
7578 
7579   ins_encode(aarch64_enc_ldarb(dst, mem));
7580 
7581   ins_pipe(pipe_serial);
7582 %}
7583 
7584 // Load Byte (8 bit unsigned) into long
7585 instruct loadUB2L_volatile(iRegLNoSp dst, /* sync_memory*/indirect mem)
7586 %{
7587   match(Set dst (ConvI2L (LoadUB mem)));
7588 
7589   ins_cost(VOLATILE_REF_COST);
7590   format %{ "ldarb  $dst, $mem\t# byte" %}
7591 
7592   ins_encode(aarch64_enc_ldarb(dst, mem));
7593 
7594   ins_pipe(pipe_serial);
7595 %}
7596 
7597 // Load Short (16 bit signed)
7598 instruct loadS_volatile(iRegINoSp dst, /* sync_memory*/indirect mem)
7599 %{
7600   match(Set dst (LoadS mem));
7601 
7602   ins_cost(VOLATILE_REF_COST);
7603   format %{ "ldarshw  $dst, $mem\t# short" %}
7604 
7605   ins_encode(aarch64_enc_ldarshw(dst, mem));
7606 
7607   ins_pipe(pipe_serial);
7608 %}
7609 
7610 instruct loadUS_volatile(iRegINoSp dst, /* sync_memory*/indirect mem)
7611 %{
7612   match(Set dst (LoadUS mem));
7613 
7614   ins_cost(VOLATILE_REF_COST);
7615   format %{ "ldarhw  $dst, $mem\t# short" %}
7616 
7617   ins_encode(aarch64_enc_ldarhw(dst, mem));
7618 
7619   ins_pipe(pipe_serial);
7620 %}
7621 
7622 // Load Short/Char (16 bit unsigned) into long
7623 instruct loadUS2L_volatile(iRegLNoSp dst, /* sync_memory*/indirect mem)
7624 %{
7625   match(Set dst (ConvI2L (LoadUS mem)));
7626 
7627   ins_cost(VOLATILE_REF_COST);
7628   format %{ "ldarh  $dst, $mem\t# short" %}
7629 
7630   ins_encode(aarch64_enc_ldarh(dst, mem));
7631 
7632   ins_pipe(pipe_serial);
7633 %}
7634 
7635 // Load Short/Char (16 bit signed) into long
7636 instruct loadS2L_volatile(iRegLNoSp dst, /* sync_memory*/indirect mem)
7637 %{
7638   match(Set dst (ConvI2L (LoadS mem)));
7639 
7640   ins_cost(VOLATILE_REF_COST);
7641   format %{ "ldarh  $dst, $mem\t# short" %}
7642 
7643   ins_encode(aarch64_enc_ldarsh(dst, mem));
7644 
7645   ins_pipe(pipe_serial);
7646 %}
7647 
7648 // Load Integer (32 bit signed)
7649 instruct loadI_volatile(iRegINoSp dst, /* sync_memory*/indirect mem)
7650 %{
7651   match(Set dst (LoadI mem));
7652 
7653   ins_cost(VOLATILE_REF_COST);
7654   format %{ "ldarw  $dst, $mem\t# int" %}
7655 
7656   ins_encode(aarch64_enc_ldarw(dst, mem));
7657 
7658   ins_pipe(pipe_serial);
7659 %}
7660 
7661 // Load Integer (32 bit unsigned) into long
7662 instruct loadUI2L_volatile(iRegLNoSp dst, /* sync_memory*/indirect mem, immL_32bits mask)
7663 %{
7664   match(Set dst (AndL (ConvI2L (LoadI mem)) mask));
7665 
7666   ins_cost(VOLATILE_REF_COST);
7667   format %{ "ldarw  $dst, $mem\t# int" %}
7668 
7669   ins_encode(aarch64_enc_ldarw(dst, mem));
7670 
7671   ins_pipe(pipe_serial);
7672 %}
7673 
7674 // Load Long (64 bit signed)
7675 instruct loadL_volatile(iRegLNoSp dst, /* sync_memory*/indirect mem)
7676 %{
7677   match(Set dst (LoadL mem));
7678 
7679   ins_cost(VOLATILE_REF_COST);
7680   format %{ "ldar  $dst, $mem\t# int" %}
7681 
7682   ins_encode(aarch64_enc_ldar(dst, mem));
7683 
7684   ins_pipe(pipe_serial);
7685 %}
7686 
7687 // Load Pointer
7688 instruct loadP_volatile(iRegPNoSp dst, /* sync_memory*/indirect mem)
7689 %{
7690   match(Set dst (LoadP mem));
7691   predicate(n->as_Load()->barrier_data() == 0);
7692 
7693   ins_cost(VOLATILE_REF_COST);
7694   format %{ "ldar  $dst, $mem\t# ptr" %}
7695 
7696   ins_encode(aarch64_enc_ldar(dst, mem));
7697 
7698   ins_pipe(pipe_serial);
7699 %}
7700 
7701 // Load Compressed Pointer
7702 instruct loadN_volatile(iRegNNoSp dst, /* sync_memory*/indirect mem)
7703 %{
7704   match(Set dst (LoadN mem));
7705 
7706   ins_cost(VOLATILE_REF_COST);
7707   format %{ "ldarw  $dst, $mem\t# compressed ptr" %}
7708 
7709   ins_encode(aarch64_enc_ldarw(dst, mem));
7710 
7711   ins_pipe(pipe_serial);
7712 %}
7713 
7714 // Load Float
7715 instruct loadF_volatile(vRegF dst, /* sync_memory*/indirect mem)
7716 %{
7717   match(Set dst (LoadF mem));
7718 
7719   ins_cost(VOLATILE_REF_COST);
7720   format %{ "ldars  $dst, $mem\t# float" %}
7721 
7722   ins_encode( aarch64_enc_fldars(dst, mem) );
7723 
7724   ins_pipe(pipe_serial);
7725 %}
7726 
7727 // Load Double
7728 instruct loadD_volatile(vRegD dst, /* sync_memory*/indirect mem)
7729 %{
7730   match(Set dst (LoadD mem));
7731 
7732   ins_cost(VOLATILE_REF_COST);
7733   format %{ "ldard  $dst, $mem\t# double" %}
7734 
7735   ins_encode( aarch64_enc_fldard(dst, mem) );
7736 
7737   ins_pipe(pipe_serial);
7738 %}
7739 
7740 // Store Byte
7741 instruct storeB_volatile(iRegIorL2I src, /* sync_memory*/indirect mem)
7742 %{
7743   match(Set mem (StoreB mem src));
7744 
7745   ins_cost(VOLATILE_REF_COST);
7746   format %{ "stlrb  $src, $mem\t# byte" %}
7747 
7748   ins_encode(aarch64_enc_stlrb(src, mem));
7749 
7750   ins_pipe(pipe_class_memory);
7751 %}
7752 
7753 // Store Char/Short
7754 instruct storeC_volatile(iRegIorL2I src, /* sync_memory*/indirect mem)
7755 %{
7756   match(Set mem (StoreC mem src));
7757 
7758   ins_cost(VOLATILE_REF_COST);
7759   format %{ "stlrh  $src, $mem\t# short" %}
7760 
7761   ins_encode(aarch64_enc_stlrh(src, mem));
7762 
7763   ins_pipe(pipe_class_memory);
7764 %}
7765 
7766 // Store Integer
7767 
7768 instruct storeI_volatile(iRegIorL2I src, /* sync_memory*/indirect mem)
7769 %{
7770   match(Set mem(StoreI mem src));
7771 
7772   ins_cost(VOLATILE_REF_COST);
7773   format %{ "stlrw  $src, $mem\t# int" %}
7774 
7775   ins_encode(aarch64_enc_stlrw(src, mem));
7776 
7777   ins_pipe(pipe_class_memory);
7778 %}
7779 
7780 // Store Long (64 bit signed)
7781 instruct storeL_volatile(iRegL src, /* sync_memory*/indirect mem)
7782 %{
7783   match(Set mem (StoreL mem src));
7784 
7785   ins_cost(VOLATILE_REF_COST);
7786   format %{ "stlr  $src, $mem\t# int" %}
7787 
7788   ins_encode(aarch64_enc_stlr(src, mem));
7789 
7790   ins_pipe(pipe_class_memory);
7791 %}
7792 
7793 // Store Pointer
7794 instruct storeP_volatile(iRegP src, /* sync_memory*/indirect mem)
7795 %{
7796   match(Set mem (StoreP mem src));
7797 
7798   ins_cost(VOLATILE_REF_COST);
7799   format %{ "stlr  $src, $mem\t# ptr" %}
7800 
7801   ins_encode(aarch64_enc_stlr(src, mem));
7802 
7803   ins_pipe(pipe_class_memory);
7804 %}
7805 
7806 // Store Compressed Pointer
7807 instruct storeN_volatile(iRegN src, /* sync_memory*/indirect mem)
7808 %{
7809   match(Set mem (StoreN mem src));
7810 
7811   ins_cost(VOLATILE_REF_COST);
7812   format %{ "stlrw  $src, $mem\t# compressed ptr" %}
7813 
7814   ins_encode(aarch64_enc_stlrw(src, mem));
7815 
7816   ins_pipe(pipe_class_memory);
7817 %}
7818 
7819 // Store Float
7820 instruct storeF_volatile(vRegF src, /* sync_memory*/indirect mem)
7821 %{
7822   match(Set mem (StoreF mem src));
7823 
7824   ins_cost(VOLATILE_REF_COST);
7825   format %{ "stlrs  $src, $mem\t# float" %}
7826 
7827   ins_encode( aarch64_enc_fstlrs(src, mem) );
7828 
7829   ins_pipe(pipe_class_memory);
7830 %}
7831 
7832 // TODO
7833 // implement storeImmF0 and storeFImmPacked
7834 
7835 // Store Double
7836 instruct storeD_volatile(vRegD src, /* sync_memory*/indirect mem)
7837 %{
7838   match(Set mem (StoreD mem src));
7839 
7840   ins_cost(VOLATILE_REF_COST);
7841   format %{ "stlrd  $src, $mem\t# double" %}
7842 
7843   ins_encode( aarch64_enc_fstlrd(src, mem) );
7844 
7845   ins_pipe(pipe_class_memory);
7846 %}
7847 
7848 //  ---------------- end of volatile loads and stores ----------------
7849 
7850 instruct cacheWB(indirect addr)
7851 %{
7852   predicate(VM_Version::supports_data_cache_line_flush());
7853   match(CacheWB addr);
7854 
7855   ins_cost(100);
7856   format %{"cache wb $addr" %}
7857   ins_encode %{
7858     assert($addr->index_position() < 0, "should be");
7859     assert($addr$$disp == 0, "should be");
7860     __ cache_wb(Address($addr$$base$$Register, 0));
7861   %}
7862   ins_pipe(pipe_slow); // XXX
7863 %}
7864 
7865 instruct cacheWBPreSync()
7866 %{
7867   predicate(VM_Version::supports_data_cache_line_flush());
7868   match(CacheWBPreSync);
7869 
7870   ins_cost(100);
7871   format %{"cache wb presync" %}
7872   ins_encode %{
7873     __ cache_wbsync(true);
7874   %}
7875   ins_pipe(pipe_slow); // XXX
7876 %}
7877 
7878 instruct cacheWBPostSync()
7879 %{
7880   predicate(VM_Version::supports_data_cache_line_flush());
7881   match(CacheWBPostSync);
7882 
7883   ins_cost(100);
7884   format %{"cache wb postsync" %}
7885   ins_encode %{
7886     __ cache_wbsync(false);
7887   %}
7888   ins_pipe(pipe_slow); // XXX
7889 %}
7890 
7891 // ============================================================================
7892 // BSWAP Instructions
7893 
7894 instruct bytes_reverse_int(iRegINoSp dst, iRegIorL2I src) %{
7895   match(Set dst (ReverseBytesI src));
7896 
7897   ins_cost(INSN_COST);
7898   format %{ "revw  $dst, $src" %}
7899 
7900   ins_encode %{
7901     __ revw(as_Register($dst$$reg), as_Register($src$$reg));
7902   %}
7903 
7904   ins_pipe(ialu_reg);
7905 %}
7906 
7907 instruct bytes_reverse_long(iRegLNoSp dst, iRegL src) %{
7908   match(Set dst (ReverseBytesL src));
7909 
7910   ins_cost(INSN_COST);
7911   format %{ "rev  $dst, $src" %}
7912 
7913   ins_encode %{
7914     __ rev(as_Register($dst$$reg), as_Register($src$$reg));
7915   %}
7916 
7917   ins_pipe(ialu_reg);
7918 %}
7919 
7920 instruct bytes_reverse_unsigned_short(iRegINoSp dst, iRegIorL2I src) %{
7921   match(Set dst (ReverseBytesUS src));
7922 
7923   ins_cost(INSN_COST);
7924   format %{ "rev16w  $dst, $src" %}
7925 
7926   ins_encode %{
7927     __ rev16w(as_Register($dst$$reg), as_Register($src$$reg));
7928   %}
7929 
7930   ins_pipe(ialu_reg);
7931 %}
7932 
7933 instruct bytes_reverse_short(iRegINoSp dst, iRegIorL2I src) %{
7934   match(Set dst (ReverseBytesS src));
7935 
7936   ins_cost(INSN_COST);
7937   format %{ "rev16w  $dst, $src\n\t"
7938             "sbfmw $dst, $dst, #0, #15" %}
7939 
7940   ins_encode %{
7941     __ rev16w(as_Register($dst$$reg), as_Register($src$$reg));
7942     __ sbfmw(as_Register($dst$$reg), as_Register($dst$$reg), 0U, 15U);
7943   %}
7944 
7945   ins_pipe(ialu_reg);
7946 %}
7947 
7948 // ============================================================================
7949 // Zero Count Instructions
7950 
7951 instruct countLeadingZerosI(iRegINoSp dst, iRegIorL2I src) %{
7952   match(Set dst (CountLeadingZerosI src));
7953 
7954   ins_cost(INSN_COST);
7955   format %{ "clzw  $dst, $src" %}
7956   ins_encode %{
7957     __ clzw(as_Register($dst$$reg), as_Register($src$$reg));
7958   %}
7959 
7960   ins_pipe(ialu_reg);
7961 %}
7962 
7963 instruct countLeadingZerosL(iRegINoSp dst, iRegL src) %{
7964   match(Set dst (CountLeadingZerosL src));
7965 
7966   ins_cost(INSN_COST);
7967   format %{ "clz   $dst, $src" %}
7968   ins_encode %{
7969     __ clz(as_Register($dst$$reg), as_Register($src$$reg));
7970   %}
7971 
7972   ins_pipe(ialu_reg);
7973 %}
7974 
7975 instruct countTrailingZerosI(iRegINoSp dst, iRegIorL2I src) %{
7976   match(Set dst (CountTrailingZerosI src));
7977 
7978   ins_cost(INSN_COST * 2);
7979   format %{ "rbitw  $dst, $src\n\t"
7980             "clzw   $dst, $dst" %}
7981   ins_encode %{
7982     __ rbitw(as_Register($dst$$reg), as_Register($src$$reg));
7983     __ clzw(as_Register($dst$$reg), as_Register($dst$$reg));
7984   %}
7985 
7986   ins_pipe(ialu_reg);
7987 %}
7988 
7989 instruct countTrailingZerosL(iRegINoSp dst, iRegL src) %{
7990   match(Set dst (CountTrailingZerosL src));
7991 
7992   ins_cost(INSN_COST * 2);
7993   format %{ "rbit   $dst, $src\n\t"
7994             "clz    $dst, $dst" %}
7995   ins_encode %{
7996     __ rbit(as_Register($dst$$reg), as_Register($src$$reg));
7997     __ clz(as_Register($dst$$reg), as_Register($dst$$reg));
7998   %}
7999 
8000   ins_pipe(ialu_reg);
8001 %}
8002 
8003 //---------- Population Count Instructions -------------------------------------
8004 //
8005 
8006 instruct popCountI(iRegINoSp dst, iRegIorL2I src, vRegF tmp) %{
8007   predicate(UsePopCountInstruction);
8008   match(Set dst (PopCountI src));
8009   effect(TEMP tmp);
8010   ins_cost(INSN_COST * 13);
8011 
8012   format %{ "movw   $src, $src\n\t"
8013             "mov    $tmp, $src\t# vector (1D)\n\t"
8014             "cnt    $tmp, $tmp\t# vector (8B)\n\t"
8015             "addv   $tmp, $tmp\t# vector (8B)\n\t"
8016             "mov    $dst, $tmp\t# vector (1D)" %}
8017   ins_encode %{
8018     __ movw($src$$Register, $src$$Register); // ensure top 32 bits 0
8019     __ mov($tmp$$FloatRegister, __ T1D, 0, $src$$Register);
8020     __ cnt($tmp$$FloatRegister, __ T8B, $tmp$$FloatRegister);
8021     __ addv($tmp$$FloatRegister, __ T8B, $tmp$$FloatRegister);
8022     __ mov($dst$$Register, $tmp$$FloatRegister, __ T1D, 0);
8023   %}
8024 
8025   ins_pipe(pipe_class_default);
8026 %}
8027 
8028 instruct popCountI_mem(iRegINoSp dst, memory4 mem, vRegF tmp) %{
8029   predicate(UsePopCountInstruction);
8030   match(Set dst (PopCountI (LoadI mem)));
8031   effect(TEMP tmp);
8032   ins_cost(INSN_COST * 13);
8033 
8034   format %{ "ldrs   $tmp, $mem\n\t"
8035             "cnt    $tmp, $tmp\t# vector (8B)\n\t"
8036             "addv   $tmp, $tmp\t# vector (8B)\n\t"
8037             "mov    $dst, $tmp\t# vector (1D)" %}
8038   ins_encode %{
8039     FloatRegister tmp_reg = as_FloatRegister($tmp$$reg);
8040     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrs, tmp_reg, $mem->opcode(),
8041               as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 4);
8042     __ cnt($tmp$$FloatRegister, __ T8B, $tmp$$FloatRegister);
8043     __ addv($tmp$$FloatRegister, __ T8B, $tmp$$FloatRegister);
8044     __ mov($dst$$Register, $tmp$$FloatRegister, __ T1D, 0);
8045   %}
8046 
8047   ins_pipe(pipe_class_default);
8048 %}
8049 
8050 // Note: Long.bitCount(long) returns an int.
8051 instruct popCountL(iRegINoSp dst, iRegL src, vRegD tmp) %{
8052   predicate(UsePopCountInstruction);
8053   match(Set dst (PopCountL src));
8054   effect(TEMP tmp);
8055   ins_cost(INSN_COST * 13);
8056 
8057   format %{ "mov    $tmp, $src\t# vector (1D)\n\t"
8058             "cnt    $tmp, $tmp\t# vector (8B)\n\t"
8059             "addv   $tmp, $tmp\t# vector (8B)\n\t"
8060             "mov    $dst, $tmp\t# vector (1D)" %}
8061   ins_encode %{
8062     __ mov($tmp$$FloatRegister, __ T1D, 0, $src$$Register);
8063     __ cnt($tmp$$FloatRegister, __ T8B, $tmp$$FloatRegister);
8064     __ addv($tmp$$FloatRegister, __ T8B, $tmp$$FloatRegister);
8065     __ mov($dst$$Register, $tmp$$FloatRegister, __ T1D, 0);
8066   %}
8067 
8068   ins_pipe(pipe_class_default);
8069 %}
8070 
8071 instruct popCountL_mem(iRegINoSp dst, memory8 mem, vRegD tmp) %{
8072   predicate(UsePopCountInstruction);
8073   match(Set dst (PopCountL (LoadL mem)));
8074   effect(TEMP tmp);
8075   ins_cost(INSN_COST * 13);
8076 
8077   format %{ "ldrd   $tmp, $mem\n\t"
8078             "cnt    $tmp, $tmp\t# vector (8B)\n\t"
8079             "addv   $tmp, $tmp\t# vector (8B)\n\t"
8080             "mov    $dst, $tmp\t# vector (1D)" %}
8081   ins_encode %{
8082     FloatRegister tmp_reg = as_FloatRegister($tmp$$reg);
8083     loadStore(C2_MacroAssembler(&cbuf), &MacroAssembler::ldrd, tmp_reg, $mem->opcode(),
8084               as_Register($mem$$base), $mem$$index, $mem$$scale, $mem$$disp, 8);
8085     __ cnt($tmp$$FloatRegister, __ T8B, $tmp$$FloatRegister);
8086     __ addv($tmp$$FloatRegister, __ T8B, $tmp$$FloatRegister);
8087     __ mov($dst$$Register, $tmp$$FloatRegister, __ T1D, 0);
8088   %}
8089 
8090   ins_pipe(pipe_class_default);
8091 %}
8092 
8093 // ============================================================================
8094 // MemBar Instruction
8095 
8096 instruct load_fence() %{
8097   match(LoadFence);
8098   ins_cost(VOLATILE_REF_COST);
8099 
8100   format %{ "load_fence" %}
8101 
8102   ins_encode %{
8103     __ membar(Assembler::LoadLoad|Assembler::LoadStore);
8104   %}
8105   ins_pipe(pipe_serial);
8106 %}
8107 
8108 instruct unnecessary_membar_acquire() %{
8109   predicate(unnecessary_acquire(n));
8110   match(MemBarAcquire);
8111   ins_cost(0);
8112 
8113   format %{ "membar_acquire (elided)" %}
8114 
8115   ins_encode %{
8116     __ block_comment("membar_acquire (elided)");
8117   %}
8118 
8119   ins_pipe(pipe_class_empty);
8120 %}
8121 
8122 instruct membar_acquire() %{
8123   match(MemBarAcquire);
8124   ins_cost(VOLATILE_REF_COST);
8125 
8126   format %{ "membar_acquire\n\t"
8127             "dmb ish" %}
8128 
8129   ins_encode %{
8130     __ block_comment("membar_acquire");
8131     __ membar(Assembler::LoadLoad|Assembler::LoadStore);
8132   %}
8133 
8134   ins_pipe(pipe_serial);
8135 %}
8136 
8137 
8138 instruct membar_acquire_lock() %{
8139   match(MemBarAcquireLock);
8140   ins_cost(VOLATILE_REF_COST);
8141 
8142   format %{ "membar_acquire_lock (elided)" %}
8143 
8144   ins_encode %{
8145     __ block_comment("membar_acquire_lock (elided)");
8146   %}
8147 
8148   ins_pipe(pipe_serial);
8149 %}
8150 
8151 instruct store_fence() %{
8152   match(StoreFence);
8153   ins_cost(VOLATILE_REF_COST);
8154 
8155   format %{ "store_fence" %}
8156 
8157   ins_encode %{
8158     __ membar(Assembler::LoadStore|Assembler::StoreStore);
8159   %}
8160   ins_pipe(pipe_serial);
8161 %}
8162 
8163 instruct unnecessary_membar_release() %{
8164   predicate(unnecessary_release(n));
8165   match(MemBarRelease);
8166   ins_cost(0);
8167 
8168   format %{ "membar_release (elided)" %}
8169 
8170   ins_encode %{
8171     __ block_comment("membar_release (elided)");
8172   %}
8173   ins_pipe(pipe_serial);
8174 %}
8175 
8176 instruct membar_release() %{
8177   match(MemBarRelease);
8178   ins_cost(VOLATILE_REF_COST);
8179 
8180   format %{ "membar_release\n\t"
8181             "dmb ish" %}
8182 
8183   ins_encode %{
8184     __ block_comment("membar_release");
8185     __ membar(Assembler::LoadStore|Assembler::StoreStore);
8186   %}
8187   ins_pipe(pipe_serial);
8188 %}
8189 
8190 instruct membar_storestore() %{
8191   match(MemBarStoreStore);
8192   ins_cost(VOLATILE_REF_COST);
8193 
8194   format %{ "MEMBAR-store-store" %}
8195 
8196   ins_encode %{
8197     __ membar(Assembler::StoreStore);
8198   %}
8199   ins_pipe(pipe_serial);
8200 %}
8201 
8202 instruct membar_release_lock() %{
8203   match(MemBarReleaseLock);
8204   ins_cost(VOLATILE_REF_COST);
8205 
8206   format %{ "membar_release_lock (elided)" %}
8207 
8208   ins_encode %{
8209     __ block_comment("membar_release_lock (elided)");
8210   %}
8211 
8212   ins_pipe(pipe_serial);
8213 %}
8214 
8215 instruct unnecessary_membar_volatile() %{
8216   predicate(unnecessary_volatile(n));
8217   match(MemBarVolatile);
8218   ins_cost(0);
8219 
8220   format %{ "membar_volatile (elided)" %}
8221 
8222   ins_encode %{
8223     __ block_comment("membar_volatile (elided)");
8224   %}
8225 
8226   ins_pipe(pipe_serial);
8227 %}
8228 
8229 instruct membar_volatile() %{
8230   match(MemBarVolatile);
8231   ins_cost(VOLATILE_REF_COST*100);
8232 
8233   format %{ "membar_volatile\n\t"
8234              "dmb ish"%}
8235 
8236   ins_encode %{
8237     __ block_comment("membar_volatile");
8238     __ membar(Assembler::StoreLoad);
8239   %}
8240 
8241   ins_pipe(pipe_serial);
8242 %}
8243 
8244 // ============================================================================
8245 // Cast/Convert Instructions
8246 
8247 instruct castX2P(iRegPNoSp dst, iRegL src) %{
8248   match(Set dst (CastX2P src));
8249 
8250   ins_cost(INSN_COST);
8251   format %{ "mov $dst, $src\t# long -> ptr" %}
8252 
8253   ins_encode %{
8254     if ($dst$$reg != $src$$reg) {
8255       __ mov(as_Register($dst$$reg), as_Register($src$$reg));
8256     }
8257   %}
8258 
8259   ins_pipe(ialu_reg);
8260 %}
8261 
8262 instruct castP2X(iRegLNoSp dst, iRegP src) %{
8263   match(Set dst (CastP2X src));
8264 
8265   ins_cost(INSN_COST);
8266   format %{ "mov $dst, $src\t# ptr -> long" %}
8267 
8268   ins_encode %{
8269     if ($dst$$reg != $src$$reg) {
8270       __ mov(as_Register($dst$$reg), as_Register($src$$reg));
8271     }
8272   %}
8273 
8274   ins_pipe(ialu_reg);
8275 %}
8276 
8277 // Convert oop into int for vectors alignment masking
8278 instruct convP2I(iRegINoSp dst, iRegP src) %{
8279   match(Set dst (ConvL2I (CastP2X src)));
8280 
8281   ins_cost(INSN_COST);
8282   format %{ "movw $dst, $src\t# ptr -> int" %}
8283   ins_encode %{
8284     __ movw($dst$$Register, $src$$Register);
8285   %}
8286 
8287   ins_pipe(ialu_reg);
8288 %}
8289 
8290 // Convert compressed oop into int for vectors alignment masking
8291 // in case of 32bit oops (heap < 4Gb).
8292 instruct convN2I(iRegINoSp dst, iRegN src)
8293 %{
8294   predicate(CompressedOops::shift() == 0);
8295   match(Set dst (ConvL2I (CastP2X (DecodeN src))));
8296 
8297   ins_cost(INSN_COST);
8298   format %{ "mov dst, $src\t# compressed ptr -> int" %}
8299   ins_encode %{
8300     __ movw($dst$$Register, $src$$Register);
8301   %}
8302 
8303   ins_pipe(ialu_reg);
8304 %}
8305 
8306 
8307 // Convert oop pointer into compressed form
8308 instruct encodeHeapOop(iRegNNoSp dst, iRegP src, rFlagsReg cr) %{
8309   predicate(n->bottom_type()->make_ptr()->ptr() != TypePtr::NotNull);
8310   match(Set dst (EncodeP src));
8311   effect(KILL cr);
8312   ins_cost(INSN_COST * 3);
8313   format %{ "encode_heap_oop $dst, $src" %}
8314   ins_encode %{
8315     Register s = $src$$Register;
8316     Register d = $dst$$Register;
8317     __ encode_heap_oop(d, s);
8318   %}
8319   ins_pipe(ialu_reg);
8320 %}
8321 
8322 instruct encodeHeapOop_not_null(iRegNNoSp dst, iRegP src, rFlagsReg cr) %{
8323   predicate(n->bottom_type()->make_ptr()->ptr() == TypePtr::NotNull);
8324   match(Set dst (EncodeP src));
8325   ins_cost(INSN_COST * 3);
8326   format %{ "encode_heap_oop_not_null $dst, $src" %}
8327   ins_encode %{
8328     __ encode_heap_oop_not_null($dst$$Register, $src$$Register);
8329   %}
8330   ins_pipe(ialu_reg);
8331 %}
8332 
8333 instruct decodeHeapOop(iRegPNoSp dst, iRegN src, rFlagsReg cr) %{
8334   predicate(n->bottom_type()->is_ptr()->ptr() != TypePtr::NotNull &&
8335             n->bottom_type()->is_ptr()->ptr() != TypePtr::Constant);
8336   match(Set dst (DecodeN src));
8337   ins_cost(INSN_COST * 3);
8338   format %{ "decode_heap_oop $dst, $src" %}
8339   ins_encode %{
8340     Register s = $src$$Register;
8341     Register d = $dst$$Register;
8342     __ decode_heap_oop(d, s);
8343   %}
8344   ins_pipe(ialu_reg);
8345 %}
8346 
8347 instruct decodeHeapOop_not_null(iRegPNoSp dst, iRegN src, rFlagsReg cr) %{
8348   predicate(n->bottom_type()->is_ptr()->ptr() == TypePtr::NotNull ||
8349             n->bottom_type()->is_ptr()->ptr() == TypePtr::Constant);
8350   match(Set dst (DecodeN src));
8351   ins_cost(INSN_COST * 3);
8352   format %{ "decode_heap_oop_not_null $dst, $src" %}
8353   ins_encode %{
8354     Register s = $src$$Register;
8355     Register d = $dst$$Register;
8356     __ decode_heap_oop_not_null(d, s);
8357   %}
8358   ins_pipe(ialu_reg);
8359 %}
8360 
8361 // n.b. AArch64 implementations of encode_klass_not_null and
8362 // decode_klass_not_null do not modify the flags register so, unlike
8363 // Intel, we don't kill CR as a side effect here
8364 
8365 instruct encodeKlass_not_null(iRegNNoSp dst, iRegP src) %{
8366   match(Set dst (EncodePKlass src));
8367 
8368   ins_cost(INSN_COST * 3);
8369   format %{ "encode_klass_not_null $dst,$src" %}
8370 
8371   ins_encode %{
8372     Register src_reg = as_Register($src$$reg);
8373     Register dst_reg = as_Register($dst$$reg);
8374     __ encode_klass_not_null(dst_reg, src_reg);
8375   %}
8376 
8377    ins_pipe(ialu_reg);
8378 %}
8379 
8380 instruct decodeKlass_not_null(iRegPNoSp dst, iRegN src) %{
8381   match(Set dst (DecodeNKlass src));
8382 
8383   ins_cost(INSN_COST * 3);
8384   format %{ "decode_klass_not_null $dst,$src" %}
8385 
8386   ins_encode %{
8387     Register src_reg = as_Register($src$$reg);
8388     Register dst_reg = as_Register($dst$$reg);
8389     if (dst_reg != src_reg) {
8390       __ decode_klass_not_null(dst_reg, src_reg);
8391     } else {
8392       __ decode_klass_not_null(dst_reg);
8393     }
8394   %}
8395 
8396    ins_pipe(ialu_reg);
8397 %}
8398 
8399 instruct checkCastPP(iRegPNoSp dst)
8400 %{
8401   match(Set dst (CheckCastPP dst));
8402 
8403   size(0);
8404   format %{ "# checkcastPP of $dst" %}
8405   ins_encode(/* empty encoding */);
8406   ins_pipe(pipe_class_empty);
8407 %}
8408 
8409 instruct castPP(iRegPNoSp dst)
8410 %{
8411   match(Set dst (CastPP dst));
8412 
8413   size(0);
8414   format %{ "# castPP of $dst" %}
8415   ins_encode(/* empty encoding */);
8416   ins_pipe(pipe_class_empty);
8417 %}
8418 
8419 instruct castII(iRegI dst)
8420 %{
8421   match(Set dst (CastII dst));
8422 
8423   size(0);
8424   format %{ "# castII of $dst" %}
8425   ins_encode(/* empty encoding */);
8426   ins_cost(0);
8427   ins_pipe(pipe_class_empty);
8428 %}
8429 
8430 // ============================================================================
8431 // Atomic operation instructions
8432 //
8433 // Intel and SPARC both implement Ideal Node LoadPLocked and
8434 // Store{PIL}Conditional instructions using a normal load for the
8435 // LoadPLocked and a CAS for the Store{PIL}Conditional.
8436 //
8437 // The ideal code appears only to use LoadPLocked/StorePLocked as a
8438 // pair to lock object allocations from Eden space when not using
8439 // TLABs.
8440 //
8441 // There does not appear to be a Load{IL}Locked Ideal Node and the
8442 // Ideal code appears to use Store{IL}Conditional as an alias for CAS
8443 // and to use StoreIConditional only for 32-bit and StoreLConditional
8444 // only for 64-bit.
8445 //
8446 // We implement LoadPLocked and StorePLocked instructions using,
8447 // respectively the AArch64 hw load-exclusive and store-conditional
8448 // instructions. Whereas we must implement each of
8449 // Store{IL}Conditional using a CAS which employs a pair of
8450 // instructions comprising a load-exclusive followed by a
8451 // store-conditional.
8452 
8453 
8454 // Locked-load (linked load) of the current heap-top
8455 // used when updating the eden heap top
8456 // implemented using ldaxr on AArch64
8457 
8458 instruct loadPLocked(iRegPNoSp dst, indirect mem)
8459 %{
8460   match(Set dst (LoadPLocked mem));
8461 
8462   ins_cost(VOLATILE_REF_COST);
8463 
8464   format %{ "ldaxr $dst, $mem\t# ptr linked acquire" %}
8465 
8466   ins_encode(aarch64_enc_ldaxr(dst, mem));
8467 
8468   ins_pipe(pipe_serial);
8469 %}
8470 
8471 // Conditional-store of the updated heap-top.
8472 // Used during allocation of the shared heap.
8473 // Sets flag (EQ) on success.
8474 // implemented using stlxr on AArch64.
8475 
8476 instruct storePConditional(memory8 heap_top_ptr, iRegP oldval, iRegP newval, rFlagsReg cr)
8477 %{
8478   match(Set cr (StorePConditional heap_top_ptr (Binary oldval newval)));
8479 
8480   ins_cost(VOLATILE_REF_COST);
8481 
8482  // TODO
8483  // do we need to do a store-conditional release or can we just use a
8484  // plain store-conditional?
8485 
8486   format %{
8487     "stlxr rscratch1, $newval, $heap_top_ptr\t# ptr cond release"
8488     "cmpw rscratch1, zr\t# EQ on successful write"
8489   %}
8490 
8491   ins_encode(aarch64_enc_stlxr(newval, heap_top_ptr));
8492 
8493   ins_pipe(pipe_serial);
8494 %}
8495 
8496 
8497 // storeLConditional is used by PhaseMacroExpand::expand_lock_node
8498 // when attempting to rebias a lock towards the current thread.  We
8499 // must use the acquire form of cmpxchg in order to guarantee acquire
8500 // semantics in this case.
8501 instruct storeLConditional(indirect mem, iRegLNoSp oldval, iRegLNoSp newval, rFlagsReg cr)
8502 %{
8503   match(Set cr (StoreLConditional mem (Binary oldval newval)));
8504 
8505   ins_cost(VOLATILE_REF_COST);
8506 
8507   format %{
8508     "cmpxchg rscratch1, $mem, $oldval, $newval, $mem\t# if $mem == $oldval then $mem <-- $newval"
8509     "cmpw rscratch1, zr\t# EQ on successful write"
8510   %}
8511 
8512   ins_encode(aarch64_enc_cmpxchg_acq(mem, oldval, newval));
8513 
8514   ins_pipe(pipe_slow);
8515 %}
8516 
8517 // storeIConditional also has acquire semantics, for no better reason
8518 // than matching storeLConditional.  At the time of writing this
8519 // comment storeIConditional was not used anywhere by AArch64.
8520 instruct storeIConditional(indirect mem, iRegINoSp oldval, iRegINoSp newval, rFlagsReg cr)
8521 %{
8522   match(Set cr (StoreIConditional mem (Binary oldval newval)));
8523 
8524   ins_cost(VOLATILE_REF_COST);
8525 
8526   format %{
8527     "cmpxchgw rscratch1, $mem, $oldval, $newval, $mem\t# if $mem == $oldval then $mem <-- $newval"
8528     "cmpw rscratch1, zr\t# EQ on successful write"
8529   %}
8530 
8531   ins_encode(aarch64_enc_cmpxchgw_acq(mem, oldval, newval));
8532 
8533   ins_pipe(pipe_slow);
8534 %}
8535 
8536 // standard CompareAndSwapX when we are using barriers
8537 // these have higher priority than the rules selected by a predicate
8538 
8539 // XXX No flag versions for CompareAndSwap{I,L,P,N} because matcher
8540 // can't match them
8541 
8542 instruct compareAndSwapB(iRegINoSp res, indirect mem, iRegINoSp oldval, iRegINoSp newval, rFlagsReg cr) %{
8543 
8544   match(Set res (CompareAndSwapB mem (Binary oldval newval)));
8545   ins_cost(2 * VOLATILE_REF_COST);
8546 
8547   effect(KILL cr);
8548 
8549   format %{
8550     "cmpxchgb $mem, $oldval, $newval\t# (int) if $mem == $oldval then $mem <-- $newval"
8551     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8552   %}
8553 
8554   ins_encode(aarch64_enc_cmpxchgb(mem, oldval, newval),
8555             aarch64_enc_cset_eq(res));
8556 
8557   ins_pipe(pipe_slow);
8558 %}
8559 
8560 instruct compareAndSwapS(iRegINoSp res, indirect mem, iRegINoSp oldval, iRegINoSp newval, rFlagsReg cr) %{
8561 
8562   match(Set res (CompareAndSwapS mem (Binary oldval newval)));
8563   ins_cost(2 * VOLATILE_REF_COST);
8564 
8565   effect(KILL cr);
8566 
8567   format %{
8568     "cmpxchgs $mem, $oldval, $newval\t# (int) if $mem == $oldval then $mem <-- $newval"
8569     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8570   %}
8571 
8572   ins_encode(aarch64_enc_cmpxchgs(mem, oldval, newval),
8573             aarch64_enc_cset_eq(res));
8574 
8575   ins_pipe(pipe_slow);
8576 %}
8577 
8578 instruct compareAndSwapI(iRegINoSp res, indirect mem, iRegINoSp oldval, iRegINoSp newval, rFlagsReg cr) %{
8579 
8580   match(Set res (CompareAndSwapI mem (Binary oldval newval)));
8581   ins_cost(2 * VOLATILE_REF_COST);
8582 
8583   effect(KILL cr);
8584 
8585  format %{
8586     "cmpxchgw $mem, $oldval, $newval\t# (int) if $mem == $oldval then $mem <-- $newval"
8587     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8588  %}
8589 
8590  ins_encode(aarch64_enc_cmpxchgw(mem, oldval, newval),
8591             aarch64_enc_cset_eq(res));
8592 
8593   ins_pipe(pipe_slow);
8594 %}
8595 
8596 instruct compareAndSwapL(iRegINoSp res, indirect mem, iRegLNoSp oldval, iRegLNoSp newval, rFlagsReg cr) %{
8597 
8598   match(Set res (CompareAndSwapL mem (Binary oldval newval)));
8599   ins_cost(2 * VOLATILE_REF_COST);
8600 
8601   effect(KILL cr);
8602 
8603  format %{
8604     "cmpxchg $mem, $oldval, $newval\t# (long) if $mem == $oldval then $mem <-- $newval"
8605     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8606  %}
8607 
8608  ins_encode(aarch64_enc_cmpxchg(mem, oldval, newval),
8609             aarch64_enc_cset_eq(res));
8610 
8611   ins_pipe(pipe_slow);
8612 %}
8613 
8614 instruct compareAndSwapP(iRegINoSp res, indirect mem, iRegP oldval, iRegP newval, rFlagsReg cr) %{
8615 
8616   match(Set res (CompareAndSwapP mem (Binary oldval newval)));
8617   predicate(n->as_LoadStore()->barrier_data() == 0);
8618   ins_cost(2 * VOLATILE_REF_COST);
8619 
8620   effect(KILL cr);
8621 
8622  format %{
8623     "cmpxchg $mem, $oldval, $newval\t# (ptr) if $mem == $oldval then $mem <-- $newval"
8624     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8625  %}
8626 
8627  ins_encode(aarch64_enc_cmpxchg(mem, oldval, newval),
8628             aarch64_enc_cset_eq(res));
8629 
8630   ins_pipe(pipe_slow);
8631 %}
8632 
8633 instruct compareAndSwapN(iRegINoSp res, indirect mem, iRegNNoSp oldval, iRegNNoSp newval, rFlagsReg cr) %{
8634 
8635   match(Set res (CompareAndSwapN mem (Binary oldval newval)));
8636   ins_cost(2 * VOLATILE_REF_COST);
8637 
8638   effect(KILL cr);
8639 
8640  format %{
8641     "cmpxchgw $mem, $oldval, $newval\t# (narrow oop) if $mem == $oldval then $mem <-- $newval"
8642     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8643  %}
8644 
8645  ins_encode(aarch64_enc_cmpxchgw(mem, oldval, newval),
8646             aarch64_enc_cset_eq(res));
8647 
8648   ins_pipe(pipe_slow);
8649 %}
8650 
8651 // alternative CompareAndSwapX when we are eliding barriers
8652 
8653 instruct compareAndSwapBAcq(iRegINoSp res, indirect mem, iRegINoSp oldval, iRegINoSp newval, rFlagsReg cr) %{
8654 
8655   predicate(needs_acquiring_load_exclusive(n));
8656   match(Set res (CompareAndSwapB mem (Binary oldval newval)));
8657   ins_cost(VOLATILE_REF_COST);
8658 
8659   effect(KILL cr);
8660 
8661   format %{
8662     "cmpxchgb_acq $mem, $oldval, $newval\t# (int) if $mem == $oldval then $mem <-- $newval"
8663     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8664   %}
8665 
8666   ins_encode(aarch64_enc_cmpxchgb_acq(mem, oldval, newval),
8667             aarch64_enc_cset_eq(res));
8668 
8669   ins_pipe(pipe_slow);
8670 %}
8671 
8672 instruct compareAndSwapSAcq(iRegINoSp res, indirect mem, iRegINoSp oldval, iRegINoSp newval, rFlagsReg cr) %{
8673 
8674   predicate(needs_acquiring_load_exclusive(n));
8675   match(Set res (CompareAndSwapS mem (Binary oldval newval)));
8676   ins_cost(VOLATILE_REF_COST);
8677 
8678   effect(KILL cr);
8679 
8680   format %{
8681     "cmpxchgs_acq $mem, $oldval, $newval\t# (int) if $mem == $oldval then $mem <-- $newval"
8682     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8683   %}
8684 
8685   ins_encode(aarch64_enc_cmpxchgs_acq(mem, oldval, newval),
8686             aarch64_enc_cset_eq(res));
8687 
8688   ins_pipe(pipe_slow);
8689 %}
8690 
8691 instruct compareAndSwapIAcq(iRegINoSp res, indirect mem, iRegINoSp oldval, iRegINoSp newval, rFlagsReg cr) %{
8692 
8693   predicate(needs_acquiring_load_exclusive(n));
8694   match(Set res (CompareAndSwapI mem (Binary oldval newval)));
8695   ins_cost(VOLATILE_REF_COST);
8696 
8697   effect(KILL cr);
8698 
8699  format %{
8700     "cmpxchgw_acq $mem, $oldval, $newval\t# (int) if $mem == $oldval then $mem <-- $newval"
8701     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8702  %}
8703 
8704  ins_encode(aarch64_enc_cmpxchgw_acq(mem, oldval, newval),
8705             aarch64_enc_cset_eq(res));
8706 
8707   ins_pipe(pipe_slow);
8708 %}
8709 
8710 instruct compareAndSwapLAcq(iRegINoSp res, indirect mem, iRegLNoSp oldval, iRegLNoSp newval, rFlagsReg cr) %{
8711 
8712   predicate(needs_acquiring_load_exclusive(n));
8713   match(Set res (CompareAndSwapL mem (Binary oldval newval)));
8714   ins_cost(VOLATILE_REF_COST);
8715 
8716   effect(KILL cr);
8717 
8718  format %{
8719     "cmpxchg_acq $mem, $oldval, $newval\t# (long) if $mem == $oldval then $mem <-- $newval"
8720     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8721  %}
8722 
8723  ins_encode(aarch64_enc_cmpxchg_acq(mem, oldval, newval),
8724             aarch64_enc_cset_eq(res));
8725 
8726   ins_pipe(pipe_slow);
8727 %}
8728 
8729 instruct compareAndSwapPAcq(iRegINoSp res, indirect mem, iRegP oldval, iRegP newval, rFlagsReg cr) %{
8730 
8731   predicate(needs_acquiring_load_exclusive(n) && (n->as_LoadStore()->barrier_data() == 0));
8732   match(Set res (CompareAndSwapP mem (Binary oldval newval)));
8733   ins_cost(VOLATILE_REF_COST);
8734 
8735   effect(KILL cr);
8736 
8737  format %{
8738     "cmpxchg_acq $mem, $oldval, $newval\t# (ptr) if $mem == $oldval then $mem <-- $newval"
8739     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8740  %}
8741 
8742  ins_encode(aarch64_enc_cmpxchg_acq(mem, oldval, newval),
8743             aarch64_enc_cset_eq(res));
8744 
8745   ins_pipe(pipe_slow);
8746 %}
8747 
8748 instruct compareAndSwapNAcq(iRegINoSp res, indirect mem, iRegNNoSp oldval, iRegNNoSp newval, rFlagsReg cr) %{
8749 
8750   predicate(needs_acquiring_load_exclusive(n));
8751   match(Set res (CompareAndSwapN mem (Binary oldval newval)));
8752   ins_cost(VOLATILE_REF_COST);
8753 
8754   effect(KILL cr);
8755 
8756  format %{
8757     "cmpxchgw_acq $mem, $oldval, $newval\t# (narrow oop) if $mem == $oldval then $mem <-- $newval"
8758     "cset $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8759  %}
8760 
8761  ins_encode(aarch64_enc_cmpxchgw_acq(mem, oldval, newval),
8762             aarch64_enc_cset_eq(res));
8763 
8764   ins_pipe(pipe_slow);
8765 %}
8766 
8767 
8768 // ---------------------------------------------------------------------
8769 
8770 
8771 // BEGIN This section of the file is automatically generated. Do not edit --------------
8772 
8773 // Sundry CAS operations.  Note that release is always true,
8774 // regardless of the memory ordering of the CAS.  This is because we
8775 // need the volatile case to be sequentially consistent but there is
8776 // no trailing StoreLoad barrier emitted by C2.  Unfortunately we
8777 // can't check the type of memory ordering here, so we always emit a
8778 // STLXR.
8779 
8780 // This section is generated from aarch64_ad_cas.m4
8781 
8782 
8783 
8784 instruct compareAndExchangeB(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
8785   match(Set res (CompareAndExchangeB mem (Binary oldval newval)));
8786   ins_cost(2 * VOLATILE_REF_COST);
8787   effect(TEMP_DEF res, KILL cr);
8788   format %{
8789     "cmpxchgb $res = $mem, $oldval, $newval\t# (byte, weak) if $mem == $oldval then $mem <-- $newval"
8790   %}
8791   ins_encode %{
8792     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8793                Assembler::byte, /*acquire*/ false, /*release*/ true,
8794                /*weak*/ false, $res$$Register);
8795     __ sxtbw($res$$Register, $res$$Register);
8796   %}
8797   ins_pipe(pipe_slow);
8798 %}
8799 
8800 instruct compareAndExchangeS(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
8801   match(Set res (CompareAndExchangeS mem (Binary oldval newval)));
8802   ins_cost(2 * VOLATILE_REF_COST);
8803   effect(TEMP_DEF res, KILL cr);
8804   format %{
8805     "cmpxchgs $res = $mem, $oldval, $newval\t# (short, weak) if $mem == $oldval then $mem <-- $newval"
8806   %}
8807   ins_encode %{
8808     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8809                Assembler::halfword, /*acquire*/ false, /*release*/ true,
8810                /*weak*/ false, $res$$Register);
8811     __ sxthw($res$$Register, $res$$Register);
8812   %}
8813   ins_pipe(pipe_slow);
8814 %}
8815 
8816 instruct compareAndExchangeI(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
8817   match(Set res (CompareAndExchangeI mem (Binary oldval newval)));
8818   ins_cost(2 * VOLATILE_REF_COST);
8819   effect(TEMP_DEF res, KILL cr);
8820   format %{
8821     "cmpxchgw $res = $mem, $oldval, $newval\t# (int, weak) if $mem == $oldval then $mem <-- $newval"
8822   %}
8823   ins_encode %{
8824     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8825                Assembler::word, /*acquire*/ false, /*release*/ true,
8826                /*weak*/ false, $res$$Register);
8827   %}
8828   ins_pipe(pipe_slow);
8829 %}
8830 
8831 instruct compareAndExchangeL(iRegLNoSp res, indirect mem, iRegL oldval, iRegL newval, rFlagsReg cr) %{
8832   match(Set res (CompareAndExchangeL mem (Binary oldval newval)));
8833   ins_cost(2 * VOLATILE_REF_COST);
8834   effect(TEMP_DEF res, KILL cr);
8835   format %{
8836     "cmpxchg $res = $mem, $oldval, $newval\t# (long, weak) if $mem == $oldval then $mem <-- $newval"
8837   %}
8838   ins_encode %{
8839     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8840                Assembler::xword, /*acquire*/ false, /*release*/ true,
8841                /*weak*/ false, $res$$Register);
8842   %}
8843   ins_pipe(pipe_slow);
8844 %}
8845 
8846 instruct compareAndExchangeN(iRegNNoSp res, indirect mem, iRegN oldval, iRegN newval, rFlagsReg cr) %{
8847   match(Set res (CompareAndExchangeN mem (Binary oldval newval)));
8848   ins_cost(2 * VOLATILE_REF_COST);
8849   effect(TEMP_DEF res, KILL cr);
8850   format %{
8851     "cmpxchgw $res = $mem, $oldval, $newval\t# (narrow oop, weak) if $mem == $oldval then $mem <-- $newval"
8852   %}
8853   ins_encode %{
8854     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8855                Assembler::word, /*acquire*/ false, /*release*/ true,
8856                /*weak*/ false, $res$$Register);
8857   %}
8858   ins_pipe(pipe_slow);
8859 %}
8860 
8861 instruct compareAndExchangeP(iRegPNoSp res, indirect mem, iRegP oldval, iRegP newval, rFlagsReg cr) %{
8862   predicate(n->as_LoadStore()->barrier_data() == 0);
8863   match(Set res (CompareAndExchangeP mem (Binary oldval newval)));
8864   ins_cost(2 * VOLATILE_REF_COST);
8865   effect(TEMP_DEF res, KILL cr);
8866   format %{
8867     "cmpxchg $res = $mem, $oldval, $newval\t# (ptr, weak) if $mem == $oldval then $mem <-- $newval"
8868   %}
8869   ins_encode %{
8870     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8871                Assembler::xword, /*acquire*/ false, /*release*/ true,
8872                /*weak*/ false, $res$$Register);
8873   %}
8874   ins_pipe(pipe_slow);
8875 %}
8876 
8877 instruct compareAndExchangeBAcq(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
8878   predicate(needs_acquiring_load_exclusive(n));
8879   match(Set res (CompareAndExchangeB mem (Binary oldval newval)));
8880   ins_cost(VOLATILE_REF_COST);
8881   effect(TEMP_DEF res, KILL cr);
8882   format %{
8883     "cmpxchgb_acq $res = $mem, $oldval, $newval\t# (byte, weak) if $mem == $oldval then $mem <-- $newval"
8884   %}
8885   ins_encode %{
8886     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8887                Assembler::byte, /*acquire*/ true, /*release*/ true,
8888                /*weak*/ false, $res$$Register);
8889     __ sxtbw($res$$Register, $res$$Register);
8890   %}
8891   ins_pipe(pipe_slow);
8892 %}
8893 
8894 instruct compareAndExchangeSAcq(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
8895   predicate(needs_acquiring_load_exclusive(n));
8896   match(Set res (CompareAndExchangeS mem (Binary oldval newval)));
8897   ins_cost(VOLATILE_REF_COST);
8898   effect(TEMP_DEF res, KILL cr);
8899   format %{
8900     "cmpxchgs_acq $res = $mem, $oldval, $newval\t# (short, weak) if $mem == $oldval then $mem <-- $newval"
8901   %}
8902   ins_encode %{
8903     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8904                Assembler::halfword, /*acquire*/ true, /*release*/ true,
8905                /*weak*/ false, $res$$Register);
8906     __ sxthw($res$$Register, $res$$Register);
8907   %}
8908   ins_pipe(pipe_slow);
8909 %}
8910 
8911 
8912 instruct compareAndExchangeIAcq(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
8913   predicate(needs_acquiring_load_exclusive(n));
8914   match(Set res (CompareAndExchangeI mem (Binary oldval newval)));
8915   ins_cost(VOLATILE_REF_COST);
8916   effect(TEMP_DEF res, KILL cr);
8917   format %{
8918     "cmpxchgw_acq $res = $mem, $oldval, $newval\t# (int, weak) if $mem == $oldval then $mem <-- $newval"
8919   %}
8920   ins_encode %{
8921     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8922                Assembler::word, /*acquire*/ true, /*release*/ true,
8923                /*weak*/ false, $res$$Register);
8924   %}
8925   ins_pipe(pipe_slow);
8926 %}
8927 
8928 instruct compareAndExchangeLAcq(iRegLNoSp res, indirect mem, iRegL oldval, iRegL newval, rFlagsReg cr) %{
8929   predicate(needs_acquiring_load_exclusive(n));
8930   match(Set res (CompareAndExchangeL mem (Binary oldval newval)));
8931   ins_cost(VOLATILE_REF_COST);
8932   effect(TEMP_DEF res, KILL cr);
8933   format %{
8934     "cmpxchg_acq $res = $mem, $oldval, $newval\t# (long, weak) if $mem == $oldval then $mem <-- $newval"
8935   %}
8936   ins_encode %{
8937     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8938                Assembler::xword, /*acquire*/ true, /*release*/ true,
8939                /*weak*/ false, $res$$Register);
8940   %}
8941   ins_pipe(pipe_slow);
8942 %}
8943 
8944 
8945 instruct compareAndExchangeNAcq(iRegNNoSp res, indirect mem, iRegN oldval, iRegN newval, rFlagsReg cr) %{
8946   predicate(needs_acquiring_load_exclusive(n));
8947   match(Set res (CompareAndExchangeN mem (Binary oldval newval)));
8948   ins_cost(VOLATILE_REF_COST);
8949   effect(TEMP_DEF res, KILL cr);
8950   format %{
8951     "cmpxchgw_acq $res = $mem, $oldval, $newval\t# (narrow oop, weak) if $mem == $oldval then $mem <-- $newval"
8952   %}
8953   ins_encode %{
8954     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8955                Assembler::word, /*acquire*/ true, /*release*/ true,
8956                /*weak*/ false, $res$$Register);
8957   %}
8958   ins_pipe(pipe_slow);
8959 %}
8960 
8961 instruct compareAndExchangePAcq(iRegPNoSp res, indirect mem, iRegP oldval, iRegP newval, rFlagsReg cr) %{
8962   predicate(needs_acquiring_load_exclusive(n) && (n->as_LoadStore()->barrier_data() == 0));
8963   match(Set res (CompareAndExchangeP mem (Binary oldval newval)));
8964   ins_cost(VOLATILE_REF_COST);
8965   effect(TEMP_DEF res, KILL cr);
8966   format %{
8967     "cmpxchg_acq $res = $mem, $oldval, $newval\t# (ptr, weak) if $mem == $oldval then $mem <-- $newval"
8968   %}
8969   ins_encode %{
8970     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8971                Assembler::xword, /*acquire*/ true, /*release*/ true,
8972                /*weak*/ false, $res$$Register);
8973   %}
8974   ins_pipe(pipe_slow);
8975 %}
8976 
8977 instruct weakCompareAndSwapB(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
8978   match(Set res (WeakCompareAndSwapB mem (Binary oldval newval)));
8979   ins_cost(2 * VOLATILE_REF_COST);
8980   effect(KILL cr);
8981   format %{
8982     "cmpxchgb $res = $mem, $oldval, $newval\t# (byte, weak) if $mem == $oldval then $mem <-- $newval"
8983     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
8984   %}
8985   ins_encode %{
8986     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
8987                Assembler::byte, /*acquire*/ false, /*release*/ true,
8988                /*weak*/ true, noreg);
8989     __ csetw($res$$Register, Assembler::EQ);
8990   %}
8991   ins_pipe(pipe_slow);
8992 %}
8993 
8994 instruct weakCompareAndSwapS(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
8995   match(Set res (WeakCompareAndSwapS mem (Binary oldval newval)));
8996   ins_cost(2 * VOLATILE_REF_COST);
8997   effect(KILL cr);
8998   format %{
8999     "cmpxchgs $res = $mem, $oldval, $newval\t# (short, weak) if $mem == $oldval then $mem <-- $newval"
9000     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9001   %}
9002   ins_encode %{
9003     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9004                Assembler::halfword, /*acquire*/ false, /*release*/ true,
9005                /*weak*/ true, noreg);
9006     __ csetw($res$$Register, Assembler::EQ);
9007   %}
9008   ins_pipe(pipe_slow);
9009 %}
9010 
9011 instruct weakCompareAndSwapI(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
9012   match(Set res (WeakCompareAndSwapI mem (Binary oldval newval)));
9013   ins_cost(2 * VOLATILE_REF_COST);
9014   effect(KILL cr);
9015   format %{
9016     "cmpxchgw $res = $mem, $oldval, $newval\t# (int, weak) if $mem == $oldval then $mem <-- $newval"
9017     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9018   %}
9019   ins_encode %{
9020     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9021                Assembler::word, /*acquire*/ false, /*release*/ true,
9022                /*weak*/ true, noreg);
9023     __ csetw($res$$Register, Assembler::EQ);
9024   %}
9025   ins_pipe(pipe_slow);
9026 %}
9027 
9028 instruct weakCompareAndSwapL(iRegINoSp res, indirect mem, iRegL oldval, iRegL newval, rFlagsReg cr) %{
9029   match(Set res (WeakCompareAndSwapL mem (Binary oldval newval)));
9030   ins_cost(2 * VOLATILE_REF_COST);
9031   effect(KILL cr);
9032   format %{
9033     "cmpxchg $res = $mem, $oldval, $newval\t# (long, weak) if $mem == $oldval then $mem <-- $newval"
9034     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9035   %}
9036   ins_encode %{
9037     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9038                Assembler::xword, /*acquire*/ false, /*release*/ true,
9039                /*weak*/ true, noreg);
9040     __ csetw($res$$Register, Assembler::EQ);
9041   %}
9042   ins_pipe(pipe_slow);
9043 %}
9044 
9045 instruct weakCompareAndSwapN(iRegINoSp res, indirect mem, iRegN oldval, iRegN newval, rFlagsReg cr) %{
9046   match(Set res (WeakCompareAndSwapN mem (Binary oldval newval)));
9047   ins_cost(2 * VOLATILE_REF_COST);
9048   effect(KILL cr);
9049   format %{
9050     "cmpxchgw $res = $mem, $oldval, $newval\t# (narrow oop, weak) if $mem == $oldval then $mem <-- $newval"
9051     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9052   %}
9053   ins_encode %{
9054     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9055                Assembler::word, /*acquire*/ false, /*release*/ true,
9056                /*weak*/ true, noreg);
9057     __ csetw($res$$Register, Assembler::EQ);
9058   %}
9059   ins_pipe(pipe_slow);
9060 %}
9061 
9062 instruct weakCompareAndSwapP(iRegINoSp res, indirect mem, iRegP oldval, iRegP newval, rFlagsReg cr) %{
9063   predicate(n->as_LoadStore()->barrier_data() == 0);
9064   match(Set res (WeakCompareAndSwapP mem (Binary oldval newval)));
9065   ins_cost(2 * VOLATILE_REF_COST);
9066   effect(KILL cr);
9067   format %{
9068     "cmpxchg $res = $mem, $oldval, $newval\t# (ptr, weak) if $mem == $oldval then $mem <-- $newval"
9069     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9070   %}
9071   ins_encode %{
9072     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9073                Assembler::xword, /*acquire*/ false, /*release*/ true,
9074                /*weak*/ true, noreg);
9075     __ csetw($res$$Register, Assembler::EQ);
9076   %}
9077   ins_pipe(pipe_slow);
9078 %}
9079 
9080 instruct weakCompareAndSwapBAcq(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
9081   predicate(needs_acquiring_load_exclusive(n));
9082   match(Set res (WeakCompareAndSwapB mem (Binary oldval newval)));
9083   ins_cost(VOLATILE_REF_COST);
9084   effect(KILL cr);
9085   format %{
9086     "cmpxchgb_acq $res = $mem, $oldval, $newval\t# (byte, weak) if $mem == $oldval then $mem <-- $newval"
9087     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9088   %}
9089   ins_encode %{
9090     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9091                Assembler::byte, /*acquire*/ true, /*release*/ true,
9092                /*weak*/ true, noreg);
9093     __ csetw($res$$Register, Assembler::EQ);
9094   %}
9095   ins_pipe(pipe_slow);
9096 %}
9097 
9098 instruct weakCompareAndSwapSAcq(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
9099   predicate(needs_acquiring_load_exclusive(n));
9100   match(Set res (WeakCompareAndSwapS mem (Binary oldval newval)));
9101   ins_cost(VOLATILE_REF_COST);
9102   effect(KILL cr);
9103   format %{
9104     "cmpxchgs_acq $res = $mem, $oldval, $newval\t# (short, weak) if $mem == $oldval then $mem <-- $newval"
9105     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9106   %}
9107   ins_encode %{
9108     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9109                Assembler::halfword, /*acquire*/ true, /*release*/ true,
9110                /*weak*/ true, noreg);
9111     __ csetw($res$$Register, Assembler::EQ);
9112   %}
9113   ins_pipe(pipe_slow);
9114 %}
9115 
9116 instruct weakCompareAndSwapIAcq(iRegINoSp res, indirect mem, iRegI oldval, iRegI newval, rFlagsReg cr) %{
9117   predicate(needs_acquiring_load_exclusive(n));
9118   match(Set res (WeakCompareAndSwapI mem (Binary oldval newval)));
9119   ins_cost(VOLATILE_REF_COST);
9120   effect(KILL cr);
9121   format %{
9122     "cmpxchgw_acq $res = $mem, $oldval, $newval\t# (int, weak) if $mem == $oldval then $mem <-- $newval"
9123     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9124   %}
9125   ins_encode %{
9126     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9127                Assembler::word, /*acquire*/ true, /*release*/ true,
9128                /*weak*/ true, noreg);
9129     __ csetw($res$$Register, Assembler::EQ);
9130   %}
9131   ins_pipe(pipe_slow);
9132 %}
9133 
9134 instruct weakCompareAndSwapLAcq(iRegINoSp res, indirect mem, iRegL oldval, iRegL newval, rFlagsReg cr) %{
9135   predicate(needs_acquiring_load_exclusive(n));
9136   match(Set res (WeakCompareAndSwapL mem (Binary oldval newval)));
9137   ins_cost(VOLATILE_REF_COST);
9138   effect(KILL cr);
9139   format %{
9140     "cmpxchg_acq $res = $mem, $oldval, $newval\t# (long, weak) if $mem == $oldval then $mem <-- $newval"
9141     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9142   %}
9143   ins_encode %{
9144     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9145                Assembler::xword, /*acquire*/ true, /*release*/ true,
9146                /*weak*/ true, noreg);
9147     __ csetw($res$$Register, Assembler::EQ);
9148   %}
9149   ins_pipe(pipe_slow);
9150 %}
9151 
9152 instruct weakCompareAndSwapNAcq(iRegINoSp res, indirect mem, iRegN oldval, iRegN newval, rFlagsReg cr) %{
9153   predicate(needs_acquiring_load_exclusive(n));
9154   match(Set res (WeakCompareAndSwapN mem (Binary oldval newval)));
9155   ins_cost(VOLATILE_REF_COST);
9156   effect(KILL cr);
9157   format %{
9158     "cmpxchgw_acq $res = $mem, $oldval, $newval\t# (narrow oop, weak) if $mem == $oldval then $mem <-- $newval"
9159     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9160   %}
9161   ins_encode %{
9162     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9163                Assembler::word, /*acquire*/ true, /*release*/ true,
9164                /*weak*/ true, noreg);
9165     __ csetw($res$$Register, Assembler::EQ);
9166   %}
9167   ins_pipe(pipe_slow);
9168 %}
9169 
9170 instruct weakCompareAndSwapPAcq(iRegINoSp res, indirect mem, iRegP oldval, iRegP newval, rFlagsReg cr) %{
9171   match(Set res (WeakCompareAndSwapP mem (Binary oldval newval)));
9172   predicate(needs_acquiring_load_exclusive(n) && (n->as_LoadStore()->barrier_data() == 0));
9173   ins_cost(VOLATILE_REF_COST);
9174   effect(KILL cr);
9175   format %{
9176     "cmpxchg_acq $res = $mem, $oldval, $newval\t# (ptr, weak) if $mem == $oldval then $mem <-- $newval"
9177     "csetw $res, EQ\t# $res <-- (EQ ? 1 : 0)"
9178   %}
9179   ins_encode %{
9180     __ cmpxchg($mem$$Register, $oldval$$Register, $newval$$Register,
9181                Assembler::xword, /*acquire*/ true, /*release*/ true,
9182                /*weak*/ true, noreg);
9183     __ csetw($res$$Register, Assembler::EQ);
9184   %}
9185   ins_pipe(pipe_slow);
9186 %}
9187 
9188 // END This section of the file is automatically generated. Do not edit --------------
9189 // ---------------------------------------------------------------------
9190 
9191 instruct get_and_setI(indirect mem, iRegI newv, iRegINoSp prev) %{
9192   match(Set prev (GetAndSetI mem newv));
9193   ins_cost(2 * VOLATILE_REF_COST);
9194   format %{ "atomic_xchgw  $prev, $newv, [$mem]" %}
9195   ins_encode %{
9196     __ atomic_xchgw($prev$$Register, $newv$$Register, as_Register($mem$$base));
9197   %}
9198   ins_pipe(pipe_serial);
9199 %}
9200 
9201 instruct get_and_setL(indirect mem, iRegL newv, iRegLNoSp prev) %{
9202   match(Set prev (GetAndSetL mem newv));
9203   ins_cost(2 * VOLATILE_REF_COST);
9204   format %{ "atomic_xchg  $prev, $newv, [$mem]" %}
9205   ins_encode %{
9206     __ atomic_xchg($prev$$Register, $newv$$Register, as_Register($mem$$base));
9207   %}
9208   ins_pipe(pipe_serial);
9209 %}
9210 
9211 instruct get_and_setN(indirect mem, iRegN newv, iRegINoSp prev) %{
9212   match(Set prev (GetAndSetN mem newv));
9213   ins_cost(2 * VOLATILE_REF_COST);
9214   format %{ "atomic_xchgw $prev, $newv, [$mem]" %}
9215   ins_encode %{
9216     __ atomic_xchgw($prev$$Register, $newv$$Register, as_Register($mem$$base));
9217   %}
9218   ins_pipe(pipe_serial);
9219 %}
9220 
9221 instruct get_and_setP(indirect mem, iRegP newv, iRegPNoSp prev) %{
9222   predicate(n->as_LoadStore()->barrier_data() == 0);
9223   match(Set prev (GetAndSetP mem newv));
9224   ins_cost(2 * VOLATILE_REF_COST);
9225   format %{ "atomic_xchg  $prev, $newv, [$mem]" %}
9226   ins_encode %{
9227     __ atomic_xchg($prev$$Register, $newv$$Register, as_Register($mem$$base));
9228   %}
9229   ins_pipe(pipe_serial);
9230 %}
9231 
9232 instruct get_and_setIAcq(indirect mem, iRegI newv, iRegINoSp prev) %{
9233   predicate(needs_acquiring_load_exclusive(n));
9234   match(Set prev (GetAndSetI mem newv));
9235   ins_cost(VOLATILE_REF_COST);
9236   format %{ "atomic_xchgw_acq  $prev, $newv, [$mem]" %}
9237   ins_encode %{
9238     __ atomic_xchgalw($prev$$Register, $newv$$Register, as_Register($mem$$base));
9239   %}
9240   ins_pipe(pipe_serial);
9241 %}
9242 
9243 instruct get_and_setLAcq(indirect mem, iRegL newv, iRegLNoSp prev) %{
9244   predicate(needs_acquiring_load_exclusive(n));
9245   match(Set prev (GetAndSetL mem newv));
9246   ins_cost(VOLATILE_REF_COST);
9247   format %{ "atomic_xchg_acq  $prev, $newv, [$mem]" %}
9248   ins_encode %{
9249     __ atomic_xchgal($prev$$Register, $newv$$Register, as_Register($mem$$base));
9250   %}
9251   ins_pipe(pipe_serial);
9252 %}
9253 
9254 instruct get_and_setNAcq(indirect mem, iRegN newv, iRegINoSp prev) %{
9255   predicate(needs_acquiring_load_exclusive(n));
9256   match(Set prev (GetAndSetN mem newv));
9257   ins_cost(VOLATILE_REF_COST);
9258   format %{ "atomic_xchgw_acq $prev, $newv, [$mem]" %}
9259   ins_encode %{
9260     __ atomic_xchgalw($prev$$Register, $newv$$Register, as_Register($mem$$base));
9261   %}
9262   ins_pipe(pipe_serial);
9263 %}
9264 
9265 instruct get_and_setPAcq(indirect mem, iRegP newv, iRegPNoSp prev) %{
9266   predicate(needs_acquiring_load_exclusive(n) && (n->as_LoadStore()->barrier_data() == 0));
9267   match(Set prev (GetAndSetP mem newv));
9268   ins_cost(VOLATILE_REF_COST);
9269   format %{ "atomic_xchg_acq  $prev, $newv, [$mem]" %}
9270   ins_encode %{
9271     __ atomic_xchgal($prev$$Register, $newv$$Register, as_Register($mem$$base));
9272   %}
9273   ins_pipe(pipe_serial);
9274 %}
9275 
9276 
9277 instruct get_and_addL(indirect mem, iRegLNoSp newval, iRegL incr) %{
9278   match(Set newval (GetAndAddL mem incr));
9279   ins_cost(2 * VOLATILE_REF_COST + 1);
9280   format %{ "get_and_addL $newval, [$mem], $incr" %}
9281   ins_encode %{
9282     __ atomic_add($newval$$Register, $incr$$Register, as_Register($mem$$base));
9283   %}
9284   ins_pipe(pipe_serial);
9285 %}
9286 
9287 instruct get_and_addL_no_res(indirect mem, Universe dummy, iRegL incr) %{
9288   predicate(n->as_LoadStore()->result_not_used());
9289   match(Set dummy (GetAndAddL mem incr));
9290   ins_cost(2 * VOLATILE_REF_COST);
9291   format %{ "get_and_addL [$mem], $incr" %}
9292   ins_encode %{
9293     __ atomic_add(noreg, $incr$$Register, as_Register($mem$$base));
9294   %}
9295   ins_pipe(pipe_serial);
9296 %}
9297 
9298 instruct get_and_addLi(indirect mem, iRegLNoSp newval, immLAddSub incr) %{
9299   match(Set newval (GetAndAddL mem incr));
9300   ins_cost(2 * VOLATILE_REF_COST + 1);
9301   format %{ "get_and_addL $newval, [$mem], $incr" %}
9302   ins_encode %{
9303     __ atomic_add($newval$$Register, $incr$$constant, as_Register($mem$$base));
9304   %}
9305   ins_pipe(pipe_serial);
9306 %}
9307 
9308 instruct get_and_addLi_no_res(indirect mem, Universe dummy, immLAddSub incr) %{
9309   predicate(n->as_LoadStore()->result_not_used());
9310   match(Set dummy (GetAndAddL mem incr));
9311   ins_cost(2 * VOLATILE_REF_COST);
9312   format %{ "get_and_addL [$mem], $incr" %}
9313   ins_encode %{
9314     __ atomic_add(noreg, $incr$$constant, as_Register($mem$$base));
9315   %}
9316   ins_pipe(pipe_serial);
9317 %}
9318 
9319 instruct get_and_addI(indirect mem, iRegINoSp newval, iRegIorL2I incr) %{
9320   match(Set newval (GetAndAddI mem incr));
9321   ins_cost(2 * VOLATILE_REF_COST + 1);
9322   format %{ "get_and_addI $newval, [$mem], $incr" %}
9323   ins_encode %{
9324     __ atomic_addw($newval$$Register, $incr$$Register, as_Register($mem$$base));
9325   %}
9326   ins_pipe(pipe_serial);
9327 %}
9328 
9329 instruct get_and_addI_no_res(indirect mem, Universe dummy, iRegIorL2I incr) %{
9330   predicate(n->as_LoadStore()->result_not_used());
9331   match(Set dummy (GetAndAddI mem incr));
9332   ins_cost(2 * VOLATILE_REF_COST);
9333   format %{ "get_and_addI [$mem], $incr" %}
9334   ins_encode %{
9335     __ atomic_addw(noreg, $incr$$Register, as_Register($mem$$base));
9336   %}
9337   ins_pipe(pipe_serial);
9338 %}
9339 
9340 instruct get_and_addIi(indirect mem, iRegINoSp newval, immIAddSub incr) %{
9341   match(Set newval (GetAndAddI mem incr));
9342   ins_cost(2 * VOLATILE_REF_COST + 1);
9343   format %{ "get_and_addI $newval, [$mem], $incr" %}
9344   ins_encode %{
9345     __ atomic_addw($newval$$Register, $incr$$constant, as_Register($mem$$base));
9346   %}
9347   ins_pipe(pipe_serial);
9348 %}
9349 
9350 instruct get_and_addIi_no_res(indirect mem, Universe dummy, immIAddSub incr) %{
9351   predicate(n->as_LoadStore()->result_not_used());
9352   match(Set dummy (GetAndAddI mem incr));
9353   ins_cost(2 * VOLATILE_REF_COST);
9354   format %{ "get_and_addI [$mem], $incr" %}
9355   ins_encode %{
9356     __ atomic_addw(noreg, $incr$$constant, as_Register($mem$$base));
9357   %}
9358   ins_pipe(pipe_serial);
9359 %}
9360 
9361 instruct get_and_addLAcq(indirect mem, iRegLNoSp newval, iRegL incr) %{
9362   predicate(needs_acquiring_load_exclusive(n));
9363   match(Set newval (GetAndAddL mem incr));
9364   ins_cost(VOLATILE_REF_COST + 1);
9365   format %{ "get_and_addL_acq $newval, [$mem], $incr" %}
9366   ins_encode %{
9367     __ atomic_addal($newval$$Register, $incr$$Register, as_Register($mem$$base));
9368   %}
9369   ins_pipe(pipe_serial);
9370 %}
9371 
9372 instruct get_and_addL_no_resAcq(indirect mem, Universe dummy, iRegL incr) %{
9373   predicate(n->as_LoadStore()->result_not_used() && needs_acquiring_load_exclusive(n));
9374   match(Set dummy (GetAndAddL mem incr));
9375   ins_cost(VOLATILE_REF_COST);
9376   format %{ "get_and_addL_acq [$mem], $incr" %}
9377   ins_encode %{
9378     __ atomic_addal(noreg, $incr$$Register, as_Register($mem$$base));
9379   %}
9380   ins_pipe(pipe_serial);
9381 %}
9382 
9383 instruct get_and_addLiAcq(indirect mem, iRegLNoSp newval, immLAddSub incr) %{
9384   predicate(needs_acquiring_load_exclusive(n));
9385   match(Set newval (GetAndAddL mem incr));
9386   ins_cost(VOLATILE_REF_COST + 1);
9387   format %{ "get_and_addL_acq $newval, [$mem], $incr" %}
9388   ins_encode %{
9389     __ atomic_addal($newval$$Register, $incr$$constant, as_Register($mem$$base));
9390   %}
9391   ins_pipe(pipe_serial);
9392 %}
9393 
9394 instruct get_and_addLi_no_resAcq(indirect mem, Universe dummy, immLAddSub incr) %{
9395   predicate(n->as_LoadStore()->result_not_used() && needs_acquiring_load_exclusive(n));
9396   match(Set dummy (GetAndAddL mem incr));
9397   ins_cost(VOLATILE_REF_COST);
9398   format %{ "get_and_addL_acq [$mem], $incr" %}
9399   ins_encode %{
9400     __ atomic_addal(noreg, $incr$$constant, as_Register($mem$$base));
9401   %}
9402   ins_pipe(pipe_serial);
9403 %}
9404 
9405 instruct get_and_addIAcq(indirect mem, iRegINoSp newval, iRegIorL2I incr) %{
9406   predicate(needs_acquiring_load_exclusive(n));
9407   match(Set newval (GetAndAddI mem incr));
9408   ins_cost(VOLATILE_REF_COST + 1);
9409   format %{ "get_and_addI_acq $newval, [$mem], $incr" %}
9410   ins_encode %{
9411     __ atomic_addalw($newval$$Register, $incr$$Register, as_Register($mem$$base));
9412   %}
9413   ins_pipe(pipe_serial);
9414 %}
9415 
9416 instruct get_and_addI_no_resAcq(indirect mem, Universe dummy, iRegIorL2I incr) %{
9417   predicate(n->as_LoadStore()->result_not_used() && needs_acquiring_load_exclusive(n));
9418   match(Set dummy (GetAndAddI mem incr));
9419   ins_cost(VOLATILE_REF_COST);
9420   format %{ "get_and_addI_acq [$mem], $incr" %}
9421   ins_encode %{
9422     __ atomic_addalw(noreg, $incr$$Register, as_Register($mem$$base));
9423   %}
9424   ins_pipe(pipe_serial);
9425 %}
9426 
9427 instruct get_and_addIiAcq(indirect mem, iRegINoSp newval, immIAddSub incr) %{
9428   predicate(needs_acquiring_load_exclusive(n));
9429   match(Set newval (GetAndAddI mem incr));
9430   ins_cost(VOLATILE_REF_COST + 1);
9431   format %{ "get_and_addI_acq $newval, [$mem], $incr" %}
9432   ins_encode %{
9433     __ atomic_addalw($newval$$Register, $incr$$constant, as_Register($mem$$base));
9434   %}
9435   ins_pipe(pipe_serial);
9436 %}
9437 
9438 instruct get_and_addIi_no_resAcq(indirect mem, Universe dummy, immIAddSub incr) %{
9439   predicate(n->as_LoadStore()->result_not_used() && needs_acquiring_load_exclusive(n));
9440   match(Set dummy (GetAndAddI mem incr));
9441   ins_cost(VOLATILE_REF_COST);
9442   format %{ "get_and_addI_acq [$mem], $incr" %}
9443   ins_encode %{
9444     __ atomic_addalw(noreg, $incr$$constant, as_Register($mem$$base));
9445   %}
9446   ins_pipe(pipe_serial);
9447 %}
9448 
9449 // Manifest a CmpL result in an integer register.
9450 // (src1 < src2) ? -1 : ((src1 > src2) ? 1 : 0)
9451 instruct cmpL3_reg_reg(iRegINoSp dst, iRegL src1, iRegL src2, rFlagsReg flags)
9452 %{
9453   match(Set dst (CmpL3 src1 src2));
9454   effect(KILL flags);
9455 
9456   ins_cost(INSN_COST * 6);
9457   format %{
9458       "cmp $src1, $src2"
9459       "csetw $dst, ne"
9460       "cnegw $dst, lt"
9461   %}
9462   // format %{ "CmpL3 $dst, $src1, $src2" %}
9463   ins_encode %{
9464     __ cmp($src1$$Register, $src2$$Register);
9465     __ csetw($dst$$Register, Assembler::NE);
9466     __ cnegw($dst$$Register, $dst$$Register, Assembler::LT);
9467   %}
9468 
9469   ins_pipe(pipe_class_default);
9470 %}
9471 
9472 instruct cmpL3_reg_imm(iRegINoSp dst, iRegL src1, immLAddSub src2, rFlagsReg flags)
9473 %{
9474   match(Set dst (CmpL3 src1 src2));
9475   effect(KILL flags);
9476 
9477   ins_cost(INSN_COST * 6);
9478   format %{
9479       "cmp $src1, $src2"
9480       "csetw $dst, ne"
9481       "cnegw $dst, lt"
9482   %}
9483   ins_encode %{
9484     int32_t con = (int32_t)$src2$$constant;
9485      if (con < 0) {
9486       __ adds(zr, $src1$$Register, -con);
9487     } else {
9488       __ subs(zr, $src1$$Register, con);
9489     }
9490     __ csetw($dst$$Register, Assembler::NE);
9491     __ cnegw($dst$$Register, $dst$$Register, Assembler::LT);
9492   %}
9493 
9494   ins_pipe(pipe_class_default);
9495 %}
9496 
9497 // ============================================================================
9498 // Conditional Move Instructions
9499 
9500 // n.b. we have identical rules for both a signed compare op (cmpOp)
9501 // and an unsigned compare op (cmpOpU). it would be nice if we could
9502 // define an op class which merged both inputs and use it to type the
9503 // argument to a single rule. unfortunatelyt his fails because the
9504 // opclass does not live up to the COND_INTER interface of its
9505 // component operands. When the generic code tries to negate the
9506 // operand it ends up running the generci Machoper::negate method
9507 // which throws a ShouldNotHappen. So, we have to provide two flavours
9508 // of each rule, one for a cmpOp and a second for a cmpOpU (sigh).
9509 
9510 instruct cmovI_reg_reg(cmpOp cmp, rFlagsReg cr, iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
9511   match(Set dst (CMoveI (Binary cmp cr) (Binary src1 src2)));
9512 
9513   ins_cost(INSN_COST * 2);
9514   format %{ "cselw $dst, $src2, $src1 $cmp\t# signed, int"  %}
9515 
9516   ins_encode %{
9517     __ cselw(as_Register($dst$$reg),
9518              as_Register($src2$$reg),
9519              as_Register($src1$$reg),
9520              (Assembler::Condition)$cmp$$cmpcode);
9521   %}
9522 
9523   ins_pipe(icond_reg_reg);
9524 %}
9525 
9526 instruct cmovUI_reg_reg(cmpOpU cmp, rFlagsRegU cr, iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
9527   match(Set dst (CMoveI (Binary cmp cr) (Binary src1 src2)));
9528 
9529   ins_cost(INSN_COST * 2);
9530   format %{ "cselw $dst, $src2, $src1 $cmp\t# unsigned, int"  %}
9531 
9532   ins_encode %{
9533     __ cselw(as_Register($dst$$reg),
9534              as_Register($src2$$reg),
9535              as_Register($src1$$reg),
9536              (Assembler::Condition)$cmp$$cmpcode);
9537   %}
9538 
9539   ins_pipe(icond_reg_reg);
9540 %}
9541 
9542 // special cases where one arg is zero
9543 
9544 // n.b. this is selected in preference to the rule above because it
9545 // avoids loading constant 0 into a source register
9546 
9547 // TODO
9548 // we ought only to be able to cull one of these variants as the ideal
9549 // transforms ought always to order the zero consistently (to left/right?)
9550 
9551 instruct cmovI_zero_reg(cmpOp cmp, rFlagsReg cr, iRegINoSp dst, immI0 zero, iRegIorL2I src) %{
9552   match(Set dst (CMoveI (Binary cmp cr) (Binary zero src)));
9553 
9554   ins_cost(INSN_COST * 2);
9555   format %{ "cselw $dst, $src, zr $cmp\t# signed, int"  %}
9556 
9557   ins_encode %{
9558     __ cselw(as_Register($dst$$reg),
9559              as_Register($src$$reg),
9560              zr,
9561              (Assembler::Condition)$cmp$$cmpcode);
9562   %}
9563 
9564   ins_pipe(icond_reg);
9565 %}
9566 
9567 instruct cmovUI_zero_reg(cmpOpU cmp, rFlagsRegU cr, iRegINoSp dst, immI0 zero, iRegIorL2I src) %{
9568   match(Set dst (CMoveI (Binary cmp cr) (Binary zero src)));
9569 
9570   ins_cost(INSN_COST * 2);
9571   format %{ "cselw $dst, $src, zr $cmp\t# unsigned, int"  %}
9572 
9573   ins_encode %{
9574     __ cselw(as_Register($dst$$reg),
9575              as_Register($src$$reg),
9576              zr,
9577              (Assembler::Condition)$cmp$$cmpcode);
9578   %}
9579 
9580   ins_pipe(icond_reg);
9581 %}
9582 
9583 instruct cmovI_reg_zero(cmpOp cmp, rFlagsReg cr, iRegINoSp dst, iRegIorL2I src, immI0 zero) %{
9584   match(Set dst (CMoveI (Binary cmp cr) (Binary src zero)));
9585 
9586   ins_cost(INSN_COST * 2);
9587   format %{ "cselw $dst, zr, $src $cmp\t# signed, int"  %}
9588 
9589   ins_encode %{
9590     __ cselw(as_Register($dst$$reg),
9591              zr,
9592              as_Register($src$$reg),
9593              (Assembler::Condition)$cmp$$cmpcode);
9594   %}
9595 
9596   ins_pipe(icond_reg);
9597 %}
9598 
9599 instruct cmovUI_reg_zero(cmpOpU cmp, rFlagsRegU cr, iRegINoSp dst, iRegIorL2I src, immI0 zero) %{
9600   match(Set dst (CMoveI (Binary cmp cr) (Binary src zero)));
9601 
9602   ins_cost(INSN_COST * 2);
9603   format %{ "cselw $dst, zr, $src $cmp\t# unsigned, int"  %}
9604 
9605   ins_encode %{
9606     __ cselw(as_Register($dst$$reg),
9607              zr,
9608              as_Register($src$$reg),
9609              (Assembler::Condition)$cmp$$cmpcode);
9610   %}
9611 
9612   ins_pipe(icond_reg);
9613 %}
9614 
9615 // special case for creating a boolean 0 or 1
9616 
9617 // n.b. this is selected in preference to the rule above because it
9618 // avoids loading constants 0 and 1 into a source register
9619 
9620 instruct cmovI_reg_zero_one(cmpOp cmp, rFlagsReg cr, iRegINoSp dst, immI0 zero, immI_1 one) %{
9621   match(Set dst (CMoveI (Binary cmp cr) (Binary one zero)));
9622 
9623   ins_cost(INSN_COST * 2);
9624   format %{ "csincw $dst, zr, zr $cmp\t# signed, int"  %}
9625 
9626   ins_encode %{
9627     // equivalently
9628     // cset(as_Register($dst$$reg),
9629     //      negate_condition((Assembler::Condition)$cmp$$cmpcode));
9630     __ csincw(as_Register($dst$$reg),
9631              zr,
9632              zr,
9633              (Assembler::Condition)$cmp$$cmpcode);
9634   %}
9635 
9636   ins_pipe(icond_none);
9637 %}
9638 
9639 instruct cmovUI_reg_zero_one(cmpOpU cmp, rFlagsRegU cr, iRegINoSp dst, immI0 zero, immI_1 one) %{
9640   match(Set dst (CMoveI (Binary cmp cr) (Binary one zero)));
9641 
9642   ins_cost(INSN_COST * 2);
9643   format %{ "csincw $dst, zr, zr $cmp\t# unsigned, int"  %}
9644 
9645   ins_encode %{
9646     // equivalently
9647     // cset(as_Register($dst$$reg),
9648     //      negate_condition((Assembler::Condition)$cmp$$cmpcode));
9649     __ csincw(as_Register($dst$$reg),
9650              zr,
9651              zr,
9652              (Assembler::Condition)$cmp$$cmpcode);
9653   %}
9654 
9655   ins_pipe(icond_none);
9656 %}
9657 
9658 instruct cmovL_reg_reg(cmpOp cmp, rFlagsReg cr, iRegLNoSp dst, iRegL src1, iRegL src2) %{
9659   match(Set dst (CMoveL (Binary cmp cr) (Binary src1 src2)));
9660 
9661   ins_cost(INSN_COST * 2);
9662   format %{ "csel $dst, $src2, $src1 $cmp\t# signed, long"  %}
9663 
9664   ins_encode %{
9665     __ csel(as_Register($dst$$reg),
9666             as_Register($src2$$reg),
9667             as_Register($src1$$reg),
9668             (Assembler::Condition)$cmp$$cmpcode);
9669   %}
9670 
9671   ins_pipe(icond_reg_reg);
9672 %}
9673 
9674 instruct cmovUL_reg_reg(cmpOpU cmp, rFlagsRegU cr, iRegLNoSp dst, iRegL src1, iRegL src2) %{
9675   match(Set dst (CMoveL (Binary cmp cr) (Binary src1 src2)));
9676 
9677   ins_cost(INSN_COST * 2);
9678   format %{ "csel $dst, $src2, $src1 $cmp\t# unsigned, long"  %}
9679 
9680   ins_encode %{
9681     __ csel(as_Register($dst$$reg),
9682             as_Register($src2$$reg),
9683             as_Register($src1$$reg),
9684             (Assembler::Condition)$cmp$$cmpcode);
9685   %}
9686 
9687   ins_pipe(icond_reg_reg);
9688 %}
9689 
9690 // special cases where one arg is zero
9691 
9692 instruct cmovL_reg_zero(cmpOp cmp, rFlagsReg cr, iRegLNoSp dst, iRegL src, immL0 zero) %{
9693   match(Set dst (CMoveL (Binary cmp cr) (Binary src zero)));
9694 
9695   ins_cost(INSN_COST * 2);
9696   format %{ "csel $dst, zr, $src $cmp\t# signed, long"  %}
9697 
9698   ins_encode %{
9699     __ csel(as_Register($dst$$reg),
9700             zr,
9701             as_Register($src$$reg),
9702             (Assembler::Condition)$cmp$$cmpcode);
9703   %}
9704 
9705   ins_pipe(icond_reg);
9706 %}
9707 
9708 instruct cmovUL_reg_zero(cmpOpU cmp, rFlagsRegU cr, iRegLNoSp dst, iRegL src, immL0 zero) %{
9709   match(Set dst (CMoveL (Binary cmp cr) (Binary src zero)));
9710 
9711   ins_cost(INSN_COST * 2);
9712   format %{ "csel $dst, zr, $src $cmp\t# unsigned, long"  %}
9713 
9714   ins_encode %{
9715     __ csel(as_Register($dst$$reg),
9716             zr,
9717             as_Register($src$$reg),
9718             (Assembler::Condition)$cmp$$cmpcode);
9719   %}
9720 
9721   ins_pipe(icond_reg);
9722 %}
9723 
9724 instruct cmovL_zero_reg(cmpOp cmp, rFlagsReg cr, iRegLNoSp dst, immL0 zero, iRegL src) %{
9725   match(Set dst (CMoveL (Binary cmp cr) (Binary zero src)));
9726 
9727   ins_cost(INSN_COST * 2);
9728   format %{ "csel $dst, $src, zr $cmp\t# signed, long"  %}
9729 
9730   ins_encode %{
9731     __ csel(as_Register($dst$$reg),
9732             as_Register($src$$reg),
9733             zr,
9734             (Assembler::Condition)$cmp$$cmpcode);
9735   %}
9736 
9737   ins_pipe(icond_reg);
9738 %}
9739 
9740 instruct cmovUL_zero_reg(cmpOpU cmp, rFlagsRegU cr, iRegLNoSp dst, immL0 zero, iRegL src) %{
9741   match(Set dst (CMoveL (Binary cmp cr) (Binary zero src)));
9742 
9743   ins_cost(INSN_COST * 2);
9744   format %{ "csel $dst, $src, zr $cmp\t# unsigned, long"  %}
9745 
9746   ins_encode %{
9747     __ csel(as_Register($dst$$reg),
9748             as_Register($src$$reg),
9749             zr,
9750             (Assembler::Condition)$cmp$$cmpcode);
9751   %}
9752 
9753   ins_pipe(icond_reg);
9754 %}
9755 
9756 instruct cmovP_reg_reg(cmpOp cmp, rFlagsReg cr, iRegPNoSp dst, iRegP src1, iRegP src2) %{
9757   match(Set dst (CMoveP (Binary cmp cr) (Binary src1 src2)));
9758 
9759   ins_cost(INSN_COST * 2);
9760   format %{ "csel $dst, $src2, $src1 $cmp\t# signed, ptr"  %}
9761 
9762   ins_encode %{
9763     __ csel(as_Register($dst$$reg),
9764             as_Register($src2$$reg),
9765             as_Register($src1$$reg),
9766             (Assembler::Condition)$cmp$$cmpcode);
9767   %}
9768 
9769   ins_pipe(icond_reg_reg);
9770 %}
9771 
9772 instruct cmovUP_reg_reg(cmpOpU cmp, rFlagsRegU cr, iRegPNoSp dst, iRegP src1, iRegP src2) %{
9773   match(Set dst (CMoveP (Binary cmp cr) (Binary src1 src2)));
9774 
9775   ins_cost(INSN_COST * 2);
9776   format %{ "csel $dst, $src2, $src1 $cmp\t# unsigned, ptr"  %}
9777 
9778   ins_encode %{
9779     __ csel(as_Register($dst$$reg),
9780             as_Register($src2$$reg),
9781             as_Register($src1$$reg),
9782             (Assembler::Condition)$cmp$$cmpcode);
9783   %}
9784 
9785   ins_pipe(icond_reg_reg);
9786 %}
9787 
9788 // special cases where one arg is zero
9789 
9790 instruct cmovP_reg_zero(cmpOp cmp, rFlagsReg cr, iRegPNoSp dst, iRegP src, immP0 zero) %{
9791   match(Set dst (CMoveP (Binary cmp cr) (Binary src zero)));
9792 
9793   ins_cost(INSN_COST * 2);
9794   format %{ "csel $dst, zr, $src $cmp\t# signed, ptr"  %}
9795 
9796   ins_encode %{
9797     __ csel(as_Register($dst$$reg),
9798             zr,
9799             as_Register($src$$reg),
9800             (Assembler::Condition)$cmp$$cmpcode);
9801   %}
9802 
9803   ins_pipe(icond_reg);
9804 %}
9805 
9806 instruct cmovUP_reg_zero(cmpOpU cmp, rFlagsRegU cr, iRegPNoSp dst, iRegP src, immP0 zero) %{
9807   match(Set dst (CMoveP (Binary cmp cr) (Binary src zero)));
9808 
9809   ins_cost(INSN_COST * 2);
9810   format %{ "csel $dst, zr, $src $cmp\t# unsigned, ptr"  %}
9811 
9812   ins_encode %{
9813     __ csel(as_Register($dst$$reg),
9814             zr,
9815             as_Register($src$$reg),
9816             (Assembler::Condition)$cmp$$cmpcode);
9817   %}
9818 
9819   ins_pipe(icond_reg);
9820 %}
9821 
9822 instruct cmovP_zero_reg(cmpOp cmp, rFlagsReg cr, iRegPNoSp dst, immP0 zero, iRegP src) %{
9823   match(Set dst (CMoveP (Binary cmp cr) (Binary zero src)));
9824 
9825   ins_cost(INSN_COST * 2);
9826   format %{ "csel $dst, $src, zr $cmp\t# signed, ptr"  %}
9827 
9828   ins_encode %{
9829     __ csel(as_Register($dst$$reg),
9830             as_Register($src$$reg),
9831             zr,
9832             (Assembler::Condition)$cmp$$cmpcode);
9833   %}
9834 
9835   ins_pipe(icond_reg);
9836 %}
9837 
9838 instruct cmovUP_zero_reg(cmpOpU cmp, rFlagsRegU cr, iRegPNoSp dst, immP0 zero, iRegP src) %{
9839   match(Set dst (CMoveP (Binary cmp cr) (Binary zero src)));
9840 
9841   ins_cost(INSN_COST * 2);
9842   format %{ "csel $dst, $src, zr $cmp\t# unsigned, ptr"  %}
9843 
9844   ins_encode %{
9845     __ csel(as_Register($dst$$reg),
9846             as_Register($src$$reg),
9847             zr,
9848             (Assembler::Condition)$cmp$$cmpcode);
9849   %}
9850 
9851   ins_pipe(icond_reg);
9852 %}
9853 
9854 instruct cmovN_reg_reg(cmpOp cmp, rFlagsReg cr, iRegNNoSp dst, iRegN src1, iRegN src2) %{
9855   match(Set dst (CMoveN (Binary cmp cr) (Binary src1 src2)));
9856 
9857   ins_cost(INSN_COST * 2);
9858   format %{ "cselw $dst, $src2, $src1 $cmp\t# signed, compressed ptr"  %}
9859 
9860   ins_encode %{
9861     __ cselw(as_Register($dst$$reg),
9862              as_Register($src2$$reg),
9863              as_Register($src1$$reg),
9864              (Assembler::Condition)$cmp$$cmpcode);
9865   %}
9866 
9867   ins_pipe(icond_reg_reg);
9868 %}
9869 
9870 instruct cmovUN_reg_reg(cmpOpU cmp, rFlagsRegU cr, iRegNNoSp dst, iRegN src1, iRegN src2) %{
9871   match(Set dst (CMoveN (Binary cmp cr) (Binary src1 src2)));
9872 
9873   ins_cost(INSN_COST * 2);
9874   format %{ "cselw $dst, $src2, $src1 $cmp\t# signed, compressed ptr"  %}
9875 
9876   ins_encode %{
9877     __ cselw(as_Register($dst$$reg),
9878              as_Register($src2$$reg),
9879              as_Register($src1$$reg),
9880              (Assembler::Condition)$cmp$$cmpcode);
9881   %}
9882 
9883   ins_pipe(icond_reg_reg);
9884 %}
9885 
9886 // special cases where one arg is zero
9887 
9888 instruct cmovN_reg_zero(cmpOp cmp, rFlagsReg cr, iRegNNoSp dst, iRegN src, immN0 zero) %{
9889   match(Set dst (CMoveN (Binary cmp cr) (Binary src zero)));
9890 
9891   ins_cost(INSN_COST * 2);
9892   format %{ "cselw $dst, zr, $src $cmp\t# signed, compressed ptr"  %}
9893 
9894   ins_encode %{
9895     __ cselw(as_Register($dst$$reg),
9896              zr,
9897              as_Register($src$$reg),
9898              (Assembler::Condition)$cmp$$cmpcode);
9899   %}
9900 
9901   ins_pipe(icond_reg);
9902 %}
9903 
9904 instruct cmovUN_reg_zero(cmpOpU cmp, rFlagsRegU cr, iRegNNoSp dst, iRegN src, immN0 zero) %{
9905   match(Set dst (CMoveN (Binary cmp cr) (Binary src zero)));
9906 
9907   ins_cost(INSN_COST * 2);
9908   format %{ "cselw $dst, zr, $src $cmp\t# unsigned, compressed ptr"  %}
9909 
9910   ins_encode %{
9911     __ cselw(as_Register($dst$$reg),
9912              zr,
9913              as_Register($src$$reg),
9914              (Assembler::Condition)$cmp$$cmpcode);
9915   %}
9916 
9917   ins_pipe(icond_reg);
9918 %}
9919 
9920 instruct cmovN_zero_reg(cmpOp cmp, rFlagsReg cr, iRegNNoSp dst, immN0 zero, iRegN src) %{
9921   match(Set dst (CMoveN (Binary cmp cr) (Binary zero src)));
9922 
9923   ins_cost(INSN_COST * 2);
9924   format %{ "cselw $dst, $src, zr $cmp\t# signed, compressed ptr"  %}
9925 
9926   ins_encode %{
9927     __ cselw(as_Register($dst$$reg),
9928              as_Register($src$$reg),
9929              zr,
9930              (Assembler::Condition)$cmp$$cmpcode);
9931   %}
9932 
9933   ins_pipe(icond_reg);
9934 %}
9935 
9936 instruct cmovUN_zero_reg(cmpOpU cmp, rFlagsRegU cr, iRegNNoSp dst, immN0 zero, iRegN src) %{
9937   match(Set dst (CMoveN (Binary cmp cr) (Binary zero src)));
9938 
9939   ins_cost(INSN_COST * 2);
9940   format %{ "cselw $dst, $src, zr $cmp\t# unsigned, compressed ptr"  %}
9941 
9942   ins_encode %{
9943     __ cselw(as_Register($dst$$reg),
9944              as_Register($src$$reg),
9945              zr,
9946              (Assembler::Condition)$cmp$$cmpcode);
9947   %}
9948 
9949   ins_pipe(icond_reg);
9950 %}
9951 
9952 instruct cmovF_reg(cmpOp cmp, rFlagsReg cr, vRegF dst, vRegF src1,  vRegF src2)
9953 %{
9954   match(Set dst (CMoveF (Binary cmp cr) (Binary src1 src2)));
9955 
9956   ins_cost(INSN_COST * 3);
9957 
9958   format %{ "fcsels $dst, $src1, $src2, $cmp\t# signed cmove float\n\t" %}
9959   ins_encode %{
9960     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
9961     __ fcsels(as_FloatRegister($dst$$reg),
9962               as_FloatRegister($src2$$reg),
9963               as_FloatRegister($src1$$reg),
9964               cond);
9965   %}
9966 
9967   ins_pipe(fp_cond_reg_reg_s);
9968 %}
9969 
9970 instruct cmovUF_reg(cmpOpU cmp, rFlagsRegU cr, vRegF dst, vRegF src1,  vRegF src2)
9971 %{
9972   match(Set dst (CMoveF (Binary cmp cr) (Binary src1 src2)));
9973 
9974   ins_cost(INSN_COST * 3);
9975 
9976   format %{ "fcsels $dst, $src1, $src2, $cmp\t# unsigned cmove float\n\t" %}
9977   ins_encode %{
9978     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
9979     __ fcsels(as_FloatRegister($dst$$reg),
9980               as_FloatRegister($src2$$reg),
9981               as_FloatRegister($src1$$reg),
9982               cond);
9983   %}
9984 
9985   ins_pipe(fp_cond_reg_reg_s);
9986 %}
9987 
9988 instruct cmovD_reg(cmpOp cmp, rFlagsReg cr, vRegD dst, vRegD src1,  vRegD src2)
9989 %{
9990   match(Set dst (CMoveD (Binary cmp cr) (Binary src1 src2)));
9991 
9992   ins_cost(INSN_COST * 3);
9993 
9994   format %{ "fcseld $dst, $src1, $src2, $cmp\t# signed cmove float\n\t" %}
9995   ins_encode %{
9996     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
9997     __ fcseld(as_FloatRegister($dst$$reg),
9998               as_FloatRegister($src2$$reg),
9999               as_FloatRegister($src1$$reg),
10000               cond);
10001   %}
10002 
10003   ins_pipe(fp_cond_reg_reg_d);
10004 %}
10005 
10006 instruct cmovUD_reg(cmpOpU cmp, rFlagsRegU cr, vRegD dst, vRegD src1,  vRegD src2)
10007 %{
10008   match(Set dst (CMoveD (Binary cmp cr) (Binary src1 src2)));
10009 
10010   ins_cost(INSN_COST * 3);
10011 
10012   format %{ "fcseld $dst, $src1, $src2, $cmp\t# unsigned cmove float\n\t" %}
10013   ins_encode %{
10014     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
10015     __ fcseld(as_FloatRegister($dst$$reg),
10016               as_FloatRegister($src2$$reg),
10017               as_FloatRegister($src1$$reg),
10018               cond);
10019   %}
10020 
10021   ins_pipe(fp_cond_reg_reg_d);
10022 %}
10023 
10024 // ============================================================================
10025 // Arithmetic Instructions
10026 //
10027 
10028 // Integer Addition
10029 
10030 // TODO
10031 // these currently employ operations which do not set CR and hence are
10032 // not flagged as killing CR but we would like to isolate the cases
10033 // where we want to set flags from those where we don't. need to work
10034 // out how to do that.
10035 
10036 instruct addI_reg_reg(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10037   match(Set dst (AddI src1 src2));
10038 
10039   ins_cost(INSN_COST);
10040   format %{ "addw  $dst, $src1, $src2" %}
10041 
10042   ins_encode %{
10043     __ addw(as_Register($dst$$reg),
10044             as_Register($src1$$reg),
10045             as_Register($src2$$reg));
10046   %}
10047 
10048   ins_pipe(ialu_reg_reg);
10049 %}
10050 
10051 instruct addI_reg_imm(iRegINoSp dst, iRegIorL2I src1, immIAddSub src2) %{
10052   match(Set dst (AddI src1 src2));
10053 
10054   ins_cost(INSN_COST);
10055   format %{ "addw $dst, $src1, $src2" %}
10056 
10057   // use opcode to indicate that this is an add not a sub
10058   opcode(0x0);
10059 
10060   ins_encode(aarch64_enc_addsubw_imm(dst, src1, src2));
10061 
10062   ins_pipe(ialu_reg_imm);
10063 %}
10064 
10065 instruct addI_reg_imm_i2l(iRegINoSp dst, iRegL src1, immIAddSub src2) %{
10066   match(Set dst (AddI (ConvL2I src1) src2));
10067 
10068   ins_cost(INSN_COST);
10069   format %{ "addw $dst, $src1, $src2" %}
10070 
10071   // use opcode to indicate that this is an add not a sub
10072   opcode(0x0);
10073 
10074   ins_encode(aarch64_enc_addsubw_imm(dst, src1, src2));
10075 
10076   ins_pipe(ialu_reg_imm);
10077 %}
10078 
10079 // Pointer Addition
10080 instruct addP_reg_reg(iRegPNoSp dst, iRegP src1, iRegL src2) %{
10081   match(Set dst (AddP src1 src2));
10082 
10083   ins_cost(INSN_COST);
10084   format %{ "add $dst, $src1, $src2\t# ptr" %}
10085 
10086   ins_encode %{
10087     __ add(as_Register($dst$$reg),
10088            as_Register($src1$$reg),
10089            as_Register($src2$$reg));
10090   %}
10091 
10092   ins_pipe(ialu_reg_reg);
10093 %}
10094 
10095 instruct addP_reg_reg_ext(iRegPNoSp dst, iRegP src1, iRegIorL2I src2) %{
10096   match(Set dst (AddP src1 (ConvI2L src2)));
10097 
10098   ins_cost(1.9 * INSN_COST);
10099   format %{ "add $dst, $src1, $src2, sxtw\t# ptr" %}
10100 
10101   ins_encode %{
10102     __ add(as_Register($dst$$reg),
10103            as_Register($src1$$reg),
10104            as_Register($src2$$reg), ext::sxtw);
10105   %}
10106 
10107   ins_pipe(ialu_reg_reg);
10108 %}
10109 
10110 instruct addP_reg_reg_lsl(iRegPNoSp dst, iRegP src1, iRegL src2, immIScale scale) %{
10111   match(Set dst (AddP src1 (LShiftL src2 scale)));
10112 
10113   ins_cost(1.9 * INSN_COST);
10114   format %{ "add $dst, $src1, $src2, LShiftL $scale\t# ptr" %}
10115 
10116   ins_encode %{
10117     __ lea(as_Register($dst$$reg),
10118            Address(as_Register($src1$$reg), as_Register($src2$$reg),
10119                    Address::lsl($scale$$constant)));
10120   %}
10121 
10122   ins_pipe(ialu_reg_reg_shift);
10123 %}
10124 
10125 instruct addP_reg_reg_ext_shift(iRegPNoSp dst, iRegP src1, iRegIorL2I src2, immIScale scale) %{
10126   match(Set dst (AddP src1 (LShiftL (ConvI2L src2) scale)));
10127 
10128   ins_cost(1.9 * INSN_COST);
10129   format %{ "add $dst, $src1, $src2, I2L $scale\t# ptr" %}
10130 
10131   ins_encode %{
10132     __ lea(as_Register($dst$$reg),
10133            Address(as_Register($src1$$reg), as_Register($src2$$reg),
10134                    Address::sxtw($scale$$constant)));
10135   %}
10136 
10137   ins_pipe(ialu_reg_reg_shift);
10138 %}
10139 
10140 instruct lshift_ext(iRegLNoSp dst, iRegIorL2I src, immI scale, rFlagsReg cr) %{
10141   match(Set dst (LShiftL (ConvI2L src) scale));
10142 
10143   ins_cost(INSN_COST);
10144   format %{ "sbfiz $dst, $src, $scale & 63, -$scale & 63\t" %}
10145 
10146   ins_encode %{
10147     __ sbfiz(as_Register($dst$$reg),
10148           as_Register($src$$reg),
10149           $scale$$constant & 63, MIN(32, (-$scale$$constant) & 63));
10150   %}
10151 
10152   ins_pipe(ialu_reg_shift);
10153 %}
10154 
10155 // Pointer Immediate Addition
10156 // n.b. this needs to be more expensive than using an indirect memory
10157 // operand
10158 instruct addP_reg_imm(iRegPNoSp dst, iRegP src1, immLAddSub src2) %{
10159   match(Set dst (AddP src1 src2));
10160 
10161   ins_cost(INSN_COST);
10162   format %{ "add $dst, $src1, $src2\t# ptr" %}
10163 
10164   // use opcode to indicate that this is an add not a sub
10165   opcode(0x0);
10166 
10167   ins_encode( aarch64_enc_addsub_imm(dst, src1, src2) );
10168 
10169   ins_pipe(ialu_reg_imm);
10170 %}
10171 
10172 // Long Addition
10173 instruct addL_reg_reg(iRegLNoSp dst, iRegL src1, iRegL src2) %{
10174 
10175   match(Set dst (AddL src1 src2));
10176 
10177   ins_cost(INSN_COST);
10178   format %{ "add  $dst, $src1, $src2" %}
10179 
10180   ins_encode %{
10181     __ add(as_Register($dst$$reg),
10182            as_Register($src1$$reg),
10183            as_Register($src2$$reg));
10184   %}
10185 
10186   ins_pipe(ialu_reg_reg);
10187 %}
10188 
10189 // No constant pool entries requiredLong Immediate Addition.
10190 instruct addL_reg_imm(iRegLNoSp dst, iRegL src1, immLAddSub src2) %{
10191   match(Set dst (AddL src1 src2));
10192 
10193   ins_cost(INSN_COST);
10194   format %{ "add $dst, $src1, $src2" %}
10195 
10196   // use opcode to indicate that this is an add not a sub
10197   opcode(0x0);
10198 
10199   ins_encode( aarch64_enc_addsub_imm(dst, src1, src2) );
10200 
10201   ins_pipe(ialu_reg_imm);
10202 %}
10203 
10204 // Integer Subtraction
10205 instruct subI_reg_reg(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10206   match(Set dst (SubI src1 src2));
10207 
10208   ins_cost(INSN_COST);
10209   format %{ "subw  $dst, $src1, $src2" %}
10210 
10211   ins_encode %{
10212     __ subw(as_Register($dst$$reg),
10213             as_Register($src1$$reg),
10214             as_Register($src2$$reg));
10215   %}
10216 
10217   ins_pipe(ialu_reg_reg);
10218 %}
10219 
10220 // Immediate Subtraction
10221 instruct subI_reg_imm(iRegINoSp dst, iRegIorL2I src1, immIAddSub src2) %{
10222   match(Set dst (SubI src1 src2));
10223 
10224   ins_cost(INSN_COST);
10225   format %{ "subw $dst, $src1, $src2" %}
10226 
10227   // use opcode to indicate that this is a sub not an add
10228   opcode(0x1);
10229 
10230   ins_encode(aarch64_enc_addsubw_imm(dst, src1, src2));
10231 
10232   ins_pipe(ialu_reg_imm);
10233 %}
10234 
10235 // Long Subtraction
10236 instruct subL_reg_reg(iRegLNoSp dst, iRegL src1, iRegL src2) %{
10237 
10238   match(Set dst (SubL src1 src2));
10239 
10240   ins_cost(INSN_COST);
10241   format %{ "sub  $dst, $src1, $src2" %}
10242 
10243   ins_encode %{
10244     __ sub(as_Register($dst$$reg),
10245            as_Register($src1$$reg),
10246            as_Register($src2$$reg));
10247   %}
10248 
10249   ins_pipe(ialu_reg_reg);
10250 %}
10251 
10252 // No constant pool entries requiredLong Immediate Subtraction.
10253 instruct subL_reg_imm(iRegLNoSp dst, iRegL src1, immLAddSub src2) %{
10254   match(Set dst (SubL src1 src2));
10255 
10256   ins_cost(INSN_COST);
10257   format %{ "sub$dst, $src1, $src2" %}
10258 
10259   // use opcode to indicate that this is a sub not an add
10260   opcode(0x1);
10261 
10262   ins_encode( aarch64_enc_addsub_imm(dst, src1, src2) );
10263 
10264   ins_pipe(ialu_reg_imm);
10265 %}
10266 
10267 // Integer Negation (special case for sub)
10268 
10269 instruct negI_reg(iRegINoSp dst, iRegIorL2I src, immI0 zero, rFlagsReg cr) %{
10270   match(Set dst (SubI zero src));
10271 
10272   ins_cost(INSN_COST);
10273   format %{ "negw $dst, $src\t# int" %}
10274 
10275   ins_encode %{
10276     __ negw(as_Register($dst$$reg),
10277             as_Register($src$$reg));
10278   %}
10279 
10280   ins_pipe(ialu_reg);
10281 %}
10282 
10283 // Long Negation
10284 
10285 instruct negL_reg(iRegLNoSp dst, iRegL src, immL0 zero, rFlagsReg cr) %{
10286   match(Set dst (SubL zero src));
10287 
10288   ins_cost(INSN_COST);
10289   format %{ "neg $dst, $src\t# long" %}
10290 
10291   ins_encode %{
10292     __ neg(as_Register($dst$$reg),
10293            as_Register($src$$reg));
10294   %}
10295 
10296   ins_pipe(ialu_reg);
10297 %}
10298 
10299 // Integer Multiply
10300 
10301 instruct mulI(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10302   match(Set dst (MulI src1 src2));
10303 
10304   ins_cost(INSN_COST * 3);
10305   format %{ "mulw  $dst, $src1, $src2" %}
10306 
10307   ins_encode %{
10308     __ mulw(as_Register($dst$$reg),
10309             as_Register($src1$$reg),
10310             as_Register($src2$$reg));
10311   %}
10312 
10313   ins_pipe(imul_reg_reg);
10314 %}
10315 
10316 instruct smulI(iRegLNoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10317   match(Set dst (MulL (ConvI2L src1) (ConvI2L src2)));
10318 
10319   ins_cost(INSN_COST * 3);
10320   format %{ "smull  $dst, $src1, $src2" %}
10321 
10322   ins_encode %{
10323     __ smull(as_Register($dst$$reg),
10324              as_Register($src1$$reg),
10325              as_Register($src2$$reg));
10326   %}
10327 
10328   ins_pipe(imul_reg_reg);
10329 %}
10330 
10331 // Long Multiply
10332 
10333 instruct mulL(iRegLNoSp dst, iRegL src1, iRegL src2) %{
10334   match(Set dst (MulL src1 src2));
10335 
10336   ins_cost(INSN_COST * 5);
10337   format %{ "mul  $dst, $src1, $src2" %}
10338 
10339   ins_encode %{
10340     __ mul(as_Register($dst$$reg),
10341            as_Register($src1$$reg),
10342            as_Register($src2$$reg));
10343   %}
10344 
10345   ins_pipe(lmul_reg_reg);
10346 %}
10347 
10348 instruct mulHiL_rReg(iRegLNoSp dst, iRegL src1, iRegL src2, rFlagsReg cr)
10349 %{
10350   match(Set dst (MulHiL src1 src2));
10351 
10352   ins_cost(INSN_COST * 7);
10353   format %{ "smulh   $dst, $src1, $src2, \t# mulhi" %}
10354 
10355   ins_encode %{
10356     __ smulh(as_Register($dst$$reg),
10357              as_Register($src1$$reg),
10358              as_Register($src2$$reg));
10359   %}
10360 
10361   ins_pipe(lmul_reg_reg);
10362 %}
10363 
10364 // Combined Integer Multiply & Add/Sub
10365 
10366 instruct maddI(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, iRegIorL2I src3) %{
10367   match(Set dst (AddI src3 (MulI src1 src2)));
10368 
10369   ins_cost(INSN_COST * 3);
10370   format %{ "madd  $dst, $src1, $src2, $src3" %}
10371 
10372   ins_encode %{
10373     __ maddw(as_Register($dst$$reg),
10374              as_Register($src1$$reg),
10375              as_Register($src2$$reg),
10376              as_Register($src3$$reg));
10377   %}
10378 
10379   ins_pipe(imac_reg_reg);
10380 %}
10381 
10382 instruct msubI(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, iRegIorL2I src3) %{
10383   match(Set dst (SubI src3 (MulI src1 src2)));
10384 
10385   ins_cost(INSN_COST * 3);
10386   format %{ "msub  $dst, $src1, $src2, $src3" %}
10387 
10388   ins_encode %{
10389     __ msubw(as_Register($dst$$reg),
10390              as_Register($src1$$reg),
10391              as_Register($src2$$reg),
10392              as_Register($src3$$reg));
10393   %}
10394 
10395   ins_pipe(imac_reg_reg);
10396 %}
10397 
10398 // Combined Integer Multiply & Neg
10399 
10400 instruct mnegI(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI0 zero) %{
10401   match(Set dst (MulI (SubI zero src1) src2));
10402   match(Set dst (MulI src1 (SubI zero src2)));
10403 
10404   ins_cost(INSN_COST * 3);
10405   format %{ "mneg  $dst, $src1, $src2" %}
10406 
10407   ins_encode %{
10408     __ mnegw(as_Register($dst$$reg),
10409              as_Register($src1$$reg),
10410              as_Register($src2$$reg));
10411   %}
10412 
10413   ins_pipe(imac_reg_reg);
10414 %}
10415 
10416 // Combined Long Multiply & Add/Sub
10417 
10418 instruct maddL(iRegLNoSp dst, iRegL src1, iRegL src2, iRegL src3) %{
10419   match(Set dst (AddL src3 (MulL src1 src2)));
10420 
10421   ins_cost(INSN_COST * 5);
10422   format %{ "madd  $dst, $src1, $src2, $src3" %}
10423 
10424   ins_encode %{
10425     __ madd(as_Register($dst$$reg),
10426             as_Register($src1$$reg),
10427             as_Register($src2$$reg),
10428             as_Register($src3$$reg));
10429   %}
10430 
10431   ins_pipe(lmac_reg_reg);
10432 %}
10433 
10434 instruct msubL(iRegLNoSp dst, iRegL src1, iRegL src2, iRegL src3) %{
10435   match(Set dst (SubL src3 (MulL src1 src2)));
10436 
10437   ins_cost(INSN_COST * 5);
10438   format %{ "msub  $dst, $src1, $src2, $src3" %}
10439 
10440   ins_encode %{
10441     __ msub(as_Register($dst$$reg),
10442             as_Register($src1$$reg),
10443             as_Register($src2$$reg),
10444             as_Register($src3$$reg));
10445   %}
10446 
10447   ins_pipe(lmac_reg_reg);
10448 %}
10449 
10450 // Combined Long Multiply & Neg
10451 
10452 instruct mnegL(iRegLNoSp dst, iRegL src1, iRegL src2, immL0 zero) %{
10453   match(Set dst (MulL (SubL zero src1) src2));
10454   match(Set dst (MulL src1 (SubL zero src2)));
10455 
10456   ins_cost(INSN_COST * 5);
10457   format %{ "mneg  $dst, $src1, $src2" %}
10458 
10459   ins_encode %{
10460     __ mneg(as_Register($dst$$reg),
10461             as_Register($src1$$reg),
10462             as_Register($src2$$reg));
10463   %}
10464 
10465   ins_pipe(lmac_reg_reg);
10466 %}
10467 
10468 // Combine Integer Signed Multiply & Add/Sub/Neg Long
10469 
10470 instruct smaddL(iRegLNoSp dst, iRegIorL2I src1, iRegIorL2I src2, iRegLNoSp src3) %{
10471   match(Set dst (AddL src3 (MulL (ConvI2L src1) (ConvI2L src2))));
10472 
10473   ins_cost(INSN_COST * 3);
10474   format %{ "smaddl  $dst, $src1, $src2, $src3" %}
10475 
10476   ins_encode %{
10477     __ smaddl(as_Register($dst$$reg),
10478               as_Register($src1$$reg),
10479               as_Register($src2$$reg),
10480               as_Register($src3$$reg));
10481   %}
10482 
10483   ins_pipe(imac_reg_reg);
10484 %}
10485 
10486 instruct smsubL(iRegLNoSp dst, iRegIorL2I src1, iRegIorL2I src2, iRegLNoSp src3) %{
10487   match(Set dst (SubL src3 (MulL (ConvI2L src1) (ConvI2L src2))));
10488 
10489   ins_cost(INSN_COST * 3);
10490   format %{ "smsubl  $dst, $src1, $src2, $src3" %}
10491 
10492   ins_encode %{
10493     __ smsubl(as_Register($dst$$reg),
10494               as_Register($src1$$reg),
10495               as_Register($src2$$reg),
10496               as_Register($src3$$reg));
10497   %}
10498 
10499   ins_pipe(imac_reg_reg);
10500 %}
10501 
10502 instruct smnegL(iRegLNoSp dst, iRegIorL2I src1, iRegIorL2I src2, immL0 zero) %{
10503   match(Set dst (MulL (SubL zero (ConvI2L src1)) (ConvI2L src2)));
10504   match(Set dst (MulL (ConvI2L src1) (SubL zero (ConvI2L src2))));
10505 
10506   ins_cost(INSN_COST * 3);
10507   format %{ "smnegl  $dst, $src1, $src2" %}
10508 
10509   ins_encode %{
10510     __ smnegl(as_Register($dst$$reg),
10511               as_Register($src1$$reg),
10512               as_Register($src2$$reg));
10513   %}
10514 
10515   ins_pipe(imac_reg_reg);
10516 %}
10517 
10518 // Combined Multiply-Add Shorts into Integer (dst = src1 * src2 + src3 * src4)
10519 
10520 instruct muladdS2I(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, iRegIorL2I src3, iRegIorL2I src4) %{
10521   match(Set dst (MulAddS2I (Binary src1 src2) (Binary src3 src4)));
10522 
10523   ins_cost(INSN_COST * 5);
10524   format %{ "mulw  rscratch1, $src1, $src2\n\t"
10525             "maddw $dst, $src3, $src4, rscratch1" %}
10526 
10527   ins_encode %{
10528     __ mulw(rscratch1, as_Register($src1$$reg), as_Register($src2$$reg));
10529     __ maddw(as_Register($dst$$reg), as_Register($src3$$reg), as_Register($src4$$reg), rscratch1); %}
10530 
10531   ins_pipe(imac_reg_reg);
10532 %}
10533 
10534 // Integer Divide
10535 
10536 instruct divI(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10537   match(Set dst (DivI src1 src2));
10538 
10539   ins_cost(INSN_COST * 19);
10540   format %{ "sdivw  $dst, $src1, $src2" %}
10541 
10542   ins_encode(aarch64_enc_divw(dst, src1, src2));
10543   ins_pipe(idiv_reg_reg);
10544 %}
10545 
10546 // Long Divide
10547 
10548 instruct divL(iRegLNoSp dst, iRegL src1, iRegL src2) %{
10549   match(Set dst (DivL src1 src2));
10550 
10551   ins_cost(INSN_COST * 35);
10552   format %{ "sdiv   $dst, $src1, $src2" %}
10553 
10554   ins_encode(aarch64_enc_div(dst, src1, src2));
10555   ins_pipe(ldiv_reg_reg);
10556 %}
10557 
10558 // Integer Remainder
10559 
10560 instruct modI(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10561   match(Set dst (ModI src1 src2));
10562 
10563   ins_cost(INSN_COST * 22);
10564   format %{ "sdivw  rscratch1, $src1, $src2\n\t"
10565             "msubw($dst, rscratch1, $src2, $src1" %}
10566 
10567   ins_encode(aarch64_enc_modw(dst, src1, src2));
10568   ins_pipe(idiv_reg_reg);
10569 %}
10570 
10571 // Long Remainder
10572 
10573 instruct modL(iRegLNoSp dst, iRegL src1, iRegL src2) %{
10574   match(Set dst (ModL src1 src2));
10575 
10576   ins_cost(INSN_COST * 38);
10577   format %{ "sdiv   rscratch1, $src1, $src2\n"
10578             "msub($dst, rscratch1, $src2, $src1" %}
10579 
10580   ins_encode(aarch64_enc_mod(dst, src1, src2));
10581   ins_pipe(ldiv_reg_reg);
10582 %}
10583 
10584 // Integer Shifts
10585 
10586 // Shift Left Register
10587 instruct lShiftI_reg_reg(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10588   match(Set dst (LShiftI src1 src2));
10589 
10590   ins_cost(INSN_COST * 2);
10591   format %{ "lslvw  $dst, $src1, $src2" %}
10592 
10593   ins_encode %{
10594     __ lslvw(as_Register($dst$$reg),
10595              as_Register($src1$$reg),
10596              as_Register($src2$$reg));
10597   %}
10598 
10599   ins_pipe(ialu_reg_reg_vshift);
10600 %}
10601 
10602 // Shift Left Immediate
10603 instruct lShiftI_reg_imm(iRegINoSp dst, iRegIorL2I src1, immI src2) %{
10604   match(Set dst (LShiftI src1 src2));
10605 
10606   ins_cost(INSN_COST);
10607   format %{ "lslw $dst, $src1, ($src2 & 0x1f)" %}
10608 
10609   ins_encode %{
10610     __ lslw(as_Register($dst$$reg),
10611             as_Register($src1$$reg),
10612             $src2$$constant & 0x1f);
10613   %}
10614 
10615   ins_pipe(ialu_reg_shift);
10616 %}
10617 
10618 // Shift Right Logical Register
10619 instruct urShiftI_reg_reg(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10620   match(Set dst (URShiftI src1 src2));
10621 
10622   ins_cost(INSN_COST * 2);
10623   format %{ "lsrvw  $dst, $src1, $src2" %}
10624 
10625   ins_encode %{
10626     __ lsrvw(as_Register($dst$$reg),
10627              as_Register($src1$$reg),
10628              as_Register($src2$$reg));
10629   %}
10630 
10631   ins_pipe(ialu_reg_reg_vshift);
10632 %}
10633 
10634 // Shift Right Logical Immediate
10635 instruct urShiftI_reg_imm(iRegINoSp dst, iRegIorL2I src1, immI src2) %{
10636   match(Set dst (URShiftI src1 src2));
10637 
10638   ins_cost(INSN_COST);
10639   format %{ "lsrw $dst, $src1, ($src2 & 0x1f)" %}
10640 
10641   ins_encode %{
10642     __ lsrw(as_Register($dst$$reg),
10643             as_Register($src1$$reg),
10644             $src2$$constant & 0x1f);
10645   %}
10646 
10647   ins_pipe(ialu_reg_shift);
10648 %}
10649 
10650 // Shift Right Arithmetic Register
10651 instruct rShiftI_reg_reg(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
10652   match(Set dst (RShiftI src1 src2));
10653 
10654   ins_cost(INSN_COST * 2);
10655   format %{ "asrvw  $dst, $src1, $src2" %}
10656 
10657   ins_encode %{
10658     __ asrvw(as_Register($dst$$reg),
10659              as_Register($src1$$reg),
10660              as_Register($src2$$reg));
10661   %}
10662 
10663   ins_pipe(ialu_reg_reg_vshift);
10664 %}
10665 
10666 // Shift Right Arithmetic Immediate
10667 instruct rShiftI_reg_imm(iRegINoSp dst, iRegIorL2I src1, immI src2) %{
10668   match(Set dst (RShiftI src1 src2));
10669 
10670   ins_cost(INSN_COST);
10671   format %{ "asrw $dst, $src1, ($src2 & 0x1f)" %}
10672 
10673   ins_encode %{
10674     __ asrw(as_Register($dst$$reg),
10675             as_Register($src1$$reg),
10676             $src2$$constant & 0x1f);
10677   %}
10678 
10679   ins_pipe(ialu_reg_shift);
10680 %}
10681 
10682 // Combined Int Mask and Right Shift (using UBFM)
10683 // TODO
10684 
10685 // Long Shifts
10686 
10687 // Shift Left Register
10688 instruct lShiftL_reg_reg(iRegLNoSp dst, iRegL src1, iRegIorL2I src2) %{
10689   match(Set dst (LShiftL src1 src2));
10690 
10691   ins_cost(INSN_COST * 2);
10692   format %{ "lslv  $dst, $src1, $src2" %}
10693 
10694   ins_encode %{
10695     __ lslv(as_Register($dst$$reg),
10696             as_Register($src1$$reg),
10697             as_Register($src2$$reg));
10698   %}
10699 
10700   ins_pipe(ialu_reg_reg_vshift);
10701 %}
10702 
10703 // Shift Left Immediate
10704 instruct lShiftL_reg_imm(iRegLNoSp dst, iRegL src1, immI src2) %{
10705   match(Set dst (LShiftL src1 src2));
10706 
10707   ins_cost(INSN_COST);
10708   format %{ "lsl $dst, $src1, ($src2 & 0x3f)" %}
10709 
10710   ins_encode %{
10711     __ lsl(as_Register($dst$$reg),
10712             as_Register($src1$$reg),
10713             $src2$$constant & 0x3f);
10714   %}
10715 
10716   ins_pipe(ialu_reg_shift);
10717 %}
10718 
10719 // Shift Right Logical Register
10720 instruct urShiftL_reg_reg(iRegLNoSp dst, iRegL src1, iRegIorL2I src2) %{
10721   match(Set dst (URShiftL src1 src2));
10722 
10723   ins_cost(INSN_COST * 2);
10724   format %{ "lsrv  $dst, $src1, $src2" %}
10725 
10726   ins_encode %{
10727     __ lsrv(as_Register($dst$$reg),
10728             as_Register($src1$$reg),
10729             as_Register($src2$$reg));
10730   %}
10731 
10732   ins_pipe(ialu_reg_reg_vshift);
10733 %}
10734 
10735 // Shift Right Logical Immediate
10736 instruct urShiftL_reg_imm(iRegLNoSp dst, iRegL src1, immI src2) %{
10737   match(Set dst (URShiftL src1 src2));
10738 
10739   ins_cost(INSN_COST);
10740   format %{ "lsr $dst, $src1, ($src2 & 0x3f)" %}
10741 
10742   ins_encode %{
10743     __ lsr(as_Register($dst$$reg),
10744            as_Register($src1$$reg),
10745            $src2$$constant & 0x3f);
10746   %}
10747 
10748   ins_pipe(ialu_reg_shift);
10749 %}
10750 
10751 // A special-case pattern for card table stores.
10752 instruct urShiftP_reg_imm(iRegLNoSp dst, iRegP src1, immI src2) %{
10753   match(Set dst (URShiftL (CastP2X src1) src2));
10754 
10755   ins_cost(INSN_COST);
10756   format %{ "lsr $dst, p2x($src1), ($src2 & 0x3f)" %}
10757 
10758   ins_encode %{
10759     __ lsr(as_Register($dst$$reg),
10760            as_Register($src1$$reg),
10761            $src2$$constant & 0x3f);
10762   %}
10763 
10764   ins_pipe(ialu_reg_shift);
10765 %}
10766 
10767 // Shift Right Arithmetic Register
10768 instruct rShiftL_reg_reg(iRegLNoSp dst, iRegL src1, iRegIorL2I src2) %{
10769   match(Set dst (RShiftL src1 src2));
10770 
10771   ins_cost(INSN_COST * 2);
10772   format %{ "asrv  $dst, $src1, $src2" %}
10773 
10774   ins_encode %{
10775     __ asrv(as_Register($dst$$reg),
10776             as_Register($src1$$reg),
10777             as_Register($src2$$reg));
10778   %}
10779 
10780   ins_pipe(ialu_reg_reg_vshift);
10781 %}
10782 
10783 // Shift Right Arithmetic Immediate
10784 instruct rShiftL_reg_imm(iRegLNoSp dst, iRegL src1, immI src2) %{
10785   match(Set dst (RShiftL src1 src2));
10786 
10787   ins_cost(INSN_COST);
10788   format %{ "asr $dst, $src1, ($src2 & 0x3f)" %}
10789 
10790   ins_encode %{
10791     __ asr(as_Register($dst$$reg),
10792            as_Register($src1$$reg),
10793            $src2$$constant & 0x3f);
10794   %}
10795 
10796   ins_pipe(ialu_reg_shift);
10797 %}
10798 
10799 // BEGIN This section of the file is automatically generated. Do not edit --------------
10800 
10801 instruct regL_not_reg(iRegLNoSp dst,
10802                          iRegL src1, immL_M1 m1,
10803                          rFlagsReg cr) %{
10804   match(Set dst (XorL src1 m1));
10805   ins_cost(INSN_COST);
10806   format %{ "eon  $dst, $src1, zr" %}
10807 
10808   ins_encode %{
10809     __ eon(as_Register($dst$$reg),
10810               as_Register($src1$$reg),
10811               zr,
10812               Assembler::LSL, 0);
10813   %}
10814 
10815   ins_pipe(ialu_reg);
10816 %}
10817 instruct regI_not_reg(iRegINoSp dst,
10818                          iRegIorL2I src1, immI_M1 m1,
10819                          rFlagsReg cr) %{
10820   match(Set dst (XorI src1 m1));
10821   ins_cost(INSN_COST);
10822   format %{ "eonw  $dst, $src1, zr" %}
10823 
10824   ins_encode %{
10825     __ eonw(as_Register($dst$$reg),
10826               as_Register($src1$$reg),
10827               zr,
10828               Assembler::LSL, 0);
10829   %}
10830 
10831   ins_pipe(ialu_reg);
10832 %}
10833 
10834 instruct AndI_reg_not_reg(iRegINoSp dst,
10835                          iRegIorL2I src1, iRegIorL2I src2, immI_M1 m1,
10836                          rFlagsReg cr) %{
10837   match(Set dst (AndI src1 (XorI src2 m1)));
10838   ins_cost(INSN_COST);
10839   format %{ "bicw  $dst, $src1, $src2" %}
10840 
10841   ins_encode %{
10842     __ bicw(as_Register($dst$$reg),
10843               as_Register($src1$$reg),
10844               as_Register($src2$$reg),
10845               Assembler::LSL, 0);
10846   %}
10847 
10848   ins_pipe(ialu_reg_reg);
10849 %}
10850 
10851 instruct AndL_reg_not_reg(iRegLNoSp dst,
10852                          iRegL src1, iRegL src2, immL_M1 m1,
10853                          rFlagsReg cr) %{
10854   match(Set dst (AndL src1 (XorL src2 m1)));
10855   ins_cost(INSN_COST);
10856   format %{ "bic  $dst, $src1, $src2" %}
10857 
10858   ins_encode %{
10859     __ bic(as_Register($dst$$reg),
10860               as_Register($src1$$reg),
10861               as_Register($src2$$reg),
10862               Assembler::LSL, 0);
10863   %}
10864 
10865   ins_pipe(ialu_reg_reg);
10866 %}
10867 
10868 instruct OrI_reg_not_reg(iRegINoSp dst,
10869                          iRegIorL2I src1, iRegIorL2I src2, immI_M1 m1,
10870                          rFlagsReg cr) %{
10871   match(Set dst (OrI src1 (XorI src2 m1)));
10872   ins_cost(INSN_COST);
10873   format %{ "ornw  $dst, $src1, $src2" %}
10874 
10875   ins_encode %{
10876     __ ornw(as_Register($dst$$reg),
10877               as_Register($src1$$reg),
10878               as_Register($src2$$reg),
10879               Assembler::LSL, 0);
10880   %}
10881 
10882   ins_pipe(ialu_reg_reg);
10883 %}
10884 
10885 instruct OrL_reg_not_reg(iRegLNoSp dst,
10886                          iRegL src1, iRegL src2, immL_M1 m1,
10887                          rFlagsReg cr) %{
10888   match(Set dst (OrL src1 (XorL src2 m1)));
10889   ins_cost(INSN_COST);
10890   format %{ "orn  $dst, $src1, $src2" %}
10891 
10892   ins_encode %{
10893     __ orn(as_Register($dst$$reg),
10894               as_Register($src1$$reg),
10895               as_Register($src2$$reg),
10896               Assembler::LSL, 0);
10897   %}
10898 
10899   ins_pipe(ialu_reg_reg);
10900 %}
10901 
10902 instruct XorI_reg_not_reg(iRegINoSp dst,
10903                          iRegIorL2I src1, iRegIorL2I src2, immI_M1 m1,
10904                          rFlagsReg cr) %{
10905   match(Set dst (XorI m1 (XorI src2 src1)));
10906   ins_cost(INSN_COST);
10907   format %{ "eonw  $dst, $src1, $src2" %}
10908 
10909   ins_encode %{
10910     __ eonw(as_Register($dst$$reg),
10911               as_Register($src1$$reg),
10912               as_Register($src2$$reg),
10913               Assembler::LSL, 0);
10914   %}
10915 
10916   ins_pipe(ialu_reg_reg);
10917 %}
10918 
10919 instruct XorL_reg_not_reg(iRegLNoSp dst,
10920                          iRegL src1, iRegL src2, immL_M1 m1,
10921                          rFlagsReg cr) %{
10922   match(Set dst (XorL m1 (XorL src2 src1)));
10923   ins_cost(INSN_COST);
10924   format %{ "eon  $dst, $src1, $src2" %}
10925 
10926   ins_encode %{
10927     __ eon(as_Register($dst$$reg),
10928               as_Register($src1$$reg),
10929               as_Register($src2$$reg),
10930               Assembler::LSL, 0);
10931   %}
10932 
10933   ins_pipe(ialu_reg_reg);
10934 %}
10935 
10936 instruct AndI_reg_URShift_not_reg(iRegINoSp dst,
10937                          iRegIorL2I src1, iRegIorL2I src2,
10938                          immI src3, immI_M1 src4, rFlagsReg cr) %{
10939   match(Set dst (AndI src1 (XorI(URShiftI src2 src3) src4)));
10940   ins_cost(1.9 * INSN_COST);
10941   format %{ "bicw  $dst, $src1, $src2, LSR $src3" %}
10942 
10943   ins_encode %{
10944     __ bicw(as_Register($dst$$reg),
10945               as_Register($src1$$reg),
10946               as_Register($src2$$reg),
10947               Assembler::LSR,
10948               $src3$$constant & 0x1f);
10949   %}
10950 
10951   ins_pipe(ialu_reg_reg_shift);
10952 %}
10953 
10954 instruct AndL_reg_URShift_not_reg(iRegLNoSp dst,
10955                          iRegL src1, iRegL src2,
10956                          immI src3, immL_M1 src4, rFlagsReg cr) %{
10957   match(Set dst (AndL src1 (XorL(URShiftL src2 src3) src4)));
10958   ins_cost(1.9 * INSN_COST);
10959   format %{ "bic  $dst, $src1, $src2, LSR $src3" %}
10960 
10961   ins_encode %{
10962     __ bic(as_Register($dst$$reg),
10963               as_Register($src1$$reg),
10964               as_Register($src2$$reg),
10965               Assembler::LSR,
10966               $src3$$constant & 0x3f);
10967   %}
10968 
10969   ins_pipe(ialu_reg_reg_shift);
10970 %}
10971 
10972 instruct AndI_reg_RShift_not_reg(iRegINoSp dst,
10973                          iRegIorL2I src1, iRegIorL2I src2,
10974                          immI src3, immI_M1 src4, rFlagsReg cr) %{
10975   match(Set dst (AndI src1 (XorI(RShiftI src2 src3) src4)));
10976   ins_cost(1.9 * INSN_COST);
10977   format %{ "bicw  $dst, $src1, $src2, ASR $src3" %}
10978 
10979   ins_encode %{
10980     __ bicw(as_Register($dst$$reg),
10981               as_Register($src1$$reg),
10982               as_Register($src2$$reg),
10983               Assembler::ASR,
10984               $src3$$constant & 0x1f);
10985   %}
10986 
10987   ins_pipe(ialu_reg_reg_shift);
10988 %}
10989 
10990 instruct AndL_reg_RShift_not_reg(iRegLNoSp dst,
10991                          iRegL src1, iRegL src2,
10992                          immI src3, immL_M1 src4, rFlagsReg cr) %{
10993   match(Set dst (AndL src1 (XorL(RShiftL src2 src3) src4)));
10994   ins_cost(1.9 * INSN_COST);
10995   format %{ "bic  $dst, $src1, $src2, ASR $src3" %}
10996 
10997   ins_encode %{
10998     __ bic(as_Register($dst$$reg),
10999               as_Register($src1$$reg),
11000               as_Register($src2$$reg),
11001               Assembler::ASR,
11002               $src3$$constant & 0x3f);
11003   %}
11004 
11005   ins_pipe(ialu_reg_reg_shift);
11006 %}
11007 
11008 instruct AndI_reg_LShift_not_reg(iRegINoSp dst,
11009                          iRegIorL2I src1, iRegIorL2I src2,
11010                          immI src3, immI_M1 src4, rFlagsReg cr) %{
11011   match(Set dst (AndI src1 (XorI(LShiftI src2 src3) src4)));
11012   ins_cost(1.9 * INSN_COST);
11013   format %{ "bicw  $dst, $src1, $src2, LSL $src3" %}
11014 
11015   ins_encode %{
11016     __ bicw(as_Register($dst$$reg),
11017               as_Register($src1$$reg),
11018               as_Register($src2$$reg),
11019               Assembler::LSL,
11020               $src3$$constant & 0x1f);
11021   %}
11022 
11023   ins_pipe(ialu_reg_reg_shift);
11024 %}
11025 
11026 instruct AndL_reg_LShift_not_reg(iRegLNoSp dst,
11027                          iRegL src1, iRegL src2,
11028                          immI src3, immL_M1 src4, rFlagsReg cr) %{
11029   match(Set dst (AndL src1 (XorL(LShiftL src2 src3) src4)));
11030   ins_cost(1.9 * INSN_COST);
11031   format %{ "bic  $dst, $src1, $src2, LSL $src3" %}
11032 
11033   ins_encode %{
11034     __ bic(as_Register($dst$$reg),
11035               as_Register($src1$$reg),
11036               as_Register($src2$$reg),
11037               Assembler::LSL,
11038               $src3$$constant & 0x3f);
11039   %}
11040 
11041   ins_pipe(ialu_reg_reg_shift);
11042 %}
11043 
11044 instruct XorI_reg_URShift_not_reg(iRegINoSp dst,
11045                          iRegIorL2I src1, iRegIorL2I src2,
11046                          immI src3, immI_M1 src4, rFlagsReg cr) %{
11047   match(Set dst (XorI src4 (XorI(URShiftI src2 src3) src1)));
11048   ins_cost(1.9 * INSN_COST);
11049   format %{ "eonw  $dst, $src1, $src2, LSR $src3" %}
11050 
11051   ins_encode %{
11052     __ eonw(as_Register($dst$$reg),
11053               as_Register($src1$$reg),
11054               as_Register($src2$$reg),
11055               Assembler::LSR,
11056               $src3$$constant & 0x1f);
11057   %}
11058 
11059   ins_pipe(ialu_reg_reg_shift);
11060 %}
11061 
11062 instruct XorL_reg_URShift_not_reg(iRegLNoSp dst,
11063                          iRegL src1, iRegL src2,
11064                          immI src3, immL_M1 src4, rFlagsReg cr) %{
11065   match(Set dst (XorL src4 (XorL(URShiftL src2 src3) src1)));
11066   ins_cost(1.9 * INSN_COST);
11067   format %{ "eon  $dst, $src1, $src2, LSR $src3" %}
11068 
11069   ins_encode %{
11070     __ eon(as_Register($dst$$reg),
11071               as_Register($src1$$reg),
11072               as_Register($src2$$reg),
11073               Assembler::LSR,
11074               $src3$$constant & 0x3f);
11075   %}
11076 
11077   ins_pipe(ialu_reg_reg_shift);
11078 %}
11079 
11080 instruct XorI_reg_RShift_not_reg(iRegINoSp dst,
11081                          iRegIorL2I src1, iRegIorL2I src2,
11082                          immI src3, immI_M1 src4, rFlagsReg cr) %{
11083   match(Set dst (XorI src4 (XorI(RShiftI src2 src3) src1)));
11084   ins_cost(1.9 * INSN_COST);
11085   format %{ "eonw  $dst, $src1, $src2, ASR $src3" %}
11086 
11087   ins_encode %{
11088     __ eonw(as_Register($dst$$reg),
11089               as_Register($src1$$reg),
11090               as_Register($src2$$reg),
11091               Assembler::ASR,
11092               $src3$$constant & 0x1f);
11093   %}
11094 
11095   ins_pipe(ialu_reg_reg_shift);
11096 %}
11097 
11098 instruct XorL_reg_RShift_not_reg(iRegLNoSp dst,
11099                          iRegL src1, iRegL src2,
11100                          immI src3, immL_M1 src4, rFlagsReg cr) %{
11101   match(Set dst (XorL src4 (XorL(RShiftL src2 src3) src1)));
11102   ins_cost(1.9 * INSN_COST);
11103   format %{ "eon  $dst, $src1, $src2, ASR $src3" %}
11104 
11105   ins_encode %{
11106     __ eon(as_Register($dst$$reg),
11107               as_Register($src1$$reg),
11108               as_Register($src2$$reg),
11109               Assembler::ASR,
11110               $src3$$constant & 0x3f);
11111   %}
11112 
11113   ins_pipe(ialu_reg_reg_shift);
11114 %}
11115 
11116 instruct XorI_reg_LShift_not_reg(iRegINoSp dst,
11117                          iRegIorL2I src1, iRegIorL2I src2,
11118                          immI src3, immI_M1 src4, rFlagsReg cr) %{
11119   match(Set dst (XorI src4 (XorI(LShiftI src2 src3) src1)));
11120   ins_cost(1.9 * INSN_COST);
11121   format %{ "eonw  $dst, $src1, $src2, LSL $src3" %}
11122 
11123   ins_encode %{
11124     __ eonw(as_Register($dst$$reg),
11125               as_Register($src1$$reg),
11126               as_Register($src2$$reg),
11127               Assembler::LSL,
11128               $src3$$constant & 0x1f);
11129   %}
11130 
11131   ins_pipe(ialu_reg_reg_shift);
11132 %}
11133 
11134 instruct XorL_reg_LShift_not_reg(iRegLNoSp dst,
11135                          iRegL src1, iRegL src2,
11136                          immI src3, immL_M1 src4, rFlagsReg cr) %{
11137   match(Set dst (XorL src4 (XorL(LShiftL src2 src3) src1)));
11138   ins_cost(1.9 * INSN_COST);
11139   format %{ "eon  $dst, $src1, $src2, LSL $src3" %}
11140 
11141   ins_encode %{
11142     __ eon(as_Register($dst$$reg),
11143               as_Register($src1$$reg),
11144               as_Register($src2$$reg),
11145               Assembler::LSL,
11146               $src3$$constant & 0x3f);
11147   %}
11148 
11149   ins_pipe(ialu_reg_reg_shift);
11150 %}
11151 
11152 instruct OrI_reg_URShift_not_reg(iRegINoSp dst,
11153                          iRegIorL2I src1, iRegIorL2I src2,
11154                          immI src3, immI_M1 src4, rFlagsReg cr) %{
11155   match(Set dst (OrI src1 (XorI(URShiftI src2 src3) src4)));
11156   ins_cost(1.9 * INSN_COST);
11157   format %{ "ornw  $dst, $src1, $src2, LSR $src3" %}
11158 
11159   ins_encode %{
11160     __ ornw(as_Register($dst$$reg),
11161               as_Register($src1$$reg),
11162               as_Register($src2$$reg),
11163               Assembler::LSR,
11164               $src3$$constant & 0x1f);
11165   %}
11166 
11167   ins_pipe(ialu_reg_reg_shift);
11168 %}
11169 
11170 instruct OrL_reg_URShift_not_reg(iRegLNoSp dst,
11171                          iRegL src1, iRegL src2,
11172                          immI src3, immL_M1 src4, rFlagsReg cr) %{
11173   match(Set dst (OrL src1 (XorL(URShiftL src2 src3) src4)));
11174   ins_cost(1.9 * INSN_COST);
11175   format %{ "orn  $dst, $src1, $src2, LSR $src3" %}
11176 
11177   ins_encode %{
11178     __ orn(as_Register($dst$$reg),
11179               as_Register($src1$$reg),
11180               as_Register($src2$$reg),
11181               Assembler::LSR,
11182               $src3$$constant & 0x3f);
11183   %}
11184 
11185   ins_pipe(ialu_reg_reg_shift);
11186 %}
11187 
11188 instruct OrI_reg_RShift_not_reg(iRegINoSp dst,
11189                          iRegIorL2I src1, iRegIorL2I src2,
11190                          immI src3, immI_M1 src4, rFlagsReg cr) %{
11191   match(Set dst (OrI src1 (XorI(RShiftI src2 src3) src4)));
11192   ins_cost(1.9 * INSN_COST);
11193   format %{ "ornw  $dst, $src1, $src2, ASR $src3" %}
11194 
11195   ins_encode %{
11196     __ ornw(as_Register($dst$$reg),
11197               as_Register($src1$$reg),
11198               as_Register($src2$$reg),
11199               Assembler::ASR,
11200               $src3$$constant & 0x1f);
11201   %}
11202 
11203   ins_pipe(ialu_reg_reg_shift);
11204 %}
11205 
11206 instruct OrL_reg_RShift_not_reg(iRegLNoSp dst,
11207                          iRegL src1, iRegL src2,
11208                          immI src3, immL_M1 src4, rFlagsReg cr) %{
11209   match(Set dst (OrL src1 (XorL(RShiftL src2 src3) src4)));
11210   ins_cost(1.9 * INSN_COST);
11211   format %{ "orn  $dst, $src1, $src2, ASR $src3" %}
11212 
11213   ins_encode %{
11214     __ orn(as_Register($dst$$reg),
11215               as_Register($src1$$reg),
11216               as_Register($src2$$reg),
11217               Assembler::ASR,
11218               $src3$$constant & 0x3f);
11219   %}
11220 
11221   ins_pipe(ialu_reg_reg_shift);
11222 %}
11223 
11224 instruct OrI_reg_LShift_not_reg(iRegINoSp dst,
11225                          iRegIorL2I src1, iRegIorL2I src2,
11226                          immI src3, immI_M1 src4, rFlagsReg cr) %{
11227   match(Set dst (OrI src1 (XorI(LShiftI src2 src3) src4)));
11228   ins_cost(1.9 * INSN_COST);
11229   format %{ "ornw  $dst, $src1, $src2, LSL $src3" %}
11230 
11231   ins_encode %{
11232     __ ornw(as_Register($dst$$reg),
11233               as_Register($src1$$reg),
11234               as_Register($src2$$reg),
11235               Assembler::LSL,
11236               $src3$$constant & 0x1f);
11237   %}
11238 
11239   ins_pipe(ialu_reg_reg_shift);
11240 %}
11241 
11242 instruct OrL_reg_LShift_not_reg(iRegLNoSp dst,
11243                          iRegL src1, iRegL src2,
11244                          immI src3, immL_M1 src4, rFlagsReg cr) %{
11245   match(Set dst (OrL src1 (XorL(LShiftL src2 src3) src4)));
11246   ins_cost(1.9 * INSN_COST);
11247   format %{ "orn  $dst, $src1, $src2, LSL $src3" %}
11248 
11249   ins_encode %{
11250     __ orn(as_Register($dst$$reg),
11251               as_Register($src1$$reg),
11252               as_Register($src2$$reg),
11253               Assembler::LSL,
11254               $src3$$constant & 0x3f);
11255   %}
11256 
11257   ins_pipe(ialu_reg_reg_shift);
11258 %}
11259 
11260 instruct AndI_reg_URShift_reg(iRegINoSp dst,
11261                          iRegIorL2I src1, iRegIorL2I src2,
11262                          immI src3, rFlagsReg cr) %{
11263   match(Set dst (AndI src1 (URShiftI src2 src3)));
11264 
11265   ins_cost(1.9 * INSN_COST);
11266   format %{ "andw  $dst, $src1, $src2, LSR $src3" %}
11267 
11268   ins_encode %{
11269     __ andw(as_Register($dst$$reg),
11270               as_Register($src1$$reg),
11271               as_Register($src2$$reg),
11272               Assembler::LSR,
11273               $src3$$constant & 0x1f);
11274   %}
11275 
11276   ins_pipe(ialu_reg_reg_shift);
11277 %}
11278 
11279 instruct AndL_reg_URShift_reg(iRegLNoSp dst,
11280                          iRegL src1, iRegL src2,
11281                          immI src3, rFlagsReg cr) %{
11282   match(Set dst (AndL src1 (URShiftL src2 src3)));
11283 
11284   ins_cost(1.9 * INSN_COST);
11285   format %{ "andr  $dst, $src1, $src2, LSR $src3" %}
11286 
11287   ins_encode %{
11288     __ andr(as_Register($dst$$reg),
11289               as_Register($src1$$reg),
11290               as_Register($src2$$reg),
11291               Assembler::LSR,
11292               $src3$$constant & 0x3f);
11293   %}
11294 
11295   ins_pipe(ialu_reg_reg_shift);
11296 %}
11297 
11298 instruct AndI_reg_RShift_reg(iRegINoSp dst,
11299                          iRegIorL2I src1, iRegIorL2I src2,
11300                          immI src3, rFlagsReg cr) %{
11301   match(Set dst (AndI src1 (RShiftI src2 src3)));
11302 
11303   ins_cost(1.9 * INSN_COST);
11304   format %{ "andw  $dst, $src1, $src2, ASR $src3" %}
11305 
11306   ins_encode %{
11307     __ andw(as_Register($dst$$reg),
11308               as_Register($src1$$reg),
11309               as_Register($src2$$reg),
11310               Assembler::ASR,
11311               $src3$$constant & 0x1f);
11312   %}
11313 
11314   ins_pipe(ialu_reg_reg_shift);
11315 %}
11316 
11317 instruct AndL_reg_RShift_reg(iRegLNoSp dst,
11318                          iRegL src1, iRegL src2,
11319                          immI src3, rFlagsReg cr) %{
11320   match(Set dst (AndL src1 (RShiftL src2 src3)));
11321 
11322   ins_cost(1.9 * INSN_COST);
11323   format %{ "andr  $dst, $src1, $src2, ASR $src3" %}
11324 
11325   ins_encode %{
11326     __ andr(as_Register($dst$$reg),
11327               as_Register($src1$$reg),
11328               as_Register($src2$$reg),
11329               Assembler::ASR,
11330               $src3$$constant & 0x3f);
11331   %}
11332 
11333   ins_pipe(ialu_reg_reg_shift);
11334 %}
11335 
11336 instruct AndI_reg_LShift_reg(iRegINoSp dst,
11337                          iRegIorL2I src1, iRegIorL2I src2,
11338                          immI src3, rFlagsReg cr) %{
11339   match(Set dst (AndI src1 (LShiftI src2 src3)));
11340 
11341   ins_cost(1.9 * INSN_COST);
11342   format %{ "andw  $dst, $src1, $src2, LSL $src3" %}
11343 
11344   ins_encode %{
11345     __ andw(as_Register($dst$$reg),
11346               as_Register($src1$$reg),
11347               as_Register($src2$$reg),
11348               Assembler::LSL,
11349               $src3$$constant & 0x1f);
11350   %}
11351 
11352   ins_pipe(ialu_reg_reg_shift);
11353 %}
11354 
11355 instruct AndL_reg_LShift_reg(iRegLNoSp dst,
11356                          iRegL src1, iRegL src2,
11357                          immI src3, rFlagsReg cr) %{
11358   match(Set dst (AndL src1 (LShiftL src2 src3)));
11359 
11360   ins_cost(1.9 * INSN_COST);
11361   format %{ "andr  $dst, $src1, $src2, LSL $src3" %}
11362 
11363   ins_encode %{
11364     __ andr(as_Register($dst$$reg),
11365               as_Register($src1$$reg),
11366               as_Register($src2$$reg),
11367               Assembler::LSL,
11368               $src3$$constant & 0x3f);
11369   %}
11370 
11371   ins_pipe(ialu_reg_reg_shift);
11372 %}
11373 
11374 instruct XorI_reg_URShift_reg(iRegINoSp dst,
11375                          iRegIorL2I src1, iRegIorL2I src2,
11376                          immI src3, rFlagsReg cr) %{
11377   match(Set dst (XorI src1 (URShiftI src2 src3)));
11378 
11379   ins_cost(1.9 * INSN_COST);
11380   format %{ "eorw  $dst, $src1, $src2, LSR $src3" %}
11381 
11382   ins_encode %{
11383     __ eorw(as_Register($dst$$reg),
11384               as_Register($src1$$reg),
11385               as_Register($src2$$reg),
11386               Assembler::LSR,
11387               $src3$$constant & 0x1f);
11388   %}
11389 
11390   ins_pipe(ialu_reg_reg_shift);
11391 %}
11392 
11393 instruct XorL_reg_URShift_reg(iRegLNoSp dst,
11394                          iRegL src1, iRegL src2,
11395                          immI src3, rFlagsReg cr) %{
11396   match(Set dst (XorL src1 (URShiftL src2 src3)));
11397 
11398   ins_cost(1.9 * INSN_COST);
11399   format %{ "eor  $dst, $src1, $src2, LSR $src3" %}
11400 
11401   ins_encode %{
11402     __ eor(as_Register($dst$$reg),
11403               as_Register($src1$$reg),
11404               as_Register($src2$$reg),
11405               Assembler::LSR,
11406               $src3$$constant & 0x3f);
11407   %}
11408 
11409   ins_pipe(ialu_reg_reg_shift);
11410 %}
11411 
11412 instruct XorI_reg_RShift_reg(iRegINoSp dst,
11413                          iRegIorL2I src1, iRegIorL2I src2,
11414                          immI src3, rFlagsReg cr) %{
11415   match(Set dst (XorI src1 (RShiftI src2 src3)));
11416 
11417   ins_cost(1.9 * INSN_COST);
11418   format %{ "eorw  $dst, $src1, $src2, ASR $src3" %}
11419 
11420   ins_encode %{
11421     __ eorw(as_Register($dst$$reg),
11422               as_Register($src1$$reg),
11423               as_Register($src2$$reg),
11424               Assembler::ASR,
11425               $src3$$constant & 0x1f);
11426   %}
11427 
11428   ins_pipe(ialu_reg_reg_shift);
11429 %}
11430 
11431 instruct XorL_reg_RShift_reg(iRegLNoSp dst,
11432                          iRegL src1, iRegL src2,
11433                          immI src3, rFlagsReg cr) %{
11434   match(Set dst (XorL src1 (RShiftL src2 src3)));
11435 
11436   ins_cost(1.9 * INSN_COST);
11437   format %{ "eor  $dst, $src1, $src2, ASR $src3" %}
11438 
11439   ins_encode %{
11440     __ eor(as_Register($dst$$reg),
11441               as_Register($src1$$reg),
11442               as_Register($src2$$reg),
11443               Assembler::ASR,
11444               $src3$$constant & 0x3f);
11445   %}
11446 
11447   ins_pipe(ialu_reg_reg_shift);
11448 %}
11449 
11450 instruct XorI_reg_LShift_reg(iRegINoSp dst,
11451                          iRegIorL2I src1, iRegIorL2I src2,
11452                          immI src3, rFlagsReg cr) %{
11453   match(Set dst (XorI src1 (LShiftI src2 src3)));
11454 
11455   ins_cost(1.9 * INSN_COST);
11456   format %{ "eorw  $dst, $src1, $src2, LSL $src3" %}
11457 
11458   ins_encode %{
11459     __ eorw(as_Register($dst$$reg),
11460               as_Register($src1$$reg),
11461               as_Register($src2$$reg),
11462               Assembler::LSL,
11463               $src3$$constant & 0x1f);
11464   %}
11465 
11466   ins_pipe(ialu_reg_reg_shift);
11467 %}
11468 
11469 instruct XorL_reg_LShift_reg(iRegLNoSp dst,
11470                          iRegL src1, iRegL src2,
11471                          immI src3, rFlagsReg cr) %{
11472   match(Set dst (XorL src1 (LShiftL src2 src3)));
11473 
11474   ins_cost(1.9 * INSN_COST);
11475   format %{ "eor  $dst, $src1, $src2, LSL $src3" %}
11476 
11477   ins_encode %{
11478     __ eor(as_Register($dst$$reg),
11479               as_Register($src1$$reg),
11480               as_Register($src2$$reg),
11481               Assembler::LSL,
11482               $src3$$constant & 0x3f);
11483   %}
11484 
11485   ins_pipe(ialu_reg_reg_shift);
11486 %}
11487 
11488 instruct OrI_reg_URShift_reg(iRegINoSp dst,
11489                          iRegIorL2I src1, iRegIorL2I src2,
11490                          immI src3, rFlagsReg cr) %{
11491   match(Set dst (OrI src1 (URShiftI src2 src3)));
11492 
11493   ins_cost(1.9 * INSN_COST);
11494   format %{ "orrw  $dst, $src1, $src2, LSR $src3" %}
11495 
11496   ins_encode %{
11497     __ orrw(as_Register($dst$$reg),
11498               as_Register($src1$$reg),
11499               as_Register($src2$$reg),
11500               Assembler::LSR,
11501               $src3$$constant & 0x1f);
11502   %}
11503 
11504   ins_pipe(ialu_reg_reg_shift);
11505 %}
11506 
11507 instruct OrL_reg_URShift_reg(iRegLNoSp dst,
11508                          iRegL src1, iRegL src2,
11509                          immI src3, rFlagsReg cr) %{
11510   match(Set dst (OrL src1 (URShiftL src2 src3)));
11511 
11512   ins_cost(1.9 * INSN_COST);
11513   format %{ "orr  $dst, $src1, $src2, LSR $src3" %}
11514 
11515   ins_encode %{
11516     __ orr(as_Register($dst$$reg),
11517               as_Register($src1$$reg),
11518               as_Register($src2$$reg),
11519               Assembler::LSR,
11520               $src3$$constant & 0x3f);
11521   %}
11522 
11523   ins_pipe(ialu_reg_reg_shift);
11524 %}
11525 
11526 instruct OrI_reg_RShift_reg(iRegINoSp dst,
11527                          iRegIorL2I src1, iRegIorL2I src2,
11528                          immI src3, rFlagsReg cr) %{
11529   match(Set dst (OrI src1 (RShiftI src2 src3)));
11530 
11531   ins_cost(1.9 * INSN_COST);
11532   format %{ "orrw  $dst, $src1, $src2, ASR $src3" %}
11533 
11534   ins_encode %{
11535     __ orrw(as_Register($dst$$reg),
11536               as_Register($src1$$reg),
11537               as_Register($src2$$reg),
11538               Assembler::ASR,
11539               $src3$$constant & 0x1f);
11540   %}
11541 
11542   ins_pipe(ialu_reg_reg_shift);
11543 %}
11544 
11545 instruct OrL_reg_RShift_reg(iRegLNoSp dst,
11546                          iRegL src1, iRegL src2,
11547                          immI src3, rFlagsReg cr) %{
11548   match(Set dst (OrL src1 (RShiftL src2 src3)));
11549 
11550   ins_cost(1.9 * INSN_COST);
11551   format %{ "orr  $dst, $src1, $src2, ASR $src3" %}
11552 
11553   ins_encode %{
11554     __ orr(as_Register($dst$$reg),
11555               as_Register($src1$$reg),
11556               as_Register($src2$$reg),
11557               Assembler::ASR,
11558               $src3$$constant & 0x3f);
11559   %}
11560 
11561   ins_pipe(ialu_reg_reg_shift);
11562 %}
11563 
11564 instruct OrI_reg_LShift_reg(iRegINoSp dst,
11565                          iRegIorL2I src1, iRegIorL2I src2,
11566                          immI src3, rFlagsReg cr) %{
11567   match(Set dst (OrI src1 (LShiftI src2 src3)));
11568 
11569   ins_cost(1.9 * INSN_COST);
11570   format %{ "orrw  $dst, $src1, $src2, LSL $src3" %}
11571 
11572   ins_encode %{
11573     __ orrw(as_Register($dst$$reg),
11574               as_Register($src1$$reg),
11575               as_Register($src2$$reg),
11576               Assembler::LSL,
11577               $src3$$constant & 0x1f);
11578   %}
11579 
11580   ins_pipe(ialu_reg_reg_shift);
11581 %}
11582 
11583 instruct OrL_reg_LShift_reg(iRegLNoSp dst,
11584                          iRegL src1, iRegL src2,
11585                          immI src3, rFlagsReg cr) %{
11586   match(Set dst (OrL src1 (LShiftL src2 src3)));
11587 
11588   ins_cost(1.9 * INSN_COST);
11589   format %{ "orr  $dst, $src1, $src2, LSL $src3" %}
11590 
11591   ins_encode %{
11592     __ orr(as_Register($dst$$reg),
11593               as_Register($src1$$reg),
11594               as_Register($src2$$reg),
11595               Assembler::LSL,
11596               $src3$$constant & 0x3f);
11597   %}
11598 
11599   ins_pipe(ialu_reg_reg_shift);
11600 %}
11601 
11602 instruct AddI_reg_URShift_reg(iRegINoSp dst,
11603                          iRegIorL2I src1, iRegIorL2I src2,
11604                          immI src3, rFlagsReg cr) %{
11605   match(Set dst (AddI src1 (URShiftI src2 src3)));
11606 
11607   ins_cost(1.9 * INSN_COST);
11608   format %{ "addw  $dst, $src1, $src2, LSR $src3" %}
11609 
11610   ins_encode %{
11611     __ addw(as_Register($dst$$reg),
11612               as_Register($src1$$reg),
11613               as_Register($src2$$reg),
11614               Assembler::LSR,
11615               $src3$$constant & 0x1f);
11616   %}
11617 
11618   ins_pipe(ialu_reg_reg_shift);
11619 %}
11620 
11621 instruct AddL_reg_URShift_reg(iRegLNoSp dst,
11622                          iRegL src1, iRegL src2,
11623                          immI src3, rFlagsReg cr) %{
11624   match(Set dst (AddL src1 (URShiftL src2 src3)));
11625 
11626   ins_cost(1.9 * INSN_COST);
11627   format %{ "add  $dst, $src1, $src2, LSR $src3" %}
11628 
11629   ins_encode %{
11630     __ add(as_Register($dst$$reg),
11631               as_Register($src1$$reg),
11632               as_Register($src2$$reg),
11633               Assembler::LSR,
11634               $src3$$constant & 0x3f);
11635   %}
11636 
11637   ins_pipe(ialu_reg_reg_shift);
11638 %}
11639 
11640 instruct AddI_reg_RShift_reg(iRegINoSp dst,
11641                          iRegIorL2I src1, iRegIorL2I src2,
11642                          immI src3, rFlagsReg cr) %{
11643   match(Set dst (AddI src1 (RShiftI src2 src3)));
11644 
11645   ins_cost(1.9 * INSN_COST);
11646   format %{ "addw  $dst, $src1, $src2, ASR $src3" %}
11647 
11648   ins_encode %{
11649     __ addw(as_Register($dst$$reg),
11650               as_Register($src1$$reg),
11651               as_Register($src2$$reg),
11652               Assembler::ASR,
11653               $src3$$constant & 0x1f);
11654   %}
11655 
11656   ins_pipe(ialu_reg_reg_shift);
11657 %}
11658 
11659 instruct AddL_reg_RShift_reg(iRegLNoSp dst,
11660                          iRegL src1, iRegL src2,
11661                          immI src3, rFlagsReg cr) %{
11662   match(Set dst (AddL src1 (RShiftL src2 src3)));
11663 
11664   ins_cost(1.9 * INSN_COST);
11665   format %{ "add  $dst, $src1, $src2, ASR $src3" %}
11666 
11667   ins_encode %{
11668     __ add(as_Register($dst$$reg),
11669               as_Register($src1$$reg),
11670               as_Register($src2$$reg),
11671               Assembler::ASR,
11672               $src3$$constant & 0x3f);
11673   %}
11674 
11675   ins_pipe(ialu_reg_reg_shift);
11676 %}
11677 
11678 instruct AddI_reg_LShift_reg(iRegINoSp dst,
11679                          iRegIorL2I src1, iRegIorL2I src2,
11680                          immI src3, rFlagsReg cr) %{
11681   match(Set dst (AddI src1 (LShiftI src2 src3)));
11682 
11683   ins_cost(1.9 * INSN_COST);
11684   format %{ "addw  $dst, $src1, $src2, LSL $src3" %}
11685 
11686   ins_encode %{
11687     __ addw(as_Register($dst$$reg),
11688               as_Register($src1$$reg),
11689               as_Register($src2$$reg),
11690               Assembler::LSL,
11691               $src3$$constant & 0x1f);
11692   %}
11693 
11694   ins_pipe(ialu_reg_reg_shift);
11695 %}
11696 
11697 instruct AddL_reg_LShift_reg(iRegLNoSp dst,
11698                          iRegL src1, iRegL src2,
11699                          immI src3, rFlagsReg cr) %{
11700   match(Set dst (AddL src1 (LShiftL src2 src3)));
11701 
11702   ins_cost(1.9 * INSN_COST);
11703   format %{ "add  $dst, $src1, $src2, LSL $src3" %}
11704 
11705   ins_encode %{
11706     __ add(as_Register($dst$$reg),
11707               as_Register($src1$$reg),
11708               as_Register($src2$$reg),
11709               Assembler::LSL,
11710               $src3$$constant & 0x3f);
11711   %}
11712 
11713   ins_pipe(ialu_reg_reg_shift);
11714 %}
11715 
11716 instruct SubI_reg_URShift_reg(iRegINoSp dst,
11717                          iRegIorL2I src1, iRegIorL2I src2,
11718                          immI src3, rFlagsReg cr) %{
11719   match(Set dst (SubI src1 (URShiftI src2 src3)));
11720 
11721   ins_cost(1.9 * INSN_COST);
11722   format %{ "subw  $dst, $src1, $src2, LSR $src3" %}
11723 
11724   ins_encode %{
11725     __ subw(as_Register($dst$$reg),
11726               as_Register($src1$$reg),
11727               as_Register($src2$$reg),
11728               Assembler::LSR,
11729               $src3$$constant & 0x1f);
11730   %}
11731 
11732   ins_pipe(ialu_reg_reg_shift);
11733 %}
11734 
11735 instruct SubL_reg_URShift_reg(iRegLNoSp dst,
11736                          iRegL src1, iRegL src2,
11737                          immI src3, rFlagsReg cr) %{
11738   match(Set dst (SubL src1 (URShiftL src2 src3)));
11739 
11740   ins_cost(1.9 * INSN_COST);
11741   format %{ "sub  $dst, $src1, $src2, LSR $src3" %}
11742 
11743   ins_encode %{
11744     __ sub(as_Register($dst$$reg),
11745               as_Register($src1$$reg),
11746               as_Register($src2$$reg),
11747               Assembler::LSR,
11748               $src3$$constant & 0x3f);
11749   %}
11750 
11751   ins_pipe(ialu_reg_reg_shift);
11752 %}
11753 
11754 instruct SubI_reg_RShift_reg(iRegINoSp dst,
11755                          iRegIorL2I src1, iRegIorL2I src2,
11756                          immI src3, rFlagsReg cr) %{
11757   match(Set dst (SubI src1 (RShiftI src2 src3)));
11758 
11759   ins_cost(1.9 * INSN_COST);
11760   format %{ "subw  $dst, $src1, $src2, ASR $src3" %}
11761 
11762   ins_encode %{
11763     __ subw(as_Register($dst$$reg),
11764               as_Register($src1$$reg),
11765               as_Register($src2$$reg),
11766               Assembler::ASR,
11767               $src3$$constant & 0x1f);
11768   %}
11769 
11770   ins_pipe(ialu_reg_reg_shift);
11771 %}
11772 
11773 instruct SubL_reg_RShift_reg(iRegLNoSp dst,
11774                          iRegL src1, iRegL src2,
11775                          immI src3, rFlagsReg cr) %{
11776   match(Set dst (SubL src1 (RShiftL src2 src3)));
11777 
11778   ins_cost(1.9 * INSN_COST);
11779   format %{ "sub  $dst, $src1, $src2, ASR $src3" %}
11780 
11781   ins_encode %{
11782     __ sub(as_Register($dst$$reg),
11783               as_Register($src1$$reg),
11784               as_Register($src2$$reg),
11785               Assembler::ASR,
11786               $src3$$constant & 0x3f);
11787   %}
11788 
11789   ins_pipe(ialu_reg_reg_shift);
11790 %}
11791 
11792 instruct SubI_reg_LShift_reg(iRegINoSp dst,
11793                          iRegIorL2I src1, iRegIorL2I src2,
11794                          immI src3, rFlagsReg cr) %{
11795   match(Set dst (SubI src1 (LShiftI src2 src3)));
11796 
11797   ins_cost(1.9 * INSN_COST);
11798   format %{ "subw  $dst, $src1, $src2, LSL $src3" %}
11799 
11800   ins_encode %{
11801     __ subw(as_Register($dst$$reg),
11802               as_Register($src1$$reg),
11803               as_Register($src2$$reg),
11804               Assembler::LSL,
11805               $src3$$constant & 0x1f);
11806   %}
11807 
11808   ins_pipe(ialu_reg_reg_shift);
11809 %}
11810 
11811 instruct SubL_reg_LShift_reg(iRegLNoSp dst,
11812                          iRegL src1, iRegL src2,
11813                          immI src3, rFlagsReg cr) %{
11814   match(Set dst (SubL src1 (LShiftL src2 src3)));
11815 
11816   ins_cost(1.9 * INSN_COST);
11817   format %{ "sub  $dst, $src1, $src2, LSL $src3" %}
11818 
11819   ins_encode %{
11820     __ sub(as_Register($dst$$reg),
11821               as_Register($src1$$reg),
11822               as_Register($src2$$reg),
11823               Assembler::LSL,
11824               $src3$$constant & 0x3f);
11825   %}
11826 
11827   ins_pipe(ialu_reg_reg_shift);
11828 %}
11829 
11830 
11831 
11832 // Shift Left followed by Shift Right.
11833 // This idiom is used by the compiler for the i2b bytecode etc.
11834 instruct sbfmL(iRegLNoSp dst, iRegL src, immI lshift_count, immI rshift_count)
11835 %{
11836   match(Set dst (RShiftL (LShiftL src lshift_count) rshift_count));
11837   ins_cost(INSN_COST * 2);
11838   format %{ "sbfm  $dst, $src, $rshift_count - $lshift_count, #63 - $lshift_count" %}
11839   ins_encode %{
11840     int lshift = $lshift_count$$constant & 63;
11841     int rshift = $rshift_count$$constant & 63;
11842     int s = 63 - lshift;
11843     int r = (rshift - lshift) & 63;
11844     __ sbfm(as_Register($dst$$reg),
11845             as_Register($src$$reg),
11846             r, s);
11847   %}
11848 
11849   ins_pipe(ialu_reg_shift);
11850 %}
11851 
11852 // Shift Left followed by Shift Right.
11853 // This idiom is used by the compiler for the i2b bytecode etc.
11854 instruct sbfmwI(iRegINoSp dst, iRegIorL2I src, immI lshift_count, immI rshift_count)
11855 %{
11856   match(Set dst (RShiftI (LShiftI src lshift_count) rshift_count));
11857   ins_cost(INSN_COST * 2);
11858   format %{ "sbfmw  $dst, $src, $rshift_count - $lshift_count, #31 - $lshift_count" %}
11859   ins_encode %{
11860     int lshift = $lshift_count$$constant & 31;
11861     int rshift = $rshift_count$$constant & 31;
11862     int s = 31 - lshift;
11863     int r = (rshift - lshift) & 31;
11864     __ sbfmw(as_Register($dst$$reg),
11865             as_Register($src$$reg),
11866             r, s);
11867   %}
11868 
11869   ins_pipe(ialu_reg_shift);
11870 %}
11871 
11872 // Shift Left followed by Shift Right.
11873 // This idiom is used by the compiler for the i2b bytecode etc.
11874 instruct ubfmL(iRegLNoSp dst, iRegL src, immI lshift_count, immI rshift_count)
11875 %{
11876   match(Set dst (URShiftL (LShiftL src lshift_count) rshift_count));
11877   ins_cost(INSN_COST * 2);
11878   format %{ "ubfm  $dst, $src, $rshift_count - $lshift_count, #63 - $lshift_count" %}
11879   ins_encode %{
11880     int lshift = $lshift_count$$constant & 63;
11881     int rshift = $rshift_count$$constant & 63;
11882     int s = 63 - lshift;
11883     int r = (rshift - lshift) & 63;
11884     __ ubfm(as_Register($dst$$reg),
11885             as_Register($src$$reg),
11886             r, s);
11887   %}
11888 
11889   ins_pipe(ialu_reg_shift);
11890 %}
11891 
11892 // Shift Left followed by Shift Right.
11893 // This idiom is used by the compiler for the i2b bytecode etc.
11894 instruct ubfmwI(iRegINoSp dst, iRegIorL2I src, immI lshift_count, immI rshift_count)
11895 %{
11896   match(Set dst (URShiftI (LShiftI src lshift_count) rshift_count));
11897   ins_cost(INSN_COST * 2);
11898   format %{ "ubfmw  $dst, $src, $rshift_count - $lshift_count, #31 - $lshift_count" %}
11899   ins_encode %{
11900     int lshift = $lshift_count$$constant & 31;
11901     int rshift = $rshift_count$$constant & 31;
11902     int s = 31 - lshift;
11903     int r = (rshift - lshift) & 31;
11904     __ ubfmw(as_Register($dst$$reg),
11905             as_Register($src$$reg),
11906             r, s);
11907   %}
11908 
11909   ins_pipe(ialu_reg_shift);
11910 %}
11911 // Bitfield extract with shift & mask
11912 
11913 instruct ubfxwI(iRegINoSp dst, iRegIorL2I src, immI rshift, immI_bitmask mask)
11914 %{
11915   match(Set dst (AndI (URShiftI src rshift) mask));
11916   // Make sure we are not going to exceed what ubfxw can do.
11917   predicate((exact_log2(n->in(2)->get_int() + 1) + (n->in(1)->in(2)->get_int() & 31)) <= (31 + 1));
11918 
11919   ins_cost(INSN_COST);
11920   format %{ "ubfxw $dst, $src, $rshift, $mask" %}
11921   ins_encode %{
11922     int rshift = $rshift$$constant & 31;
11923     long mask = $mask$$constant;
11924     int width = exact_log2(mask+1);
11925     __ ubfxw(as_Register($dst$$reg),
11926             as_Register($src$$reg), rshift, width);
11927   %}
11928   ins_pipe(ialu_reg_shift);
11929 %}
11930 instruct ubfxL(iRegLNoSp dst, iRegL src, immI rshift, immL_bitmask mask)
11931 %{
11932   match(Set dst (AndL (URShiftL src rshift) mask));
11933   // Make sure we are not going to exceed what ubfx can do.
11934   predicate((exact_log2_long(n->in(2)->get_long() + 1) + (n->in(1)->in(2)->get_int() & 63)) <= (63 + 1));
11935 
11936   ins_cost(INSN_COST);
11937   format %{ "ubfx $dst, $src, $rshift, $mask" %}
11938   ins_encode %{
11939     int rshift = $rshift$$constant & 63;
11940     long mask = $mask$$constant;
11941     int width = exact_log2_long(mask+1);
11942     __ ubfx(as_Register($dst$$reg),
11943             as_Register($src$$reg), rshift, width);
11944   %}
11945   ins_pipe(ialu_reg_shift);
11946 %}
11947 
11948 // We can use ubfx when extending an And with a mask when we know mask
11949 // is positive.  We know that because immI_bitmask guarantees it.
11950 instruct ubfxIConvI2L(iRegLNoSp dst, iRegIorL2I src, immI rshift, immI_bitmask mask)
11951 %{
11952   match(Set dst (ConvI2L (AndI (URShiftI src rshift) mask)));
11953   // Make sure we are not going to exceed what ubfxw can do.
11954   predicate((exact_log2(n->in(1)->in(2)->get_int() + 1) + (n->in(1)->in(1)->in(2)->get_int() & 31)) <= (31 + 1));
11955 
11956   ins_cost(INSN_COST * 2);
11957   format %{ "ubfx $dst, $src, $rshift, $mask" %}
11958   ins_encode %{
11959     int rshift = $rshift$$constant & 31;
11960     long mask = $mask$$constant;
11961     int width = exact_log2(mask+1);
11962     __ ubfx(as_Register($dst$$reg),
11963             as_Register($src$$reg), rshift, width);
11964   %}
11965   ins_pipe(ialu_reg_shift);
11966 %}
11967 
11968 // We can use ubfiz when masking by a positive number and then left shifting the result.
11969 // We know that the mask is positive because immI_bitmask guarantees it.
11970 instruct ubfizwI(iRegINoSp dst, iRegIorL2I src, immI lshift, immI_bitmask mask)
11971 %{
11972   match(Set dst (LShiftI (AndI src mask) lshift));
11973   predicate((exact_log2(n->in(1)->in(2)->get_int() + 1) + (n->in(2)->get_int() & 31)) <= (31 + 1));
11974 
11975   ins_cost(INSN_COST);
11976   format %{ "ubfizw $dst, $src, $lshift, $mask" %}
11977   ins_encode %{
11978     int lshift = $lshift$$constant & 31;
11979     long mask = $mask$$constant;
11980     int width = exact_log2(mask+1);
11981     __ ubfizw(as_Register($dst$$reg),
11982           as_Register($src$$reg), lshift, width);
11983   %}
11984   ins_pipe(ialu_reg_shift);
11985 %}
11986 // We can use ubfiz when masking by a positive number and then left shifting the result.
11987 // We know that the mask is positive because immL_bitmask guarantees it.
11988 instruct ubfizL(iRegLNoSp dst, iRegL src, immI lshift, immL_bitmask mask)
11989 %{
11990   match(Set dst (LShiftL (AndL src mask) lshift));
11991   predicate((exact_log2_long(n->in(1)->in(2)->get_long() + 1) + (n->in(2)->get_int() & 63)) <= (63 + 1));
11992 
11993   ins_cost(INSN_COST);
11994   format %{ "ubfiz $dst, $src, $lshift, $mask" %}
11995   ins_encode %{
11996     int lshift = $lshift$$constant & 63;
11997     long mask = $mask$$constant;
11998     int width = exact_log2_long(mask+1);
11999     __ ubfiz(as_Register($dst$$reg),
12000           as_Register($src$$reg), lshift, width);
12001   %}
12002   ins_pipe(ialu_reg_shift);
12003 %}
12004 
12005 // If there is a convert I to L block between and AndI and a LShiftL, we can also match ubfiz
12006 instruct ubfizIConvI2L(iRegLNoSp dst, iRegIorL2I src, immI lshift, immI_bitmask mask)
12007 %{
12008   match(Set dst (LShiftL (ConvI2L (AndI src mask)) lshift));
12009   predicate((exact_log2(n->in(1)->in(1)->in(2)->get_int() + 1) + (n->in(2)->get_int() & 63)) <= (63 + 1));
12010 
12011   ins_cost(INSN_COST);
12012   format %{ "ubfiz $dst, $src, $lshift, $mask" %}
12013   ins_encode %{
12014     int lshift = $lshift$$constant & 63;
12015     long mask = $mask$$constant;
12016     int width = exact_log2(mask+1);
12017     __ ubfiz(as_Register($dst$$reg),
12018              as_Register($src$$reg), lshift, width);
12019   %}
12020   ins_pipe(ialu_reg_shift);
12021 %}
12022 
12023 // Rotations
12024 
12025 instruct extrOrL(iRegLNoSp dst, iRegL src1, iRegL src2, immI lshift, immI rshift, rFlagsReg cr)
12026 %{
12027   match(Set dst (OrL (LShiftL src1 lshift) (URShiftL src2 rshift)));
12028   predicate(0 == (((n->in(1)->in(2)->get_int() & 63) + (n->in(2)->in(2)->get_int() & 63)) & 63));
12029 
12030   ins_cost(INSN_COST);
12031   format %{ "extr $dst, $src1, $src2, #$rshift" %}
12032 
12033   ins_encode %{
12034     __ extr(as_Register($dst$$reg), as_Register($src1$$reg), as_Register($src2$$reg),
12035             $rshift$$constant & 63);
12036   %}
12037   ins_pipe(ialu_reg_reg_extr);
12038 %}
12039 
12040 instruct extrOrI(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI lshift, immI rshift, rFlagsReg cr)
12041 %{
12042   match(Set dst (OrI (LShiftI src1 lshift) (URShiftI src2 rshift)));
12043   predicate(0 == (((n->in(1)->in(2)->get_int() & 31) + (n->in(2)->in(2)->get_int() & 31)) & 31));
12044 
12045   ins_cost(INSN_COST);
12046   format %{ "extr $dst, $src1, $src2, #$rshift" %}
12047 
12048   ins_encode %{
12049     __ extrw(as_Register($dst$$reg), as_Register($src1$$reg), as_Register($src2$$reg),
12050             $rshift$$constant & 31);
12051   %}
12052   ins_pipe(ialu_reg_reg_extr);
12053 %}
12054 
12055 instruct extrAddL(iRegLNoSp dst, iRegL src1, iRegL src2, immI lshift, immI rshift, rFlagsReg cr)
12056 %{
12057   match(Set dst (AddL (LShiftL src1 lshift) (URShiftL src2 rshift)));
12058   predicate(0 == (((n->in(1)->in(2)->get_int() & 63) + (n->in(2)->in(2)->get_int() & 63)) & 63));
12059 
12060   ins_cost(INSN_COST);
12061   format %{ "extr $dst, $src1, $src2, #$rshift" %}
12062 
12063   ins_encode %{
12064     __ extr(as_Register($dst$$reg), as_Register($src1$$reg), as_Register($src2$$reg),
12065             $rshift$$constant & 63);
12066   %}
12067   ins_pipe(ialu_reg_reg_extr);
12068 %}
12069 
12070 instruct extrAddI(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI lshift, immI rshift, rFlagsReg cr)
12071 %{
12072   match(Set dst (AddI (LShiftI src1 lshift) (URShiftI src2 rshift)));
12073   predicate(0 == (((n->in(1)->in(2)->get_int() & 31) + (n->in(2)->in(2)->get_int() & 31)) & 31));
12074 
12075   ins_cost(INSN_COST);
12076   format %{ "extr $dst, $src1, $src2, #$rshift" %}
12077 
12078   ins_encode %{
12079     __ extrw(as_Register($dst$$reg), as_Register($src1$$reg), as_Register($src2$$reg),
12080             $rshift$$constant & 31);
12081   %}
12082   ins_pipe(ialu_reg_reg_extr);
12083 %}
12084 
12085 
12086 // rol expander
12087 
12088 instruct rolL_rReg(iRegLNoSp dst, iRegL src, iRegI shift, rFlagsReg cr)
12089 %{
12090   effect(DEF dst, USE src, USE shift);
12091 
12092   format %{ "rol    $dst, $src, $shift" %}
12093   ins_cost(INSN_COST * 3);
12094   ins_encode %{
12095     __ subw(rscratch1, zr, as_Register($shift$$reg));
12096     __ rorv(as_Register($dst$$reg), as_Register($src$$reg),
12097             rscratch1);
12098     %}
12099   ins_pipe(ialu_reg_reg_vshift);
12100 %}
12101 
12102 // rol expander
12103 
12104 instruct rolI_rReg(iRegINoSp dst, iRegI src, iRegI shift, rFlagsReg cr)
12105 %{
12106   effect(DEF dst, USE src, USE shift);
12107 
12108   format %{ "rol    $dst, $src, $shift" %}
12109   ins_cost(INSN_COST * 3);
12110   ins_encode %{
12111     __ subw(rscratch1, zr, as_Register($shift$$reg));
12112     __ rorvw(as_Register($dst$$reg), as_Register($src$$reg),
12113             rscratch1);
12114     %}
12115   ins_pipe(ialu_reg_reg_vshift);
12116 %}
12117 
12118 instruct rolL_rReg_Var_C_64(iRegLNoSp dst, iRegL src, iRegI shift, immI_64 c_64, rFlagsReg cr)
12119 %{
12120   match(Set dst (OrL (LShiftL src shift) (URShiftL src (SubI c_64 shift))));
12121 
12122   expand %{
12123     rolL_rReg(dst, src, shift, cr);
12124   %}
12125 %}
12126 
12127 instruct rolL_rReg_Var_C0(iRegLNoSp dst, iRegL src, iRegI shift, immI0 c0, rFlagsReg cr)
12128 %{
12129   match(Set dst (OrL (LShiftL src shift) (URShiftL src (SubI c0 shift))));
12130 
12131   expand %{
12132     rolL_rReg(dst, src, shift, cr);
12133   %}
12134 %}
12135 
12136 instruct rolI_rReg_Var_C_32(iRegINoSp dst, iRegI src, iRegI shift, immI_32 c_32, rFlagsReg cr)
12137 %{
12138   match(Set dst (OrI (LShiftI src shift) (URShiftI src (SubI c_32 shift))));
12139 
12140   expand %{
12141     rolI_rReg(dst, src, shift, cr);
12142   %}
12143 %}
12144 
12145 instruct rolI_rReg_Var_C0(iRegINoSp dst, iRegI src, iRegI shift, immI0 c0, rFlagsReg cr)
12146 %{
12147   match(Set dst (OrI (LShiftI src shift) (URShiftI src (SubI c0 shift))));
12148 
12149   expand %{
12150     rolI_rReg(dst, src, shift, cr);
12151   %}
12152 %}
12153 
12154 // ror expander
12155 
12156 instruct rorL_rReg(iRegLNoSp dst, iRegL src, iRegI shift, rFlagsReg cr)
12157 %{
12158   effect(DEF dst, USE src, USE shift);
12159 
12160   format %{ "ror    $dst, $src, $shift" %}
12161   ins_cost(INSN_COST);
12162   ins_encode %{
12163     __ rorv(as_Register($dst$$reg), as_Register($src$$reg),
12164             as_Register($shift$$reg));
12165     %}
12166   ins_pipe(ialu_reg_reg_vshift);
12167 %}
12168 
12169 // ror expander
12170 
12171 instruct rorI_rReg(iRegINoSp dst, iRegI src, iRegI shift, rFlagsReg cr)
12172 %{
12173   effect(DEF dst, USE src, USE shift);
12174 
12175   format %{ "ror    $dst, $src, $shift" %}
12176   ins_cost(INSN_COST);
12177   ins_encode %{
12178     __ rorvw(as_Register($dst$$reg), as_Register($src$$reg),
12179             as_Register($shift$$reg));
12180     %}
12181   ins_pipe(ialu_reg_reg_vshift);
12182 %}
12183 
12184 instruct rorL_rReg_Var_C_64(iRegLNoSp dst, iRegL src, iRegI shift, immI_64 c_64, rFlagsReg cr)
12185 %{
12186   match(Set dst (OrL (URShiftL src shift) (LShiftL src (SubI c_64 shift))));
12187 
12188   expand %{
12189     rorL_rReg(dst, src, shift, cr);
12190   %}
12191 %}
12192 
12193 instruct rorL_rReg_Var_C0(iRegLNoSp dst, iRegL src, iRegI shift, immI0 c0, rFlagsReg cr)
12194 %{
12195   match(Set dst (OrL (URShiftL src shift) (LShiftL src (SubI c0 shift))));
12196 
12197   expand %{
12198     rorL_rReg(dst, src, shift, cr);
12199   %}
12200 %}
12201 
12202 instruct rorI_rReg_Var_C_32(iRegINoSp dst, iRegI src, iRegI shift, immI_32 c_32, rFlagsReg cr)
12203 %{
12204   match(Set dst (OrI (URShiftI src shift) (LShiftI src (SubI c_32 shift))));
12205 
12206   expand %{
12207     rorI_rReg(dst, src, shift, cr);
12208   %}
12209 %}
12210 
12211 instruct rorI_rReg_Var_C0(iRegINoSp dst, iRegI src, iRegI shift, immI0 c0, rFlagsReg cr)
12212 %{
12213   match(Set dst (OrI (URShiftI src shift) (LShiftI src (SubI c0 shift))));
12214 
12215   expand %{
12216     rorI_rReg(dst, src, shift, cr);
12217   %}
12218 %}
12219 
12220 // Add/subtract (extended)
12221 
12222 instruct AddExtI(iRegLNoSp dst, iRegL src1, iRegIorL2I src2, rFlagsReg cr)
12223 %{
12224   match(Set dst (AddL src1 (ConvI2L src2)));
12225   ins_cost(INSN_COST);
12226   format %{ "add  $dst, $src1, $src2, sxtw" %}
12227 
12228    ins_encode %{
12229      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12230             as_Register($src2$$reg), ext::sxtw);
12231    %}
12232   ins_pipe(ialu_reg_reg);
12233 %};
12234 
12235 instruct SubExtI(iRegLNoSp dst, iRegL src1, iRegIorL2I src2, rFlagsReg cr)
12236 %{
12237   match(Set dst (SubL src1 (ConvI2L src2)));
12238   ins_cost(INSN_COST);
12239   format %{ "sub  $dst, $src1, $src2, sxtw" %}
12240 
12241    ins_encode %{
12242      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12243             as_Register($src2$$reg), ext::sxtw);
12244    %}
12245   ins_pipe(ialu_reg_reg);
12246 %};
12247 
12248 
12249 instruct AddExtI_sxth(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_16 lshift, immI_16 rshift, rFlagsReg cr)
12250 %{
12251   match(Set dst (AddI src1 (RShiftI (LShiftI src2 lshift) rshift)));
12252   ins_cost(INSN_COST);
12253   format %{ "add  $dst, $src1, $src2, sxth" %}
12254 
12255    ins_encode %{
12256      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12257             as_Register($src2$$reg), ext::sxth);
12258    %}
12259   ins_pipe(ialu_reg_reg);
12260 %}
12261 
12262 instruct AddExtI_sxtb(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_24 lshift, immI_24 rshift, rFlagsReg cr)
12263 %{
12264   match(Set dst (AddI src1 (RShiftI (LShiftI src2 lshift) rshift)));
12265   ins_cost(INSN_COST);
12266   format %{ "add  $dst, $src1, $src2, sxtb" %}
12267 
12268    ins_encode %{
12269      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12270             as_Register($src2$$reg), ext::sxtb);
12271    %}
12272   ins_pipe(ialu_reg_reg);
12273 %}
12274 
12275 instruct AddExtI_uxtb(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_24 lshift, immI_24 rshift, rFlagsReg cr)
12276 %{
12277   match(Set dst (AddI src1 (URShiftI (LShiftI src2 lshift) rshift)));
12278   ins_cost(INSN_COST);
12279   format %{ "add  $dst, $src1, $src2, uxtb" %}
12280 
12281    ins_encode %{
12282      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12283             as_Register($src2$$reg), ext::uxtb);
12284    %}
12285   ins_pipe(ialu_reg_reg);
12286 %}
12287 
12288 instruct AddExtL_sxth(iRegLNoSp dst, iRegL src1, iRegL src2, immI_48 lshift, immI_48 rshift, rFlagsReg cr)
12289 %{
12290   match(Set dst (AddL src1 (RShiftL (LShiftL src2 lshift) rshift)));
12291   ins_cost(INSN_COST);
12292   format %{ "add  $dst, $src1, $src2, sxth" %}
12293 
12294    ins_encode %{
12295      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12296             as_Register($src2$$reg), ext::sxth);
12297    %}
12298   ins_pipe(ialu_reg_reg);
12299 %}
12300 
12301 instruct AddExtL_sxtw(iRegLNoSp dst, iRegL src1, iRegL src2, immI_32 lshift, immI_32 rshift, rFlagsReg cr)
12302 %{
12303   match(Set dst (AddL src1 (RShiftL (LShiftL src2 lshift) rshift)));
12304   ins_cost(INSN_COST);
12305   format %{ "add  $dst, $src1, $src2, sxtw" %}
12306 
12307    ins_encode %{
12308      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12309             as_Register($src2$$reg), ext::sxtw);
12310    %}
12311   ins_pipe(ialu_reg_reg);
12312 %}
12313 
12314 instruct AddExtL_sxtb(iRegLNoSp dst, iRegL src1, iRegL src2, immI_56 lshift, immI_56 rshift, rFlagsReg cr)
12315 %{
12316   match(Set dst (AddL src1 (RShiftL (LShiftL src2 lshift) rshift)));
12317   ins_cost(INSN_COST);
12318   format %{ "add  $dst, $src1, $src2, sxtb" %}
12319 
12320    ins_encode %{
12321      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12322             as_Register($src2$$reg), ext::sxtb);
12323    %}
12324   ins_pipe(ialu_reg_reg);
12325 %}
12326 
12327 instruct AddExtL_uxtb(iRegLNoSp dst, iRegL src1, iRegL src2, immI_56 lshift, immI_56 rshift, rFlagsReg cr)
12328 %{
12329   match(Set dst (AddL src1 (URShiftL (LShiftL src2 lshift) rshift)));
12330   ins_cost(INSN_COST);
12331   format %{ "add  $dst, $src1, $src2, uxtb" %}
12332 
12333    ins_encode %{
12334      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12335             as_Register($src2$$reg), ext::uxtb);
12336    %}
12337   ins_pipe(ialu_reg_reg);
12338 %}
12339 
12340 
12341 instruct AddExtI_uxtb_and(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_255 mask, rFlagsReg cr)
12342 %{
12343   match(Set dst (AddI src1 (AndI src2 mask)));
12344   ins_cost(INSN_COST);
12345   format %{ "addw  $dst, $src1, $src2, uxtb" %}
12346 
12347    ins_encode %{
12348      __ addw(as_Register($dst$$reg), as_Register($src1$$reg),
12349             as_Register($src2$$reg), ext::uxtb);
12350    %}
12351   ins_pipe(ialu_reg_reg);
12352 %}
12353 
12354 instruct AddExtI_uxth_and(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_65535 mask, rFlagsReg cr)
12355 %{
12356   match(Set dst (AddI src1 (AndI src2 mask)));
12357   ins_cost(INSN_COST);
12358   format %{ "addw  $dst, $src1, $src2, uxth" %}
12359 
12360    ins_encode %{
12361      __ addw(as_Register($dst$$reg), as_Register($src1$$reg),
12362             as_Register($src2$$reg), ext::uxth);
12363    %}
12364   ins_pipe(ialu_reg_reg);
12365 %}
12366 
12367 instruct AddExtL_uxtb_and(iRegLNoSp dst, iRegL src1, iRegL src2, immL_255 mask, rFlagsReg cr)
12368 %{
12369   match(Set dst (AddL src1 (AndL src2 mask)));
12370   ins_cost(INSN_COST);
12371   format %{ "add  $dst, $src1, $src2, uxtb" %}
12372 
12373    ins_encode %{
12374      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12375             as_Register($src2$$reg), ext::uxtb);
12376    %}
12377   ins_pipe(ialu_reg_reg);
12378 %}
12379 
12380 instruct AddExtL_uxth_and(iRegLNoSp dst, iRegL src1, iRegL src2, immL_65535 mask, rFlagsReg cr)
12381 %{
12382   match(Set dst (AddL src1 (AndL src2 mask)));
12383   ins_cost(INSN_COST);
12384   format %{ "add  $dst, $src1, $src2, uxth" %}
12385 
12386    ins_encode %{
12387      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12388             as_Register($src2$$reg), ext::uxth);
12389    %}
12390   ins_pipe(ialu_reg_reg);
12391 %}
12392 
12393 instruct AddExtL_uxtw_and(iRegLNoSp dst, iRegL src1, iRegL src2, immL_4294967295 mask, rFlagsReg cr)
12394 %{
12395   match(Set dst (AddL src1 (AndL src2 mask)));
12396   ins_cost(INSN_COST);
12397   format %{ "add  $dst, $src1, $src2, uxtw" %}
12398 
12399    ins_encode %{
12400      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12401             as_Register($src2$$reg), ext::uxtw);
12402    %}
12403   ins_pipe(ialu_reg_reg);
12404 %}
12405 
12406 instruct SubExtI_uxtb_and(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_255 mask, rFlagsReg cr)
12407 %{
12408   match(Set dst (SubI src1 (AndI src2 mask)));
12409   ins_cost(INSN_COST);
12410   format %{ "subw  $dst, $src1, $src2, uxtb" %}
12411 
12412    ins_encode %{
12413      __ subw(as_Register($dst$$reg), as_Register($src1$$reg),
12414             as_Register($src2$$reg), ext::uxtb);
12415    %}
12416   ins_pipe(ialu_reg_reg);
12417 %}
12418 
12419 instruct SubExtI_uxth_and(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_65535 mask, rFlagsReg cr)
12420 %{
12421   match(Set dst (SubI src1 (AndI src2 mask)));
12422   ins_cost(INSN_COST);
12423   format %{ "subw  $dst, $src1, $src2, uxth" %}
12424 
12425    ins_encode %{
12426      __ subw(as_Register($dst$$reg), as_Register($src1$$reg),
12427             as_Register($src2$$reg), ext::uxth);
12428    %}
12429   ins_pipe(ialu_reg_reg);
12430 %}
12431 
12432 instruct SubExtL_uxtb_and(iRegLNoSp dst, iRegL src1, iRegL src2, immL_255 mask, rFlagsReg cr)
12433 %{
12434   match(Set dst (SubL src1 (AndL src2 mask)));
12435   ins_cost(INSN_COST);
12436   format %{ "sub  $dst, $src1, $src2, uxtb" %}
12437 
12438    ins_encode %{
12439      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12440             as_Register($src2$$reg), ext::uxtb);
12441    %}
12442   ins_pipe(ialu_reg_reg);
12443 %}
12444 
12445 instruct SubExtL_uxth_and(iRegLNoSp dst, iRegL src1, iRegL src2, immL_65535 mask, rFlagsReg cr)
12446 %{
12447   match(Set dst (SubL src1 (AndL src2 mask)));
12448   ins_cost(INSN_COST);
12449   format %{ "sub  $dst, $src1, $src2, uxth" %}
12450 
12451    ins_encode %{
12452      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12453             as_Register($src2$$reg), ext::uxth);
12454    %}
12455   ins_pipe(ialu_reg_reg);
12456 %}
12457 
12458 instruct SubExtL_uxtw_and(iRegLNoSp dst, iRegL src1, iRegL src2, immL_4294967295 mask, rFlagsReg cr)
12459 %{
12460   match(Set dst (SubL src1 (AndL src2 mask)));
12461   ins_cost(INSN_COST);
12462   format %{ "sub  $dst, $src1, $src2, uxtw" %}
12463 
12464    ins_encode %{
12465      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12466             as_Register($src2$$reg), ext::uxtw);
12467    %}
12468   ins_pipe(ialu_reg_reg);
12469 %}
12470 
12471 
12472 instruct AddExtL_sxtb_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immIExt lshift2, immI_56 lshift1, immI_56 rshift1, rFlagsReg cr)
12473 %{
12474   match(Set dst (AddL src1 (LShiftL (RShiftL (LShiftL src2 lshift1) rshift1) lshift2)));
12475   ins_cost(1.9 * INSN_COST);
12476   format %{ "add  $dst, $src1, $src2, sxtb #lshift2" %}
12477 
12478    ins_encode %{
12479      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12480             as_Register($src2$$reg), ext::sxtb, ($lshift2$$constant));
12481    %}
12482   ins_pipe(ialu_reg_reg_shift);
12483 %}
12484 
12485 instruct AddExtL_sxth_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immIExt lshift2, immI_48 lshift1, immI_48 rshift1, rFlagsReg cr)
12486 %{
12487   match(Set dst (AddL src1 (LShiftL (RShiftL (LShiftL src2 lshift1) rshift1) lshift2)));
12488   ins_cost(1.9 * INSN_COST);
12489   format %{ "add  $dst, $src1, $src2, sxth #lshift2" %}
12490 
12491    ins_encode %{
12492      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12493             as_Register($src2$$reg), ext::sxth, ($lshift2$$constant));
12494    %}
12495   ins_pipe(ialu_reg_reg_shift);
12496 %}
12497 
12498 instruct AddExtL_sxtw_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immIExt lshift2, immI_32 lshift1, immI_32 rshift1, rFlagsReg cr)
12499 %{
12500   match(Set dst (AddL src1 (LShiftL (RShiftL (LShiftL src2 lshift1) rshift1) lshift2)));
12501   ins_cost(1.9 * INSN_COST);
12502   format %{ "add  $dst, $src1, $src2, sxtw #lshift2" %}
12503 
12504    ins_encode %{
12505      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12506             as_Register($src2$$reg), ext::sxtw, ($lshift2$$constant));
12507    %}
12508   ins_pipe(ialu_reg_reg_shift);
12509 %}
12510 
12511 instruct SubExtL_sxtb_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immIExt lshift2, immI_56 lshift1, immI_56 rshift1, rFlagsReg cr)
12512 %{
12513   match(Set dst (SubL src1 (LShiftL (RShiftL (LShiftL src2 lshift1) rshift1) lshift2)));
12514   ins_cost(1.9 * INSN_COST);
12515   format %{ "sub  $dst, $src1, $src2, sxtb #lshift2" %}
12516 
12517    ins_encode %{
12518      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12519             as_Register($src2$$reg), ext::sxtb, ($lshift2$$constant));
12520    %}
12521   ins_pipe(ialu_reg_reg_shift);
12522 %}
12523 
12524 instruct SubExtL_sxth_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immIExt lshift2, immI_48 lshift1, immI_48 rshift1, rFlagsReg cr)
12525 %{
12526   match(Set dst (SubL src1 (LShiftL (RShiftL (LShiftL src2 lshift1) rshift1) lshift2)));
12527   ins_cost(1.9 * INSN_COST);
12528   format %{ "sub  $dst, $src1, $src2, sxth #lshift2" %}
12529 
12530    ins_encode %{
12531      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12532             as_Register($src2$$reg), ext::sxth, ($lshift2$$constant));
12533    %}
12534   ins_pipe(ialu_reg_reg_shift);
12535 %}
12536 
12537 instruct SubExtL_sxtw_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immIExt lshift2, immI_32 lshift1, immI_32 rshift1, rFlagsReg cr)
12538 %{
12539   match(Set dst (SubL src1 (LShiftL (RShiftL (LShiftL src2 lshift1) rshift1) lshift2)));
12540   ins_cost(1.9 * INSN_COST);
12541   format %{ "sub  $dst, $src1, $src2, sxtw #lshift2" %}
12542 
12543    ins_encode %{
12544      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12545             as_Register($src2$$reg), ext::sxtw, ($lshift2$$constant));
12546    %}
12547   ins_pipe(ialu_reg_reg_shift);
12548 %}
12549 
12550 instruct AddExtI_sxtb_shift(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immIExt lshift2, immI_24 lshift1, immI_24 rshift1, rFlagsReg cr)
12551 %{
12552   match(Set dst (AddI src1 (LShiftI (RShiftI (LShiftI src2 lshift1) rshift1) lshift2)));
12553   ins_cost(1.9 * INSN_COST);
12554   format %{ "addw  $dst, $src1, $src2, sxtb #lshift2" %}
12555 
12556    ins_encode %{
12557      __ addw(as_Register($dst$$reg), as_Register($src1$$reg),
12558             as_Register($src2$$reg), ext::sxtb, ($lshift2$$constant));
12559    %}
12560   ins_pipe(ialu_reg_reg_shift);
12561 %}
12562 
12563 instruct AddExtI_sxth_shift(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immIExt lshift2, immI_16 lshift1, immI_16 rshift1, rFlagsReg cr)
12564 %{
12565   match(Set dst (AddI src1 (LShiftI (RShiftI (LShiftI src2 lshift1) rshift1) lshift2)));
12566   ins_cost(1.9 * INSN_COST);
12567   format %{ "addw  $dst, $src1, $src2, sxth #lshift2" %}
12568 
12569    ins_encode %{
12570      __ addw(as_Register($dst$$reg), as_Register($src1$$reg),
12571             as_Register($src2$$reg), ext::sxth, ($lshift2$$constant));
12572    %}
12573   ins_pipe(ialu_reg_reg_shift);
12574 %}
12575 
12576 instruct SubExtI_sxtb_shift(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immIExt lshift2, immI_24 lshift1, immI_24 rshift1, rFlagsReg cr)
12577 %{
12578   match(Set dst (SubI src1 (LShiftI (RShiftI (LShiftI src2 lshift1) rshift1) lshift2)));
12579   ins_cost(1.9 * INSN_COST);
12580   format %{ "subw  $dst, $src1, $src2, sxtb #lshift2" %}
12581 
12582    ins_encode %{
12583      __ subw(as_Register($dst$$reg), as_Register($src1$$reg),
12584             as_Register($src2$$reg), ext::sxtb, ($lshift2$$constant));
12585    %}
12586   ins_pipe(ialu_reg_reg_shift);
12587 %}
12588 
12589 instruct SubExtI_sxth_shift(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immIExt lshift2, immI_16 lshift1, immI_16 rshift1, rFlagsReg cr)
12590 %{
12591   match(Set dst (SubI src1 (LShiftI (RShiftI (LShiftI src2 lshift1) rshift1) lshift2)));
12592   ins_cost(1.9 * INSN_COST);
12593   format %{ "subw  $dst, $src1, $src2, sxth #lshift2" %}
12594 
12595    ins_encode %{
12596      __ subw(as_Register($dst$$reg), as_Register($src1$$reg),
12597             as_Register($src2$$reg), ext::sxth, ($lshift2$$constant));
12598    %}
12599   ins_pipe(ialu_reg_reg_shift);
12600 %}
12601 
12602 
12603 instruct AddExtI_shift(iRegLNoSp dst, iRegL src1, iRegIorL2I src2, immIExt lshift, rFlagsReg cr)
12604 %{
12605   match(Set dst (AddL src1 (LShiftL (ConvI2L src2) lshift)));
12606   ins_cost(1.9 * INSN_COST);
12607   format %{ "add  $dst, $src1, $src2, sxtw #lshift" %}
12608 
12609    ins_encode %{
12610      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12611             as_Register($src2$$reg), ext::sxtw, ($lshift$$constant));
12612    %}
12613   ins_pipe(ialu_reg_reg_shift);
12614 %};
12615 
12616 instruct SubExtI_shift(iRegLNoSp dst, iRegL src1, iRegIorL2I src2, immIExt lshift, rFlagsReg cr)
12617 %{
12618   match(Set dst (SubL src1 (LShiftL (ConvI2L src2) lshift)));
12619   ins_cost(1.9 * INSN_COST);
12620   format %{ "sub  $dst, $src1, $src2, sxtw #lshift" %}
12621 
12622    ins_encode %{
12623      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12624             as_Register($src2$$reg), ext::sxtw, ($lshift$$constant));
12625    %}
12626   ins_pipe(ialu_reg_reg_shift);
12627 %};
12628 
12629 
12630 instruct AddExtL_uxtb_and_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immL_255 mask, immIExt lshift, rFlagsReg cr)
12631 %{
12632   match(Set dst (AddL src1 (LShiftL (AndL src2 mask) lshift)));
12633   ins_cost(1.9 * INSN_COST);
12634   format %{ "add  $dst, $src1, $src2, uxtb #lshift" %}
12635 
12636    ins_encode %{
12637      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12638             as_Register($src2$$reg), ext::uxtb, ($lshift$$constant));
12639    %}
12640   ins_pipe(ialu_reg_reg_shift);
12641 %}
12642 
12643 instruct AddExtL_uxth_and_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immL_65535 mask, immIExt lshift, rFlagsReg cr)
12644 %{
12645   match(Set dst (AddL src1 (LShiftL (AndL src2 mask) lshift)));
12646   ins_cost(1.9 * INSN_COST);
12647   format %{ "add  $dst, $src1, $src2, uxth #lshift" %}
12648 
12649    ins_encode %{
12650      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12651             as_Register($src2$$reg), ext::uxth, ($lshift$$constant));
12652    %}
12653   ins_pipe(ialu_reg_reg_shift);
12654 %}
12655 
12656 instruct AddExtL_uxtw_and_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immL_4294967295 mask, immIExt lshift, rFlagsReg cr)
12657 %{
12658   match(Set dst (AddL src1 (LShiftL (AndL src2 mask) lshift)));
12659   ins_cost(1.9 * INSN_COST);
12660   format %{ "add  $dst, $src1, $src2, uxtw #lshift" %}
12661 
12662    ins_encode %{
12663      __ add(as_Register($dst$$reg), as_Register($src1$$reg),
12664             as_Register($src2$$reg), ext::uxtw, ($lshift$$constant));
12665    %}
12666   ins_pipe(ialu_reg_reg_shift);
12667 %}
12668 
12669 instruct SubExtL_uxtb_and_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immL_255 mask, immIExt lshift, rFlagsReg cr)
12670 %{
12671   match(Set dst (SubL src1 (LShiftL (AndL src2 mask) lshift)));
12672   ins_cost(1.9 * INSN_COST);
12673   format %{ "sub  $dst, $src1, $src2, uxtb #lshift" %}
12674 
12675    ins_encode %{
12676      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12677             as_Register($src2$$reg), ext::uxtb, ($lshift$$constant));
12678    %}
12679   ins_pipe(ialu_reg_reg_shift);
12680 %}
12681 
12682 instruct SubExtL_uxth_and_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immL_65535 mask, immIExt lshift, rFlagsReg cr)
12683 %{
12684   match(Set dst (SubL src1 (LShiftL (AndL src2 mask) lshift)));
12685   ins_cost(1.9 * INSN_COST);
12686   format %{ "sub  $dst, $src1, $src2, uxth #lshift" %}
12687 
12688    ins_encode %{
12689      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12690             as_Register($src2$$reg), ext::uxth, ($lshift$$constant));
12691    %}
12692   ins_pipe(ialu_reg_reg_shift);
12693 %}
12694 
12695 instruct SubExtL_uxtw_and_shift(iRegLNoSp dst, iRegL src1, iRegL src2, immL_4294967295 mask, immIExt lshift, rFlagsReg cr)
12696 %{
12697   match(Set dst (SubL src1 (LShiftL (AndL src2 mask) lshift)));
12698   ins_cost(1.9 * INSN_COST);
12699   format %{ "sub  $dst, $src1, $src2, uxtw #lshift" %}
12700 
12701    ins_encode %{
12702      __ sub(as_Register($dst$$reg), as_Register($src1$$reg),
12703             as_Register($src2$$reg), ext::uxtw, ($lshift$$constant));
12704    %}
12705   ins_pipe(ialu_reg_reg_shift);
12706 %}
12707 
12708 instruct AddExtI_uxtb_and_shift(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_255 mask, immIExt lshift, rFlagsReg cr)
12709 %{
12710   match(Set dst (AddI src1 (LShiftI (AndI src2 mask) lshift)));
12711   ins_cost(1.9 * INSN_COST);
12712   format %{ "addw  $dst, $src1, $src2, uxtb #lshift" %}
12713 
12714    ins_encode %{
12715      __ addw(as_Register($dst$$reg), as_Register($src1$$reg),
12716             as_Register($src2$$reg), ext::uxtb, ($lshift$$constant));
12717    %}
12718   ins_pipe(ialu_reg_reg_shift);
12719 %}
12720 
12721 instruct AddExtI_uxth_and_shift(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_65535 mask, immIExt lshift, rFlagsReg cr)
12722 %{
12723   match(Set dst (AddI src1 (LShiftI (AndI src2 mask) lshift)));
12724   ins_cost(1.9 * INSN_COST);
12725   format %{ "addw  $dst, $src1, $src2, uxth #lshift" %}
12726 
12727    ins_encode %{
12728      __ addw(as_Register($dst$$reg), as_Register($src1$$reg),
12729             as_Register($src2$$reg), ext::uxth, ($lshift$$constant));
12730    %}
12731   ins_pipe(ialu_reg_reg_shift);
12732 %}
12733 
12734 instruct SubExtI_uxtb_and_shift(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_255 mask, immIExt lshift, rFlagsReg cr)
12735 %{
12736   match(Set dst (SubI src1 (LShiftI (AndI src2 mask) lshift)));
12737   ins_cost(1.9 * INSN_COST);
12738   format %{ "subw  $dst, $src1, $src2, uxtb #lshift" %}
12739 
12740    ins_encode %{
12741      __ subw(as_Register($dst$$reg), as_Register($src1$$reg),
12742             as_Register($src2$$reg), ext::uxtb, ($lshift$$constant));
12743    %}
12744   ins_pipe(ialu_reg_reg_shift);
12745 %}
12746 
12747 instruct SubExtI_uxth_and_shift(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, immI_65535 mask, immIExt lshift, rFlagsReg cr)
12748 %{
12749   match(Set dst (SubI src1 (LShiftI (AndI src2 mask) lshift)));
12750   ins_cost(1.9 * INSN_COST);
12751   format %{ "subw  $dst, $src1, $src2, uxth #lshift" %}
12752 
12753    ins_encode %{
12754      __ subw(as_Register($dst$$reg), as_Register($src1$$reg),
12755             as_Register($src2$$reg), ext::uxth, ($lshift$$constant));
12756    %}
12757   ins_pipe(ialu_reg_reg_shift);
12758 %}
12759 // END This section of the file is automatically generated. Do not edit --------------
12760 
12761 // ============================================================================
12762 // Floating Point Arithmetic Instructions
12763 
12764 instruct addF_reg_reg(vRegF dst, vRegF src1, vRegF src2) %{
12765   match(Set dst (AddF src1 src2));
12766 
12767   ins_cost(INSN_COST * 5);
12768   format %{ "fadds   $dst, $src1, $src2" %}
12769 
12770   ins_encode %{
12771     __ fadds(as_FloatRegister($dst$$reg),
12772              as_FloatRegister($src1$$reg),
12773              as_FloatRegister($src2$$reg));
12774   %}
12775 
12776   ins_pipe(fp_dop_reg_reg_s);
12777 %}
12778 
12779 instruct addD_reg_reg(vRegD dst, vRegD src1, vRegD src2) %{
12780   match(Set dst (AddD src1 src2));
12781 
12782   ins_cost(INSN_COST * 5);
12783   format %{ "faddd   $dst, $src1, $src2" %}
12784 
12785   ins_encode %{
12786     __ faddd(as_FloatRegister($dst$$reg),
12787              as_FloatRegister($src1$$reg),
12788              as_FloatRegister($src2$$reg));
12789   %}
12790 
12791   ins_pipe(fp_dop_reg_reg_d);
12792 %}
12793 
12794 instruct subF_reg_reg(vRegF dst, vRegF src1, vRegF src2) %{
12795   match(Set dst (SubF src1 src2));
12796 
12797   ins_cost(INSN_COST * 5);
12798   format %{ "fsubs   $dst, $src1, $src2" %}
12799 
12800   ins_encode %{
12801     __ fsubs(as_FloatRegister($dst$$reg),
12802              as_FloatRegister($src1$$reg),
12803              as_FloatRegister($src2$$reg));
12804   %}
12805 
12806   ins_pipe(fp_dop_reg_reg_s);
12807 %}
12808 
12809 instruct subD_reg_reg(vRegD dst, vRegD src1, vRegD src2) %{
12810   match(Set dst (SubD src1 src2));
12811 
12812   ins_cost(INSN_COST * 5);
12813   format %{ "fsubd   $dst, $src1, $src2" %}
12814 
12815   ins_encode %{
12816     __ fsubd(as_FloatRegister($dst$$reg),
12817              as_FloatRegister($src1$$reg),
12818              as_FloatRegister($src2$$reg));
12819   %}
12820 
12821   ins_pipe(fp_dop_reg_reg_d);
12822 %}
12823 
12824 instruct mulF_reg_reg(vRegF dst, vRegF src1, vRegF src2) %{
12825   match(Set dst (MulF src1 src2));
12826 
12827   ins_cost(INSN_COST * 6);
12828   format %{ "fmuls   $dst, $src1, $src2" %}
12829 
12830   ins_encode %{
12831     __ fmuls(as_FloatRegister($dst$$reg),
12832              as_FloatRegister($src1$$reg),
12833              as_FloatRegister($src2$$reg));
12834   %}
12835 
12836   ins_pipe(fp_dop_reg_reg_s);
12837 %}
12838 
12839 instruct mulD_reg_reg(vRegD dst, vRegD src1, vRegD src2) %{
12840   match(Set dst (MulD src1 src2));
12841 
12842   ins_cost(INSN_COST * 6);
12843   format %{ "fmuld   $dst, $src1, $src2" %}
12844 
12845   ins_encode %{
12846     __ fmuld(as_FloatRegister($dst$$reg),
12847              as_FloatRegister($src1$$reg),
12848              as_FloatRegister($src2$$reg));
12849   %}
12850 
12851   ins_pipe(fp_dop_reg_reg_d);
12852 %}
12853 
12854 // src1 * src2 + src3
12855 instruct maddF_reg_reg(vRegF dst, vRegF src1, vRegF src2, vRegF src3) %{
12856   predicate(UseFMA);
12857   match(Set dst (FmaF src3 (Binary src1 src2)));
12858 
12859   format %{ "fmadds   $dst, $src1, $src2, $src3" %}
12860 
12861   ins_encode %{
12862     __ fmadds(as_FloatRegister($dst$$reg),
12863              as_FloatRegister($src1$$reg),
12864              as_FloatRegister($src2$$reg),
12865              as_FloatRegister($src3$$reg));
12866   %}
12867 
12868   ins_pipe(pipe_class_default);
12869 %}
12870 
12871 // src1 * src2 + src3
12872 instruct maddD_reg_reg(vRegD dst, vRegD src1, vRegD src2, vRegD src3) %{
12873   predicate(UseFMA);
12874   match(Set dst (FmaD src3 (Binary src1 src2)));
12875 
12876   format %{ "fmaddd   $dst, $src1, $src2, $src3" %}
12877 
12878   ins_encode %{
12879     __ fmaddd(as_FloatRegister($dst$$reg),
12880              as_FloatRegister($src1$$reg),
12881              as_FloatRegister($src2$$reg),
12882              as_FloatRegister($src3$$reg));
12883   %}
12884 
12885   ins_pipe(pipe_class_default);
12886 %}
12887 
12888 // -src1 * src2 + src3
12889 instruct msubF_reg_reg(vRegF dst, vRegF src1, vRegF src2, vRegF src3) %{
12890   predicate(UseFMA);
12891   match(Set dst (FmaF src3 (Binary (NegF src1) src2)));
12892   match(Set dst (FmaF src3 (Binary src1 (NegF src2))));
12893 
12894   format %{ "fmsubs   $dst, $src1, $src2, $src3" %}
12895 
12896   ins_encode %{
12897     __ fmsubs(as_FloatRegister($dst$$reg),
12898               as_FloatRegister($src1$$reg),
12899               as_FloatRegister($src2$$reg),
12900               as_FloatRegister($src3$$reg));
12901   %}
12902 
12903   ins_pipe(pipe_class_default);
12904 %}
12905 
12906 // -src1 * src2 + src3
12907 instruct msubD_reg_reg(vRegD dst, vRegD src1, vRegD src2, vRegD src3) %{
12908   predicate(UseFMA);
12909   match(Set dst (FmaD src3 (Binary (NegD src1) src2)));
12910   match(Set dst (FmaD src3 (Binary src1 (NegD src2))));
12911 
12912   format %{ "fmsubd   $dst, $src1, $src2, $src3" %}
12913 
12914   ins_encode %{
12915     __ fmsubd(as_FloatRegister($dst$$reg),
12916               as_FloatRegister($src1$$reg),
12917               as_FloatRegister($src2$$reg),
12918               as_FloatRegister($src3$$reg));
12919   %}
12920 
12921   ins_pipe(pipe_class_default);
12922 %}
12923 
12924 // -src1 * src2 - src3
12925 instruct mnaddF_reg_reg(vRegF dst, vRegF src1, vRegF src2, vRegF src3) %{
12926   predicate(UseFMA);
12927   match(Set dst (FmaF (NegF src3) (Binary (NegF src1) src2)));
12928   match(Set dst (FmaF (NegF src3) (Binary src1 (NegF src2))));
12929 
12930   format %{ "fnmadds  $dst, $src1, $src2, $src3" %}
12931 
12932   ins_encode %{
12933     __ fnmadds(as_FloatRegister($dst$$reg),
12934                as_FloatRegister($src1$$reg),
12935                as_FloatRegister($src2$$reg),
12936                as_FloatRegister($src3$$reg));
12937   %}
12938 
12939   ins_pipe(pipe_class_default);
12940 %}
12941 
12942 // -src1 * src2 - src3
12943 instruct mnaddD_reg_reg(vRegD dst, vRegD src1, vRegD src2, vRegD src3) %{
12944   predicate(UseFMA);
12945   match(Set dst (FmaD (NegD src3) (Binary (NegD src1) src2)));
12946   match(Set dst (FmaD (NegD src3) (Binary src1 (NegD src2))));
12947 
12948   format %{ "fnmaddd   $dst, $src1, $src2, $src3" %}
12949 
12950   ins_encode %{
12951     __ fnmaddd(as_FloatRegister($dst$$reg),
12952                as_FloatRegister($src1$$reg),
12953                as_FloatRegister($src2$$reg),
12954                as_FloatRegister($src3$$reg));
12955   %}
12956 
12957   ins_pipe(pipe_class_default);
12958 %}
12959 
12960 // src1 * src2 - src3
12961 instruct mnsubF_reg_reg(vRegF dst, vRegF src1, vRegF src2, vRegF src3, immF0 zero) %{
12962   predicate(UseFMA);
12963   match(Set dst (FmaF (NegF src3) (Binary src1 src2)));
12964 
12965   format %{ "fnmsubs  $dst, $src1, $src2, $src3" %}
12966 
12967   ins_encode %{
12968     __ fnmsubs(as_FloatRegister($dst$$reg),
12969                as_FloatRegister($src1$$reg),
12970                as_FloatRegister($src2$$reg),
12971                as_FloatRegister($src3$$reg));
12972   %}
12973 
12974   ins_pipe(pipe_class_default);
12975 %}
12976 
12977 // src1 * src2 - src3
12978 instruct mnsubD_reg_reg(vRegD dst, vRegD src1, vRegD src2, vRegD src3, immD0 zero) %{
12979   predicate(UseFMA);
12980   match(Set dst (FmaD (NegD src3) (Binary src1 src2)));
12981 
12982   format %{ "fnmsubd   $dst, $src1, $src2, $src3" %}
12983 
12984   ins_encode %{
12985   // n.b. insn name should be fnmsubd
12986     __ fnmsub(as_FloatRegister($dst$$reg),
12987               as_FloatRegister($src1$$reg),
12988               as_FloatRegister($src2$$reg),
12989               as_FloatRegister($src3$$reg));
12990   %}
12991 
12992   ins_pipe(pipe_class_default);
12993 %}
12994 
12995 
12996 // Math.max(FF)F
12997 instruct maxF_reg_reg(vRegF dst, vRegF src1, vRegF src2) %{
12998   match(Set dst (MaxF src1 src2));
12999 
13000   format %{ "fmaxs   $dst, $src1, $src2" %}
13001   ins_encode %{
13002     __ fmaxs(as_FloatRegister($dst$$reg),
13003              as_FloatRegister($src1$$reg),
13004              as_FloatRegister($src2$$reg));
13005   %}
13006 
13007   ins_pipe(fp_dop_reg_reg_s);
13008 %}
13009 
13010 // Math.min(FF)F
13011 instruct minF_reg_reg(vRegF dst, vRegF src1, vRegF src2) %{
13012   match(Set dst (MinF src1 src2));
13013 
13014   format %{ "fmins   $dst, $src1, $src2" %}
13015   ins_encode %{
13016     __ fmins(as_FloatRegister($dst$$reg),
13017              as_FloatRegister($src1$$reg),
13018              as_FloatRegister($src2$$reg));
13019   %}
13020 
13021   ins_pipe(fp_dop_reg_reg_s);
13022 %}
13023 
13024 // Math.max(DD)D
13025 instruct maxD_reg_reg(vRegD dst, vRegD src1, vRegD src2) %{
13026   match(Set dst (MaxD src1 src2));
13027 
13028   format %{ "fmaxd   $dst, $src1, $src2" %}
13029   ins_encode %{
13030     __ fmaxd(as_FloatRegister($dst$$reg),
13031              as_FloatRegister($src1$$reg),
13032              as_FloatRegister($src2$$reg));
13033   %}
13034 
13035   ins_pipe(fp_dop_reg_reg_d);
13036 %}
13037 
13038 // Math.min(DD)D
13039 instruct minD_reg_reg(vRegD dst, vRegD src1, vRegD src2) %{
13040   match(Set dst (MinD src1 src2));
13041 
13042   format %{ "fmind   $dst, $src1, $src2" %}
13043   ins_encode %{
13044     __ fmind(as_FloatRegister($dst$$reg),
13045              as_FloatRegister($src1$$reg),
13046              as_FloatRegister($src2$$reg));
13047   %}
13048 
13049   ins_pipe(fp_dop_reg_reg_d);
13050 %}
13051 
13052 
13053 instruct divF_reg_reg(vRegF dst, vRegF src1, vRegF src2) %{
13054   match(Set dst (DivF src1  src2));
13055 
13056   ins_cost(INSN_COST * 18);
13057   format %{ "fdivs   $dst, $src1, $src2" %}
13058 
13059   ins_encode %{
13060     __ fdivs(as_FloatRegister($dst$$reg),
13061              as_FloatRegister($src1$$reg),
13062              as_FloatRegister($src2$$reg));
13063   %}
13064 
13065   ins_pipe(fp_div_s);
13066 %}
13067 
13068 instruct divD_reg_reg(vRegD dst, vRegD src1, vRegD src2) %{
13069   match(Set dst (DivD src1  src2));
13070 
13071   ins_cost(INSN_COST * 32);
13072   format %{ "fdivd   $dst, $src1, $src2" %}
13073 
13074   ins_encode %{
13075     __ fdivd(as_FloatRegister($dst$$reg),
13076              as_FloatRegister($src1$$reg),
13077              as_FloatRegister($src2$$reg));
13078   %}
13079 
13080   ins_pipe(fp_div_d);
13081 %}
13082 
13083 instruct negF_reg_reg(vRegF dst, vRegF src) %{
13084   match(Set dst (NegF src));
13085 
13086   ins_cost(INSN_COST * 3);
13087   format %{ "fneg   $dst, $src" %}
13088 
13089   ins_encode %{
13090     __ fnegs(as_FloatRegister($dst$$reg),
13091              as_FloatRegister($src$$reg));
13092   %}
13093 
13094   ins_pipe(fp_uop_s);
13095 %}
13096 
13097 instruct negD_reg_reg(vRegD dst, vRegD src) %{
13098   match(Set dst (NegD src));
13099 
13100   ins_cost(INSN_COST * 3);
13101   format %{ "fnegd   $dst, $src" %}
13102 
13103   ins_encode %{
13104     __ fnegd(as_FloatRegister($dst$$reg),
13105              as_FloatRegister($src$$reg));
13106   %}
13107 
13108   ins_pipe(fp_uop_d);
13109 %}
13110 
13111 instruct absI_reg(iRegINoSp dst, iRegIorL2I src, rFlagsReg cr)
13112 %{
13113   match(Set dst (AbsI src));
13114 
13115   effect(KILL cr);
13116   ins_cost(INSN_COST * 2);
13117   format %{ "cmpw  $src, zr\n\t"
13118             "cnegw $dst, $src, Assembler::LT\t# int abs"
13119   %}
13120 
13121   ins_encode %{
13122     __ cmpw(as_Register($src$$reg), zr);
13123     __ cnegw(as_Register($dst$$reg), as_Register($src$$reg), Assembler::LT);
13124   %}
13125   ins_pipe(pipe_class_default);
13126 %}
13127 
13128 instruct absL_reg(iRegLNoSp dst, iRegL src, rFlagsReg cr)
13129 %{
13130   match(Set dst (AbsL src));
13131 
13132   effect(KILL cr);
13133   ins_cost(INSN_COST * 2);
13134   format %{ "cmp  $src, zr\n\t"
13135             "cneg $dst, $src, Assembler::LT\t# long abs"
13136   %}
13137 
13138   ins_encode %{
13139     __ cmp(as_Register($src$$reg), zr);
13140     __ cneg(as_Register($dst$$reg), as_Register($src$$reg), Assembler::LT);
13141   %}
13142   ins_pipe(pipe_class_default);
13143 %}
13144 
13145 instruct absF_reg(vRegF dst, vRegF src) %{
13146   match(Set dst (AbsF src));
13147 
13148   ins_cost(INSN_COST * 3);
13149   format %{ "fabss   $dst, $src" %}
13150   ins_encode %{
13151     __ fabss(as_FloatRegister($dst$$reg),
13152              as_FloatRegister($src$$reg));
13153   %}
13154 
13155   ins_pipe(fp_uop_s);
13156 %}
13157 
13158 instruct absD_reg(vRegD dst, vRegD src) %{
13159   match(Set dst (AbsD src));
13160 
13161   ins_cost(INSN_COST * 3);
13162   format %{ "fabsd   $dst, $src" %}
13163   ins_encode %{
13164     __ fabsd(as_FloatRegister($dst$$reg),
13165              as_FloatRegister($src$$reg));
13166   %}
13167 
13168   ins_pipe(fp_uop_d);
13169 %}
13170 
13171 instruct sqrtD_reg(vRegD dst, vRegD src) %{
13172   match(Set dst (SqrtD src));
13173 
13174   ins_cost(INSN_COST * 50);
13175   format %{ "fsqrtd  $dst, $src" %}
13176   ins_encode %{
13177     __ fsqrtd(as_FloatRegister($dst$$reg),
13178              as_FloatRegister($src$$reg));
13179   %}
13180 
13181   ins_pipe(fp_div_s);
13182 %}
13183 
13184 instruct sqrtF_reg(vRegF dst, vRegF src) %{
13185   match(Set dst (SqrtF src));
13186 
13187   ins_cost(INSN_COST * 50);
13188   format %{ "fsqrts  $dst, $src" %}
13189   ins_encode %{
13190     __ fsqrts(as_FloatRegister($dst$$reg),
13191              as_FloatRegister($src$$reg));
13192   %}
13193 
13194   ins_pipe(fp_div_d);
13195 %}
13196 
13197 // Math.rint, floor, ceil
13198 instruct roundD_reg(vRegD dst, vRegD src, immI rmode) %{
13199   match(Set dst (RoundDoubleMode src rmode));
13200   format %{ "frint  $dst, $src, $rmode" %}
13201   ins_encode %{
13202     switch ($rmode$$constant) {
13203       case RoundDoubleModeNode::rmode_rint:
13204         __ frintnd(as_FloatRegister($dst$$reg),
13205                    as_FloatRegister($src$$reg));
13206         break;
13207       case RoundDoubleModeNode::rmode_floor:
13208         __ frintmd(as_FloatRegister($dst$$reg),
13209                    as_FloatRegister($src$$reg));
13210         break;
13211       case RoundDoubleModeNode::rmode_ceil:
13212         __ frintpd(as_FloatRegister($dst$$reg),
13213                    as_FloatRegister($src$$reg));
13214         break;
13215     }
13216   %}
13217   ins_pipe(fp_uop_d);
13218 %}
13219 
13220 instruct signumD_reg(vRegD dst, vRegD src, vRegD tmp, vRegD one) %{
13221   match(Set dst (SignumD src));
13222   effect(TEMP_DEF dst, TEMP tmp, TEMP one);
13223   format %{ "signumD  $dst, $src" %}
13224   ins_encode %{
13225     FloatRegister src = as_FloatRegister($src$$reg),
13226                   dst = as_FloatRegister($dst$$reg),
13227                   tmp = as_FloatRegister($tmp$$reg),
13228                   one = as_FloatRegister($one$$reg);
13229     __ fmovd(tmp, 0.0d);
13230     __ fmovd(one, 1.0d);
13231     __ facgtd(dst, src, tmp); // dst=0 for +-0.0 and NaN. 0xFFF..F otherwise
13232     __ ushrd(dst, dst, 1);    // dst=0 for +-0.0 and NaN. 0x7FF..F otherwise
13233     // Bit selection instruction gets bit from "one" for each enabled bit in
13234     // "dst", otherwise gets a bit from "src". For "src" that contains +-0.0 or
13235     // NaN the whole "src" will be copied because "dst" is zero. For all other
13236     // "src" values dst is 0x7FF..F, which means only the sign bit is copied
13237     // from "src", and all other bits are copied from 1.0.
13238     __ bsl(dst, __ T8B, one, src);
13239   %}
13240   ins_pipe(fp_uop_d);
13241 %}
13242 
13243 instruct signumF_reg(vRegF dst, vRegF src, vRegF tmp, vRegF one) %{
13244   match(Set dst (SignumF src));
13245   effect(TEMP_DEF dst, USE src, TEMP tmp, TEMP one);
13246   format %{ "signumF  $dst, $src" %}
13247   ins_encode %{
13248     FloatRegister src = as_FloatRegister($src$$reg),
13249                   dst = as_FloatRegister($dst$$reg),
13250                   tmp = as_FloatRegister($tmp$$reg),
13251                   one = as_FloatRegister($one$$reg);
13252     __ fmovs(tmp, 0.0f);
13253     __ fmovs(one, 1.0f);
13254     __ facgts(dst, src, tmp);     // dst=0 for +-0.0 and NaN. 0xFFF..F otherwise
13255     __ ushr(dst, __ T2S, dst, 1); // dst=0 for +-0.0 and NaN. 0x7FF..F otherwise
13256     // Bit selection instruction gets bit from "one" for each enabled bit in
13257     // "dst", otherwise gets a bit from "src". For "src" that contains +-0.0 or
13258     // NaN the whole "src" will be copied because "dst" is zero. For all other
13259     // "src" values dst is 0x7FF..F, which means only the sign bit is copied
13260     // from "src", and all other bits are copied from 1.0.
13261     __ bsl(dst, __ T8B, one, src);
13262   %}
13263   ins_pipe(fp_uop_d);
13264 %}
13265 
13266 // ============================================================================
13267 // Logical Instructions
13268 
13269 // Integer Logical Instructions
13270 
13271 // And Instructions
13272 
13273 
13274 instruct andI_reg_reg(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2, rFlagsReg cr) %{
13275   match(Set dst (AndI src1 src2));
13276 
13277   format %{ "andw  $dst, $src1, $src2\t# int" %}
13278 
13279   ins_cost(INSN_COST);
13280   ins_encode %{
13281     __ andw(as_Register($dst$$reg),
13282             as_Register($src1$$reg),
13283             as_Register($src2$$reg));
13284   %}
13285 
13286   ins_pipe(ialu_reg_reg);
13287 %}
13288 
13289 instruct andI_reg_imm(iRegINoSp dst, iRegIorL2I src1, immILog src2, rFlagsReg cr) %{
13290   match(Set dst (AndI src1 src2));
13291 
13292   format %{ "andsw  $dst, $src1, $src2\t# int" %}
13293 
13294   ins_cost(INSN_COST);
13295   ins_encode %{
13296     __ andw(as_Register($dst$$reg),
13297             as_Register($src1$$reg),
13298             (unsigned long)($src2$$constant));
13299   %}
13300 
13301   ins_pipe(ialu_reg_imm);
13302 %}
13303 
13304 // Or Instructions
13305 
13306 instruct orI_reg_reg(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
13307   match(Set dst (OrI src1 src2));
13308 
13309   format %{ "orrw  $dst, $src1, $src2\t# int" %}
13310 
13311   ins_cost(INSN_COST);
13312   ins_encode %{
13313     __ orrw(as_Register($dst$$reg),
13314             as_Register($src1$$reg),
13315             as_Register($src2$$reg));
13316   %}
13317 
13318   ins_pipe(ialu_reg_reg);
13319 %}
13320 
13321 instruct orI_reg_imm(iRegINoSp dst, iRegIorL2I src1, immILog src2) %{
13322   match(Set dst (OrI src1 src2));
13323 
13324   format %{ "orrw  $dst, $src1, $src2\t# int" %}
13325 
13326   ins_cost(INSN_COST);
13327   ins_encode %{
13328     __ orrw(as_Register($dst$$reg),
13329             as_Register($src1$$reg),
13330             (unsigned long)($src2$$constant));
13331   %}
13332 
13333   ins_pipe(ialu_reg_imm);
13334 %}
13335 
13336 // Xor Instructions
13337 
13338 instruct xorI_reg_reg(iRegINoSp dst, iRegIorL2I src1, iRegIorL2I src2) %{
13339   match(Set dst (XorI src1 src2));
13340 
13341   format %{ "eorw  $dst, $src1, $src2\t# int" %}
13342 
13343   ins_cost(INSN_COST);
13344   ins_encode %{
13345     __ eorw(as_Register($dst$$reg),
13346             as_Register($src1$$reg),
13347             as_Register($src2$$reg));
13348   %}
13349 
13350   ins_pipe(ialu_reg_reg);
13351 %}
13352 
13353 instruct xorI_reg_imm(iRegINoSp dst, iRegIorL2I src1, immILog src2) %{
13354   match(Set dst (XorI src1 src2));
13355 
13356   format %{ "eorw  $dst, $src1, $src2\t# int" %}
13357 
13358   ins_cost(INSN_COST);
13359   ins_encode %{
13360     __ eorw(as_Register($dst$$reg),
13361             as_Register($src1$$reg),
13362             (unsigned long)($src2$$constant));
13363   %}
13364 
13365   ins_pipe(ialu_reg_imm);
13366 %}
13367 
13368 // Long Logical Instructions
13369 // TODO
13370 
13371 instruct andL_reg_reg(iRegLNoSp dst, iRegL src1, iRegL src2, rFlagsReg cr) %{
13372   match(Set dst (AndL src1 src2));
13373 
13374   format %{ "and  $dst, $src1, $src2\t# int" %}
13375 
13376   ins_cost(INSN_COST);
13377   ins_encode %{
13378     __ andr(as_Register($dst$$reg),
13379             as_Register($src1$$reg),
13380             as_Register($src2$$reg));
13381   %}
13382 
13383   ins_pipe(ialu_reg_reg);
13384 %}
13385 
13386 instruct andL_reg_imm(iRegLNoSp dst, iRegL src1, immLLog src2, rFlagsReg cr) %{
13387   match(Set dst (AndL src1 src2));
13388 
13389   format %{ "and  $dst, $src1, $src2\t# int" %}
13390 
13391   ins_cost(INSN_COST);
13392   ins_encode %{
13393     __ andr(as_Register($dst$$reg),
13394             as_Register($src1$$reg),
13395             (unsigned long)($src2$$constant));
13396   %}
13397 
13398   ins_pipe(ialu_reg_imm);
13399 %}
13400 
13401 // Or Instructions
13402 
13403 instruct orL_reg_reg(iRegLNoSp dst, iRegL src1, iRegL src2) %{
13404   match(Set dst (OrL src1 src2));
13405 
13406   format %{ "orr  $dst, $src1, $src2\t# int" %}
13407 
13408   ins_cost(INSN_COST);
13409   ins_encode %{
13410     __ orr(as_Register($dst$$reg),
13411            as_Register($src1$$reg),
13412            as_Register($src2$$reg));
13413   %}
13414 
13415   ins_pipe(ialu_reg_reg);
13416 %}
13417 
13418 instruct orL_reg_imm(iRegLNoSp dst, iRegL src1, immLLog src2) %{
13419   match(Set dst (OrL src1 src2));
13420 
13421   format %{ "orr  $dst, $src1, $src2\t# int" %}
13422 
13423   ins_cost(INSN_COST);
13424   ins_encode %{
13425     __ orr(as_Register($dst$$reg),
13426            as_Register($src1$$reg),
13427            (unsigned long)($src2$$constant));
13428   %}
13429 
13430   ins_pipe(ialu_reg_imm);
13431 %}
13432 
13433 // Xor Instructions
13434 
13435 instruct xorL_reg_reg(iRegLNoSp dst, iRegL src1, iRegL src2) %{
13436   match(Set dst (XorL src1 src2));
13437 
13438   format %{ "eor  $dst, $src1, $src2\t# int" %}
13439 
13440   ins_cost(INSN_COST);
13441   ins_encode %{
13442     __ eor(as_Register($dst$$reg),
13443            as_Register($src1$$reg),
13444            as_Register($src2$$reg));
13445   %}
13446 
13447   ins_pipe(ialu_reg_reg);
13448 %}
13449 
13450 instruct xorL_reg_imm(iRegLNoSp dst, iRegL src1, immLLog src2) %{
13451   match(Set dst (XorL src1 src2));
13452 
13453   ins_cost(INSN_COST);
13454   format %{ "eor  $dst, $src1, $src2\t# int" %}
13455 
13456   ins_encode %{
13457     __ eor(as_Register($dst$$reg),
13458            as_Register($src1$$reg),
13459            (unsigned long)($src2$$constant));
13460   %}
13461 
13462   ins_pipe(ialu_reg_imm);
13463 %}
13464 
13465 instruct convI2L_reg_reg(iRegLNoSp dst, iRegIorL2I src)
13466 %{
13467   match(Set dst (ConvI2L src));
13468 
13469   ins_cost(INSN_COST);
13470   format %{ "sxtw  $dst, $src\t# i2l" %}
13471   ins_encode %{
13472     __ sbfm($dst$$Register, $src$$Register, 0, 31);
13473   %}
13474   ins_pipe(ialu_reg_shift);
13475 %}
13476 
13477 // this pattern occurs in bigmath arithmetic
13478 instruct convUI2L_reg_reg(iRegLNoSp dst, iRegIorL2I src, immL_32bits mask)
13479 %{
13480   match(Set dst (AndL (ConvI2L src) mask));
13481 
13482   ins_cost(INSN_COST);
13483   format %{ "ubfm  $dst, $src, 0, 31\t# ui2l" %}
13484   ins_encode %{
13485     __ ubfm($dst$$Register, $src$$Register, 0, 31);
13486   %}
13487 
13488   ins_pipe(ialu_reg_shift);
13489 %}
13490 
13491 instruct convL2I_reg(iRegINoSp dst, iRegL src) %{
13492   match(Set dst (ConvL2I src));
13493 
13494   ins_cost(INSN_COST);
13495   format %{ "movw  $dst, $src \t// l2i" %}
13496 
13497   ins_encode %{
13498     __ movw(as_Register($dst$$reg), as_Register($src$$reg));
13499   %}
13500 
13501   ins_pipe(ialu_reg);
13502 %}
13503 
13504 instruct convI2B(iRegINoSp dst, iRegIorL2I src, rFlagsReg cr)
13505 %{
13506   match(Set dst (Conv2B src));
13507   effect(KILL cr);
13508 
13509   format %{
13510     "cmpw $src, zr\n\t"
13511     "cset $dst, ne"
13512   %}
13513 
13514   ins_encode %{
13515     __ cmpw(as_Register($src$$reg), zr);
13516     __ cset(as_Register($dst$$reg), Assembler::NE);
13517   %}
13518 
13519   ins_pipe(ialu_reg);
13520 %}
13521 
13522 instruct convP2B(iRegINoSp dst, iRegP src, rFlagsReg cr)
13523 %{
13524   match(Set dst (Conv2B src));
13525   effect(KILL cr);
13526 
13527   format %{
13528     "cmp  $src, zr\n\t"
13529     "cset $dst, ne"
13530   %}
13531 
13532   ins_encode %{
13533     __ cmp(as_Register($src$$reg), zr);
13534     __ cset(as_Register($dst$$reg), Assembler::NE);
13535   %}
13536 
13537   ins_pipe(ialu_reg);
13538 %}
13539 
13540 instruct convD2F_reg(vRegF dst, vRegD src) %{
13541   match(Set dst (ConvD2F src));
13542 
13543   ins_cost(INSN_COST * 5);
13544   format %{ "fcvtd  $dst, $src \t// d2f" %}
13545 
13546   ins_encode %{
13547     __ fcvtd(as_FloatRegister($dst$$reg), as_FloatRegister($src$$reg));
13548   %}
13549 
13550   ins_pipe(fp_d2f);
13551 %}
13552 
13553 instruct convF2D_reg(vRegD dst, vRegF src) %{
13554   match(Set dst (ConvF2D src));
13555 
13556   ins_cost(INSN_COST * 5);
13557   format %{ "fcvts  $dst, $src \t// f2d" %}
13558 
13559   ins_encode %{
13560     __ fcvts(as_FloatRegister($dst$$reg), as_FloatRegister($src$$reg));
13561   %}
13562 
13563   ins_pipe(fp_f2d);
13564 %}
13565 
13566 instruct convF2I_reg_reg(iRegINoSp dst, vRegF src) %{
13567   match(Set dst (ConvF2I src));
13568 
13569   ins_cost(INSN_COST * 5);
13570   format %{ "fcvtzsw  $dst, $src \t// f2i" %}
13571 
13572   ins_encode %{
13573     __ fcvtzsw(as_Register($dst$$reg), as_FloatRegister($src$$reg));
13574   %}
13575 
13576   ins_pipe(fp_f2i);
13577 %}
13578 
13579 instruct convF2L_reg_reg(iRegLNoSp dst, vRegF src) %{
13580   match(Set dst (ConvF2L src));
13581 
13582   ins_cost(INSN_COST * 5);
13583   format %{ "fcvtzs  $dst, $src \t// f2l" %}
13584 
13585   ins_encode %{
13586     __ fcvtzs(as_Register($dst$$reg), as_FloatRegister($src$$reg));
13587   %}
13588 
13589   ins_pipe(fp_f2l);
13590 %}
13591 
13592 instruct convI2F_reg_reg(vRegF dst, iRegIorL2I src) %{
13593   match(Set dst (ConvI2F src));
13594 
13595   ins_cost(INSN_COST * 5);
13596   format %{ "scvtfws  $dst, $src \t// i2f" %}
13597 
13598   ins_encode %{
13599     __ scvtfws(as_FloatRegister($dst$$reg), as_Register($src$$reg));
13600   %}
13601 
13602   ins_pipe(fp_i2f);
13603 %}
13604 
13605 instruct convL2F_reg_reg(vRegF dst, iRegL src) %{
13606   match(Set dst (ConvL2F src));
13607 
13608   ins_cost(INSN_COST * 5);
13609   format %{ "scvtfs  $dst, $src \t// l2f" %}
13610 
13611   ins_encode %{
13612     __ scvtfs(as_FloatRegister($dst$$reg), as_Register($src$$reg));
13613   %}
13614 
13615   ins_pipe(fp_l2f);
13616 %}
13617 
13618 instruct convD2I_reg_reg(iRegINoSp dst, vRegD src) %{
13619   match(Set dst (ConvD2I src));
13620 
13621   ins_cost(INSN_COST * 5);
13622   format %{ "fcvtzdw  $dst, $src \t// d2i" %}
13623 
13624   ins_encode %{
13625     __ fcvtzdw(as_Register($dst$$reg), as_FloatRegister($src$$reg));
13626   %}
13627 
13628   ins_pipe(fp_d2i);
13629 %}
13630 
13631 instruct convD2L_reg_reg(iRegLNoSp dst, vRegD src) %{
13632   match(Set dst (ConvD2L src));
13633 
13634   ins_cost(INSN_COST * 5);
13635   format %{ "fcvtzd  $dst, $src \t// d2l" %}
13636 
13637   ins_encode %{
13638     __ fcvtzd(as_Register($dst$$reg), as_FloatRegister($src$$reg));
13639   %}
13640 
13641   ins_pipe(fp_d2l);
13642 %}
13643 
13644 instruct convI2D_reg_reg(vRegD dst, iRegIorL2I src) %{
13645   match(Set dst (ConvI2D src));
13646 
13647   ins_cost(INSN_COST * 5);
13648   format %{ "scvtfwd  $dst, $src \t// i2d" %}
13649 
13650   ins_encode %{
13651     __ scvtfwd(as_FloatRegister($dst$$reg), as_Register($src$$reg));
13652   %}
13653 
13654   ins_pipe(fp_i2d);
13655 %}
13656 
13657 instruct convL2D_reg_reg(vRegD dst, iRegL src) %{
13658   match(Set dst (ConvL2D src));
13659 
13660   ins_cost(INSN_COST * 5);
13661   format %{ "scvtfd  $dst, $src \t// l2d" %}
13662 
13663   ins_encode %{
13664     __ scvtfd(as_FloatRegister($dst$$reg), as_Register($src$$reg));
13665   %}
13666 
13667   ins_pipe(fp_l2d);
13668 %}
13669 
13670 // stack <-> reg and reg <-> reg shuffles with no conversion
13671 
13672 instruct MoveF2I_stack_reg(iRegINoSp dst, stackSlotF src) %{
13673 
13674   match(Set dst (MoveF2I src));
13675 
13676   effect(DEF dst, USE src);
13677 
13678   ins_cost(4 * INSN_COST);
13679 
13680   format %{ "ldrw $dst, $src\t# MoveF2I_stack_reg" %}
13681 
13682   ins_encode %{
13683     __ ldrw($dst$$Register, Address(sp, $src$$disp));
13684   %}
13685 
13686   ins_pipe(iload_reg_reg);
13687 
13688 %}
13689 
13690 instruct MoveI2F_stack_reg(vRegF dst, stackSlotI src) %{
13691 
13692   match(Set dst (MoveI2F src));
13693 
13694   effect(DEF dst, USE src);
13695 
13696   ins_cost(4 * INSN_COST);
13697 
13698   format %{ "ldrs $dst, $src\t# MoveI2F_stack_reg" %}
13699 
13700   ins_encode %{
13701     __ ldrs(as_FloatRegister($dst$$reg), Address(sp, $src$$disp));
13702   %}
13703 
13704   ins_pipe(pipe_class_memory);
13705 
13706 %}
13707 
13708 instruct MoveD2L_stack_reg(iRegLNoSp dst, stackSlotD src) %{
13709 
13710   match(Set dst (MoveD2L src));
13711 
13712   effect(DEF dst, USE src);
13713 
13714   ins_cost(4 * INSN_COST);
13715 
13716   format %{ "ldr $dst, $src\t# MoveD2L_stack_reg" %}
13717 
13718   ins_encode %{
13719     __ ldr($dst$$Register, Address(sp, $src$$disp));
13720   %}
13721 
13722   ins_pipe(iload_reg_reg);
13723 
13724 %}
13725 
13726 instruct MoveL2D_stack_reg(vRegD dst, stackSlotL src) %{
13727 
13728   match(Set dst (MoveL2D src));
13729 
13730   effect(DEF dst, USE src);
13731 
13732   ins_cost(4 * INSN_COST);
13733 
13734   format %{ "ldrd $dst, $src\t# MoveL2D_stack_reg" %}
13735 
13736   ins_encode %{
13737     __ ldrd(as_FloatRegister($dst$$reg), Address(sp, $src$$disp));
13738   %}
13739 
13740   ins_pipe(pipe_class_memory);
13741 
13742 %}
13743 
13744 instruct MoveF2I_reg_stack(stackSlotI dst, vRegF src) %{
13745 
13746   match(Set dst (MoveF2I src));
13747 
13748   effect(DEF dst, USE src);
13749 
13750   ins_cost(INSN_COST);
13751 
13752   format %{ "strs $src, $dst\t# MoveF2I_reg_stack" %}
13753 
13754   ins_encode %{
13755     __ strs(as_FloatRegister($src$$reg), Address(sp, $dst$$disp));
13756   %}
13757 
13758   ins_pipe(pipe_class_memory);
13759 
13760 %}
13761 
13762 instruct MoveI2F_reg_stack(stackSlotF dst, iRegI src) %{
13763 
13764   match(Set dst (MoveI2F src));
13765 
13766   effect(DEF dst, USE src);
13767 
13768   ins_cost(INSN_COST);
13769 
13770   format %{ "strw $src, $dst\t# MoveI2F_reg_stack" %}
13771 
13772   ins_encode %{
13773     __ strw($src$$Register, Address(sp, $dst$$disp));
13774   %}
13775 
13776   ins_pipe(istore_reg_reg);
13777 
13778 %}
13779 
13780 instruct MoveD2L_reg_stack(stackSlotL dst, vRegD src) %{
13781 
13782   match(Set dst (MoveD2L src));
13783 
13784   effect(DEF dst, USE src);
13785 
13786   ins_cost(INSN_COST);
13787 
13788   format %{ "strd $dst, $src\t# MoveD2L_reg_stack" %}
13789 
13790   ins_encode %{
13791     __ strd(as_FloatRegister($src$$reg), Address(sp, $dst$$disp));
13792   %}
13793 
13794   ins_pipe(pipe_class_memory);
13795 
13796 %}
13797 
13798 instruct MoveL2D_reg_stack(stackSlotD dst, iRegL src) %{
13799 
13800   match(Set dst (MoveL2D src));
13801 
13802   effect(DEF dst, USE src);
13803 
13804   ins_cost(INSN_COST);
13805 
13806   format %{ "str $src, $dst\t# MoveL2D_reg_stack" %}
13807 
13808   ins_encode %{
13809     __ str($src$$Register, Address(sp, $dst$$disp));
13810   %}
13811 
13812   ins_pipe(istore_reg_reg);
13813 
13814 %}
13815 
13816 instruct MoveF2I_reg_reg(iRegINoSp dst, vRegF src) %{
13817 
13818   match(Set dst (MoveF2I src));
13819 
13820   effect(DEF dst, USE src);
13821 
13822   ins_cost(INSN_COST);
13823 
13824   format %{ "fmovs $dst, $src\t# MoveF2I_reg_reg" %}
13825 
13826   ins_encode %{
13827     __ fmovs($dst$$Register, as_FloatRegister($src$$reg));
13828   %}
13829 
13830   ins_pipe(fp_f2i);
13831 
13832 %}
13833 
13834 instruct MoveI2F_reg_reg(vRegF dst, iRegI src) %{
13835 
13836   match(Set dst (MoveI2F src));
13837 
13838   effect(DEF dst, USE src);
13839 
13840   ins_cost(INSN_COST);
13841 
13842   format %{ "fmovs $dst, $src\t# MoveI2F_reg_reg" %}
13843 
13844   ins_encode %{
13845     __ fmovs(as_FloatRegister($dst$$reg), $src$$Register);
13846   %}
13847 
13848   ins_pipe(fp_i2f);
13849 
13850 %}
13851 
13852 instruct MoveD2L_reg_reg(iRegLNoSp dst, vRegD src) %{
13853 
13854   match(Set dst (MoveD2L src));
13855 
13856   effect(DEF dst, USE src);
13857 
13858   ins_cost(INSN_COST);
13859 
13860   format %{ "fmovd $dst, $src\t# MoveD2L_reg_reg" %}
13861 
13862   ins_encode %{
13863     __ fmovd($dst$$Register, as_FloatRegister($src$$reg));
13864   %}
13865 
13866   ins_pipe(fp_d2l);
13867 
13868 %}
13869 
13870 instruct MoveL2D_reg_reg(vRegD dst, iRegL src) %{
13871 
13872   match(Set dst (MoveL2D src));
13873 
13874   effect(DEF dst, USE src);
13875 
13876   ins_cost(INSN_COST);
13877 
13878   format %{ "fmovd $dst, $src\t# MoveL2D_reg_reg" %}
13879 
13880   ins_encode %{
13881     __ fmovd(as_FloatRegister($dst$$reg), $src$$Register);
13882   %}
13883 
13884   ins_pipe(fp_l2d);
13885 
13886 %}
13887 
13888 // ============================================================================
13889 // clearing of an array
13890 
13891 instruct clearArray_reg_reg(iRegL_R11 cnt, iRegP_R10 base, Universe dummy, rFlagsReg cr)
13892 %{
13893   match(Set dummy (ClearArray cnt base));
13894   effect(USE_KILL cnt, USE_KILL base, KILL cr);
13895 
13896   ins_cost(4 * INSN_COST);
13897   format %{ "ClearArray $cnt, $base" %}
13898 
13899   ins_encode %{
13900     __ zero_words($base$$Register, $cnt$$Register);
13901   %}
13902 
13903   ins_pipe(pipe_class_memory);
13904 %}
13905 
13906 instruct clearArray_imm_reg(immL cnt, iRegP_R10 base, Universe dummy, rFlagsReg cr)
13907 %{
13908   predicate((u_int64_t)n->in(2)->get_long()
13909             < (u_int64_t)(BlockZeroingLowLimit >> LogBytesPerWord));
13910   match(Set dummy (ClearArray cnt base));
13911   effect(USE_KILL base);
13912 
13913   ins_cost(4 * INSN_COST);
13914   format %{ "ClearArray $cnt, $base" %}
13915 
13916   ins_encode %{
13917     __ zero_words($base$$Register, (u_int64_t)$cnt$$constant);
13918   %}
13919 
13920   ins_pipe(pipe_class_memory);
13921 %}
13922 
13923 // ============================================================================
13924 // Overflow Math Instructions
13925 
13926 instruct overflowAddI_reg_reg(rFlagsReg cr, iRegIorL2I op1, iRegIorL2I op2)
13927 %{
13928   match(Set cr (OverflowAddI op1 op2));
13929 
13930   format %{ "cmnw  $op1, $op2\t# overflow check int" %}
13931   ins_cost(INSN_COST);
13932   ins_encode %{
13933     __ cmnw($op1$$Register, $op2$$Register);
13934   %}
13935 
13936   ins_pipe(icmp_reg_reg);
13937 %}
13938 
13939 instruct overflowAddI_reg_imm(rFlagsReg cr, iRegIorL2I op1, immIAddSub op2)
13940 %{
13941   match(Set cr (OverflowAddI op1 op2));
13942 
13943   format %{ "cmnw  $op1, $op2\t# overflow check int" %}
13944   ins_cost(INSN_COST);
13945   ins_encode %{
13946     __ cmnw($op1$$Register, $op2$$constant);
13947   %}
13948 
13949   ins_pipe(icmp_reg_imm);
13950 %}
13951 
13952 instruct overflowAddL_reg_reg(rFlagsReg cr, iRegL op1, iRegL op2)
13953 %{
13954   match(Set cr (OverflowAddL op1 op2));
13955 
13956   format %{ "cmn   $op1, $op2\t# overflow check long" %}
13957   ins_cost(INSN_COST);
13958   ins_encode %{
13959     __ cmn($op1$$Register, $op2$$Register);
13960   %}
13961 
13962   ins_pipe(icmp_reg_reg);
13963 %}
13964 
13965 instruct overflowAddL_reg_imm(rFlagsReg cr, iRegL op1, immLAddSub op2)
13966 %{
13967   match(Set cr (OverflowAddL op1 op2));
13968 
13969   format %{ "cmn   $op1, $op2\t# overflow check long" %}
13970   ins_cost(INSN_COST);
13971   ins_encode %{
13972     __ cmn($op1$$Register, $op2$$constant);
13973   %}
13974 
13975   ins_pipe(icmp_reg_imm);
13976 %}
13977 
13978 instruct overflowSubI_reg_reg(rFlagsReg cr, iRegIorL2I op1, iRegIorL2I op2)
13979 %{
13980   match(Set cr (OverflowSubI op1 op2));
13981 
13982   format %{ "cmpw  $op1, $op2\t# overflow check int" %}
13983   ins_cost(INSN_COST);
13984   ins_encode %{
13985     __ cmpw($op1$$Register, $op2$$Register);
13986   %}
13987 
13988   ins_pipe(icmp_reg_reg);
13989 %}
13990 
13991 instruct overflowSubI_reg_imm(rFlagsReg cr, iRegIorL2I op1, immIAddSub op2)
13992 %{
13993   match(Set cr (OverflowSubI op1 op2));
13994 
13995   format %{ "cmpw  $op1, $op2\t# overflow check int" %}
13996   ins_cost(INSN_COST);
13997   ins_encode %{
13998     __ cmpw($op1$$Register, $op2$$constant);
13999   %}
14000 
14001   ins_pipe(icmp_reg_imm);
14002 %}
14003 
14004 instruct overflowSubL_reg_reg(rFlagsReg cr, iRegL op1, iRegL op2)
14005 %{
14006   match(Set cr (OverflowSubL op1 op2));
14007 
14008   format %{ "cmp   $op1, $op2\t# overflow check long" %}
14009   ins_cost(INSN_COST);
14010   ins_encode %{
14011     __ cmp($op1$$Register, $op2$$Register);
14012   %}
14013 
14014   ins_pipe(icmp_reg_reg);
14015 %}
14016 
14017 instruct overflowSubL_reg_imm(rFlagsReg cr, iRegL op1, immLAddSub op2)
14018 %{
14019   match(Set cr (OverflowSubL op1 op2));
14020 
14021   format %{ "cmp   $op1, $op2\t# overflow check long" %}
14022   ins_cost(INSN_COST);
14023   ins_encode %{
14024     __ subs(zr, $op1$$Register, $op2$$constant);
14025   %}
14026 
14027   ins_pipe(icmp_reg_imm);
14028 %}
14029 
14030 instruct overflowNegI_reg(rFlagsReg cr, immI0 zero, iRegIorL2I op1)
14031 %{
14032   match(Set cr (OverflowSubI zero op1));
14033 
14034   format %{ "cmpw  zr, $op1\t# overflow check int" %}
14035   ins_cost(INSN_COST);
14036   ins_encode %{
14037     __ cmpw(zr, $op1$$Register);
14038   %}
14039 
14040   ins_pipe(icmp_reg_imm);
14041 %}
14042 
14043 instruct overflowNegL_reg(rFlagsReg cr, immI0 zero, iRegL op1)
14044 %{
14045   match(Set cr (OverflowSubL zero op1));
14046 
14047   format %{ "cmp   zr, $op1\t# overflow check long" %}
14048   ins_cost(INSN_COST);
14049   ins_encode %{
14050     __ cmp(zr, $op1$$Register);
14051   %}
14052 
14053   ins_pipe(icmp_reg_imm);
14054 %}
14055 
14056 instruct overflowMulI_reg(rFlagsReg cr, iRegIorL2I op1, iRegIorL2I op2)
14057 %{
14058   match(Set cr (OverflowMulI op1 op2));
14059 
14060   format %{ "smull rscratch1, $op1, $op2\t# overflow check int\n\t"
14061             "cmp   rscratch1, rscratch1, sxtw\n\t"
14062             "movw  rscratch1, #0x80000000\n\t"
14063             "cselw rscratch1, rscratch1, zr, NE\n\t"
14064             "cmpw  rscratch1, #1" %}
14065   ins_cost(5 * INSN_COST);
14066   ins_encode %{
14067     __ smull(rscratch1, $op1$$Register, $op2$$Register);
14068     __ subs(zr, rscratch1, rscratch1, ext::sxtw);      // NE => overflow
14069     __ movw(rscratch1, 0x80000000);                    // Develop 0 (EQ),
14070     __ cselw(rscratch1, rscratch1, zr, Assembler::NE); // or 0x80000000 (NE)
14071     __ cmpw(rscratch1, 1);                             // 0x80000000 - 1 => VS
14072   %}
14073 
14074   ins_pipe(pipe_slow);
14075 %}
14076 
14077 instruct overflowMulI_reg_branch(cmpOp cmp, iRegIorL2I op1, iRegIorL2I op2, label labl, rFlagsReg cr)
14078 %{
14079   match(If cmp (OverflowMulI op1 op2));
14080   predicate(n->in(1)->as_Bool()->_test._test == BoolTest::overflow
14081             || n->in(1)->as_Bool()->_test._test == BoolTest::no_overflow);
14082   effect(USE labl, KILL cr);
14083 
14084   format %{ "smull rscratch1, $op1, $op2\t# overflow check int\n\t"
14085             "cmp   rscratch1, rscratch1, sxtw\n\t"
14086             "b$cmp   $labl" %}
14087   ins_cost(3 * INSN_COST); // Branch is rare so treat as INSN_COST
14088   ins_encode %{
14089     Label* L = $labl$$label;
14090     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14091     __ smull(rscratch1, $op1$$Register, $op2$$Register);
14092     __ subs(zr, rscratch1, rscratch1, ext::sxtw);      // NE => overflow
14093     __ br(cond == Assembler::VS ? Assembler::NE : Assembler::EQ, *L);
14094   %}
14095 
14096   ins_pipe(pipe_serial);
14097 %}
14098 
14099 instruct overflowMulL_reg(rFlagsReg cr, iRegL op1, iRegL op2)
14100 %{
14101   match(Set cr (OverflowMulL op1 op2));
14102 
14103   format %{ "mul   rscratch1, $op1, $op2\t#overflow check long\n\t"
14104             "smulh rscratch2, $op1, $op2\n\t"
14105             "cmp   rscratch2, rscratch1, ASR #63\n\t"
14106             "movw  rscratch1, #0x80000000\n\t"
14107             "cselw rscratch1, rscratch1, zr, NE\n\t"
14108             "cmpw  rscratch1, #1" %}
14109   ins_cost(6 * INSN_COST);
14110   ins_encode %{
14111     __ mul(rscratch1, $op1$$Register, $op2$$Register);   // Result bits 0..63
14112     __ smulh(rscratch2, $op1$$Register, $op2$$Register); // Result bits 64..127
14113     __ cmp(rscratch2, rscratch1, Assembler::ASR, 63);    // Top is pure sign ext
14114     __ movw(rscratch1, 0x80000000);                    // Develop 0 (EQ),
14115     __ cselw(rscratch1, rscratch1, zr, Assembler::NE); // or 0x80000000 (NE)
14116     __ cmpw(rscratch1, 1);                             // 0x80000000 - 1 => VS
14117   %}
14118 
14119   ins_pipe(pipe_slow);
14120 %}
14121 
14122 instruct overflowMulL_reg_branch(cmpOp cmp, iRegL op1, iRegL op2, label labl, rFlagsReg cr)
14123 %{
14124   match(If cmp (OverflowMulL op1 op2));
14125   predicate(n->in(1)->as_Bool()->_test._test == BoolTest::overflow
14126             || n->in(1)->as_Bool()->_test._test == BoolTest::no_overflow);
14127   effect(USE labl, KILL cr);
14128 
14129   format %{ "mul   rscratch1, $op1, $op2\t#overflow check long\n\t"
14130             "smulh rscratch2, $op1, $op2\n\t"
14131             "cmp   rscratch2, rscratch1, ASR #63\n\t"
14132             "b$cmp $labl" %}
14133   ins_cost(4 * INSN_COST); // Branch is rare so treat as INSN_COST
14134   ins_encode %{
14135     Label* L = $labl$$label;
14136     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14137     __ mul(rscratch1, $op1$$Register, $op2$$Register);   // Result bits 0..63
14138     __ smulh(rscratch2, $op1$$Register, $op2$$Register); // Result bits 64..127
14139     __ cmp(rscratch2, rscratch1, Assembler::ASR, 63);    // Top is pure sign ext
14140     __ br(cond == Assembler::VS ? Assembler::NE : Assembler::EQ, *L);
14141   %}
14142 
14143   ins_pipe(pipe_serial);
14144 %}
14145 
14146 // ============================================================================
14147 // Compare Instructions
14148 
14149 instruct compI_reg_reg(rFlagsReg cr, iRegI op1, iRegI op2)
14150 %{
14151   match(Set cr (CmpI op1 op2));
14152 
14153   effect(DEF cr, USE op1, USE op2);
14154 
14155   ins_cost(INSN_COST);
14156   format %{ "cmpw  $op1, $op2" %}
14157 
14158   ins_encode(aarch64_enc_cmpw(op1, op2));
14159 
14160   ins_pipe(icmp_reg_reg);
14161 %}
14162 
14163 instruct compI_reg_immI0(rFlagsReg cr, iRegI op1, immI0 zero)
14164 %{
14165   match(Set cr (CmpI op1 zero));
14166 
14167   effect(DEF cr, USE op1);
14168 
14169   ins_cost(INSN_COST);
14170   format %{ "cmpw $op1, 0" %}
14171 
14172   ins_encode(aarch64_enc_cmpw_imm_addsub(op1, zero));
14173 
14174   ins_pipe(icmp_reg_imm);
14175 %}
14176 
14177 instruct compI_reg_immIAddSub(rFlagsReg cr, iRegI op1, immIAddSub op2)
14178 %{
14179   match(Set cr (CmpI op1 op2));
14180 
14181   effect(DEF cr, USE op1);
14182 
14183   ins_cost(INSN_COST);
14184   format %{ "cmpw  $op1, $op2" %}
14185 
14186   ins_encode(aarch64_enc_cmpw_imm_addsub(op1, op2));
14187 
14188   ins_pipe(icmp_reg_imm);
14189 %}
14190 
14191 instruct compI_reg_immI(rFlagsReg cr, iRegI op1, immI op2)
14192 %{
14193   match(Set cr (CmpI op1 op2));
14194 
14195   effect(DEF cr, USE op1);
14196 
14197   ins_cost(INSN_COST * 2);
14198   format %{ "cmpw  $op1, $op2" %}
14199 
14200   ins_encode(aarch64_enc_cmpw_imm(op1, op2));
14201 
14202   ins_pipe(icmp_reg_imm);
14203 %}
14204 
14205 // Unsigned compare Instructions; really, same as signed compare
14206 // except it should only be used to feed an If or a CMovI which takes a
14207 // cmpOpU.
14208 
14209 instruct compU_reg_reg(rFlagsRegU cr, iRegI op1, iRegI op2)
14210 %{
14211   match(Set cr (CmpU op1 op2));
14212 
14213   effect(DEF cr, USE op1, USE op2);
14214 
14215   ins_cost(INSN_COST);
14216   format %{ "cmpw  $op1, $op2\t# unsigned" %}
14217 
14218   ins_encode(aarch64_enc_cmpw(op1, op2));
14219 
14220   ins_pipe(icmp_reg_reg);
14221 %}
14222 
14223 instruct compU_reg_immI0(rFlagsRegU cr, iRegI op1, immI0 zero)
14224 %{
14225   match(Set cr (CmpU op1 zero));
14226 
14227   effect(DEF cr, USE op1);
14228 
14229   ins_cost(INSN_COST);
14230   format %{ "cmpw $op1, #0\t# unsigned" %}
14231 
14232   ins_encode(aarch64_enc_cmpw_imm_addsub(op1, zero));
14233 
14234   ins_pipe(icmp_reg_imm);
14235 %}
14236 
14237 instruct compU_reg_immIAddSub(rFlagsRegU cr, iRegI op1, immIAddSub op2)
14238 %{
14239   match(Set cr (CmpU op1 op2));
14240 
14241   effect(DEF cr, USE op1);
14242 
14243   ins_cost(INSN_COST);
14244   format %{ "cmpw  $op1, $op2\t# unsigned" %}
14245 
14246   ins_encode(aarch64_enc_cmpw_imm_addsub(op1, op2));
14247 
14248   ins_pipe(icmp_reg_imm);
14249 %}
14250 
14251 instruct compU_reg_immI(rFlagsRegU cr, iRegI op1, immI op2)
14252 %{
14253   match(Set cr (CmpU op1 op2));
14254 
14255   effect(DEF cr, USE op1);
14256 
14257   ins_cost(INSN_COST * 2);
14258   format %{ "cmpw  $op1, $op2\t# unsigned" %}
14259 
14260   ins_encode(aarch64_enc_cmpw_imm(op1, op2));
14261 
14262   ins_pipe(icmp_reg_imm);
14263 %}
14264 
14265 instruct compL_reg_reg(rFlagsReg cr, iRegL op1, iRegL op2)
14266 %{
14267   match(Set cr (CmpL op1 op2));
14268 
14269   effect(DEF cr, USE op1, USE op2);
14270 
14271   ins_cost(INSN_COST);
14272   format %{ "cmp  $op1, $op2" %}
14273 
14274   ins_encode(aarch64_enc_cmp(op1, op2));
14275 
14276   ins_pipe(icmp_reg_reg);
14277 %}
14278 
14279 instruct compL_reg_immL0(rFlagsReg cr, iRegL op1, immL0 zero)
14280 %{
14281   match(Set cr (CmpL op1 zero));
14282 
14283   effect(DEF cr, USE op1);
14284 
14285   ins_cost(INSN_COST);
14286   format %{ "tst  $op1" %}
14287 
14288   ins_encode(aarch64_enc_cmp_imm_addsub(op1, zero));
14289 
14290   ins_pipe(icmp_reg_imm);
14291 %}
14292 
14293 instruct compL_reg_immLAddSub(rFlagsReg cr, iRegL op1, immLAddSub op2)
14294 %{
14295   match(Set cr (CmpL op1 op2));
14296 
14297   effect(DEF cr, USE op1);
14298 
14299   ins_cost(INSN_COST);
14300   format %{ "cmp  $op1, $op2" %}
14301 
14302   ins_encode(aarch64_enc_cmp_imm_addsub(op1, op2));
14303 
14304   ins_pipe(icmp_reg_imm);
14305 %}
14306 
14307 instruct compL_reg_immL(rFlagsReg cr, iRegL op1, immL op2)
14308 %{
14309   match(Set cr (CmpL op1 op2));
14310 
14311   effect(DEF cr, USE op1);
14312 
14313   ins_cost(INSN_COST * 2);
14314   format %{ "cmp  $op1, $op2" %}
14315 
14316   ins_encode(aarch64_enc_cmp_imm(op1, op2));
14317 
14318   ins_pipe(icmp_reg_imm);
14319 %}
14320 
14321 instruct compUL_reg_reg(rFlagsRegU cr, iRegL op1, iRegL op2)
14322 %{
14323   match(Set cr (CmpUL op1 op2));
14324 
14325   effect(DEF cr, USE op1, USE op2);
14326 
14327   ins_cost(INSN_COST);
14328   format %{ "cmp  $op1, $op2" %}
14329 
14330   ins_encode(aarch64_enc_cmp(op1, op2));
14331 
14332   ins_pipe(icmp_reg_reg);
14333 %}
14334 
14335 instruct compUL_reg_immL0(rFlagsRegU cr, iRegL op1, immL0 zero)
14336 %{
14337   match(Set cr (CmpUL op1 zero));
14338 
14339   effect(DEF cr, USE op1);
14340 
14341   ins_cost(INSN_COST);
14342   format %{ "tst  $op1" %}
14343 
14344   ins_encode(aarch64_enc_cmp_imm_addsub(op1, zero));
14345 
14346   ins_pipe(icmp_reg_imm);
14347 %}
14348 
14349 instruct compUL_reg_immLAddSub(rFlagsRegU cr, iRegL op1, immLAddSub op2)
14350 %{
14351   match(Set cr (CmpUL op1 op2));
14352 
14353   effect(DEF cr, USE op1);
14354 
14355   ins_cost(INSN_COST);
14356   format %{ "cmp  $op1, $op2" %}
14357 
14358   ins_encode(aarch64_enc_cmp_imm_addsub(op1, op2));
14359 
14360   ins_pipe(icmp_reg_imm);
14361 %}
14362 
14363 instruct compUL_reg_immL(rFlagsRegU cr, iRegL op1, immL op2)
14364 %{
14365   match(Set cr (CmpUL op1 op2));
14366 
14367   effect(DEF cr, USE op1);
14368 
14369   ins_cost(INSN_COST * 2);
14370   format %{ "cmp  $op1, $op2" %}
14371 
14372   ins_encode(aarch64_enc_cmp_imm(op1, op2));
14373 
14374   ins_pipe(icmp_reg_imm);
14375 %}
14376 
14377 instruct compP_reg_reg(rFlagsRegU cr, iRegP op1, iRegP op2)
14378 %{
14379   match(Set cr (CmpP op1 op2));
14380 
14381   effect(DEF cr, USE op1, USE op2);
14382 
14383   ins_cost(INSN_COST);
14384   format %{ "cmp  $op1, $op2\t // ptr" %}
14385 
14386   ins_encode(aarch64_enc_cmpp(op1, op2));
14387 
14388   ins_pipe(icmp_reg_reg);
14389 %}
14390 
14391 instruct compN_reg_reg(rFlagsRegU cr, iRegN op1, iRegN op2)
14392 %{
14393   match(Set cr (CmpN op1 op2));
14394 
14395   effect(DEF cr, USE op1, USE op2);
14396 
14397   ins_cost(INSN_COST);
14398   format %{ "cmp  $op1, $op2\t // compressed ptr" %}
14399 
14400   ins_encode(aarch64_enc_cmpn(op1, op2));
14401 
14402   ins_pipe(icmp_reg_reg);
14403 %}
14404 
14405 instruct testP_reg(rFlagsRegU cr, iRegP op1, immP0 zero)
14406 %{
14407   match(Set cr (CmpP op1 zero));
14408 
14409   effect(DEF cr, USE op1, USE zero);
14410 
14411   ins_cost(INSN_COST);
14412   format %{ "cmp  $op1, 0\t // ptr" %}
14413 
14414   ins_encode(aarch64_enc_testp(op1));
14415 
14416   ins_pipe(icmp_reg_imm);
14417 %}
14418 
14419 instruct testN_reg(rFlagsRegU cr, iRegN op1, immN0 zero)
14420 %{
14421   match(Set cr (CmpN op1 zero));
14422 
14423   effect(DEF cr, USE op1, USE zero);
14424 
14425   ins_cost(INSN_COST);
14426   format %{ "cmp  $op1, 0\t // compressed ptr" %}
14427 
14428   ins_encode(aarch64_enc_testn(op1));
14429 
14430   ins_pipe(icmp_reg_imm);
14431 %}
14432 
14433 // FP comparisons
14434 //
14435 // n.b. CmpF/CmpD set a normal flags reg which then gets compared
14436 // using normal cmpOp. See declaration of rFlagsReg for details.
14437 
14438 instruct compF_reg_reg(rFlagsReg cr, vRegF src1, vRegF src2)
14439 %{
14440   match(Set cr (CmpF src1 src2));
14441 
14442   ins_cost(3 * INSN_COST);
14443   format %{ "fcmps $src1, $src2" %}
14444 
14445   ins_encode %{
14446     __ fcmps(as_FloatRegister($src1$$reg), as_FloatRegister($src2$$reg));
14447   %}
14448 
14449   ins_pipe(pipe_class_compare);
14450 %}
14451 
14452 instruct compF_reg_zero(rFlagsReg cr, vRegF src1, immF0 src2)
14453 %{
14454   match(Set cr (CmpF src1 src2));
14455 
14456   ins_cost(3 * INSN_COST);
14457   format %{ "fcmps $src1, 0.0" %}
14458 
14459   ins_encode %{
14460     __ fcmps(as_FloatRegister($src1$$reg), 0.0);
14461   %}
14462 
14463   ins_pipe(pipe_class_compare);
14464 %}
14465 // FROM HERE
14466 
14467 instruct compD_reg_reg(rFlagsReg cr, vRegD src1, vRegD src2)
14468 %{
14469   match(Set cr (CmpD src1 src2));
14470 
14471   ins_cost(3 * INSN_COST);
14472   format %{ "fcmpd $src1, $src2" %}
14473 
14474   ins_encode %{
14475     __ fcmpd(as_FloatRegister($src1$$reg), as_FloatRegister($src2$$reg));
14476   %}
14477 
14478   ins_pipe(pipe_class_compare);
14479 %}
14480 
14481 instruct compD_reg_zero(rFlagsReg cr, vRegD src1, immD0 src2)
14482 %{
14483   match(Set cr (CmpD src1 src2));
14484 
14485   ins_cost(3 * INSN_COST);
14486   format %{ "fcmpd $src1, 0.0" %}
14487 
14488   ins_encode %{
14489     __ fcmpd(as_FloatRegister($src1$$reg), 0.0);
14490   %}
14491 
14492   ins_pipe(pipe_class_compare);
14493 %}
14494 
14495 instruct compF3_reg_reg(iRegINoSp dst, vRegF src1, vRegF src2, rFlagsReg cr)
14496 %{
14497   match(Set dst (CmpF3 src1 src2));
14498   effect(KILL cr);
14499 
14500   ins_cost(5 * INSN_COST);
14501   format %{ "fcmps $src1, $src2\n\t"
14502             "csinvw($dst, zr, zr, eq\n\t"
14503             "csnegw($dst, $dst, $dst, lt)"
14504   %}
14505 
14506   ins_encode %{
14507     Label done;
14508     FloatRegister s1 = as_FloatRegister($src1$$reg);
14509     FloatRegister s2 = as_FloatRegister($src2$$reg);
14510     Register d = as_Register($dst$$reg);
14511     __ fcmps(s1, s2);
14512     // installs 0 if EQ else -1
14513     __ csinvw(d, zr, zr, Assembler::EQ);
14514     // keeps -1 if less or unordered else installs 1
14515     __ csnegw(d, d, d, Assembler::LT);
14516     __ bind(done);
14517   %}
14518 
14519   ins_pipe(pipe_class_default);
14520 
14521 %}
14522 
14523 instruct compD3_reg_reg(iRegINoSp dst, vRegD src1, vRegD src2, rFlagsReg cr)
14524 %{
14525   match(Set dst (CmpD3 src1 src2));
14526   effect(KILL cr);
14527 
14528   ins_cost(5 * INSN_COST);
14529   format %{ "fcmpd $src1, $src2\n\t"
14530             "csinvw($dst, zr, zr, eq\n\t"
14531             "csnegw($dst, $dst, $dst, lt)"
14532   %}
14533 
14534   ins_encode %{
14535     Label done;
14536     FloatRegister s1 = as_FloatRegister($src1$$reg);
14537     FloatRegister s2 = as_FloatRegister($src2$$reg);
14538     Register d = as_Register($dst$$reg);
14539     __ fcmpd(s1, s2);
14540     // installs 0 if EQ else -1
14541     __ csinvw(d, zr, zr, Assembler::EQ);
14542     // keeps -1 if less or unordered else installs 1
14543     __ csnegw(d, d, d, Assembler::LT);
14544     __ bind(done);
14545   %}
14546   ins_pipe(pipe_class_default);
14547 
14548 %}
14549 
14550 instruct compF3_reg_immF0(iRegINoSp dst, vRegF src1, immF0 zero, rFlagsReg cr)
14551 %{
14552   match(Set dst (CmpF3 src1 zero));
14553   effect(KILL cr);
14554 
14555   ins_cost(5 * INSN_COST);
14556   format %{ "fcmps $src1, 0.0\n\t"
14557             "csinvw($dst, zr, zr, eq\n\t"
14558             "csnegw($dst, $dst, $dst, lt)"
14559   %}
14560 
14561   ins_encode %{
14562     Label done;
14563     FloatRegister s1 = as_FloatRegister($src1$$reg);
14564     Register d = as_Register($dst$$reg);
14565     __ fcmps(s1, 0.0);
14566     // installs 0 if EQ else -1
14567     __ csinvw(d, zr, zr, Assembler::EQ);
14568     // keeps -1 if less or unordered else installs 1
14569     __ csnegw(d, d, d, Assembler::LT);
14570     __ bind(done);
14571   %}
14572 
14573   ins_pipe(pipe_class_default);
14574 
14575 %}
14576 
14577 instruct compD3_reg_immD0(iRegINoSp dst, vRegD src1, immD0 zero, rFlagsReg cr)
14578 %{
14579   match(Set dst (CmpD3 src1 zero));
14580   effect(KILL cr);
14581 
14582   ins_cost(5 * INSN_COST);
14583   format %{ "fcmpd $src1, 0.0\n\t"
14584             "csinvw($dst, zr, zr, eq\n\t"
14585             "csnegw($dst, $dst, $dst, lt)"
14586   %}
14587 
14588   ins_encode %{
14589     Label done;
14590     FloatRegister s1 = as_FloatRegister($src1$$reg);
14591     Register d = as_Register($dst$$reg);
14592     __ fcmpd(s1, 0.0);
14593     // installs 0 if EQ else -1
14594     __ csinvw(d, zr, zr, Assembler::EQ);
14595     // keeps -1 if less or unordered else installs 1
14596     __ csnegw(d, d, d, Assembler::LT);
14597     __ bind(done);
14598   %}
14599   ins_pipe(pipe_class_default);
14600 
14601 %}
14602 
14603 instruct cmpLTMask_reg_reg(iRegINoSp dst, iRegIorL2I p, iRegIorL2I q, rFlagsReg cr)
14604 %{
14605   match(Set dst (CmpLTMask p q));
14606   effect(KILL cr);
14607 
14608   ins_cost(3 * INSN_COST);
14609 
14610   format %{ "cmpw $p, $q\t# cmpLTMask\n\t"
14611             "csetw $dst, lt\n\t"
14612             "subw $dst, zr, $dst"
14613   %}
14614 
14615   ins_encode %{
14616     __ cmpw(as_Register($p$$reg), as_Register($q$$reg));
14617     __ csetw(as_Register($dst$$reg), Assembler::LT);
14618     __ subw(as_Register($dst$$reg), zr, as_Register($dst$$reg));
14619   %}
14620 
14621   ins_pipe(ialu_reg_reg);
14622 %}
14623 
14624 instruct cmpLTMask_reg_zero(iRegINoSp dst, iRegIorL2I src, immI0 zero, rFlagsReg cr)
14625 %{
14626   match(Set dst (CmpLTMask src zero));
14627   effect(KILL cr);
14628 
14629   ins_cost(INSN_COST);
14630 
14631   format %{ "asrw $dst, $src, #31\t# cmpLTMask0" %}
14632 
14633   ins_encode %{
14634     __ asrw(as_Register($dst$$reg), as_Register($src$$reg), 31);
14635   %}
14636 
14637   ins_pipe(ialu_reg_shift);
14638 %}
14639 
14640 // ============================================================================
14641 // Max and Min
14642 
14643 instruct cmovI_reg_reg_lt(iRegINoSp dst, iRegI src1, iRegI src2, rFlagsReg cr)
14644 %{
14645   effect( DEF dst, USE src1, USE src2, USE cr );
14646 
14647   ins_cost(INSN_COST * 2);
14648   format %{ "cselw $dst, $src1, $src2 lt\t"  %}
14649 
14650   ins_encode %{
14651     __ cselw(as_Register($dst$$reg),
14652              as_Register($src1$$reg),
14653              as_Register($src2$$reg),
14654              Assembler::LT);
14655   %}
14656 
14657   ins_pipe(icond_reg_reg);
14658 %}
14659 
14660 instruct minI_rReg(iRegINoSp dst, iRegI src1, iRegI src2)
14661 %{
14662   match(Set dst (MinI src1 src2));
14663   ins_cost(INSN_COST * 3);
14664 
14665   expand %{
14666     rFlagsReg cr;
14667     compI_reg_reg(cr, src1, src2);
14668     cmovI_reg_reg_lt(dst, src1, src2, cr);
14669   %}
14670 
14671 %}
14672 // FROM HERE
14673 
14674 instruct cmovI_reg_reg_gt(iRegINoSp dst, iRegI src1, iRegI src2, rFlagsReg cr)
14675 %{
14676   effect( DEF dst, USE src1, USE src2, USE cr );
14677 
14678   ins_cost(INSN_COST * 2);
14679   format %{ "cselw $dst, $src1, $src2 gt\t"  %}
14680 
14681   ins_encode %{
14682     __ cselw(as_Register($dst$$reg),
14683              as_Register($src1$$reg),
14684              as_Register($src2$$reg),
14685              Assembler::GT);
14686   %}
14687 
14688   ins_pipe(icond_reg_reg);
14689 %}
14690 
14691 instruct maxI_rReg(iRegINoSp dst, iRegI src1, iRegI src2)
14692 %{
14693   match(Set dst (MaxI src1 src2));
14694   ins_cost(INSN_COST * 3);
14695   expand %{
14696     rFlagsReg cr;
14697     compI_reg_reg(cr, src1, src2);
14698     cmovI_reg_reg_gt(dst, src1, src2, cr);
14699   %}
14700 %}
14701 
14702 // ============================================================================
14703 // Branch Instructions
14704 
14705 // Direct Branch.
14706 instruct branch(label lbl)
14707 %{
14708   match(Goto);
14709 
14710   effect(USE lbl);
14711 
14712   ins_cost(BRANCH_COST);
14713   format %{ "b  $lbl" %}
14714 
14715   ins_encode(aarch64_enc_b(lbl));
14716 
14717   ins_pipe(pipe_branch);
14718 %}
14719 
14720 // Conditional Near Branch
14721 instruct branchCon(cmpOp cmp, rFlagsReg cr, label lbl)
14722 %{
14723   // Same match rule as `branchConFar'.
14724   match(If cmp cr);
14725 
14726   effect(USE lbl);
14727 
14728   ins_cost(BRANCH_COST);
14729   // If set to 1 this indicates that the current instruction is a
14730   // short variant of a long branch. This avoids using this
14731   // instruction in first-pass matching. It will then only be used in
14732   // the `Shorten_branches' pass.
14733   // ins_short_branch(1);
14734   format %{ "b$cmp  $lbl" %}
14735 
14736   ins_encode(aarch64_enc_br_con(cmp, lbl));
14737 
14738   ins_pipe(pipe_branch_cond);
14739 %}
14740 
14741 // Conditional Near Branch Unsigned
14742 instruct branchConU(cmpOpU cmp, rFlagsRegU cr, label lbl)
14743 %{
14744   // Same match rule as `branchConFar'.
14745   match(If cmp cr);
14746 
14747   effect(USE lbl);
14748 
14749   ins_cost(BRANCH_COST);
14750   // If set to 1 this indicates that the current instruction is a
14751   // short variant of a long branch. This avoids using this
14752   // instruction in first-pass matching. It will then only be used in
14753   // the `Shorten_branches' pass.
14754   // ins_short_branch(1);
14755   format %{ "b$cmp  $lbl\t# unsigned" %}
14756 
14757   ins_encode(aarch64_enc_br_conU(cmp, lbl));
14758 
14759   ins_pipe(pipe_branch_cond);
14760 %}
14761 
14762 // Make use of CBZ and CBNZ.  These instructions, as well as being
14763 // shorter than (cmp; branch), have the additional benefit of not
14764 // killing the flags.
14765 
14766 instruct cmpI_imm0_branch(cmpOpEqNe cmp, iRegIorL2I op1, immI0 op2, label labl, rFlagsReg cr) %{
14767   match(If cmp (CmpI op1 op2));
14768   effect(USE labl);
14769 
14770   ins_cost(BRANCH_COST);
14771   format %{ "cbw$cmp   $op1, $labl" %}
14772   ins_encode %{
14773     Label* L = $labl$$label;
14774     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14775     if (cond == Assembler::EQ)
14776       __ cbzw($op1$$Register, *L);
14777     else
14778       __ cbnzw($op1$$Register, *L);
14779   %}
14780   ins_pipe(pipe_cmp_branch);
14781 %}
14782 
14783 instruct cmpL_imm0_branch(cmpOpEqNe cmp, iRegL op1, immL0 op2, label labl, rFlagsReg cr) %{
14784   match(If cmp (CmpL op1 op2));
14785   effect(USE labl);
14786 
14787   ins_cost(BRANCH_COST);
14788   format %{ "cb$cmp   $op1, $labl" %}
14789   ins_encode %{
14790     Label* L = $labl$$label;
14791     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14792     if (cond == Assembler::EQ)
14793       __ cbz($op1$$Register, *L);
14794     else
14795       __ cbnz($op1$$Register, *L);
14796   %}
14797   ins_pipe(pipe_cmp_branch);
14798 %}
14799 
14800 instruct cmpP_imm0_branch(cmpOpEqNe cmp, iRegP op1, immP0 op2, label labl, rFlagsReg cr) %{
14801   match(If cmp (CmpP op1 op2));
14802   effect(USE labl);
14803 
14804   ins_cost(BRANCH_COST);
14805   format %{ "cb$cmp   $op1, $labl" %}
14806   ins_encode %{
14807     Label* L = $labl$$label;
14808     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14809     if (cond == Assembler::EQ)
14810       __ cbz($op1$$Register, *L);
14811     else
14812       __ cbnz($op1$$Register, *L);
14813   %}
14814   ins_pipe(pipe_cmp_branch);
14815 %}
14816 
14817 instruct cmpN_imm0_branch(cmpOpEqNe cmp, iRegN op1, immN0 op2, label labl, rFlagsReg cr) %{
14818   match(If cmp (CmpN op1 op2));
14819   effect(USE labl);
14820 
14821   ins_cost(BRANCH_COST);
14822   format %{ "cbw$cmp   $op1, $labl" %}
14823   ins_encode %{
14824     Label* L = $labl$$label;
14825     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14826     if (cond == Assembler::EQ)
14827       __ cbzw($op1$$Register, *L);
14828     else
14829       __ cbnzw($op1$$Register, *L);
14830   %}
14831   ins_pipe(pipe_cmp_branch);
14832 %}
14833 
14834 instruct cmpP_narrowOop_imm0_branch(cmpOpEqNe cmp, iRegN oop, immP0 zero, label labl, rFlagsReg cr) %{
14835   match(If cmp (CmpP (DecodeN oop) zero));
14836   effect(USE labl);
14837 
14838   ins_cost(BRANCH_COST);
14839   format %{ "cb$cmp   $oop, $labl" %}
14840   ins_encode %{
14841     Label* L = $labl$$label;
14842     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14843     if (cond == Assembler::EQ)
14844       __ cbzw($oop$$Register, *L);
14845     else
14846       __ cbnzw($oop$$Register, *L);
14847   %}
14848   ins_pipe(pipe_cmp_branch);
14849 %}
14850 
14851 instruct cmpUI_imm0_branch(cmpOpUEqNeLtGe cmp, iRegIorL2I op1, immI0 op2, label labl, rFlagsRegU cr) %{
14852   match(If cmp (CmpU op1 op2));
14853   effect(USE labl);
14854 
14855   ins_cost(BRANCH_COST);
14856   format %{ "cbw$cmp   $op1, $labl" %}
14857   ins_encode %{
14858     Label* L = $labl$$label;
14859     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14860     if (cond == Assembler::EQ || cond == Assembler::LS)
14861       __ cbzw($op1$$Register, *L);
14862     else
14863       __ cbnzw($op1$$Register, *L);
14864   %}
14865   ins_pipe(pipe_cmp_branch);
14866 %}
14867 
14868 instruct cmpUL_imm0_branch(cmpOpUEqNeLtGe cmp, iRegL op1, immL0 op2, label labl, rFlagsRegU cr) %{
14869   match(If cmp (CmpUL op1 op2));
14870   effect(USE labl);
14871 
14872   ins_cost(BRANCH_COST);
14873   format %{ "cb$cmp   $op1, $labl" %}
14874   ins_encode %{
14875     Label* L = $labl$$label;
14876     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14877     if (cond == Assembler::EQ || cond == Assembler::LS)
14878       __ cbz($op1$$Register, *L);
14879     else
14880       __ cbnz($op1$$Register, *L);
14881   %}
14882   ins_pipe(pipe_cmp_branch);
14883 %}
14884 
14885 // Test bit and Branch
14886 
14887 // Patterns for short (< 32KiB) variants
14888 instruct cmpL_branch_sign(cmpOpLtGe cmp, iRegL op1, immL0 op2, label labl) %{
14889   match(If cmp (CmpL op1 op2));
14890   effect(USE labl);
14891 
14892   ins_cost(BRANCH_COST);
14893   format %{ "cb$cmp   $op1, $labl # long" %}
14894   ins_encode %{
14895     Label* L = $labl$$label;
14896     Assembler::Condition cond =
14897       ((Assembler::Condition)$cmp$$cmpcode == Assembler::LT) ? Assembler::NE : Assembler::EQ;
14898     __ tbr(cond, $op1$$Register, 63, *L);
14899   %}
14900   ins_pipe(pipe_cmp_branch);
14901   ins_short_branch(1);
14902 %}
14903 
14904 instruct cmpI_branch_sign(cmpOpLtGe cmp, iRegIorL2I op1, immI0 op2, label labl) %{
14905   match(If cmp (CmpI op1 op2));
14906   effect(USE labl);
14907 
14908   ins_cost(BRANCH_COST);
14909   format %{ "cb$cmp   $op1, $labl # int" %}
14910   ins_encode %{
14911     Label* L = $labl$$label;
14912     Assembler::Condition cond =
14913       ((Assembler::Condition)$cmp$$cmpcode == Assembler::LT) ? Assembler::NE : Assembler::EQ;
14914     __ tbr(cond, $op1$$Register, 31, *L);
14915   %}
14916   ins_pipe(pipe_cmp_branch);
14917   ins_short_branch(1);
14918 %}
14919 
14920 instruct cmpL_branch_bit(cmpOpEqNe cmp, iRegL op1, immL op2, immL0 op3, label labl) %{
14921   match(If cmp (CmpL (AndL op1 op2) op3));
14922   predicate(is_power_of_2((julong)n->in(2)->in(1)->in(2)->get_long()));
14923   effect(USE labl);
14924 
14925   ins_cost(BRANCH_COST);
14926   format %{ "tb$cmp   $op1, $op2, $labl" %}
14927   ins_encode %{
14928     Label* L = $labl$$label;
14929     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14930     int bit = exact_log2_long($op2$$constant);
14931     __ tbr(cond, $op1$$Register, bit, *L);
14932   %}
14933   ins_pipe(pipe_cmp_branch);
14934   ins_short_branch(1);
14935 %}
14936 
14937 instruct cmpI_branch_bit(cmpOpEqNe cmp, iRegIorL2I op1, immI op2, immI0 op3, label labl) %{
14938   match(If cmp (CmpI (AndI op1 op2) op3));
14939   predicate(is_power_of_2((juint)n->in(2)->in(1)->in(2)->get_int()));
14940   effect(USE labl);
14941 
14942   ins_cost(BRANCH_COST);
14943   format %{ "tb$cmp   $op1, $op2, $labl" %}
14944   ins_encode %{
14945     Label* L = $labl$$label;
14946     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14947     int bit = exact_log2((juint)$op2$$constant);
14948     __ tbr(cond, $op1$$Register, bit, *L);
14949   %}
14950   ins_pipe(pipe_cmp_branch);
14951   ins_short_branch(1);
14952 %}
14953 
14954 // And far variants
14955 instruct far_cmpL_branch_sign(cmpOpLtGe cmp, iRegL op1, immL0 op2, label labl) %{
14956   match(If cmp (CmpL op1 op2));
14957   effect(USE labl);
14958 
14959   ins_cost(BRANCH_COST);
14960   format %{ "cb$cmp   $op1, $labl # long" %}
14961   ins_encode %{
14962     Label* L = $labl$$label;
14963     Assembler::Condition cond =
14964       ((Assembler::Condition)$cmp$$cmpcode == Assembler::LT) ? Assembler::NE : Assembler::EQ;
14965     __ tbr(cond, $op1$$Register, 63, *L, /*far*/true);
14966   %}
14967   ins_pipe(pipe_cmp_branch);
14968 %}
14969 
14970 instruct far_cmpI_branch_sign(cmpOpLtGe cmp, iRegIorL2I op1, immI0 op2, label labl) %{
14971   match(If cmp (CmpI op1 op2));
14972   effect(USE labl);
14973 
14974   ins_cost(BRANCH_COST);
14975   format %{ "cb$cmp   $op1, $labl # int" %}
14976   ins_encode %{
14977     Label* L = $labl$$label;
14978     Assembler::Condition cond =
14979       ((Assembler::Condition)$cmp$$cmpcode == Assembler::LT) ? Assembler::NE : Assembler::EQ;
14980     __ tbr(cond, $op1$$Register, 31, *L, /*far*/true);
14981   %}
14982   ins_pipe(pipe_cmp_branch);
14983 %}
14984 
14985 instruct far_cmpL_branch_bit(cmpOpEqNe cmp, iRegL op1, immL op2, immL0 op3, label labl) %{
14986   match(If cmp (CmpL (AndL op1 op2) op3));
14987   predicate(is_power_of_2((julong)n->in(2)->in(1)->in(2)->get_long()));
14988   effect(USE labl);
14989 
14990   ins_cost(BRANCH_COST);
14991   format %{ "tb$cmp   $op1, $op2, $labl" %}
14992   ins_encode %{
14993     Label* L = $labl$$label;
14994     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
14995     int bit = exact_log2_long($op2$$constant);
14996     __ tbr(cond, $op1$$Register, bit, *L, /*far*/true);
14997   %}
14998   ins_pipe(pipe_cmp_branch);
14999 %}
15000 
15001 instruct far_cmpI_branch_bit(cmpOpEqNe cmp, iRegIorL2I op1, immI op2, immI0 op3, label labl) %{
15002   match(If cmp (CmpI (AndI op1 op2) op3));
15003   predicate(is_power_of_2((juint)n->in(2)->in(1)->in(2)->get_int()));
15004   effect(USE labl);
15005 
15006   ins_cost(BRANCH_COST);
15007   format %{ "tb$cmp   $op1, $op2, $labl" %}
15008   ins_encode %{
15009     Label* L = $labl$$label;
15010     Assembler::Condition cond = (Assembler::Condition)$cmp$$cmpcode;
15011     int bit = exact_log2((juint)$op2$$constant);
15012     __ tbr(cond, $op1$$Register, bit, *L, /*far*/true);
15013   %}
15014   ins_pipe(pipe_cmp_branch);
15015 %}
15016 
15017 // Test bits
15018 
15019 instruct cmpL_and(cmpOp cmp, iRegL op1, immL op2, immL0 op3, rFlagsReg cr) %{
15020   match(Set cr (CmpL (AndL op1 op2) op3));
15021   predicate(Assembler::operand_valid_for_logical_immediate
15022             (/*is_32*/false, n->in(1)->in(2)->get_long()));
15023 
15024   ins_cost(INSN_COST);
15025   format %{ "tst $op1, $op2 # long" %}
15026   ins_encode %{
15027     __ tst($op1$$Register, $op2$$constant);
15028   %}
15029   ins_pipe(ialu_reg_reg);
15030 %}
15031 
15032 instruct cmpI_and(cmpOp cmp, iRegIorL2I op1, immI op2, immI0 op3, rFlagsReg cr) %{
15033   match(Set cr (CmpI (AndI op1 op2) op3));
15034   predicate(Assembler::operand_valid_for_logical_immediate
15035             (/*is_32*/true, n->in(1)->in(2)->get_int()));
15036 
15037   ins_cost(INSN_COST);
15038   format %{ "tst $op1, $op2 # int" %}
15039   ins_encode %{
15040     __ tstw($op1$$Register, $op2$$constant);
15041   %}
15042   ins_pipe(ialu_reg_reg);
15043 %}
15044 
15045 instruct cmpL_and_reg(cmpOp cmp, iRegL op1, iRegL op2, immL0 op3, rFlagsReg cr) %{
15046   match(Set cr (CmpL (AndL op1 op2) op3));
15047 
15048   ins_cost(INSN_COST);
15049   format %{ "tst $op1, $op2 # long" %}
15050   ins_encode %{
15051     __ tst($op1$$Register, $op2$$Register);
15052   %}
15053   ins_pipe(ialu_reg_reg);
15054 %}
15055 
15056 instruct cmpI_and_reg(cmpOp cmp, iRegIorL2I op1, iRegIorL2I op2, immI0 op3, rFlagsReg cr) %{
15057   match(Set cr (CmpI (AndI op1 op2) op3));
15058 
15059   ins_cost(INSN_COST);
15060   format %{ "tstw $op1, $op2 # int" %}
15061   ins_encode %{
15062     __ tstw($op1$$Register, $op2$$Register);
15063   %}
15064   ins_pipe(ialu_reg_reg);
15065 %}
15066 
15067 
15068 // Conditional Far Branch
15069 // Conditional Far Branch Unsigned
15070 // TODO: fixme
15071 
15072 // counted loop end branch near
15073 instruct branchLoopEnd(cmpOp cmp, rFlagsReg cr, label lbl)
15074 %{
15075   match(CountedLoopEnd cmp cr);
15076 
15077   effect(USE lbl);
15078 
15079   ins_cost(BRANCH_COST);
15080   // short variant.
15081   // ins_short_branch(1);
15082   format %{ "b$cmp $lbl \t// counted loop end" %}
15083 
15084   ins_encode(aarch64_enc_br_con(cmp, lbl));
15085 
15086   ins_pipe(pipe_branch);
15087 %}
15088 
15089 // counted loop end branch near Unsigned
15090 instruct branchLoopEndU(cmpOpU cmp, rFlagsRegU cr, label lbl)
15091 %{
15092   match(CountedLoopEnd cmp cr);
15093 
15094   effect(USE lbl);
15095 
15096   ins_cost(BRANCH_COST);
15097   // short variant.
15098   // ins_short_branch(1);
15099   format %{ "b$cmp $lbl \t// counted loop end unsigned" %}
15100 
15101   ins_encode(aarch64_enc_br_conU(cmp, lbl));
15102 
15103   ins_pipe(pipe_branch);
15104 %}
15105 
15106 // counted loop end branch far
15107 // counted loop end branch far unsigned
15108 // TODO: fixme
15109 
15110 // ============================================================================
15111 // inlined locking and unlocking
15112 
15113 instruct cmpFastLock(rFlagsReg cr, iRegP object, iRegP box, iRegPNoSp tmp, iRegPNoSp tmp2)
15114 %{
15115   match(Set cr (FastLock object box));
15116   effect(TEMP tmp, TEMP tmp2);
15117 
15118   // TODO
15119   // identify correct cost
15120   ins_cost(5 * INSN_COST);
15121   format %{ "fastlock $object,$box\t! kills $tmp,$tmp2" %}
15122 
15123   ins_encode(aarch64_enc_fast_lock(object, box, tmp, tmp2));
15124 
15125   ins_pipe(pipe_serial);
15126 %}
15127 
15128 instruct cmpFastUnlock(rFlagsReg cr, iRegP object, iRegP box, iRegPNoSp tmp, iRegPNoSp tmp2)
15129 %{
15130   match(Set cr (FastUnlock object box));
15131   effect(TEMP tmp, TEMP tmp2);
15132 
15133   ins_cost(5 * INSN_COST);
15134   format %{ "fastunlock $object,$box\t! kills $tmp, $tmp2" %}
15135 
15136   ins_encode(aarch64_enc_fast_unlock(object, box, tmp, tmp2));
15137 
15138   ins_pipe(pipe_serial);
15139 %}
15140 
15141 
15142 // ============================================================================
15143 // Safepoint Instructions
15144 
15145 // TODO
15146 // provide a near and far version of this code
15147 
15148 instruct safePoint(rFlagsReg cr, iRegP poll)
15149 %{
15150   match(SafePoint poll);
15151   effect(KILL cr);
15152 
15153   format %{
15154     "ldrw zr, [$poll]\t# Safepoint: poll for GC"
15155   %}
15156   ins_encode %{
15157     __ read_polling_page(as_Register($poll$$reg), relocInfo::poll_type);
15158   %}
15159   ins_pipe(pipe_serial); // ins_pipe(iload_reg_mem);
15160 %}
15161 
15162 
15163 // ============================================================================
15164 // Procedure Call/Return Instructions
15165 
15166 // Call Java Static Instruction
15167 
15168 instruct CallStaticJavaDirect(method meth)
15169 %{
15170   match(CallStaticJava);
15171 
15172   effect(USE meth);
15173 
15174   ins_cost(CALL_COST);
15175 
15176   format %{ "call,static $meth \t// ==> " %}
15177 
15178   ins_encode( aarch64_enc_java_static_call(meth),
15179               aarch64_enc_call_epilog );
15180 
15181   ins_pipe(pipe_class_call);
15182 %}
15183 
15184 // TO HERE
15185 
15186 // Call Java Dynamic Instruction
15187 instruct CallDynamicJavaDirect(method meth)
15188 %{
15189   match(CallDynamicJava);
15190 
15191   effect(USE meth);
15192 
15193   ins_cost(CALL_COST);
15194 
15195   format %{ "CALL,dynamic $meth \t// ==> " %}
15196 
15197   ins_encode( aarch64_enc_java_dynamic_call(meth),
15198                aarch64_enc_call_epilog );
15199 
15200   ins_pipe(pipe_class_call);
15201 %}
15202 
15203 // Call Runtime Instruction
15204 
15205 instruct CallRuntimeDirect(method meth)
15206 %{
15207   match(CallRuntime);
15208 
15209   effect(USE meth);
15210 
15211   ins_cost(CALL_COST);
15212 
15213   format %{ "CALL, runtime $meth" %}
15214 
15215   ins_encode( aarch64_enc_java_to_runtime(meth) );
15216 
15217   ins_pipe(pipe_class_call);
15218 %}
15219 
15220 // Call Runtime Instruction
15221 
15222 instruct CallLeafDirect(method meth)
15223 %{
15224   match(CallLeaf);
15225 
15226   effect(USE meth);
15227 
15228   ins_cost(CALL_COST);
15229 
15230   format %{ "CALL, runtime leaf $meth" %}
15231 
15232   ins_encode( aarch64_enc_java_to_runtime(meth) );
15233 
15234   ins_pipe(pipe_class_call);
15235 %}
15236 
15237 // Call Runtime Instruction
15238 
15239 instruct CallLeafNoFPDirect(method meth)
15240 %{
15241   match(CallLeafNoFP);
15242 
15243   effect(USE meth);
15244 
15245   ins_cost(CALL_COST);
15246 
15247   format %{ "CALL, runtime leaf nofp $meth" %}
15248 
15249   ins_encode( aarch64_enc_java_to_runtime(meth) );
15250 
15251   ins_pipe(pipe_class_call);
15252 %}
15253 
15254 // Tail Call; Jump from runtime stub to Java code.
15255 // Also known as an 'interprocedural jump'.
15256 // Target of jump will eventually return to caller.
15257 // TailJump below removes the return address.
15258 instruct TailCalljmpInd(iRegPNoSp jump_target, inline_cache_RegP method_oop)
15259 %{
15260   match(TailCall jump_target method_oop);
15261 
15262   ins_cost(CALL_COST);
15263 
15264   format %{ "br $jump_target\t# $method_oop holds method oop" %}
15265 
15266   ins_encode(aarch64_enc_tail_call(jump_target));
15267 
15268   ins_pipe(pipe_class_call);
15269 %}
15270 
15271 instruct TailjmpInd(iRegPNoSp jump_target, iRegP_R0 ex_oop)
15272 %{
15273   match(TailJump jump_target ex_oop);
15274 
15275   ins_cost(CALL_COST);
15276 
15277   format %{ "br $jump_target\t# $ex_oop holds exception oop" %}
15278 
15279   ins_encode(aarch64_enc_tail_jmp(jump_target));
15280 
15281   ins_pipe(pipe_class_call);
15282 %}
15283 
15284 // Create exception oop: created by stack-crawling runtime code.
15285 // Created exception is now available to this handler, and is setup
15286 // just prior to jumping to this handler. No code emitted.
15287 // TODO check
15288 // should ex_oop be in r0? intel uses rax, ppc cannot use r0 so uses rarg1
15289 instruct CreateException(iRegP_R0 ex_oop)
15290 %{
15291   match(Set ex_oop (CreateEx));
15292 
15293   format %{ " -- \t// exception oop; no code emitted" %}
15294 
15295   size(0);
15296 
15297   ins_encode( /*empty*/ );
15298 
15299   ins_pipe(pipe_class_empty);
15300 %}
15301 
15302 // Rethrow exception: The exception oop will come in the first
15303 // argument position. Then JUMP (not call) to the rethrow stub code.
15304 instruct RethrowException() %{
15305   match(Rethrow);
15306   ins_cost(CALL_COST);
15307 
15308   format %{ "b rethrow_stub" %}
15309 
15310   ins_encode( aarch64_enc_rethrow() );
15311 
15312   ins_pipe(pipe_class_call);
15313 %}
15314 
15315 
15316 // Return Instruction
15317 // epilog node loads ret address into lr as part of frame pop
15318 instruct Ret()
15319 %{
15320   match(Return);
15321 
15322   format %{ "ret\t// return register" %}
15323 
15324   ins_encode( aarch64_enc_ret() );
15325 
15326   ins_pipe(pipe_branch);
15327 %}
15328 
15329 // Die now.
15330 instruct ShouldNotReachHere() %{
15331   match(Halt);
15332 
15333   ins_cost(CALL_COST);
15334   format %{ "ShouldNotReachHere" %}
15335 
15336   ins_encode %{
15337     if (is_reachable()) {
15338       __ stop(_halt_reason);
15339     }
15340   %}
15341 
15342   ins_pipe(pipe_class_default);
15343 %}
15344 
15345 // ============================================================================
15346 // Partial Subtype Check
15347 //
15348 // superklass array for an instance of the superklass.  Set a hidden
15349 // internal cache on a hit (cache is checked with exposed code in
15350 // gen_subtype_check()).  Return NZ for a miss or zero for a hit.  The
15351 // encoding ALSO sets flags.
15352 
15353 instruct partialSubtypeCheck(iRegP_R4 sub, iRegP_R0 super, iRegP_R2 temp, iRegP_R5 result, rFlagsReg cr)
15354 %{
15355   match(Set result (PartialSubtypeCheck sub super));
15356   effect(KILL cr, KILL temp);
15357 
15358   ins_cost(1100);  // slightly larger than the next version
15359   format %{ "partialSubtypeCheck $result, $sub, $super" %}
15360 
15361   ins_encode(aarch64_enc_partial_subtype_check(sub, super, temp, result));
15362 
15363   opcode(0x1); // Force zero of result reg on hit
15364 
15365   ins_pipe(pipe_class_memory);
15366 %}
15367 
15368 instruct partialSubtypeCheckVsZero(iRegP_R4 sub, iRegP_R0 super, iRegP_R2 temp, iRegP_R5 result, immP0 zero, rFlagsReg cr)
15369 %{
15370   match(Set cr (CmpP (PartialSubtypeCheck sub super) zero));
15371   effect(KILL temp, KILL result);
15372 
15373   ins_cost(1100);  // slightly larger than the next version
15374   format %{ "partialSubtypeCheck $result, $sub, $super == 0" %}
15375 
15376   ins_encode(aarch64_enc_partial_subtype_check(sub, super, temp, result));
15377 
15378   opcode(0x0); // Don't zero result reg on hit
15379 
15380   ins_pipe(pipe_class_memory);
15381 %}
15382 
15383 instruct string_compareU(iRegP_R1 str1, iRegI_R2 cnt1, iRegP_R3 str2, iRegI_R4 cnt2,
15384                         iRegI_R0 result, iRegP_R10 tmp1, iRegL_R11 tmp2, rFlagsReg cr)
15385 %{
15386   predicate(((StrCompNode*)n)->encoding() == StrIntrinsicNode::UU);
15387   match(Set result (StrComp (Binary str1 cnt1) (Binary str2 cnt2)));
15388   effect(KILL tmp1, KILL tmp2, USE_KILL str1, USE_KILL str2, USE_KILL cnt1, USE_KILL cnt2, KILL cr);
15389 
15390   format %{ "String Compare $str1,$cnt1,$str2,$cnt2 -> $result   # KILL $tmp1" %}
15391   ins_encode %{
15392     // Count is in 8-bit bytes; non-Compact chars are 16 bits.
15393     __ string_compare($str1$$Register, $str2$$Register,
15394                       $cnt1$$Register, $cnt2$$Register, $result$$Register,
15395                       $tmp1$$Register, $tmp2$$Register,
15396                       fnoreg, fnoreg, fnoreg, StrIntrinsicNode::UU);
15397   %}
15398   ins_pipe(pipe_class_memory);
15399 %}
15400 
15401 instruct string_compareL(iRegP_R1 str1, iRegI_R2 cnt1, iRegP_R3 str2, iRegI_R4 cnt2,
15402                         iRegI_R0 result, iRegP_R10 tmp1, iRegL_R11 tmp2, rFlagsReg cr)
15403 %{
15404   predicate(((StrCompNode*)n)->encoding() == StrIntrinsicNode::LL);
15405   match(Set result (StrComp (Binary str1 cnt1) (Binary str2 cnt2)));
15406   effect(KILL tmp1, KILL tmp2, USE_KILL str1, USE_KILL str2, USE_KILL cnt1, USE_KILL cnt2, KILL cr);
15407 
15408   format %{ "String Compare $str1,$cnt1,$str2,$cnt2 -> $result   # KILL $tmp1" %}
15409   ins_encode %{
15410     __ string_compare($str1$$Register, $str2$$Register,
15411                       $cnt1$$Register, $cnt2$$Register, $result$$Register,
15412                       $tmp1$$Register, $tmp2$$Register,
15413                       fnoreg, fnoreg, fnoreg, StrIntrinsicNode::LL);
15414   %}
15415   ins_pipe(pipe_class_memory);
15416 %}
15417 
15418 instruct string_compareUL(iRegP_R1 str1, iRegI_R2 cnt1, iRegP_R3 str2, iRegI_R4 cnt2,
15419                         iRegI_R0 result, iRegP_R10 tmp1, iRegL_R11 tmp2,
15420                         vRegD_V0 vtmp1, vRegD_V1 vtmp2, vRegD_V2 vtmp3, rFlagsReg cr)
15421 %{
15422   predicate(((StrCompNode*)n)->encoding() == StrIntrinsicNode::UL);
15423   match(Set result (StrComp (Binary str1 cnt1) (Binary str2 cnt2)));
15424   effect(KILL tmp1, KILL tmp2, KILL vtmp1, KILL vtmp2, KILL vtmp3,
15425          USE_KILL str1, USE_KILL str2, USE_KILL cnt1, USE_KILL cnt2, KILL cr);
15426 
15427   format %{ "String Compare $str1,$cnt1,$str2,$cnt2 -> $result   # KILL $tmp1, $tmp2, $vtmp1, $vtmp2, $vtmp3" %}
15428   ins_encode %{
15429     __ string_compare($str1$$Register, $str2$$Register,
15430                       $cnt1$$Register, $cnt2$$Register, $result$$Register,
15431                       $tmp1$$Register, $tmp2$$Register,
15432                       $vtmp1$$FloatRegister, $vtmp2$$FloatRegister,
15433                       $vtmp3$$FloatRegister, StrIntrinsicNode::UL);
15434   %}
15435   ins_pipe(pipe_class_memory);
15436 %}
15437 
15438 instruct string_compareLU(iRegP_R1 str1, iRegI_R2 cnt1, iRegP_R3 str2, iRegI_R4 cnt2,
15439                         iRegI_R0 result, iRegP_R10 tmp1, iRegL_R11 tmp2,
15440                         vRegD_V0 vtmp1, vRegD_V1 vtmp2, vRegD_V2 vtmp3, rFlagsReg cr)
15441 %{
15442   predicate(((StrCompNode*)n)->encoding() == StrIntrinsicNode::LU);
15443   match(Set result (StrComp (Binary str1 cnt1) (Binary str2 cnt2)));
15444   effect(KILL tmp1, KILL tmp2, KILL vtmp1, KILL vtmp2, KILL vtmp3,
15445          USE_KILL str1, USE_KILL str2, USE_KILL cnt1, USE_KILL cnt2, KILL cr);
15446 
15447   format %{ "String Compare $str1,$cnt1,$str2,$cnt2 -> $result   # KILL $tmp1, $tmp2, $vtmp1, $vtmp2, $vtmp3" %}
15448   ins_encode %{
15449     __ string_compare($str1$$Register, $str2$$Register,
15450                       $cnt1$$Register, $cnt2$$Register, $result$$Register,
15451                       $tmp1$$Register, $tmp2$$Register,
15452                       $vtmp1$$FloatRegister, $vtmp2$$FloatRegister,
15453                       $vtmp3$$FloatRegister,StrIntrinsicNode::LU);
15454   %}
15455   ins_pipe(pipe_class_memory);
15456 %}
15457 
15458 instruct string_indexofUU(iRegP_R1 str1, iRegI_R4 cnt1, iRegP_R3 str2, iRegI_R2 cnt2,
15459        iRegI_R0 result, iRegINoSp tmp1, iRegINoSp tmp2, iRegINoSp tmp3,
15460        iRegINoSp tmp4, iRegINoSp tmp5, iRegINoSp tmp6, rFlagsReg cr)
15461 %{
15462   predicate(((StrIndexOfNode*)n)->encoding() == StrIntrinsicNode::UU);
15463   match(Set result (StrIndexOf (Binary str1 cnt1) (Binary str2 cnt2)));
15464   effect(USE_KILL str1, USE_KILL str2, USE_KILL cnt1, USE_KILL cnt2,
15465          TEMP tmp1, TEMP tmp2, TEMP tmp3, TEMP tmp4, TEMP tmp5, TEMP tmp6, KILL cr);
15466   format %{ "String IndexOf $str1,$cnt1,$str2,$cnt2 -> $result (UU)" %}
15467 
15468   ins_encode %{
15469     __ string_indexof($str1$$Register, $str2$$Register,
15470                       $cnt1$$Register, $cnt2$$Register,
15471                       $tmp1$$Register, $tmp2$$Register,
15472                       $tmp3$$Register, $tmp4$$Register,
15473                       $tmp5$$Register, $tmp6$$Register,
15474                       -1, $result$$Register, StrIntrinsicNode::UU);
15475   %}
15476   ins_pipe(pipe_class_memory);
15477 %}
15478 
15479 instruct string_indexofLL(iRegP_R1 str1, iRegI_R4 cnt1, iRegP_R3 str2, iRegI_R2 cnt2,
15480        iRegI_R0 result, iRegINoSp tmp1, iRegINoSp tmp2, iRegINoSp tmp3,
15481        iRegINoSp tmp4, iRegINoSp tmp5, iRegINoSp tmp6, rFlagsReg cr)
15482 %{
15483   predicate(((StrIndexOfNode*)n)->encoding() == StrIntrinsicNode::LL);
15484   match(Set result (StrIndexOf (Binary str1 cnt1) (Binary str2 cnt2)));
15485   effect(USE_KILL str1, USE_KILL str2, USE_KILL cnt1, USE_KILL cnt2,
15486          TEMP tmp1, TEMP tmp2, TEMP tmp3, TEMP tmp4, TEMP tmp5, TEMP tmp6, KILL cr);
15487   format %{ "String IndexOf $str1,$cnt1,$str2,$cnt2 -> $result (LL)" %}
15488 
15489   ins_encode %{
15490     __ string_indexof($str1$$Register, $str2$$Register,
15491                       $cnt1$$Register, $cnt2$$Register,
15492                       $tmp1$$Register, $tmp2$$Register,
15493                       $tmp3$$Register, $tmp4$$Register,
15494                       $tmp5$$Register, $tmp6$$Register,
15495                       -1, $result$$Register, StrIntrinsicNode::LL);
15496   %}
15497   ins_pipe(pipe_class_memory);
15498 %}
15499 
15500 instruct string_indexofUL(iRegP_R1 str1, iRegI_R4 cnt1, iRegP_R3 str2, iRegI_R2 cnt2,
15501        iRegI_R0 result, iRegINoSp tmp1, iRegINoSp tmp2, iRegINoSp tmp3,
15502        iRegINoSp tmp4, iRegINoSp tmp5, iRegINoSp tmp6, rFlagsReg cr)
15503 %{
15504   predicate(((StrIndexOfNode*)n)->encoding() == StrIntrinsicNode::UL);
15505   match(Set result (StrIndexOf (Binary str1 cnt1) (Binary str2 cnt2)));
15506   effect(USE_KILL str1, USE_KILL str2, USE_KILL cnt1, USE_KILL cnt2,
15507          TEMP tmp1, TEMP tmp2, TEMP tmp3, TEMP tmp4, TEMP tmp5, TEMP tmp6, KILL cr);
15508   format %{ "String IndexOf $str1,$cnt1,$str2,$cnt2 -> $result (UL)" %}
15509 
15510   ins_encode %{
15511     __ string_indexof($str1$$Register, $str2$$Register,
15512                       $cnt1$$Register, $cnt2$$Register,
15513                       $tmp1$$Register, $tmp2$$Register,
15514                       $tmp3$$Register, $tmp4$$Register,
15515                       $tmp5$$Register, $tmp6$$Register,
15516                       -1, $result$$Register, StrIntrinsicNode::UL);
15517   %}
15518   ins_pipe(pipe_class_memory);
15519 %}
15520 
15521 instruct string_indexof_conUU(iRegP_R1 str1, iRegI_R4 cnt1, iRegP_R3 str2,
15522                  immI_le_4 int_cnt2, iRegI_R0 result, iRegINoSp tmp1, iRegINoSp tmp2,
15523                  iRegINoSp tmp3, iRegINoSp tmp4, rFlagsReg cr)
15524 %{
15525   predicate(((StrIndexOfNode*)n)->encoding() == StrIntrinsicNode::UU);
15526   match(Set result (StrIndexOf (Binary str1 cnt1) (Binary str2 int_cnt2)));
15527   effect(USE_KILL str1, USE_KILL str2, USE_KILL cnt1,
15528          TEMP tmp1, TEMP tmp2, TEMP tmp3, TEMP tmp4, KILL cr);
15529   format %{ "String IndexOf $str1,$cnt1,$str2,$int_cnt2 -> $result (UU)" %}
15530 
15531   ins_encode %{
15532     int icnt2 = (int)$int_cnt2$$constant;
15533     __ string_indexof($str1$$Register, $str2$$Register,
15534                       $cnt1$$Register, zr,
15535                       $tmp1$$Register, $tmp2$$Register,
15536                       $tmp3$$Register, $tmp4$$Register, zr, zr,
15537                       icnt2, $result$$Register, StrIntrinsicNode::UU);
15538   %}
15539   ins_pipe(pipe_class_memory);
15540 %}
15541 
15542 instruct string_indexof_conLL(iRegP_R1 str1, iRegI_R4 cnt1, iRegP_R3 str2,
15543                  immI_le_4 int_cnt2, iRegI_R0 result, iRegINoSp tmp1, iRegINoSp tmp2,
15544                  iRegINoSp tmp3, iRegINoSp tmp4, rFlagsReg cr)
15545 %{
15546   predicate(((StrIndexOfNode*)n)->encoding() == StrIntrinsicNode::LL);
15547   match(Set result (StrIndexOf (Binary str1 cnt1) (Binary str2 int_cnt2)));
15548   effect(USE_KILL str1, USE_KILL str2, USE_KILL cnt1,
15549          TEMP tmp1, TEMP tmp2, TEMP tmp3, TEMP tmp4, KILL cr);
15550   format %{ "String IndexOf $str1,$cnt1,$str2,$int_cnt2 -> $result (LL)" %}
15551 
15552   ins_encode %{
15553     int icnt2 = (int)$int_cnt2$$constant;
15554     __ string_indexof($str1$$Register, $str2$$Register,
15555                       $cnt1$$Register, zr,
15556                       $tmp1$$Register, $tmp2$$Register,
15557                       $tmp3$$Register, $tmp4$$Register, zr, zr,
15558                       icnt2, $result$$Register, StrIntrinsicNode::LL);
15559   %}
15560   ins_pipe(pipe_class_memory);
15561 %}
15562 
15563 instruct string_indexof_conUL(iRegP_R1 str1, iRegI_R4 cnt1, iRegP_R3 str2,
15564                  immI_1 int_cnt2, iRegI_R0 result, iRegINoSp tmp1, iRegINoSp tmp2,
15565                  iRegINoSp tmp3, iRegINoSp tmp4, rFlagsReg cr)
15566 %{
15567   predicate(((StrIndexOfNode*)n)->encoding() == StrIntrinsicNode::UL);
15568   match(Set result (StrIndexOf (Binary str1 cnt1) (Binary str2 int_cnt2)));
15569   effect(USE_KILL str1, USE_KILL str2, USE_KILL cnt1,
15570          TEMP tmp1, TEMP tmp2, TEMP tmp3, TEMP tmp4, KILL cr);
15571   format %{ "String IndexOf $str1,$cnt1,$str2,$int_cnt2 -> $result (UL)" %}
15572 
15573   ins_encode %{
15574     int icnt2 = (int)$int_cnt2$$constant;
15575     __ string_indexof($str1$$Register, $str2$$Register,
15576                       $cnt1$$Register, zr,
15577                       $tmp1$$Register, $tmp2$$Register,
15578                       $tmp3$$Register, $tmp4$$Register, zr, zr,
15579                       icnt2, $result$$Register, StrIntrinsicNode::UL);
15580   %}
15581   ins_pipe(pipe_class_memory);
15582 %}
15583 
15584 instruct string_indexofU_char(iRegP_R1 str1, iRegI_R2 cnt1, iRegI_R3 ch,
15585                               iRegI_R0 result, iRegINoSp tmp1, iRegINoSp tmp2,
15586                               iRegINoSp tmp3, rFlagsReg cr)
15587 %{
15588   match(Set result (StrIndexOfChar (Binary str1 cnt1) ch));
15589   effect(USE_KILL str1, USE_KILL cnt1, USE_KILL ch,
15590          TEMP tmp1, TEMP tmp2, TEMP tmp3, KILL cr);
15591 
15592   format %{ "String IndexOf char[] $str1,$cnt1,$ch -> $result" %}
15593 
15594   ins_encode %{
15595     __ string_indexof_char($str1$$Register, $cnt1$$Register, $ch$$Register,
15596                            $result$$Register, $tmp1$$Register, $tmp2$$Register,
15597                            $tmp3$$Register);
15598   %}
15599   ins_pipe(pipe_class_memory);
15600 %}
15601 
15602 instruct string_equalsL(iRegP_R1 str1, iRegP_R3 str2, iRegI_R4 cnt,
15603                         iRegI_R0 result, rFlagsReg cr)
15604 %{
15605   predicate(((StrEqualsNode*)n)->encoding() == StrIntrinsicNode::LL);
15606   match(Set result (StrEquals (Binary str1 str2) cnt));
15607   effect(USE_KILL str1, USE_KILL str2, USE_KILL cnt, KILL cr);
15608 
15609   format %{ "String Equals $str1,$str2,$cnt -> $result" %}
15610   ins_encode %{
15611     // Count is in 8-bit bytes; non-Compact chars are 16 bits.
15612     __ string_equals($str1$$Register, $str2$$Register,
15613                      $result$$Register, $cnt$$Register, 1);
15614   %}
15615   ins_pipe(pipe_class_memory);
15616 %}
15617 
15618 instruct string_equalsU(iRegP_R1 str1, iRegP_R3 str2, iRegI_R4 cnt,
15619                         iRegI_R0 result, rFlagsReg cr)
15620 %{
15621   predicate(((StrEqualsNode*)n)->encoding() == StrIntrinsicNode::UU);
15622   match(Set result (StrEquals (Binary str1 str2) cnt));
15623   effect(USE_KILL str1, USE_KILL str2, USE_KILL cnt, KILL cr);
15624 
15625   format %{ "String Equals $str1,$str2,$cnt -> $result" %}
15626   ins_encode %{
15627     // Count is in 8-bit bytes; non-Compact chars are 16 bits.
15628     __ string_equals($str1$$Register, $str2$$Register,
15629                      $result$$Register, $cnt$$Register, 2);
15630   %}
15631   ins_pipe(pipe_class_memory);
15632 %}
15633 
15634 instruct array_equalsB(iRegP_R1 ary1, iRegP_R2 ary2, iRegI_R0 result,
15635                        iRegP_R3 tmp1, iRegP_R4 tmp2, iRegP_R5 tmp3,
15636                        iRegP_R10 tmp, rFlagsReg cr)
15637 %{
15638   predicate(((AryEqNode*)n)->encoding() == StrIntrinsicNode::LL);
15639   match(Set result (AryEq ary1 ary2));
15640   effect(KILL tmp, USE_KILL ary1, USE_KILL ary2, TEMP tmp1, TEMP tmp2, TEMP tmp3, KILL cr);
15641 
15642   format %{ "Array Equals $ary1,ary2 -> $result    // KILL $tmp" %}
15643   ins_encode %{
15644     __ arrays_equals($ary1$$Register, $ary2$$Register,
15645                      $tmp1$$Register, $tmp2$$Register, $tmp3$$Register,
15646                      $result$$Register, $tmp$$Register, 1);
15647     %}
15648   ins_pipe(pipe_class_memory);
15649 %}
15650 
15651 instruct array_equalsC(iRegP_R1 ary1, iRegP_R2 ary2, iRegI_R0 result,
15652                        iRegP_R3 tmp1, iRegP_R4 tmp2, iRegP_R5 tmp3,
15653                        iRegP_R10 tmp, rFlagsReg cr)
15654 %{
15655   predicate(((AryEqNode*)n)->encoding() == StrIntrinsicNode::UU);
15656   match(Set result (AryEq ary1 ary2));
15657   effect(KILL tmp, USE_KILL ary1, USE_KILL ary2, TEMP tmp1, TEMP tmp2, TEMP tmp3, KILL cr);
15658 
15659   format %{ "Array Equals $ary1,ary2 -> $result    // KILL $tmp" %}
15660   ins_encode %{
15661     __ arrays_equals($ary1$$Register, $ary2$$Register,
15662                      $tmp1$$Register, $tmp2$$Register, $tmp3$$Register,
15663                      $result$$Register, $tmp$$Register, 2);
15664   %}
15665   ins_pipe(pipe_class_memory);
15666 %}
15667 
15668 instruct has_negatives(iRegP_R1 ary1, iRegI_R2 len, iRegI_R0 result, rFlagsReg cr)
15669 %{
15670   match(Set result (HasNegatives ary1 len));
15671   effect(USE_KILL ary1, USE_KILL len, KILL cr);
15672   format %{ "has negatives byte[] $ary1,$len -> $result" %}
15673   ins_encode %{
15674     __ has_negatives($ary1$$Register, $len$$Register, $result$$Register);
15675   %}
15676   ins_pipe( pipe_slow );
15677 %}
15678 
15679 // fast char[] to byte[] compression
15680 instruct string_compress(iRegP_R2 src, iRegP_R1 dst, iRegI_R3 len,
15681                          vRegD_V0 tmp1, vRegD_V1 tmp2,
15682                          vRegD_V2 tmp3, vRegD_V3 tmp4,
15683                          iRegI_R0 result, rFlagsReg cr)
15684 %{
15685   match(Set result (StrCompressedCopy src (Binary dst len)));
15686   effect(TEMP tmp1, TEMP tmp2, TEMP tmp3, TEMP tmp4, USE_KILL src, USE_KILL dst, USE_KILL len, KILL cr);
15687 
15688   format %{ "String Compress $src,$dst -> $result    // KILL R1, R2, R3, R4" %}
15689   ins_encode %{
15690     __ char_array_compress($src$$Register, $dst$$Register, $len$$Register,
15691                            $tmp1$$FloatRegister, $tmp2$$FloatRegister,
15692                            $tmp3$$FloatRegister, $tmp4$$FloatRegister,
15693                            $result$$Register);
15694   %}
15695   ins_pipe( pipe_slow );
15696 %}
15697 
15698 // fast byte[] to char[] inflation
15699 instruct string_inflate(Universe dummy, iRegP_R0 src, iRegP_R1 dst, iRegI_R2 len,
15700                         vRegD_V0 tmp1, vRegD_V1 tmp2, vRegD_V2 tmp3, iRegP_R3 tmp4, rFlagsReg cr)
15701 %{
15702   match(Set dummy (StrInflatedCopy src (Binary dst len)));
15703   effect(TEMP tmp1, TEMP tmp2, TEMP tmp3, TEMP tmp4, USE_KILL src, USE_KILL dst, USE_KILL len, KILL cr);
15704 
15705   format %{ "String Inflate $src,$dst    // KILL $tmp1, $tmp2" %}
15706   ins_encode %{
15707     __ byte_array_inflate($src$$Register, $dst$$Register, $len$$Register,
15708                           $tmp1$$FloatRegister, $tmp2$$FloatRegister, $tmp3$$FloatRegister, $tmp4$$Register);
15709   %}
15710   ins_pipe(pipe_class_memory);
15711 %}
15712 
15713 // encode char[] to byte[] in ISO_8859_1
15714 instruct encode_iso_array(iRegP_R2 src, iRegP_R1 dst, iRegI_R3 len,
15715                           vRegD_V0 Vtmp1, vRegD_V1 Vtmp2,
15716                           vRegD_V2 Vtmp3, vRegD_V3 Vtmp4,
15717                           iRegI_R0 result, rFlagsReg cr)
15718 %{
15719   match(Set result (EncodeISOArray src (Binary dst len)));
15720   effect(USE_KILL src, USE_KILL dst, USE_KILL len,
15721          KILL Vtmp1, KILL Vtmp2, KILL Vtmp3, KILL Vtmp4, KILL cr);
15722 
15723   format %{ "Encode array $src,$dst,$len -> $result" %}
15724   ins_encode %{
15725     __ encode_iso_array($src$$Register, $dst$$Register, $len$$Register,
15726          $result$$Register, $Vtmp1$$FloatRegister,  $Vtmp2$$FloatRegister,
15727          $Vtmp3$$FloatRegister,  $Vtmp4$$FloatRegister);
15728   %}
15729   ins_pipe( pipe_class_memory );
15730 %}
15731 
15732 // ============================================================================
15733 // This name is KNOWN by the ADLC and cannot be changed.
15734 // The ADLC forces a 'TypeRawPtr::BOTTOM' output type
15735 // for this guy.
15736 instruct tlsLoadP(thread_RegP dst)
15737 %{
15738   match(Set dst (ThreadLocal));
15739 
15740   ins_cost(0);
15741 
15742   format %{ " -- \t// $dst=Thread::current(), empty" %}
15743 
15744   size(0);
15745 
15746   ins_encode( /*empty*/ );
15747 
15748   ins_pipe(pipe_class_empty);
15749 %}
15750 
15751 // ====================VECTOR INSTRUCTIONS=====================================
15752 
15753 // Load vector (32 bits)
15754 instruct loadV4(vecD dst, vmem4 mem)
15755 %{
15756   predicate(n->as_LoadVector()->memory_size() == 4);
15757   match(Set dst (LoadVector mem));
15758   ins_cost(4 * INSN_COST);
15759   format %{ "ldrs   $dst,$mem\t# vector (32 bits)" %}
15760   ins_encode( aarch64_enc_ldrvS(dst, mem) );
15761   ins_pipe(vload_reg_mem64);
15762 %}
15763 
15764 // Load vector (64 bits)
15765 instruct loadV8(vecD dst, vmem8 mem)
15766 %{
15767   predicate(n->as_LoadVector()->memory_size() == 8);
15768   match(Set dst (LoadVector mem));
15769   ins_cost(4 * INSN_COST);
15770   format %{ "ldrd   $dst,$mem\t# vector (64 bits)" %}
15771   ins_encode( aarch64_enc_ldrvD(dst, mem) );
15772   ins_pipe(vload_reg_mem64);
15773 %}
15774 
15775 // Load Vector (128 bits)
15776 instruct loadV16(vecX dst, vmem16 mem)
15777 %{
15778   predicate(n->as_LoadVector()->memory_size() == 16);
15779   match(Set dst (LoadVector mem));
15780   ins_cost(4 * INSN_COST);
15781   format %{ "ldrq   $dst,$mem\t# vector (128 bits)" %}
15782   ins_encode( aarch64_enc_ldrvQ(dst, mem) );
15783   ins_pipe(vload_reg_mem128);
15784 %}
15785 
15786 // Store Vector (32 bits)
15787 instruct storeV4(vecD src, vmem4 mem)
15788 %{
15789   predicate(n->as_StoreVector()->memory_size() == 4);
15790   match(Set mem (StoreVector mem src));
15791   ins_cost(4 * INSN_COST);
15792   format %{ "strs   $mem,$src\t# vector (32 bits)" %}
15793   ins_encode( aarch64_enc_strvS(src, mem) );
15794   ins_pipe(vstore_reg_mem64);
15795 %}
15796 
15797 // Store Vector (64 bits)
15798 instruct storeV8(vecD src, vmem8 mem)
15799 %{
15800   predicate(n->as_StoreVector()->memory_size() == 8);
15801   match(Set mem (StoreVector mem src));
15802   ins_cost(4 * INSN_COST);
15803   format %{ "strd   $mem,$src\t# vector (64 bits)" %}
15804   ins_encode( aarch64_enc_strvD(src, mem) );
15805   ins_pipe(vstore_reg_mem64);
15806 %}
15807 
15808 // Store Vector (128 bits)
15809 instruct storeV16(vecX src, vmem16 mem)
15810 %{
15811   predicate(n->as_StoreVector()->memory_size() == 16);
15812   match(Set mem (StoreVector mem src));
15813   ins_cost(4 * INSN_COST);
15814   format %{ "strq   $mem,$src\t# vector (128 bits)" %}
15815   ins_encode( aarch64_enc_strvQ(src, mem) );
15816   ins_pipe(vstore_reg_mem128);
15817 %}
15818 
15819 instruct replicate8B(vecD dst, iRegIorL2I src)
15820 %{
15821   predicate(n->as_Vector()->length() == 4 ||
15822             n->as_Vector()->length() == 8);
15823   match(Set dst (ReplicateB src));
15824   ins_cost(INSN_COST);
15825   format %{ "dup  $dst, $src\t# vector (8B)" %}
15826   ins_encode %{
15827     __ dup(as_FloatRegister($dst$$reg), __ T8B, as_Register($src$$reg));
15828   %}
15829   ins_pipe(vdup_reg_reg64);
15830 %}
15831 
15832 instruct replicate16B(vecX dst, iRegIorL2I src)
15833 %{
15834   predicate(n->as_Vector()->length() == 16);
15835   match(Set dst (ReplicateB src));
15836   ins_cost(INSN_COST);
15837   format %{ "dup  $dst, $src\t# vector (16B)" %}
15838   ins_encode %{
15839     __ dup(as_FloatRegister($dst$$reg), __ T16B, as_Register($src$$reg));
15840   %}
15841   ins_pipe(vdup_reg_reg128);
15842 %}
15843 
15844 instruct replicate8B_imm(vecD dst, immI con)
15845 %{
15846   predicate(n->as_Vector()->length() == 4 ||
15847             n->as_Vector()->length() == 8);
15848   match(Set dst (ReplicateB con));
15849   ins_cost(INSN_COST);
15850   format %{ "movi  $dst, $con\t# vector(8B)" %}
15851   ins_encode %{
15852     __ mov(as_FloatRegister($dst$$reg), __ T8B, $con$$constant & 0xff);
15853   %}
15854   ins_pipe(vmovi_reg_imm64);
15855 %}
15856 
15857 instruct replicate16B_imm(vecX dst, immI con)
15858 %{
15859   predicate(n->as_Vector()->length() == 16);
15860   match(Set dst (ReplicateB con));
15861   ins_cost(INSN_COST);
15862   format %{ "movi  $dst, $con\t# vector(16B)" %}
15863   ins_encode %{
15864     __ mov(as_FloatRegister($dst$$reg), __ T16B, $con$$constant & 0xff);
15865   %}
15866   ins_pipe(vmovi_reg_imm128);
15867 %}
15868 
15869 instruct replicate4S(vecD dst, iRegIorL2I src)
15870 %{
15871   predicate(n->as_Vector()->length() == 2 ||
15872             n->as_Vector()->length() == 4);
15873   match(Set dst (ReplicateS src));
15874   ins_cost(INSN_COST);
15875   format %{ "dup  $dst, $src\t# vector (4S)" %}
15876   ins_encode %{
15877     __ dup(as_FloatRegister($dst$$reg), __ T4H, as_Register($src$$reg));
15878   %}
15879   ins_pipe(vdup_reg_reg64);
15880 %}
15881 
15882 instruct replicate8S(vecX dst, iRegIorL2I src)
15883 %{
15884   predicate(n->as_Vector()->length() == 8);
15885   match(Set dst (ReplicateS src));
15886   ins_cost(INSN_COST);
15887   format %{ "dup  $dst, $src\t# vector (8S)" %}
15888   ins_encode %{
15889     __ dup(as_FloatRegister($dst$$reg), __ T8H, as_Register($src$$reg));
15890   %}
15891   ins_pipe(vdup_reg_reg128);
15892 %}
15893 
15894 instruct replicate4S_imm(vecD dst, immI con)
15895 %{
15896   predicate(n->as_Vector()->length() == 2 ||
15897             n->as_Vector()->length() == 4);
15898   match(Set dst (ReplicateS con));
15899   ins_cost(INSN_COST);
15900   format %{ "movi  $dst, $con\t# vector(4H)" %}
15901   ins_encode %{
15902     __ mov(as_FloatRegister($dst$$reg), __ T4H, $con$$constant & 0xffff);
15903   %}
15904   ins_pipe(vmovi_reg_imm64);
15905 %}
15906 
15907 instruct replicate8S_imm(vecX dst, immI con)
15908 %{
15909   predicate(n->as_Vector()->length() == 8);
15910   match(Set dst (ReplicateS con));
15911   ins_cost(INSN_COST);
15912   format %{ "movi  $dst, $con\t# vector(8H)" %}
15913   ins_encode %{
15914     __ mov(as_FloatRegister($dst$$reg), __ T8H, $con$$constant & 0xffff);
15915   %}
15916   ins_pipe(vmovi_reg_imm128);
15917 %}
15918 
15919 instruct replicate2I(vecD dst, iRegIorL2I src)
15920 %{
15921   predicate(n->as_Vector()->length() == 2);
15922   match(Set dst (ReplicateI src));
15923   ins_cost(INSN_COST);
15924   format %{ "dup  $dst, $src\t# vector (2I)" %}
15925   ins_encode %{
15926     __ dup(as_FloatRegister($dst$$reg), __ T2S, as_Register($src$$reg));
15927   %}
15928   ins_pipe(vdup_reg_reg64);
15929 %}
15930 
15931 instruct replicate4I(vecX dst, iRegIorL2I src)
15932 %{
15933   predicate(n->as_Vector()->length() == 4);
15934   match(Set dst (ReplicateI src));
15935   ins_cost(INSN_COST);
15936   format %{ "dup  $dst, $src\t# vector (4I)" %}
15937   ins_encode %{
15938     __ dup(as_FloatRegister($dst$$reg), __ T4S, as_Register($src$$reg));
15939   %}
15940   ins_pipe(vdup_reg_reg128);
15941 %}
15942 
15943 instruct replicate2I_imm(vecD dst, immI con)
15944 %{
15945   predicate(n->as_Vector()->length() == 2);
15946   match(Set dst (ReplicateI con));
15947   ins_cost(INSN_COST);
15948   format %{ "movi  $dst, $con\t# vector(2I)" %}
15949   ins_encode %{
15950     __ mov(as_FloatRegister($dst$$reg), __ T2S, $con$$constant);
15951   %}
15952   ins_pipe(vmovi_reg_imm64);
15953 %}
15954 
15955 instruct replicate4I_imm(vecX dst, immI con)
15956 %{
15957   predicate(n->as_Vector()->length() == 4);
15958   match(Set dst (ReplicateI con));
15959   ins_cost(INSN_COST);
15960   format %{ "movi  $dst, $con\t# vector(4I)" %}
15961   ins_encode %{
15962     __ mov(as_FloatRegister($dst$$reg), __ T4S, $con$$constant);
15963   %}
15964   ins_pipe(vmovi_reg_imm128);
15965 %}
15966 
15967 instruct replicate2L(vecX dst, iRegL src)
15968 %{
15969   predicate(n->as_Vector()->length() == 2);
15970   match(Set dst (ReplicateL src));
15971   ins_cost(INSN_COST);
15972   format %{ "dup  $dst, $src\t# vector (2L)" %}
15973   ins_encode %{
15974     __ dup(as_FloatRegister($dst$$reg), __ T2D, as_Register($src$$reg));
15975   %}
15976   ins_pipe(vdup_reg_reg128);
15977 %}
15978 
15979 instruct replicate2L_zero(vecX dst, immI0 zero)
15980 %{
15981   predicate(n->as_Vector()->length() == 2);
15982   match(Set dst (ReplicateI zero));
15983   ins_cost(INSN_COST);
15984   format %{ "movi  $dst, $zero\t# vector(4I)" %}
15985   ins_encode %{
15986     __ eor(as_FloatRegister($dst$$reg), __ T16B,
15987            as_FloatRegister($dst$$reg),
15988            as_FloatRegister($dst$$reg));
15989   %}
15990   ins_pipe(vmovi_reg_imm128);
15991 %}
15992 
15993 instruct replicate2F(vecD dst, vRegF src)
15994 %{
15995   predicate(n->as_Vector()->length() == 2);
15996   match(Set dst (ReplicateF src));
15997   ins_cost(INSN_COST);
15998   format %{ "dup  $dst, $src\t# vector (2F)" %}
15999   ins_encode %{
16000     __ dup(as_FloatRegister($dst$$reg), __ T2S,
16001            as_FloatRegister($src$$reg));
16002   %}
16003   ins_pipe(vdup_reg_freg64);
16004 %}
16005 
16006 instruct replicate4F(vecX dst, vRegF src)
16007 %{
16008   predicate(n->as_Vector()->length() == 4);
16009   match(Set dst (ReplicateF src));
16010   ins_cost(INSN_COST);
16011   format %{ "dup  $dst, $src\t# vector (4F)" %}
16012   ins_encode %{
16013     __ dup(as_FloatRegister($dst$$reg), __ T4S,
16014            as_FloatRegister($src$$reg));
16015   %}
16016   ins_pipe(vdup_reg_freg128);
16017 %}
16018 
16019 instruct replicate2D(vecX dst, vRegD src)
16020 %{
16021   predicate(n->as_Vector()->length() == 2);
16022   match(Set dst (ReplicateD src));
16023   ins_cost(INSN_COST);
16024   format %{ "dup  $dst, $src\t# vector (2D)" %}
16025   ins_encode %{
16026     __ dup(as_FloatRegister($dst$$reg), __ T2D,
16027            as_FloatRegister($src$$reg));
16028   %}
16029   ins_pipe(vdup_reg_dreg128);
16030 %}
16031 
16032 // ====================REDUCTION ARITHMETIC====================================
16033 
16034 instruct reduce_add2I(iRegINoSp dst, iRegIorL2I isrc, vecD vsrc, iRegINoSp tmp, iRegINoSp tmp2)
16035 %{
16036   match(Set dst (AddReductionVI isrc vsrc));
16037   ins_cost(INSN_COST);
16038   effect(TEMP tmp, TEMP tmp2);
16039   format %{ "umov  $tmp, $vsrc, S, 0\n\t"
16040             "umov  $tmp2, $vsrc, S, 1\n\t"
16041             "addw  $tmp, $isrc, $tmp\n\t"
16042             "addw  $dst, $tmp, $tmp2\t# add reduction2I"
16043   %}
16044   ins_encode %{
16045     __ umov($tmp$$Register, as_FloatRegister($vsrc$$reg), __ S, 0);
16046     __ umov($tmp2$$Register, as_FloatRegister($vsrc$$reg), __ S, 1);
16047     __ addw($tmp$$Register, $isrc$$Register, $tmp$$Register);
16048     __ addw($dst$$Register, $tmp$$Register, $tmp2$$Register);
16049   %}
16050   ins_pipe(pipe_class_default);
16051 %}
16052 
16053 instruct reduce_add4I(iRegINoSp dst, iRegIorL2I isrc, vecX vsrc, vecX vtmp, iRegINoSp itmp)
16054 %{
16055   match(Set dst (AddReductionVI isrc vsrc));
16056   ins_cost(INSN_COST);
16057   effect(TEMP vtmp, TEMP itmp);
16058   format %{ "addv  $vtmp, T4S, $vsrc\n\t"
16059             "umov  $itmp, $vtmp, S, 0\n\t"
16060             "addw  $dst, $itmp, $isrc\t# add reduction4I"
16061   %}
16062   ins_encode %{
16063     __ addv(as_FloatRegister($vtmp$$reg), __ T4S,
16064             as_FloatRegister($vsrc$$reg));
16065     __ umov($itmp$$Register, as_FloatRegister($vtmp$$reg), __ S, 0);
16066     __ addw($dst$$Register, $itmp$$Register, $isrc$$Register);
16067   %}
16068   ins_pipe(pipe_class_default);
16069 %}
16070 
16071 instruct reduce_mul2I(iRegINoSp dst, iRegIorL2I isrc, vecD vsrc, iRegINoSp tmp)
16072 %{
16073   match(Set dst (MulReductionVI isrc vsrc));
16074   ins_cost(INSN_COST);
16075   effect(TEMP tmp, TEMP dst);
16076   format %{ "umov  $tmp, $vsrc, S, 0\n\t"
16077             "mul   $dst, $tmp, $isrc\n\t"
16078             "umov  $tmp, $vsrc, S, 1\n\t"
16079             "mul   $dst, $tmp, $dst\t# mul reduction2I"
16080   %}
16081   ins_encode %{
16082     __ umov($tmp$$Register, as_FloatRegister($vsrc$$reg), __ S, 0);
16083     __ mul($dst$$Register, $tmp$$Register, $isrc$$Register);
16084     __ umov($tmp$$Register, as_FloatRegister($vsrc$$reg), __ S, 1);
16085     __ mul($dst$$Register, $tmp$$Register, $dst$$Register);
16086   %}
16087   ins_pipe(pipe_class_default);
16088 %}
16089 
16090 instruct reduce_mul4I(iRegINoSp dst, iRegIorL2I isrc, vecX vsrc, vecX vtmp, iRegINoSp itmp)
16091 %{
16092   match(Set dst (MulReductionVI isrc vsrc));
16093   ins_cost(INSN_COST);
16094   effect(TEMP vtmp, TEMP itmp, TEMP dst);
16095   format %{ "ins   $vtmp, D, $vsrc, 0, 1\n\t"
16096             "mulv  $vtmp, T2S, $vtmp, $vsrc\n\t"
16097             "umov  $itmp, $vtmp, S, 0\n\t"
16098             "mul   $dst, $itmp, $isrc\n\t"
16099             "umov  $itmp, $vtmp, S, 1\n\t"
16100             "mul   $dst, $itmp, $dst\t# mul reduction4I"
16101   %}
16102   ins_encode %{
16103     __ ins(as_FloatRegister($vtmp$$reg), __ D,
16104            as_FloatRegister($vsrc$$reg), 0, 1);
16105     __ mulv(as_FloatRegister($vtmp$$reg), __ T2S,
16106             as_FloatRegister($vtmp$$reg), as_FloatRegister($vsrc$$reg));
16107     __ umov($itmp$$Register, as_FloatRegister($vtmp$$reg), __ S, 0);
16108     __ mul($dst$$Register, $itmp$$Register, $isrc$$Register);
16109     __ umov($itmp$$Register, as_FloatRegister($vtmp$$reg), __ S, 1);
16110     __ mul($dst$$Register, $itmp$$Register, $dst$$Register);
16111   %}
16112   ins_pipe(pipe_class_default);
16113 %}
16114 
16115 instruct reduce_add2F(vRegF dst, vRegF fsrc, vecD vsrc, vecD tmp)
16116 %{
16117   match(Set dst (AddReductionVF fsrc vsrc));
16118   ins_cost(INSN_COST);
16119   effect(TEMP tmp, TEMP dst);
16120   format %{ "fadds $dst, $fsrc, $vsrc\n\t"
16121             "ins   $tmp, S, $vsrc, 0, 1\n\t"
16122             "fadds $dst, $dst, $tmp\t# add reduction2F"
16123   %}
16124   ins_encode %{
16125     __ fadds(as_FloatRegister($dst$$reg),
16126              as_FloatRegister($fsrc$$reg), as_FloatRegister($vsrc$$reg));
16127     __ ins(as_FloatRegister($tmp$$reg), __ S,
16128            as_FloatRegister($vsrc$$reg), 0, 1);
16129     __ fadds(as_FloatRegister($dst$$reg),
16130              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16131   %}
16132   ins_pipe(pipe_class_default);
16133 %}
16134 
16135 instruct reduce_add4F(vRegF dst, vRegF fsrc, vecX vsrc, vecX tmp)
16136 %{
16137   match(Set dst (AddReductionVF fsrc vsrc));
16138   ins_cost(INSN_COST);
16139   effect(TEMP tmp, TEMP dst);
16140   format %{ "fadds $dst, $fsrc, $vsrc\n\t"
16141             "ins   $tmp, S, $vsrc, 0, 1\n\t"
16142             "fadds $dst, $dst, $tmp\n\t"
16143             "ins   $tmp, S, $vsrc, 0, 2\n\t"
16144             "fadds $dst, $dst, $tmp\n\t"
16145             "ins   $tmp, S, $vsrc, 0, 3\n\t"
16146             "fadds $dst, $dst, $tmp\t# add reduction4F"
16147   %}
16148   ins_encode %{
16149     __ fadds(as_FloatRegister($dst$$reg),
16150              as_FloatRegister($fsrc$$reg), as_FloatRegister($vsrc$$reg));
16151     __ ins(as_FloatRegister($tmp$$reg), __ S,
16152            as_FloatRegister($vsrc$$reg), 0, 1);
16153     __ fadds(as_FloatRegister($dst$$reg),
16154              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16155     __ ins(as_FloatRegister($tmp$$reg), __ S,
16156            as_FloatRegister($vsrc$$reg), 0, 2);
16157     __ fadds(as_FloatRegister($dst$$reg),
16158              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16159     __ ins(as_FloatRegister($tmp$$reg), __ S,
16160            as_FloatRegister($vsrc$$reg), 0, 3);
16161     __ fadds(as_FloatRegister($dst$$reg),
16162              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16163   %}
16164   ins_pipe(pipe_class_default);
16165 %}
16166 
16167 instruct reduce_mul2F(vRegF dst, vRegF fsrc, vecD vsrc, vecD tmp)
16168 %{
16169   match(Set dst (MulReductionVF fsrc vsrc));
16170   ins_cost(INSN_COST);
16171   effect(TEMP tmp, TEMP dst);
16172   format %{ "fmuls $dst, $fsrc, $vsrc\n\t"
16173             "ins   $tmp, S, $vsrc, 0, 1\n\t"
16174             "fmuls $dst, $dst, $tmp\t# mul reduction2F"
16175   %}
16176   ins_encode %{
16177     __ fmuls(as_FloatRegister($dst$$reg),
16178              as_FloatRegister($fsrc$$reg), as_FloatRegister($vsrc$$reg));
16179     __ ins(as_FloatRegister($tmp$$reg), __ S,
16180            as_FloatRegister($vsrc$$reg), 0, 1);
16181     __ fmuls(as_FloatRegister($dst$$reg),
16182              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16183   %}
16184   ins_pipe(pipe_class_default);
16185 %}
16186 
16187 instruct reduce_mul4F(vRegF dst, vRegF fsrc, vecX vsrc, vecX tmp)
16188 %{
16189   match(Set dst (MulReductionVF fsrc vsrc));
16190   ins_cost(INSN_COST);
16191   effect(TEMP tmp, TEMP dst);
16192   format %{ "fmuls $dst, $fsrc, $vsrc\n\t"
16193             "ins   $tmp, S, $vsrc, 0, 1\n\t"
16194             "fmuls $dst, $dst, $tmp\n\t"
16195             "ins   $tmp, S, $vsrc, 0, 2\n\t"
16196             "fmuls $dst, $dst, $tmp\n\t"
16197             "ins   $tmp, S, $vsrc, 0, 3\n\t"
16198             "fmuls $dst, $dst, $tmp\t# mul reduction4F"
16199   %}
16200   ins_encode %{
16201     __ fmuls(as_FloatRegister($dst$$reg),
16202              as_FloatRegister($fsrc$$reg), as_FloatRegister($vsrc$$reg));
16203     __ ins(as_FloatRegister($tmp$$reg), __ S,
16204            as_FloatRegister($vsrc$$reg), 0, 1);
16205     __ fmuls(as_FloatRegister($dst$$reg),
16206              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16207     __ ins(as_FloatRegister($tmp$$reg), __ S,
16208            as_FloatRegister($vsrc$$reg), 0, 2);
16209     __ fmuls(as_FloatRegister($dst$$reg),
16210              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16211     __ ins(as_FloatRegister($tmp$$reg), __ S,
16212            as_FloatRegister($vsrc$$reg), 0, 3);
16213     __ fmuls(as_FloatRegister($dst$$reg),
16214              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16215   %}
16216   ins_pipe(pipe_class_default);
16217 %}
16218 
16219 instruct reduce_add2D(vRegD dst, vRegD dsrc, vecX vsrc, vecX tmp)
16220 %{
16221   match(Set dst (AddReductionVD dsrc vsrc));
16222   ins_cost(INSN_COST);
16223   effect(TEMP tmp, TEMP dst);
16224   format %{ "faddd $dst, $dsrc, $vsrc\n\t"
16225             "ins   $tmp, D, $vsrc, 0, 1\n\t"
16226             "faddd $dst, $dst, $tmp\t# add reduction2D"
16227   %}
16228   ins_encode %{
16229     __ faddd(as_FloatRegister($dst$$reg),
16230              as_FloatRegister($dsrc$$reg), as_FloatRegister($vsrc$$reg));
16231     __ ins(as_FloatRegister($tmp$$reg), __ D,
16232            as_FloatRegister($vsrc$$reg), 0, 1);
16233     __ faddd(as_FloatRegister($dst$$reg),
16234              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16235   %}
16236   ins_pipe(pipe_class_default);
16237 %}
16238 
16239 instruct reduce_mul2D(vRegD dst, vRegD dsrc, vecX vsrc, vecX tmp)
16240 %{
16241   match(Set dst (MulReductionVD dsrc vsrc));
16242   ins_cost(INSN_COST);
16243   effect(TEMP tmp, TEMP dst);
16244   format %{ "fmuld $dst, $dsrc, $vsrc\n\t"
16245             "ins   $tmp, D, $vsrc, 0, 1\n\t"
16246             "fmuld $dst, $dst, $tmp\t# mul reduction2D"
16247   %}
16248   ins_encode %{
16249     __ fmuld(as_FloatRegister($dst$$reg),
16250              as_FloatRegister($dsrc$$reg), as_FloatRegister($vsrc$$reg));
16251     __ ins(as_FloatRegister($tmp$$reg), __ D,
16252            as_FloatRegister($vsrc$$reg), 0, 1);
16253     __ fmuld(as_FloatRegister($dst$$reg),
16254              as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16255   %}
16256   ins_pipe(pipe_class_default);
16257 %}
16258 
16259 instruct reduce_max2F(vRegF dst, vRegF fsrc, vecD vsrc, vecD tmp) %{
16260   predicate(n->in(2)->bottom_type()->is_vect()->element_basic_type() == T_FLOAT);
16261   match(Set dst (MaxReductionV fsrc vsrc));
16262   ins_cost(INSN_COST);
16263   effect(TEMP_DEF dst, TEMP tmp);
16264   format %{ "fmaxs $dst, $fsrc, $vsrc\n\t"
16265             "ins   $tmp, S, $vsrc, 0, 1\n\t"
16266             "fmaxs $dst, $dst, $tmp\t# max reduction2F" %}
16267   ins_encode %{
16268     __ fmaxs(as_FloatRegister($dst$$reg), as_FloatRegister($fsrc$$reg), as_FloatRegister($vsrc$$reg));
16269     __ ins(as_FloatRegister($tmp$$reg), __ S, as_FloatRegister($vsrc$$reg), 0, 1);
16270     __ fmaxs(as_FloatRegister($dst$$reg), as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16271   %}
16272   ins_pipe(pipe_class_default);
16273 %}
16274 
16275 instruct reduce_max4F(vRegF dst, vRegF fsrc, vecX vsrc) %{
16276   predicate(n->in(2)->bottom_type()->is_vect()->element_basic_type() == T_FLOAT);
16277   match(Set dst (MaxReductionV fsrc vsrc));
16278   ins_cost(INSN_COST);
16279   effect(TEMP_DEF dst);
16280   format %{ "fmaxv $dst, T4S, $vsrc\n\t"
16281             "fmaxs $dst, $dst, $fsrc\t# max reduction4F" %}
16282   ins_encode %{
16283     __ fmaxv(as_FloatRegister($dst$$reg), __ T4S, as_FloatRegister($vsrc$$reg));
16284     __ fmaxs(as_FloatRegister($dst$$reg), as_FloatRegister($dst$$reg), as_FloatRegister($fsrc$$reg));
16285   %}
16286   ins_pipe(pipe_class_default);
16287 %}
16288 
16289 instruct reduce_max2D(vRegD dst, vRegD dsrc, vecX vsrc, vecX tmp) %{
16290   predicate(n->in(2)->bottom_type()->is_vect()->element_basic_type() == T_DOUBLE);
16291   match(Set dst (MaxReductionV dsrc vsrc));
16292   ins_cost(INSN_COST);
16293   effect(TEMP_DEF dst, TEMP tmp);
16294   format %{ "fmaxd $dst, $dsrc, $vsrc\n\t"
16295             "ins   $tmp, D, $vsrc, 0, 1\n\t"
16296             "fmaxd $dst, $dst, $tmp\t# max reduction2D" %}
16297   ins_encode %{
16298     __ fmaxd(as_FloatRegister($dst$$reg), as_FloatRegister($dsrc$$reg), as_FloatRegister($vsrc$$reg));
16299     __ ins(as_FloatRegister($tmp$$reg), __ D, as_FloatRegister($vsrc$$reg), 0, 1);
16300     __ fmaxd(as_FloatRegister($dst$$reg), as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16301   %}
16302   ins_pipe(pipe_class_default);
16303 %}
16304 
16305 instruct reduce_min2F(vRegF dst, vRegF fsrc, vecD vsrc, vecD tmp) %{
16306   predicate(n->in(2)->bottom_type()->is_vect()->element_basic_type() == T_FLOAT);
16307   match(Set dst (MinReductionV fsrc vsrc));
16308   ins_cost(INSN_COST);
16309   effect(TEMP_DEF dst, TEMP tmp);
16310   format %{ "fmins $dst, $fsrc, $vsrc\n\t"
16311             "ins   $tmp, S, $vsrc, 0, 1\n\t"
16312             "fmins $dst, $dst, $tmp\t# min reduction2F" %}
16313   ins_encode %{
16314     __ fmins(as_FloatRegister($dst$$reg), as_FloatRegister($fsrc$$reg), as_FloatRegister($vsrc$$reg));
16315     __ ins(as_FloatRegister($tmp$$reg), __ S, as_FloatRegister($vsrc$$reg), 0, 1);
16316     __ fmins(as_FloatRegister($dst$$reg), as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16317   %}
16318   ins_pipe(pipe_class_default);
16319 %}
16320 
16321 instruct reduce_min4F(vRegF dst, vRegF fsrc, vecX vsrc) %{
16322   predicate(n->in(2)->bottom_type()->is_vect()->element_basic_type() == T_FLOAT);
16323   match(Set dst (MinReductionV fsrc vsrc));
16324   ins_cost(INSN_COST);
16325   effect(TEMP_DEF dst);
16326   format %{ "fminv $dst, T4S, $vsrc\n\t"
16327             "fmins $dst, $dst, $fsrc\t# min reduction4F" %}
16328   ins_encode %{
16329     __ fminv(as_FloatRegister($dst$$reg), __ T4S, as_FloatRegister($vsrc$$reg));
16330     __ fmins(as_FloatRegister($dst$$reg), as_FloatRegister($dst$$reg), as_FloatRegister($fsrc$$reg));
16331   %}
16332   ins_pipe(pipe_class_default);
16333 %}
16334 
16335 instruct reduce_min2D(vRegD dst, vRegD dsrc, vecX vsrc, vecX tmp) %{
16336   predicate(n->in(2)->bottom_type()->is_vect()->element_basic_type() == T_DOUBLE);
16337   match(Set dst (MinReductionV dsrc vsrc));
16338   ins_cost(INSN_COST);
16339   effect(TEMP_DEF dst, TEMP tmp);
16340   format %{ "fmind $dst, $dsrc, $vsrc\n\t"
16341             "ins   $tmp, D, $vsrc, 0, 1\n\t"
16342             "fmind $dst, $dst, $tmp\t# min reduction2D" %}
16343   ins_encode %{
16344     __ fmind(as_FloatRegister($dst$$reg), as_FloatRegister($dsrc$$reg), as_FloatRegister($vsrc$$reg));
16345     __ ins(as_FloatRegister($tmp$$reg), __ D, as_FloatRegister($vsrc$$reg), 0, 1);
16346     __ fmind(as_FloatRegister($dst$$reg), as_FloatRegister($dst$$reg), as_FloatRegister($tmp$$reg));
16347   %}
16348   ins_pipe(pipe_class_default);
16349 %}
16350 
16351 // ====================VECTOR ARITHMETIC=======================================
16352 
16353 // --------------------------------- ADD --------------------------------------
16354 
16355 instruct vadd8B(vecD dst, vecD src1, vecD src2)
16356 %{
16357   predicate(n->as_Vector()->length() == 4 ||
16358             n->as_Vector()->length() == 8);
16359   match(Set dst (AddVB src1 src2));
16360   ins_cost(INSN_COST);
16361   format %{ "addv  $dst,$src1,$src2\t# vector (8B)" %}
16362   ins_encode %{
16363     __ addv(as_FloatRegister($dst$$reg), __ T8B,
16364             as_FloatRegister($src1$$reg),
16365             as_FloatRegister($src2$$reg));
16366   %}
16367   ins_pipe(vdop64);
16368 %}
16369 
16370 instruct vadd16B(vecX dst, vecX src1, vecX src2)
16371 %{
16372   predicate(n->as_Vector()->length() == 16);
16373   match(Set dst (AddVB src1 src2));
16374   ins_cost(INSN_COST);
16375   format %{ "addv  $dst,$src1,$src2\t# vector (16B)" %}
16376   ins_encode %{
16377     __ addv(as_FloatRegister($dst$$reg), __ T16B,
16378             as_FloatRegister($src1$$reg),
16379             as_FloatRegister($src2$$reg));
16380   %}
16381   ins_pipe(vdop128);
16382 %}
16383 
16384 instruct vadd4S(vecD dst, vecD src1, vecD src2)
16385 %{
16386   predicate(n->as_Vector()->length() == 2 ||
16387             n->as_Vector()->length() == 4);
16388   match(Set dst (AddVS src1 src2));
16389   ins_cost(INSN_COST);
16390   format %{ "addv  $dst,$src1,$src2\t# vector (4H)" %}
16391   ins_encode %{
16392     __ addv(as_FloatRegister($dst$$reg), __ T4H,
16393             as_FloatRegister($src1$$reg),
16394             as_FloatRegister($src2$$reg));
16395   %}
16396   ins_pipe(vdop64);
16397 %}
16398 
16399 instruct vadd8S(vecX dst, vecX src1, vecX src2)
16400 %{
16401   predicate(n->as_Vector()->length() == 8);
16402   match(Set dst (AddVS src1 src2));
16403   ins_cost(INSN_COST);
16404   format %{ "addv  $dst,$src1,$src2\t# vector (8H)" %}
16405   ins_encode %{
16406     __ addv(as_FloatRegister($dst$$reg), __ T8H,
16407             as_FloatRegister($src1$$reg),
16408             as_FloatRegister($src2$$reg));
16409   %}
16410   ins_pipe(vdop128);
16411 %}
16412 
16413 instruct vadd2I(vecD dst, vecD src1, vecD src2)
16414 %{
16415   predicate(n->as_Vector()->length() == 2);
16416   match(Set dst (AddVI src1 src2));
16417   ins_cost(INSN_COST);
16418   format %{ "addv  $dst,$src1,$src2\t# vector (2S)" %}
16419   ins_encode %{
16420     __ addv(as_FloatRegister($dst$$reg), __ T2S,
16421             as_FloatRegister($src1$$reg),
16422             as_FloatRegister($src2$$reg));
16423   %}
16424   ins_pipe(vdop64);
16425 %}
16426 
16427 instruct vadd4I(vecX dst, vecX src1, vecX src2)
16428 %{
16429   predicate(n->as_Vector()->length() == 4);
16430   match(Set dst (AddVI src1 src2));
16431   ins_cost(INSN_COST);
16432   format %{ "addv  $dst,$src1,$src2\t# vector (4S)" %}
16433   ins_encode %{
16434     __ addv(as_FloatRegister($dst$$reg), __ T4S,
16435             as_FloatRegister($src1$$reg),
16436             as_FloatRegister($src2$$reg));
16437   %}
16438   ins_pipe(vdop128);
16439 %}
16440 
16441 instruct vadd2L(vecX dst, vecX src1, vecX src2)
16442 %{
16443   predicate(n->as_Vector()->length() == 2);
16444   match(Set dst (AddVL src1 src2));
16445   ins_cost(INSN_COST);
16446   format %{ "addv  $dst,$src1,$src2\t# vector (2L)" %}
16447   ins_encode %{
16448     __ addv(as_FloatRegister($dst$$reg), __ T2D,
16449             as_FloatRegister($src1$$reg),
16450             as_FloatRegister($src2$$reg));
16451   %}
16452   ins_pipe(vdop128);
16453 %}
16454 
16455 instruct vadd2F(vecD dst, vecD src1, vecD src2)
16456 %{
16457   predicate(n->as_Vector()->length() == 2);
16458   match(Set dst (AddVF src1 src2));
16459   ins_cost(INSN_COST);
16460   format %{ "fadd  $dst,$src1,$src2\t# vector (2S)" %}
16461   ins_encode %{
16462     __ fadd(as_FloatRegister($dst$$reg), __ T2S,
16463             as_FloatRegister($src1$$reg),
16464             as_FloatRegister($src2$$reg));
16465   %}
16466   ins_pipe(vdop_fp64);
16467 %}
16468 
16469 instruct vadd4F(vecX dst, vecX src1, vecX src2)
16470 %{
16471   predicate(n->as_Vector()->length() == 4);
16472   match(Set dst (AddVF src1 src2));
16473   ins_cost(INSN_COST);
16474   format %{ "fadd  $dst,$src1,$src2\t# vector (4S)" %}
16475   ins_encode %{
16476     __ fadd(as_FloatRegister($dst$$reg), __ T4S,
16477             as_FloatRegister($src1$$reg),
16478             as_FloatRegister($src2$$reg));
16479   %}
16480   ins_pipe(vdop_fp128);
16481 %}
16482 
16483 instruct vadd2D(vecX dst, vecX src1, vecX src2)
16484 %{
16485   match(Set dst (AddVD src1 src2));
16486   ins_cost(INSN_COST);
16487   format %{ "fadd  $dst,$src1,$src2\t# vector (2D)" %}
16488   ins_encode %{
16489     __ fadd(as_FloatRegister($dst$$reg), __ T2D,
16490             as_FloatRegister($src1$$reg),
16491             as_FloatRegister($src2$$reg));
16492   %}
16493   ins_pipe(vdop_fp128);
16494 %}
16495 
16496 // --------------------------------- SUB --------------------------------------
16497 
16498 instruct vsub8B(vecD dst, vecD src1, vecD src2)
16499 %{
16500   predicate(n->as_Vector()->length() == 4 ||
16501             n->as_Vector()->length() == 8);
16502   match(Set dst (SubVB src1 src2));
16503   ins_cost(INSN_COST);
16504   format %{ "subv  $dst,$src1,$src2\t# vector (8B)" %}
16505   ins_encode %{
16506     __ subv(as_FloatRegister($dst$$reg), __ T8B,
16507             as_FloatRegister($src1$$reg),
16508             as_FloatRegister($src2$$reg));
16509   %}
16510   ins_pipe(vdop64);
16511 %}
16512 
16513 instruct vsub16B(vecX dst, vecX src1, vecX src2)
16514 %{
16515   predicate(n->as_Vector()->length() == 16);
16516   match(Set dst (SubVB src1 src2));
16517   ins_cost(INSN_COST);
16518   format %{ "subv  $dst,$src1,$src2\t# vector (16B)" %}
16519   ins_encode %{
16520     __ subv(as_FloatRegister($dst$$reg), __ T16B,
16521             as_FloatRegister($src1$$reg),
16522             as_FloatRegister($src2$$reg));
16523   %}
16524   ins_pipe(vdop128);
16525 %}
16526 
16527 instruct vsub4S(vecD dst, vecD src1, vecD src2)
16528 %{
16529   predicate(n->as_Vector()->length() == 2 ||
16530             n->as_Vector()->length() == 4);
16531   match(Set dst (SubVS src1 src2));
16532   ins_cost(INSN_COST);
16533   format %{ "subv  $dst,$src1,$src2\t# vector (4H)" %}
16534   ins_encode %{
16535     __ subv(as_FloatRegister($dst$$reg), __ T4H,
16536             as_FloatRegister($src1$$reg),
16537             as_FloatRegister($src2$$reg));
16538   %}
16539   ins_pipe(vdop64);
16540 %}
16541 
16542 instruct vsub8S(vecX dst, vecX src1, vecX src2)
16543 %{
16544   predicate(n->as_Vector()->length() == 8);
16545   match(Set dst (SubVS src1 src2));
16546   ins_cost(INSN_COST);
16547   format %{ "subv  $dst,$src1,$src2\t# vector (8H)" %}
16548   ins_encode %{
16549     __ subv(as_FloatRegister($dst$$reg), __ T8H,
16550             as_FloatRegister($src1$$reg),
16551             as_FloatRegister($src2$$reg));
16552   %}
16553   ins_pipe(vdop128);
16554 %}
16555 
16556 instruct vsub2I(vecD dst, vecD src1, vecD src2)
16557 %{
16558   predicate(n->as_Vector()->length() == 2);
16559   match(Set dst (SubVI src1 src2));
16560   ins_cost(INSN_COST);
16561   format %{ "subv  $dst,$src1,$src2\t# vector (2S)" %}
16562   ins_encode %{
16563     __ subv(as_FloatRegister($dst$$reg), __ T2S,
16564             as_FloatRegister($src1$$reg),
16565             as_FloatRegister($src2$$reg));
16566   %}
16567   ins_pipe(vdop64);
16568 %}
16569 
16570 instruct vsub4I(vecX dst, vecX src1, vecX src2)
16571 %{
16572   predicate(n->as_Vector()->length() == 4);
16573   match(Set dst (SubVI src1 src2));
16574   ins_cost(INSN_COST);
16575   format %{ "subv  $dst,$src1,$src2\t# vector (4S)" %}
16576   ins_encode %{
16577     __ subv(as_FloatRegister($dst$$reg), __ T4S,
16578             as_FloatRegister($src1$$reg),
16579             as_FloatRegister($src2$$reg));
16580   %}
16581   ins_pipe(vdop128);
16582 %}
16583 
16584 instruct vsub2L(vecX dst, vecX src1, vecX src2)
16585 %{
16586   predicate(n->as_Vector()->length() == 2);
16587   match(Set dst (SubVL src1 src2));
16588   ins_cost(INSN_COST);
16589   format %{ "subv  $dst,$src1,$src2\t# vector (2L)" %}
16590   ins_encode %{
16591     __ subv(as_FloatRegister($dst$$reg), __ T2D,
16592             as_FloatRegister($src1$$reg),
16593             as_FloatRegister($src2$$reg));
16594   %}
16595   ins_pipe(vdop128);
16596 %}
16597 
16598 instruct vsub2F(vecD dst, vecD src1, vecD src2)
16599 %{
16600   predicate(n->as_Vector()->length() == 2);
16601   match(Set dst (SubVF src1 src2));
16602   ins_cost(INSN_COST);
16603   format %{ "fsub  $dst,$src1,$src2\t# vector (2S)" %}
16604   ins_encode %{
16605     __ fsub(as_FloatRegister($dst$$reg), __ T2S,
16606             as_FloatRegister($src1$$reg),
16607             as_FloatRegister($src2$$reg));
16608   %}
16609   ins_pipe(vdop_fp64);
16610 %}
16611 
16612 instruct vsub4F(vecX dst, vecX src1, vecX src2)
16613 %{
16614   predicate(n->as_Vector()->length() == 4);
16615   match(Set dst (SubVF src1 src2));
16616   ins_cost(INSN_COST);
16617   format %{ "fsub  $dst,$src1,$src2\t# vector (4S)" %}
16618   ins_encode %{
16619     __ fsub(as_FloatRegister($dst$$reg), __ T4S,
16620             as_FloatRegister($src1$$reg),
16621             as_FloatRegister($src2$$reg));
16622   %}
16623   ins_pipe(vdop_fp128);
16624 %}
16625 
16626 instruct vsub2D(vecX dst, vecX src1, vecX src2)
16627 %{
16628   predicate(n->as_Vector()->length() == 2);
16629   match(Set dst (SubVD src1 src2));
16630   ins_cost(INSN_COST);
16631   format %{ "fsub  $dst,$src1,$src2\t# vector (2D)" %}
16632   ins_encode %{
16633     __ fsub(as_FloatRegister($dst$$reg), __ T2D,
16634             as_FloatRegister($src1$$reg),
16635             as_FloatRegister($src2$$reg));
16636   %}
16637   ins_pipe(vdop_fp128);
16638 %}
16639 
16640 // --------------------------------- MUL --------------------------------------
16641 
16642 instruct vmul8B(vecD dst, vecD src1, vecD src2)
16643 %{
16644   predicate(n->as_Vector()->length() == 4 ||
16645             n->as_Vector()->length() == 8);
16646   match(Set dst (MulVB src1 src2));
16647   ins_cost(INSN_COST);
16648   format %{ "mulv  $dst,$src1,$src2\t# vector (8B)" %}
16649   ins_encode %{
16650     __ mulv(as_FloatRegister($dst$$reg), __ T8B,
16651             as_FloatRegister($src1$$reg),
16652             as_FloatRegister($src2$$reg));
16653   %}
16654   ins_pipe(vmul64);
16655 %}
16656 
16657 instruct vmul16B(vecX dst, vecX src1, vecX src2)
16658 %{
16659   predicate(n->as_Vector()->length() == 16);
16660   match(Set dst (MulVB src1 src2));
16661   ins_cost(INSN_COST);
16662   format %{ "mulv  $dst,$src1,$src2\t# vector (16B)" %}
16663   ins_encode %{
16664     __ mulv(as_FloatRegister($dst$$reg), __ T16B,
16665             as_FloatRegister($src1$$reg),
16666             as_FloatRegister($src2$$reg));
16667   %}
16668   ins_pipe(vmul128);
16669 %}
16670 
16671 instruct vmul4S(vecD dst, vecD src1, vecD src2)
16672 %{
16673   predicate(n->as_Vector()->length() == 2 ||
16674             n->as_Vector()->length() == 4);
16675   match(Set dst (MulVS src1 src2));
16676   ins_cost(INSN_COST);
16677   format %{ "mulv  $dst,$src1,$src2\t# vector (4H)" %}
16678   ins_encode %{
16679     __ mulv(as_FloatRegister($dst$$reg), __ T4H,
16680             as_FloatRegister($src1$$reg),
16681             as_FloatRegister($src2$$reg));
16682   %}
16683   ins_pipe(vmul64);
16684 %}
16685 
16686 instruct vmul8S(vecX dst, vecX src1, vecX src2)
16687 %{
16688   predicate(n->as_Vector()->length() == 8);
16689   match(Set dst (MulVS src1 src2));
16690   ins_cost(INSN_COST);
16691   format %{ "mulv  $dst,$src1,$src2\t# vector (8H)" %}
16692   ins_encode %{
16693     __ mulv(as_FloatRegister($dst$$reg), __ T8H,
16694             as_FloatRegister($src1$$reg),
16695             as_FloatRegister($src2$$reg));
16696   %}
16697   ins_pipe(vmul128);
16698 %}
16699 
16700 instruct vmul2I(vecD dst, vecD src1, vecD src2)
16701 %{
16702   predicate(n->as_Vector()->length() == 2);
16703   match(Set dst (MulVI src1 src2));
16704   ins_cost(INSN_COST);
16705   format %{ "mulv  $dst,$src1,$src2\t# vector (2S)" %}
16706   ins_encode %{
16707     __ mulv(as_FloatRegister($dst$$reg), __ T2S,
16708             as_FloatRegister($src1$$reg),
16709             as_FloatRegister($src2$$reg));
16710   %}
16711   ins_pipe(vmul64);
16712 %}
16713 
16714 instruct vmul4I(vecX dst, vecX src1, vecX src2)
16715 %{
16716   predicate(n->as_Vector()->length() == 4);
16717   match(Set dst (MulVI src1 src2));
16718   ins_cost(INSN_COST);
16719   format %{ "mulv  $dst,$src1,$src2\t# vector (4S)" %}
16720   ins_encode %{
16721     __ mulv(as_FloatRegister($dst$$reg), __ T4S,
16722             as_FloatRegister($src1$$reg),
16723             as_FloatRegister($src2$$reg));
16724   %}
16725   ins_pipe(vmul128);
16726 %}
16727 
16728 instruct vmul2F(vecD dst, vecD src1, vecD src2)
16729 %{
16730   predicate(n->as_Vector()->length() == 2);
16731   match(Set dst (MulVF src1 src2));
16732   ins_cost(INSN_COST);
16733   format %{ "fmul  $dst,$src1,$src2\t# vector (2S)" %}
16734   ins_encode %{
16735     __ fmul(as_FloatRegister($dst$$reg), __ T2S,
16736             as_FloatRegister($src1$$reg),
16737             as_FloatRegister($src2$$reg));
16738   %}
16739   ins_pipe(vmuldiv_fp64);
16740 %}
16741 
16742 instruct vmul4F(vecX dst, vecX src1, vecX src2)
16743 %{
16744   predicate(n->as_Vector()->length() == 4);
16745   match(Set dst (MulVF src1 src2));
16746   ins_cost(INSN_COST);
16747   format %{ "fmul  $dst,$src1,$src2\t# vector (4S)" %}
16748   ins_encode %{
16749     __ fmul(as_FloatRegister($dst$$reg), __ T4S,
16750             as_FloatRegister($src1$$reg),
16751             as_FloatRegister($src2$$reg));
16752   %}
16753   ins_pipe(vmuldiv_fp128);
16754 %}
16755 
16756 instruct vmul2D(vecX dst, vecX src1, vecX src2)
16757 %{
16758   predicate(n->as_Vector()->length() == 2);
16759   match(Set dst (MulVD src1 src2));
16760   ins_cost(INSN_COST);
16761   format %{ "fmul  $dst,$src1,$src2\t# vector (2D)" %}
16762   ins_encode %{
16763     __ fmul(as_FloatRegister($dst$$reg), __ T2D,
16764             as_FloatRegister($src1$$reg),
16765             as_FloatRegister($src2$$reg));
16766   %}
16767   ins_pipe(vmuldiv_fp128);
16768 %}
16769 
16770 // --------------------------------- MLA --------------------------------------
16771 
16772 instruct vmla4S(vecD dst, vecD src1, vecD src2)
16773 %{
16774   predicate(n->as_Vector()->length() == 2 ||
16775             n->as_Vector()->length() == 4);
16776   match(Set dst (AddVS dst (MulVS src1 src2)));
16777   ins_cost(INSN_COST);
16778   format %{ "mlav  $dst,$src1,$src2\t# vector (4H)" %}
16779   ins_encode %{
16780     __ mlav(as_FloatRegister($dst$$reg), __ T4H,
16781             as_FloatRegister($src1$$reg),
16782             as_FloatRegister($src2$$reg));
16783   %}
16784   ins_pipe(vmla64);
16785 %}
16786 
16787 instruct vmla8S(vecX dst, vecX src1, vecX src2)
16788 %{
16789   predicate(n->as_Vector()->length() == 8);
16790   match(Set dst (AddVS dst (MulVS src1 src2)));
16791   ins_cost(INSN_COST);
16792   format %{ "mlav  $dst,$src1,$src2\t# vector (8H)" %}
16793   ins_encode %{
16794     __ mlav(as_FloatRegister($dst$$reg), __ T8H,
16795             as_FloatRegister($src1$$reg),
16796             as_FloatRegister($src2$$reg));
16797   %}
16798   ins_pipe(vmla128);
16799 %}
16800 
16801 instruct vmla2I(vecD dst, vecD src1, vecD src2)
16802 %{
16803   predicate(n->as_Vector()->length() == 2);
16804   match(Set dst (AddVI dst (MulVI src1 src2)));
16805   ins_cost(INSN_COST);
16806   format %{ "mlav  $dst,$src1,$src2\t# vector (2S)" %}
16807   ins_encode %{
16808     __ mlav(as_FloatRegister($dst$$reg), __ T2S,
16809             as_FloatRegister($src1$$reg),
16810             as_FloatRegister($src2$$reg));
16811   %}
16812   ins_pipe(vmla64);
16813 %}
16814 
16815 instruct vmla4I(vecX dst, vecX src1, vecX src2)
16816 %{
16817   predicate(n->as_Vector()->length() == 4);
16818   match(Set dst (AddVI dst (MulVI src1 src2)));
16819   ins_cost(INSN_COST);
16820   format %{ "mlav  $dst,$src1,$src2\t# vector (4S)" %}
16821   ins_encode %{
16822     __ mlav(as_FloatRegister($dst$$reg), __ T4S,
16823             as_FloatRegister($src1$$reg),
16824             as_FloatRegister($src2$$reg));
16825   %}
16826   ins_pipe(vmla128);
16827 %}
16828 
16829 // dst + src1 * src2
16830 instruct vmla2F(vecD dst, vecD src1, vecD src2) %{
16831   predicate(UseFMA && n->as_Vector()->length() == 2);
16832   match(Set dst (FmaVF  dst (Binary src1 src2)));
16833   format %{ "fmla  $dst,$src1,$src2\t# vector (2S)" %}
16834   ins_cost(INSN_COST);
16835   ins_encode %{
16836     __ fmla(as_FloatRegister($dst$$reg), __ T2S,
16837             as_FloatRegister($src1$$reg),
16838             as_FloatRegister($src2$$reg));
16839   %}
16840   ins_pipe(vmuldiv_fp64);
16841 %}
16842 
16843 // dst + src1 * src2
16844 instruct vmla4F(vecX dst, vecX src1, vecX src2) %{
16845   predicate(UseFMA && n->as_Vector()->length() == 4);
16846   match(Set dst (FmaVF  dst (Binary src1 src2)));
16847   format %{ "fmla  $dst,$src1,$src2\t# vector (4S)" %}
16848   ins_cost(INSN_COST);
16849   ins_encode %{
16850     __ fmla(as_FloatRegister($dst$$reg), __ T4S,
16851             as_FloatRegister($src1$$reg),
16852             as_FloatRegister($src2$$reg));
16853   %}
16854   ins_pipe(vmuldiv_fp128);
16855 %}
16856 
16857 // dst + src1 * src2
16858 instruct vmla2D(vecX dst, vecX src1, vecX src2) %{
16859   predicate(UseFMA && n->as_Vector()->length() == 2);
16860   match(Set dst (FmaVD  dst (Binary src1 src2)));
16861   format %{ "fmla  $dst,$src1,$src2\t# vector (2D)" %}
16862   ins_cost(INSN_COST);
16863   ins_encode %{
16864     __ fmla(as_FloatRegister($dst$$reg), __ T2D,
16865             as_FloatRegister($src1$$reg),
16866             as_FloatRegister($src2$$reg));
16867   %}
16868   ins_pipe(vmuldiv_fp128);
16869 %}
16870 
16871 // --------------------------------- MLS --------------------------------------
16872 
16873 instruct vmls4S(vecD dst, vecD src1, vecD src2)
16874 %{
16875   predicate(n->as_Vector()->length() == 2 ||
16876             n->as_Vector()->length() == 4);
16877   match(Set dst (SubVS dst (MulVS src1 src2)));
16878   ins_cost(INSN_COST);
16879   format %{ "mlsv  $dst,$src1,$src2\t# vector (4H)" %}
16880   ins_encode %{
16881     __ mlsv(as_FloatRegister($dst$$reg), __ T4H,
16882             as_FloatRegister($src1$$reg),
16883             as_FloatRegister($src2$$reg));
16884   %}
16885   ins_pipe(vmla64);
16886 %}
16887 
16888 instruct vmls8S(vecX dst, vecX src1, vecX src2)
16889 %{
16890   predicate(n->as_Vector()->length() == 8);
16891   match(Set dst (SubVS dst (MulVS src1 src2)));
16892   ins_cost(INSN_COST);
16893   format %{ "mlsv  $dst,$src1,$src2\t# vector (8H)" %}
16894   ins_encode %{
16895     __ mlsv(as_FloatRegister($dst$$reg), __ T8H,
16896             as_FloatRegister($src1$$reg),
16897             as_FloatRegister($src2$$reg));
16898   %}
16899   ins_pipe(vmla128);
16900 %}
16901 
16902 instruct vmls2I(vecD dst, vecD src1, vecD src2)
16903 %{
16904   predicate(n->as_Vector()->length() == 2);
16905   match(Set dst (SubVI dst (MulVI src1 src2)));
16906   ins_cost(INSN_COST);
16907   format %{ "mlsv  $dst,$src1,$src2\t# vector (2S)" %}
16908   ins_encode %{
16909     __ mlsv(as_FloatRegister($dst$$reg), __ T2S,
16910             as_FloatRegister($src1$$reg),
16911             as_FloatRegister($src2$$reg));
16912   %}
16913   ins_pipe(vmla64);
16914 %}
16915 
16916 instruct vmls4I(vecX dst, vecX src1, vecX src2)
16917 %{
16918   predicate(n->as_Vector()->length() == 4);
16919   match(Set dst (SubVI dst (MulVI src1 src2)));
16920   ins_cost(INSN_COST);
16921   format %{ "mlsv  $dst,$src1,$src2\t# vector (4S)" %}
16922   ins_encode %{
16923     __ mlsv(as_FloatRegister($dst$$reg), __ T4S,
16924             as_FloatRegister($src1$$reg),
16925             as_FloatRegister($src2$$reg));
16926   %}
16927   ins_pipe(vmla128);
16928 %}
16929 
16930 // dst - src1 * src2
16931 instruct vmls2F(vecD dst, vecD src1, vecD src2) %{
16932   predicate(UseFMA && n->as_Vector()->length() == 2);
16933   match(Set dst (FmaVF  dst (Binary (NegVF src1) src2)));
16934   match(Set dst (FmaVF  dst (Binary src1 (NegVF src2))));
16935   format %{ "fmls  $dst,$src1,$src2\t# vector (2S)" %}
16936   ins_cost(INSN_COST);
16937   ins_encode %{
16938     __ fmls(as_FloatRegister($dst$$reg), __ T2S,
16939             as_FloatRegister($src1$$reg),
16940             as_FloatRegister($src2$$reg));
16941   %}
16942   ins_pipe(vmuldiv_fp64);
16943 %}
16944 
16945 // dst - src1 * src2
16946 instruct vmls4F(vecX dst, vecX src1, vecX src2) %{
16947   predicate(UseFMA && n->as_Vector()->length() == 4);
16948   match(Set dst (FmaVF  dst (Binary (NegVF src1) src2)));
16949   match(Set dst (FmaVF  dst (Binary src1 (NegVF src2))));
16950   format %{ "fmls  $dst,$src1,$src2\t# vector (4S)" %}
16951   ins_cost(INSN_COST);
16952   ins_encode %{
16953     __ fmls(as_FloatRegister($dst$$reg), __ T4S,
16954             as_FloatRegister($src1$$reg),
16955             as_FloatRegister($src2$$reg));
16956   %}
16957   ins_pipe(vmuldiv_fp128);
16958 %}
16959 
16960 // dst - src1 * src2
16961 instruct vmls2D(vecX dst, vecX src1, vecX src2) %{
16962   predicate(UseFMA && n->as_Vector()->length() == 2);
16963   match(Set dst (FmaVD  dst (Binary (NegVD src1) src2)));
16964   match(Set dst (FmaVD  dst (Binary src1 (NegVD src2))));
16965   format %{ "fmls  $dst,$src1,$src2\t# vector (2D)" %}
16966   ins_cost(INSN_COST);
16967   ins_encode %{
16968     __ fmls(as_FloatRegister($dst$$reg), __ T2D,
16969             as_FloatRegister($src1$$reg),
16970             as_FloatRegister($src2$$reg));
16971   %}
16972   ins_pipe(vmuldiv_fp128);
16973 %}
16974 
16975 // --------------- Vector Multiply-Add Shorts into Integer --------------------
16976 
16977 instruct vmuladdS2I(vecX dst, vecX src1, vecX src2, vecX tmp) %{
16978   predicate(n->in(1)->bottom_type()->is_vect()->element_basic_type() == T_SHORT);
16979   match(Set dst (MulAddVS2VI src1 src2));
16980   ins_cost(INSN_COST);
16981   effect(TEMP_DEF dst, TEMP tmp);
16982   format %{ "smullv  $tmp, $src1, $src2\t# vector (4H)\n\t"
16983             "smullv  $dst, $src1, $src2\t# vector (8H)\n\t"
16984             "addpv   $dst, $tmp, $dst\t# vector (4S)\n\t" %}
16985   ins_encode %{
16986     __ smullv(as_FloatRegister($tmp$$reg), __ T4H,
16987               as_FloatRegister($src1$$reg),
16988               as_FloatRegister($src2$$reg));
16989     __ smullv(as_FloatRegister($dst$$reg), __ T8H,
16990               as_FloatRegister($src1$$reg),
16991               as_FloatRegister($src2$$reg));
16992     __ addpv(as_FloatRegister($dst$$reg), __ T4S,
16993              as_FloatRegister($tmp$$reg),
16994              as_FloatRegister($dst$$reg));
16995   %}
16996   ins_pipe(vmuldiv_fp128);
16997 %}
16998 
16999 // --------------------------------- DIV --------------------------------------
17000 
17001 instruct vdiv2F(vecD dst, vecD src1, vecD src2)
17002 %{
17003   predicate(n->as_Vector()->length() == 2);
17004   match(Set dst (DivVF src1 src2));
17005   ins_cost(INSN_COST);
17006   format %{ "fdiv  $dst,$src1,$src2\t# vector (2S)" %}
17007   ins_encode %{
17008     __ fdiv(as_FloatRegister($dst$$reg), __ T2S,
17009             as_FloatRegister($src1$$reg),
17010             as_FloatRegister($src2$$reg));
17011   %}
17012   ins_pipe(vmuldiv_fp64);
17013 %}
17014 
17015 instruct vdiv4F(vecX dst, vecX src1, vecX src2)
17016 %{
17017   predicate(n->as_Vector()->length() == 4);
17018   match(Set dst (DivVF src1 src2));
17019   ins_cost(INSN_COST);
17020   format %{ "fdiv  $dst,$src1,$src2\t# vector (4S)" %}
17021   ins_encode %{
17022     __ fdiv(as_FloatRegister($dst$$reg), __ T4S,
17023             as_FloatRegister($src1$$reg),
17024             as_FloatRegister($src2$$reg));
17025   %}
17026   ins_pipe(vmuldiv_fp128);
17027 %}
17028 
17029 instruct vdiv2D(vecX dst, vecX src1, vecX src2)
17030 %{
17031   predicate(n->as_Vector()->length() == 2);
17032   match(Set dst (DivVD src1 src2));
17033   ins_cost(INSN_COST);
17034   format %{ "fdiv  $dst,$src1,$src2\t# vector (2D)" %}
17035   ins_encode %{
17036     __ fdiv(as_FloatRegister($dst$$reg), __ T2D,
17037             as_FloatRegister($src1$$reg),
17038             as_FloatRegister($src2$$reg));
17039   %}
17040   ins_pipe(vmuldiv_fp128);
17041 %}
17042 
17043 // --------------------------------- SQRT -------------------------------------
17044 
17045 instruct vsqrt2F(vecD dst, vecD src)
17046 %{
17047   predicate(n->as_Vector()->length() == 2);
17048   match(Set dst (SqrtVF src));
17049   format %{ "fsqrt  $dst, $src\t# vector (2F)" %}
17050   ins_encode %{
17051     __ fsqrt(as_FloatRegister($dst$$reg), __ T2S, as_FloatRegister($src$$reg));
17052   %}
17053   ins_pipe(vunop_fp64);
17054 %}
17055 
17056 instruct vsqrt4F(vecX dst, vecX src)
17057 %{
17058   predicate(n->as_Vector()->length() == 4);
17059   match(Set dst (SqrtVF src));
17060   format %{ "fsqrt  $dst, $src\t# vector (4F)" %}
17061   ins_encode %{
17062     __ fsqrt(as_FloatRegister($dst$$reg), __ T4S, as_FloatRegister($src$$reg));
17063   %}
17064   ins_pipe(vsqrt_fp128);
17065 %}
17066 
17067 instruct vsqrt2D(vecX dst, vecX src)
17068 %{
17069   predicate(n->as_Vector()->length() == 2);
17070   match(Set dst (SqrtVD src));
17071   format %{ "fsqrt  $dst, $src\t# vector (2D)" %}
17072   ins_encode %{
17073     __ fsqrt(as_FloatRegister($dst$$reg), __ T2D,
17074              as_FloatRegister($src$$reg));
17075   %}
17076   ins_pipe(vsqrt_fp128);
17077 %}
17078 
17079 // --------------------------------- ABS --------------------------------------
17080 
17081 instruct vabs8B(vecD dst, vecD src)
17082 %{
17083   predicate(n->as_Vector()->length() == 4 ||
17084             n->as_Vector()->length() == 8);
17085   match(Set dst (AbsVB src));
17086   ins_cost(INSN_COST);
17087   format %{ "abs  $dst, $src\t# vector (8B)" %}
17088   ins_encode %{
17089     __ absr(as_FloatRegister($dst$$reg), __ T8B, as_FloatRegister($src$$reg));
17090   %}
17091   ins_pipe(vlogical64);
17092 %}
17093 
17094 instruct vabs16B(vecX dst, vecX src)
17095 %{
17096   predicate(n->as_Vector()->length() == 16);
17097   match(Set dst (AbsVB src));
17098   ins_cost(INSN_COST);
17099   format %{ "abs  $dst, $src\t# vector (16B)" %}
17100   ins_encode %{
17101     __ absr(as_FloatRegister($dst$$reg), __ T16B, as_FloatRegister($src$$reg));
17102   %}
17103   ins_pipe(vlogical128);
17104 %}
17105 
17106 instruct vabs4S(vecD dst, vecD src)
17107 %{
17108   predicate(n->as_Vector()->length() == 4);
17109   match(Set dst (AbsVS src));
17110   ins_cost(INSN_COST);
17111   format %{ "abs  $dst, $src\t# vector (4H)" %}
17112   ins_encode %{
17113     __ absr(as_FloatRegister($dst$$reg), __ T4H, as_FloatRegister($src$$reg));
17114   %}
17115   ins_pipe(vlogical64);
17116 %}
17117 
17118 instruct vabs8S(vecX dst, vecX src)
17119 %{
17120   predicate(n->as_Vector()->length() == 8);
17121   match(Set dst (AbsVS src));
17122   ins_cost(INSN_COST);
17123   format %{ "abs  $dst, $src\t# vector (8H)" %}
17124   ins_encode %{
17125     __ absr(as_FloatRegister($dst$$reg), __ T8H, as_FloatRegister($src$$reg));
17126   %}
17127   ins_pipe(vlogical128);
17128 %}
17129 
17130 instruct vabs2I(vecD dst, vecD src)
17131 %{
17132   predicate(n->as_Vector()->length() == 2);
17133   match(Set dst (AbsVI src));
17134   ins_cost(INSN_COST);
17135   format %{ "abs  $dst, $src\t# vector (2S)" %}
17136   ins_encode %{
17137     __ absr(as_FloatRegister($dst$$reg), __ T2S, as_FloatRegister($src$$reg));
17138   %}
17139   ins_pipe(vlogical64);
17140 %}
17141 
17142 instruct vabs4I(vecX dst, vecX src)
17143 %{
17144   predicate(n->as_Vector()->length() == 4);
17145   match(Set dst (AbsVI src));
17146   ins_cost(INSN_COST);
17147   format %{ "abs  $dst, $src\t# vector (4S)" %}
17148   ins_encode %{
17149     __ absr(as_FloatRegister($dst$$reg), __ T4S, as_FloatRegister($src$$reg));
17150   %}
17151   ins_pipe(vlogical128);
17152 %}
17153 
17154 instruct vabs2L(vecX dst, vecX src)
17155 %{
17156   predicate(n->as_Vector()->length() == 2);
17157   match(Set dst (AbsVL src));
17158   ins_cost(INSN_COST);
17159   format %{ "abs  $dst, $src\t# vector (2D)" %}
17160   ins_encode %{
17161     __ absr(as_FloatRegister($dst$$reg), __ T2D, as_FloatRegister($src$$reg));
17162   %}
17163   ins_pipe(vlogical128);
17164 %}
17165 
17166 instruct vabs2F(vecD dst, vecD src)
17167 %{
17168   predicate(n->as_Vector()->length() == 2);
17169   match(Set dst (AbsVF src));
17170   ins_cost(INSN_COST * 3);
17171   format %{ "fabs  $dst,$src\t# vector (2S)" %}
17172   ins_encode %{
17173     __ fabs(as_FloatRegister($dst$$reg), __ T2S,
17174             as_FloatRegister($src$$reg));
17175   %}
17176   ins_pipe(vunop_fp64);
17177 %}
17178 
17179 instruct vabs4F(vecX dst, vecX src)
17180 %{
17181   predicate(n->as_Vector()->length() == 4);
17182   match(Set dst (AbsVF src));
17183   ins_cost(INSN_COST * 3);
17184   format %{ "fabs  $dst,$src\t# vector (4S)" %}
17185   ins_encode %{
17186     __ fabs(as_FloatRegister($dst$$reg), __ T4S,
17187             as_FloatRegister($src$$reg));
17188   %}
17189   ins_pipe(vunop_fp128);
17190 %}
17191 
17192 instruct vabs2D(vecX dst, vecX src)
17193 %{
17194   predicate(n->as_Vector()->length() == 2);
17195   match(Set dst (AbsVD src));
17196   ins_cost(INSN_COST * 3);
17197   format %{ "fabs  $dst,$src\t# vector (2D)" %}
17198   ins_encode %{
17199     __ fabs(as_FloatRegister($dst$$reg), __ T2D,
17200             as_FloatRegister($src$$reg));
17201   %}
17202   ins_pipe(vunop_fp128);
17203 %}
17204 
17205 // --------------------------------- NEG --------------------------------------
17206 
17207 instruct vneg2F(vecD dst, vecD src)
17208 %{
17209   predicate(n->as_Vector()->length() == 2);
17210   match(Set dst (NegVF src));
17211   ins_cost(INSN_COST * 3);
17212   format %{ "fneg  $dst,$src\t# vector (2S)" %}
17213   ins_encode %{
17214     __ fneg(as_FloatRegister($dst$$reg), __ T2S,
17215             as_FloatRegister($src$$reg));
17216   %}
17217   ins_pipe(vunop_fp64);
17218 %}
17219 
17220 instruct vneg4F(vecX dst, vecX src)
17221 %{
17222   predicate(n->as_Vector()->length() == 4);
17223   match(Set dst (NegVF src));
17224   ins_cost(INSN_COST * 3);
17225   format %{ "fneg  $dst,$src\t# vector (4S)" %}
17226   ins_encode %{
17227     __ fneg(as_FloatRegister($dst$$reg), __ T4S,
17228             as_FloatRegister($src$$reg));
17229   %}
17230   ins_pipe(vunop_fp128);
17231 %}
17232 
17233 instruct vneg2D(vecX dst, vecX src)
17234 %{
17235   predicate(n->as_Vector()->length() == 2);
17236   match(Set dst (NegVD src));
17237   ins_cost(INSN_COST * 3);
17238   format %{ "fneg  $dst,$src\t# vector (2D)" %}
17239   ins_encode %{
17240     __ fneg(as_FloatRegister($dst$$reg), __ T2D,
17241             as_FloatRegister($src$$reg));
17242   %}
17243   ins_pipe(vunop_fp128);
17244 %}
17245 
17246 // --------------------------------- AND --------------------------------------
17247 
17248 instruct vand8B(vecD dst, vecD src1, vecD src2)
17249 %{
17250   predicate(n->as_Vector()->length_in_bytes() == 4 ||
17251             n->as_Vector()->length_in_bytes() == 8);
17252   match(Set dst (AndV src1 src2));
17253   ins_cost(INSN_COST);
17254   format %{ "and  $dst,$src1,$src2\t# vector (8B)" %}
17255   ins_encode %{
17256     __ andr(as_FloatRegister($dst$$reg), __ T8B,
17257             as_FloatRegister($src1$$reg),
17258             as_FloatRegister($src2$$reg));
17259   %}
17260   ins_pipe(vlogical64);
17261 %}
17262 
17263 instruct vand16B(vecX dst, vecX src1, vecX src2)
17264 %{
17265   predicate(n->as_Vector()->length_in_bytes() == 16);
17266   match(Set dst (AndV src1 src2));
17267   ins_cost(INSN_COST);
17268   format %{ "and  $dst,$src1,$src2\t# vector (16B)" %}
17269   ins_encode %{
17270     __ andr(as_FloatRegister($dst$$reg), __ T16B,
17271             as_FloatRegister($src1$$reg),
17272             as_FloatRegister($src2$$reg));
17273   %}
17274   ins_pipe(vlogical128);
17275 %}
17276 
17277 // --------------------------------- OR ---------------------------------------
17278 
17279 instruct vor8B(vecD dst, vecD src1, vecD src2)
17280 %{
17281   predicate(n->as_Vector()->length_in_bytes() == 4 ||
17282             n->as_Vector()->length_in_bytes() == 8);
17283   match(Set dst (OrV src1 src2));
17284   ins_cost(INSN_COST);
17285   format %{ "and  $dst,$src1,$src2\t# vector (8B)" %}
17286   ins_encode %{
17287     __ orr(as_FloatRegister($dst$$reg), __ T8B,
17288             as_FloatRegister($src1$$reg),
17289             as_FloatRegister($src2$$reg));
17290   %}
17291   ins_pipe(vlogical64);
17292 %}
17293 
17294 instruct vor16B(vecX dst, vecX src1, vecX src2)
17295 %{
17296   predicate(n->as_Vector()->length_in_bytes() == 16);
17297   match(Set dst (OrV src1 src2));
17298   ins_cost(INSN_COST);
17299   format %{ "orr  $dst,$src1,$src2\t# vector (16B)" %}
17300   ins_encode %{
17301     __ orr(as_FloatRegister($dst$$reg), __ T16B,
17302             as_FloatRegister($src1$$reg),
17303             as_FloatRegister($src2$$reg));
17304   %}
17305   ins_pipe(vlogical128);
17306 %}
17307 
17308 // --------------------------------- XOR --------------------------------------
17309 
17310 instruct vxor8B(vecD dst, vecD src1, vecD src2)
17311 %{
17312   predicate(n->as_Vector()->length_in_bytes() == 4 ||
17313             n->as_Vector()->length_in_bytes() == 8);
17314   match(Set dst (XorV src1 src2));
17315   ins_cost(INSN_COST);
17316   format %{ "xor  $dst,$src1,$src2\t# vector (8B)" %}
17317   ins_encode %{
17318     __ eor(as_FloatRegister($dst$$reg), __ T8B,
17319             as_FloatRegister($src1$$reg),
17320             as_FloatRegister($src2$$reg));
17321   %}
17322   ins_pipe(vlogical64);
17323 %}
17324 
17325 instruct vxor16B(vecX dst, vecX src1, vecX src2)
17326 %{
17327   predicate(n->as_Vector()->length_in_bytes() == 16);
17328   match(Set dst (XorV src1 src2));
17329   ins_cost(INSN_COST);
17330   format %{ "xor  $dst,$src1,$src2\t# vector (16B)" %}
17331   ins_encode %{
17332     __ eor(as_FloatRegister($dst$$reg), __ T16B,
17333             as_FloatRegister($src1$$reg),
17334             as_FloatRegister($src2$$reg));
17335   %}
17336   ins_pipe(vlogical128);
17337 %}
17338 
17339 // ------------------------------ Shift ---------------------------------------
17340 instruct vshiftcnt8B(vecD dst, iRegIorL2I cnt) %{
17341   predicate(n->as_Vector()->length_in_bytes() == 8);
17342   match(Set dst (LShiftCntV cnt));
17343   match(Set dst (RShiftCntV cnt));
17344   format %{ "dup  $dst, $cnt\t# shift count vector (8B)" %}
17345   ins_encode %{
17346     __ dup(as_FloatRegister($dst$$reg), __ T8B, as_Register($cnt$$reg));
17347   %}
17348   ins_pipe(vdup_reg_reg64);
17349 %}
17350 
17351 instruct vshiftcnt16B(vecX dst, iRegIorL2I cnt) %{
17352   predicate(n->as_Vector()->length_in_bytes() == 16);
17353   match(Set dst (LShiftCntV cnt));
17354   match(Set dst (RShiftCntV cnt));
17355   format %{ "dup  $dst, $cnt\t# shift count vector (16B)" %}
17356   ins_encode %{
17357     __ dup(as_FloatRegister($dst$$reg), __ T16B, as_Register($cnt$$reg));
17358   %}
17359   ins_pipe(vdup_reg_reg128);
17360 %}
17361 
17362 instruct vsll8B(vecD dst, vecD src, vecD shift) %{
17363   predicate(n->as_Vector()->length() == 4 ||
17364             n->as_Vector()->length() == 8);
17365   match(Set dst (LShiftVB src shift));
17366   ins_cost(INSN_COST);
17367   format %{ "sshl  $dst,$src,$shift\t# vector (8B)" %}
17368   ins_encode %{
17369     __ sshl(as_FloatRegister($dst$$reg), __ T8B,
17370             as_FloatRegister($src$$reg),
17371             as_FloatRegister($shift$$reg));
17372   %}
17373   ins_pipe(vshift64);
17374 %}
17375 
17376 instruct vsll16B(vecX dst, vecX src, vecX shift) %{
17377   predicate(n->as_Vector()->length() == 16);
17378   match(Set dst (LShiftVB src shift));
17379   ins_cost(INSN_COST);
17380   format %{ "sshl  $dst,$src,$shift\t# vector (16B)" %}
17381   ins_encode %{
17382     __ sshl(as_FloatRegister($dst$$reg), __ T16B,
17383             as_FloatRegister($src$$reg),
17384             as_FloatRegister($shift$$reg));
17385   %}
17386   ins_pipe(vshift128);
17387 %}
17388 
17389 // Right shifts with vector shift count on aarch64 SIMD are implemented
17390 // as left shift by negative shift count.
17391 // There are two cases for vector shift count.
17392 //
17393 // Case 1: The vector shift count is from replication.
17394 //        |            |
17395 //    LoadVector  RShiftCntV
17396 //        |       /
17397 //     RShiftVI
17398 // Note: In inner loop, multiple neg instructions are used, which can be
17399 // moved to outer loop and merge into one neg instruction.
17400 //
17401 // Case 2: The vector shift count is from loading.
17402 // This case isn't supported by middle-end now. But it's supported by
17403 // panama/vectorIntrinsics(JEP 338: Vector API).
17404 //        |            |
17405 //    LoadVector  LoadVector
17406 //        |       /
17407 //     RShiftVI
17408 //
17409 
17410 instruct vsra8B(vecD dst, vecD src, vecD shift, vecD tmp) %{
17411   predicate(n->as_Vector()->length() == 4 ||
17412             n->as_Vector()->length() == 8);
17413   match(Set dst (RShiftVB src shift));
17414   ins_cost(INSN_COST);
17415   effect(TEMP tmp);
17416   format %{ "negr  $tmp,$shift\t"
17417             "sshl  $dst,$src,$tmp\t# vector (8B)" %}
17418   ins_encode %{
17419     __ negr(as_FloatRegister($tmp$$reg), __ T8B,
17420             as_FloatRegister($shift$$reg));
17421     __ sshl(as_FloatRegister($dst$$reg), __ T8B,
17422             as_FloatRegister($src$$reg),
17423             as_FloatRegister($tmp$$reg));
17424   %}
17425   ins_pipe(vshift64);
17426 %}
17427 
17428 instruct vsra16B(vecX dst, vecX src, vecX shift, vecX tmp) %{
17429   predicate(n->as_Vector()->length() == 16);
17430   match(Set dst (RShiftVB src shift));
17431   ins_cost(INSN_COST);
17432   effect(TEMP tmp);
17433   format %{ "negr  $tmp,$shift\t"
17434             "sshl  $dst,$src,$tmp\t# vector (16B)" %}
17435   ins_encode %{
17436     __ negr(as_FloatRegister($tmp$$reg), __ T16B,
17437             as_FloatRegister($shift$$reg));
17438     __ sshl(as_FloatRegister($dst$$reg), __ T16B,
17439             as_FloatRegister($src$$reg),
17440             as_FloatRegister($tmp$$reg));
17441   %}
17442   ins_pipe(vshift128);
17443 %}
17444 
17445 instruct vsrl8B(vecD dst, vecD src, vecD shift, vecD tmp) %{
17446   predicate(n->as_Vector()->length() == 4 ||
17447             n->as_Vector()->length() == 8);
17448   match(Set dst (URShiftVB src shift));
17449   ins_cost(INSN_COST);
17450   effect(TEMP tmp);
17451   format %{ "negr  $tmp,$shift\t"
17452             "ushl  $dst,$src,$tmp\t# vector (8B)" %}
17453   ins_encode %{
17454     __ negr(as_FloatRegister($tmp$$reg), __ T8B,
17455             as_FloatRegister($shift$$reg));
17456     __ ushl(as_FloatRegister($dst$$reg), __ T8B,
17457             as_FloatRegister($src$$reg),
17458             as_FloatRegister($tmp$$reg));
17459   %}
17460   ins_pipe(vshift64);
17461 %}
17462 
17463 instruct vsrl16B(vecX dst, vecX src, vecX shift, vecX tmp) %{
17464   predicate(n->as_Vector()->length() == 16);
17465   match(Set dst (URShiftVB src shift));
17466   ins_cost(INSN_COST);
17467   effect(TEMP tmp);
17468   format %{ "negr  $tmp,$shift\t"
17469             "ushl  $dst,$src,$tmp\t# vector (16B)" %}
17470   ins_encode %{
17471     __ negr(as_FloatRegister($tmp$$reg), __ T16B,
17472             as_FloatRegister($shift$$reg));
17473     __ ushl(as_FloatRegister($dst$$reg), __ T16B,
17474             as_FloatRegister($src$$reg),
17475             as_FloatRegister($tmp$$reg));
17476   %}
17477   ins_pipe(vshift128);
17478 %}
17479 
17480 instruct vsll8B_imm(vecD dst, vecD src, immI shift) %{
17481   predicate(n->as_Vector()->length() == 4 ||
17482             n->as_Vector()->length() == 8);
17483   match(Set dst (LShiftVB src (LShiftCntV shift)));
17484   ins_cost(INSN_COST);
17485   format %{ "shl    $dst, $src, $shift\t# vector (8B)" %}
17486   ins_encode %{
17487     int sh = (int)$shift$$constant;
17488     if (sh >= 8) {
17489       __ eor(as_FloatRegister($dst$$reg), __ T8B,
17490              as_FloatRegister($src$$reg),
17491              as_FloatRegister($src$$reg));
17492     } else {
17493       __ shl(as_FloatRegister($dst$$reg), __ T8B,
17494              as_FloatRegister($src$$reg), sh);
17495     }
17496   %}
17497   ins_pipe(vshift64_imm);
17498 %}
17499 
17500 instruct vsll16B_imm(vecX dst, vecX src, immI shift) %{
17501   predicate(n->as_Vector()->length() == 16);
17502   match(Set dst (LShiftVB src (LShiftCntV shift)));
17503   ins_cost(INSN_COST);
17504   format %{ "shl    $dst, $src, $shift\t# vector (16B)" %}
17505   ins_encode %{
17506     int sh = (int)$shift$$constant;
17507     if (sh >= 8) {
17508       __ eor(as_FloatRegister($dst$$reg), __ T16B,
17509              as_FloatRegister($src$$reg),
17510              as_FloatRegister($src$$reg));
17511     } else {
17512       __ shl(as_FloatRegister($dst$$reg), __ T16B,
17513              as_FloatRegister($src$$reg), sh);
17514     }
17515   %}
17516   ins_pipe(vshift128_imm);
17517 %}
17518 
17519 instruct vsra8B_imm(vecD dst, vecD src, immI shift) %{
17520   predicate(n->as_Vector()->length() == 4 ||
17521             n->as_Vector()->length() == 8);
17522   match(Set dst (RShiftVB src (RShiftCntV shift)));
17523   ins_cost(INSN_COST);
17524   format %{ "sshr    $dst, $src, $shift\t# vector (8B)" %}
17525   ins_encode %{
17526     int sh = (int)$shift$$constant;
17527     if (sh >= 8) sh = 7;
17528     __ sshr(as_FloatRegister($dst$$reg), __ T8B,
17529            as_FloatRegister($src$$reg), sh);
17530   %}
17531   ins_pipe(vshift64_imm);
17532 %}
17533 
17534 instruct vsra16B_imm(vecX dst, vecX src, immI shift) %{
17535   predicate(n->as_Vector()->length() == 16);
17536   match(Set dst (RShiftVB src (RShiftCntV shift)));
17537   ins_cost(INSN_COST);
17538   format %{ "sshr    $dst, $src, $shift\t# vector (16B)" %}
17539   ins_encode %{
17540     int sh = (int)$shift$$constant;
17541     if (sh >= 8) sh = 7;
17542     __ sshr(as_FloatRegister($dst$$reg), __ T16B,
17543            as_FloatRegister($src$$reg), sh);
17544   %}
17545   ins_pipe(vshift128_imm);
17546 %}
17547 
17548 instruct vsrl8B_imm(vecD dst, vecD src, immI shift) %{
17549   predicate(n->as_Vector()->length() == 4 ||
17550             n->as_Vector()->length() == 8);
17551   match(Set dst (URShiftVB src (RShiftCntV shift)));
17552   ins_cost(INSN_COST);
17553   format %{ "ushr    $dst, $src, $shift\t# vector (8B)" %}
17554   ins_encode %{
17555     int sh = (int)$shift$$constant;
17556     if (sh >= 8) {
17557       __ eor(as_FloatRegister($dst$$reg), __ T8B,
17558              as_FloatRegister($src$$reg),
17559              as_FloatRegister($src$$reg));
17560     } else {
17561       __ ushr(as_FloatRegister($dst$$reg), __ T8B,
17562              as_FloatRegister($src$$reg), sh);
17563     }
17564   %}
17565   ins_pipe(vshift64_imm);
17566 %}
17567 
17568 instruct vsrl16B_imm(vecX dst, vecX src, immI shift) %{
17569   predicate(n->as_Vector()->length() == 16);
17570   match(Set dst (URShiftVB src (RShiftCntV shift)));
17571   ins_cost(INSN_COST);
17572   format %{ "ushr    $dst, $src, $shift\t# vector (16B)" %}
17573   ins_encode %{
17574     int sh = (int)$shift$$constant;
17575     if (sh >= 8) {
17576       __ eor(as_FloatRegister($dst$$reg), __ T16B,
17577              as_FloatRegister($src$$reg),
17578              as_FloatRegister($src$$reg));
17579     } else {
17580       __ ushr(as_FloatRegister($dst$$reg), __ T16B,
17581              as_FloatRegister($src$$reg), sh);
17582     }
17583   %}
17584   ins_pipe(vshift128_imm);
17585 %}
17586 
17587 instruct vsll4S(vecD dst, vecD src, vecD shift) %{
17588   predicate(n->as_Vector()->length() == 2 ||
17589             n->as_Vector()->length() == 4);
17590   match(Set dst (LShiftVS src shift));
17591   ins_cost(INSN_COST);
17592   format %{ "sshl  $dst,$src,$shift\t# vector (4H)" %}
17593   ins_encode %{
17594     __ sshl(as_FloatRegister($dst$$reg), __ T4H,
17595             as_FloatRegister($src$$reg),
17596             as_FloatRegister($shift$$reg));
17597   %}
17598   ins_pipe(vshift64);
17599 %}
17600 
17601 instruct vsll8S(vecX dst, vecX src, vecX shift) %{
17602   predicate(n->as_Vector()->length() == 8);
17603   match(Set dst (LShiftVS src shift));
17604   ins_cost(INSN_COST);
17605   format %{ "sshl  $dst,$src,$shift\t# vector (8H)" %}
17606   ins_encode %{
17607     __ sshl(as_FloatRegister($dst$$reg), __ T8H,
17608             as_FloatRegister($src$$reg),
17609             as_FloatRegister($shift$$reg));
17610   %}
17611   ins_pipe(vshift128);
17612 %}
17613 
17614 instruct vsra4S(vecD dst, vecD src, vecD shift, vecD tmp) %{
17615   predicate(n->as_Vector()->length() == 2 ||
17616             n->as_Vector()->length() == 4);
17617   match(Set dst (RShiftVS src shift));
17618   ins_cost(INSN_COST);
17619   effect(TEMP tmp);
17620   format %{ "negr  $tmp,$shift\t"
17621             "sshl  $dst,$src,$tmp\t# vector (4H)" %}
17622   ins_encode %{
17623     __ negr(as_FloatRegister($tmp$$reg), __ T8B,
17624             as_FloatRegister($shift$$reg));
17625     __ sshl(as_FloatRegister($dst$$reg), __ T4H,
17626             as_FloatRegister($src$$reg),
17627             as_FloatRegister($tmp$$reg));
17628   %}
17629   ins_pipe(vshift64);
17630 %}
17631 
17632 instruct vsra8S(vecX dst, vecX src, vecX shift, vecX tmp) %{
17633   predicate(n->as_Vector()->length() == 8);
17634   match(Set dst (RShiftVS src shift));
17635   ins_cost(INSN_COST);
17636   effect(TEMP tmp);
17637   format %{ "negr  $tmp,$shift\t"
17638             "sshl  $dst,$src,$tmp\t# vector (8H)" %}
17639   ins_encode %{
17640     __ negr(as_FloatRegister($tmp$$reg), __ T16B,
17641             as_FloatRegister($shift$$reg));
17642     __ sshl(as_FloatRegister($dst$$reg), __ T8H,
17643             as_FloatRegister($src$$reg),
17644             as_FloatRegister($tmp$$reg));
17645   %}
17646   ins_pipe(vshift128);
17647 %}
17648 
17649 instruct vsrl4S(vecD dst, vecD src, vecD shift, vecD tmp) %{
17650   predicate(n->as_Vector()->length() == 2 ||
17651             n->as_Vector()->length() == 4);
17652   match(Set dst (URShiftVS src shift));
17653   ins_cost(INSN_COST);
17654   effect(TEMP tmp);
17655   format %{ "negr  $tmp,$shift\t"
17656             "ushl  $dst,$src,$tmp\t# vector (4H)" %}
17657   ins_encode %{
17658     __ negr(as_FloatRegister($tmp$$reg), __ T8B,
17659             as_FloatRegister($shift$$reg));
17660     __ ushl(as_FloatRegister($dst$$reg), __ T4H,
17661             as_FloatRegister($src$$reg),
17662             as_FloatRegister($tmp$$reg));
17663   %}
17664   ins_pipe(vshift64);
17665 %}
17666 
17667 instruct vsrl8S(vecX dst, vecX src, vecX shift, vecX tmp) %{
17668   predicate(n->as_Vector()->length() == 8);
17669   match(Set dst (URShiftVS src shift));
17670   ins_cost(INSN_COST);
17671   effect(TEMP tmp);
17672   format %{ "negr  $tmp,$shift\t"
17673             "ushl  $dst,$src,$tmp\t# vector (8H)" %}
17674   ins_encode %{
17675     __ negr(as_FloatRegister($tmp$$reg), __ T16B,
17676             as_FloatRegister($shift$$reg));
17677     __ ushl(as_FloatRegister($dst$$reg), __ T8H,
17678             as_FloatRegister($src$$reg),
17679             as_FloatRegister($tmp$$reg));
17680   %}
17681   ins_pipe(vshift128);
17682 %}
17683 
17684 instruct vsll4S_imm(vecD dst, vecD src, immI shift) %{
17685   predicate(n->as_Vector()->length() == 2 ||
17686             n->as_Vector()->length() == 4);
17687   match(Set dst (LShiftVS src (LShiftCntV shift)));
17688   ins_cost(INSN_COST);
17689   format %{ "shl    $dst, $src, $shift\t# vector (4H)" %}
17690   ins_encode %{
17691     int sh = (int)$shift$$constant;
17692     if (sh >= 16) {
17693       __ eor(as_FloatRegister($dst$$reg), __ T8B,
17694              as_FloatRegister($src$$reg),
17695              as_FloatRegister($src$$reg));
17696     } else {
17697       __ shl(as_FloatRegister($dst$$reg), __ T4H,
17698              as_FloatRegister($src$$reg), sh);
17699     }
17700   %}
17701   ins_pipe(vshift64_imm);
17702 %}
17703 
17704 instruct vsll8S_imm(vecX dst, vecX src, immI shift) %{
17705   predicate(n->as_Vector()->length() == 8);
17706   match(Set dst (LShiftVS src (LShiftCntV shift)));
17707   ins_cost(INSN_COST);
17708   format %{ "shl    $dst, $src, $shift\t# vector (8H)" %}
17709   ins_encode %{
17710     int sh = (int)$shift$$constant;
17711     if (sh >= 16) {
17712       __ eor(as_FloatRegister($dst$$reg), __ T16B,
17713              as_FloatRegister($src$$reg),
17714              as_FloatRegister($src$$reg));
17715     } else {
17716       __ shl(as_FloatRegister($dst$$reg), __ T8H,
17717              as_FloatRegister($src$$reg), sh);
17718     }
17719   %}
17720   ins_pipe(vshift128_imm);
17721 %}
17722 
17723 instruct vsra4S_imm(vecD dst, vecD src, immI shift) %{
17724   predicate(n->as_Vector()->length() == 2 ||
17725             n->as_Vector()->length() == 4);
17726   match(Set dst (RShiftVS src (RShiftCntV shift)));
17727   ins_cost(INSN_COST);
17728   format %{ "sshr    $dst, $src, $shift\t# vector (4H)" %}
17729   ins_encode %{
17730     int sh = (int)$shift$$constant;
17731     if (sh >= 16) sh = 15;
17732     __ sshr(as_FloatRegister($dst$$reg), __ T4H,
17733            as_FloatRegister($src$$reg), sh);
17734   %}
17735   ins_pipe(vshift64_imm);
17736 %}
17737 
17738 instruct vsra8S_imm(vecX dst, vecX src, immI shift) %{
17739   predicate(n->as_Vector()->length() == 8);
17740   match(Set dst (RShiftVS src (RShiftCntV shift)));
17741   ins_cost(INSN_COST);
17742   format %{ "sshr    $dst, $src, $shift\t# vector (8H)" %}
17743   ins_encode %{
17744     int sh = (int)$shift$$constant;
17745     if (sh >= 16) sh = 15;
17746     __ sshr(as_FloatRegister($dst$$reg), __ T8H,
17747            as_FloatRegister($src$$reg), sh);
17748   %}
17749   ins_pipe(vshift128_imm);
17750 %}
17751 
17752 instruct vsrl4S_imm(vecD dst, vecD src, immI shift) %{
17753   predicate(n->as_Vector()->length() == 2 ||
17754             n->as_Vector()->length() == 4);
17755   match(Set dst (URShiftVS src (RShiftCntV shift)));
17756   ins_cost(INSN_COST);
17757   format %{ "ushr    $dst, $src, $shift\t# vector (4H)" %}
17758   ins_encode %{
17759     int sh = (int)$shift$$constant;
17760     if (sh >= 16) {
17761       __ eor(as_FloatRegister($dst$$reg), __ T8B,
17762              as_FloatRegister($src$$reg),
17763              as_FloatRegister($src$$reg));
17764     } else {
17765       __ ushr(as_FloatRegister($dst$$reg), __ T4H,
17766              as_FloatRegister($src$$reg), sh);
17767     }
17768   %}
17769   ins_pipe(vshift64_imm);
17770 %}
17771 
17772 instruct vsrl8S_imm(vecX dst, vecX src, immI shift) %{
17773   predicate(n->as_Vector()->length() == 8);
17774   match(Set dst (URShiftVS src (RShiftCntV shift)));
17775   ins_cost(INSN_COST);
17776   format %{ "ushr    $dst, $src, $shift\t# vector (8H)" %}
17777   ins_encode %{
17778     int sh = (int)$shift$$constant;
17779     if (sh >= 16) {
17780       __ eor(as_FloatRegister($dst$$reg), __ T16B,
17781              as_FloatRegister($src$$reg),
17782              as_FloatRegister($src$$reg));
17783     } else {
17784       __ ushr(as_FloatRegister($dst$$reg), __ T8H,
17785              as_FloatRegister($src$$reg), sh);
17786     }
17787   %}
17788   ins_pipe(vshift128_imm);
17789 %}
17790 
17791 instruct vsll2I(vecD dst, vecD src, vecD shift) %{
17792   predicate(n->as_Vector()->length() == 2);
17793   match(Set dst (LShiftVI src shift));
17794   ins_cost(INSN_COST);
17795   format %{ "sshl  $dst,$src,$shift\t# vector (2S)" %}
17796   ins_encode %{
17797     __ sshl(as_FloatRegister($dst$$reg), __ T2S,
17798             as_FloatRegister($src$$reg),
17799             as_FloatRegister($shift$$reg));
17800   %}
17801   ins_pipe(vshift64);
17802 %}
17803 
17804 instruct vsll4I(vecX dst, vecX src, vecX shift) %{
17805   predicate(n->as_Vector()->length() == 4);
17806   match(Set dst (LShiftVI src shift));
17807   ins_cost(INSN_COST);
17808   format %{ "sshl  $dst,$src,$shift\t# vector (4S)" %}
17809   ins_encode %{
17810     __ sshl(as_FloatRegister($dst$$reg), __ T4S,
17811             as_FloatRegister($src$$reg),
17812             as_FloatRegister($shift$$reg));
17813   %}
17814   ins_pipe(vshift128);
17815 %}
17816 
17817 instruct vsra2I(vecD dst, vecD src, vecD shift, vecD tmp) %{
17818   predicate(n->as_Vector()->length() == 2);
17819   match(Set dst (RShiftVI src shift));
17820   ins_cost(INSN_COST);
17821   effect(TEMP tmp);
17822   format %{ "negr  $tmp,$shift\t"
17823             "sshl  $dst,$src,$tmp\t# vector (2S)" %}
17824   ins_encode %{
17825     __ negr(as_FloatRegister($tmp$$reg), __ T8B,
17826             as_FloatRegister($shift$$reg));
17827     __ sshl(as_FloatRegister($dst$$reg), __ T2S,
17828             as_FloatRegister($src$$reg),
17829             as_FloatRegister($tmp$$reg));
17830   %}
17831   ins_pipe(vshift64);
17832 %}
17833 
17834 instruct vsra4I(vecX dst, vecX src, vecX shift, vecX tmp) %{
17835   predicate(n->as_Vector()->length() == 4);
17836   match(Set dst (RShiftVI src shift));
17837   ins_cost(INSN_COST);
17838   effect(TEMP tmp);
17839   format %{ "negr  $tmp,$shift\t"
17840             "sshl  $dst,$src,$tmp\t# vector (4S)" %}
17841   ins_encode %{
17842     __ negr(as_FloatRegister($tmp$$reg), __ T16B,
17843             as_FloatRegister($shift$$reg));
17844     __ sshl(as_FloatRegister($dst$$reg), __ T4S,
17845             as_FloatRegister($src$$reg),
17846             as_FloatRegister($tmp$$reg));
17847   %}
17848   ins_pipe(vshift128);
17849 %}
17850 
17851 instruct vsrl2I(vecD dst, vecD src, vecD shift, vecD tmp) %{
17852   predicate(n->as_Vector()->length() == 2);
17853   match(Set dst (URShiftVI src shift));
17854   ins_cost(INSN_COST);
17855   effect(TEMP tmp);
17856   format %{ "negr  $tmp,$shift\t"
17857             "ushl  $dst,$src,$tmp\t# vector (2S)" %}
17858   ins_encode %{
17859     __ negr(as_FloatRegister($tmp$$reg), __ T8B,
17860             as_FloatRegister($shift$$reg));
17861     __ ushl(as_FloatRegister($dst$$reg), __ T2S,
17862             as_FloatRegister($src$$reg),
17863             as_FloatRegister($tmp$$reg));
17864   %}
17865   ins_pipe(vshift64);
17866 %}
17867 
17868 instruct vsrl4I(vecX dst, vecX src, vecX shift, vecX tmp) %{
17869   predicate(n->as_Vector()->length() == 4);
17870   match(Set dst (URShiftVI src shift));
17871   ins_cost(INSN_COST);
17872   effect(TEMP tmp);
17873   format %{ "negr  $tmp,$shift\t"
17874             "ushl  $dst,$src,$tmp\t# vector (4S)" %}
17875   ins_encode %{
17876     __ negr(as_FloatRegister($tmp$$reg), __ T16B,
17877             as_FloatRegister($shift$$reg));
17878     __ ushl(as_FloatRegister($dst$$reg), __ T4S,
17879             as_FloatRegister($src$$reg),
17880             as_FloatRegister($tmp$$reg));
17881   %}
17882   ins_pipe(vshift128);
17883 %}
17884 
17885 instruct vsll2I_imm(vecD dst, vecD src, immI shift) %{
17886   predicate(n->as_Vector()->length() == 2);
17887   match(Set dst (LShiftVI src (LShiftCntV shift)));
17888   ins_cost(INSN_COST);
17889   format %{ "shl    $dst, $src, $shift\t# vector (2S)" %}
17890   ins_encode %{
17891     __ shl(as_FloatRegister($dst$$reg), __ T2S,
17892            as_FloatRegister($src$$reg),
17893            (int)$shift$$constant);
17894   %}
17895   ins_pipe(vshift64_imm);
17896 %}
17897 
17898 instruct vsll4I_imm(vecX dst, vecX src, immI shift) %{
17899   predicate(n->as_Vector()->length() == 4);
17900   match(Set dst (LShiftVI src (LShiftCntV shift)));
17901   ins_cost(INSN_COST);
17902   format %{ "shl    $dst, $src, $shift\t# vector (4S)" %}
17903   ins_encode %{
17904     __ shl(as_FloatRegister($dst$$reg), __ T4S,
17905            as_FloatRegister($src$$reg),
17906            (int)$shift$$constant);
17907   %}
17908   ins_pipe(vshift128_imm);
17909 %}
17910 
17911 instruct vsra2I_imm(vecD dst, vecD src, immI shift) %{
17912   predicate(n->as_Vector()->length() == 2);
17913   match(Set dst (RShiftVI src (RShiftCntV shift)));
17914   ins_cost(INSN_COST);
17915   format %{ "sshr    $dst, $src, $shift\t# vector (2S)" %}
17916   ins_encode %{
17917     __ sshr(as_FloatRegister($dst$$reg), __ T2S,
17918             as_FloatRegister($src$$reg),
17919             (int)$shift$$constant);
17920   %}
17921   ins_pipe(vshift64_imm);
17922 %}
17923 
17924 instruct vsra4I_imm(vecX dst, vecX src, immI shift) %{
17925   predicate(n->as_Vector()->length() == 4);
17926   match(Set dst (RShiftVI src (RShiftCntV shift)));
17927   ins_cost(INSN_COST);
17928   format %{ "sshr    $dst, $src, $shift\t# vector (4S)" %}
17929   ins_encode %{
17930     __ sshr(as_FloatRegister($dst$$reg), __ T4S,
17931             as_FloatRegister($src$$reg),
17932             (int)$shift$$constant);
17933   %}
17934   ins_pipe(vshift128_imm);
17935 %}
17936 
17937 instruct vsrl2I_imm(vecD dst, vecD src, immI shift) %{
17938   predicate(n->as_Vector()->length() == 2);
17939   match(Set dst (URShiftVI src (RShiftCntV shift)));
17940   ins_cost(INSN_COST);
17941   format %{ "ushr    $dst, $src, $shift\t# vector (2S)" %}
17942   ins_encode %{
17943     __ ushr(as_FloatRegister($dst$$reg), __ T2S,
17944             as_FloatRegister($src$$reg),
17945             (int)$shift$$constant);
17946   %}
17947   ins_pipe(vshift64_imm);
17948 %}
17949 
17950 instruct vsrl4I_imm(vecX dst, vecX src, immI shift) %{
17951   predicate(n->as_Vector()->length() == 4);
17952   match(Set dst (URShiftVI src (RShiftCntV shift)));
17953   ins_cost(INSN_COST);
17954   format %{ "ushr    $dst, $src, $shift\t# vector (4S)" %}
17955   ins_encode %{
17956     __ ushr(as_FloatRegister($dst$$reg), __ T4S,
17957             as_FloatRegister($src$$reg),
17958             (int)$shift$$constant);
17959   %}
17960   ins_pipe(vshift128_imm);
17961 %}
17962 
17963 instruct vsll2L(vecX dst, vecX src, vecX shift) %{
17964   predicate(n->as_Vector()->length() == 2);
17965   match(Set dst (LShiftVL src shift));
17966   ins_cost(INSN_COST);
17967   format %{ "sshl  $dst,$src,$shift\t# vector (2D)" %}
17968   ins_encode %{
17969     __ sshl(as_FloatRegister($dst$$reg), __ T2D,
17970             as_FloatRegister($src$$reg),
17971             as_FloatRegister($shift$$reg));
17972   %}
17973   ins_pipe(vshift128);
17974 %}
17975 
17976 instruct vsra2L(vecX dst, vecX src, vecX shift, vecX tmp) %{
17977   predicate(n->as_Vector()->length() == 2);
17978   match(Set dst (RShiftVL src shift));
17979   ins_cost(INSN_COST);
17980   effect(TEMP tmp);
17981   format %{ "negr  $tmp,$shift\t"
17982             "sshl  $dst,$src,$tmp\t# vector (2D)" %}
17983   ins_encode %{
17984     __ negr(as_FloatRegister($tmp$$reg), __ T16B,
17985             as_FloatRegister($shift$$reg));
17986     __ sshl(as_FloatRegister($dst$$reg), __ T2D,
17987             as_FloatRegister($src$$reg),
17988             as_FloatRegister($tmp$$reg));
17989   %}
17990   ins_pipe(vshift128);
17991 %}
17992 
17993 instruct vsrl2L(vecX dst, vecX src, vecX shift, vecX tmp) %{
17994   predicate(n->as_Vector()->length() == 2);
17995   match(Set dst (URShiftVL src shift));
17996   ins_cost(INSN_COST);
17997   effect(TEMP tmp);
17998   format %{ "negr  $tmp,$shift\t"
17999             "ushl  $dst,$src,$tmp\t# vector (2D)" %}
18000   ins_encode %{
18001     __ negr(as_FloatRegister($tmp$$reg), __ T16B,
18002             as_FloatRegister($shift$$reg));
18003     __ ushl(as_FloatRegister($dst$$reg), __ T2D,
18004             as_FloatRegister($src$$reg),
18005             as_FloatRegister($tmp$$reg));
18006   %}
18007   ins_pipe(vshift128);
18008 %}
18009 
18010 instruct vsll2L_imm(vecX dst, vecX src, immI shift) %{
18011   predicate(n->as_Vector()->length() == 2);
18012   match(Set dst (LShiftVL src (LShiftCntV shift)));
18013   ins_cost(INSN_COST);
18014   format %{ "shl    $dst, $src, $shift\t# vector (2D)" %}
18015   ins_encode %{
18016     __ shl(as_FloatRegister($dst$$reg), __ T2D,
18017            as_FloatRegister($src$$reg),
18018            (int)$shift$$constant);
18019   %}
18020   ins_pipe(vshift128_imm);
18021 %}
18022 
18023 instruct vsra2L_imm(vecX dst, vecX src, immI shift) %{
18024   predicate(n->as_Vector()->length() == 2);
18025   match(Set dst (RShiftVL src (RShiftCntV shift)));
18026   ins_cost(INSN_COST);
18027   format %{ "sshr    $dst, $src, $shift\t# vector (2D)" %}
18028   ins_encode %{
18029     __ sshr(as_FloatRegister($dst$$reg), __ T2D,
18030             as_FloatRegister($src$$reg),
18031             (int)$shift$$constant);
18032   %}
18033   ins_pipe(vshift128_imm);
18034 %}
18035 
18036 instruct vsrl2L_imm(vecX dst, vecX src, immI shift) %{
18037   predicate(n->as_Vector()->length() == 2);
18038   match(Set dst (URShiftVL src (RShiftCntV shift)));
18039   ins_cost(INSN_COST);
18040   format %{ "ushr    $dst, $src, $shift\t# vector (2D)" %}
18041   ins_encode %{
18042     __ ushr(as_FloatRegister($dst$$reg), __ T2D,
18043             as_FloatRegister($src$$reg),
18044             (int)$shift$$constant);
18045   %}
18046   ins_pipe(vshift128_imm);
18047 %}
18048 
18049 instruct vmax2F(vecD dst, vecD src1, vecD src2)
18050 %{
18051   predicate(n->as_Vector()->length() == 2 && n->bottom_type()->is_vect()->element_basic_type() == T_FLOAT);
18052   match(Set dst (MaxV src1 src2));
18053   ins_cost(INSN_COST);
18054   format %{ "fmax  $dst,$src1,$src2\t# vector (2F)" %}
18055   ins_encode %{
18056     __ fmax(as_FloatRegister($dst$$reg), __ T2S,
18057             as_FloatRegister($src1$$reg),
18058             as_FloatRegister($src2$$reg));
18059   %}
18060   ins_pipe(vdop_fp64);
18061 %}
18062 
18063 instruct vmax4F(vecX dst, vecX src1, vecX src2)
18064 %{
18065   predicate(n->as_Vector()->length() == 4 && n->bottom_type()->is_vect()->element_basic_type() == T_FLOAT);
18066   match(Set dst (MaxV src1 src2));
18067   ins_cost(INSN_COST);
18068   format %{ "fmax  $dst,$src1,$src2\t# vector (4S)" %}
18069   ins_encode %{
18070     __ fmax(as_FloatRegister($dst$$reg), __ T4S,
18071             as_FloatRegister($src1$$reg),
18072             as_FloatRegister($src2$$reg));
18073   %}
18074   ins_pipe(vdop_fp128);
18075 %}
18076 
18077 instruct vmax2D(vecX dst, vecX src1, vecX src2)
18078 %{
18079   predicate(n->as_Vector()->length() == 2 && n->bottom_type()->is_vect()->element_basic_type() == T_DOUBLE);
18080   match(Set dst (MaxV src1 src2));
18081   ins_cost(INSN_COST);
18082   format %{ "fmax  $dst,$src1,$src2\t# vector (2D)" %}
18083   ins_encode %{
18084     __ fmax(as_FloatRegister($dst$$reg), __ T2D,
18085             as_FloatRegister($src1$$reg),
18086             as_FloatRegister($src2$$reg));
18087   %}
18088   ins_pipe(vdop_fp128);
18089 %}
18090 
18091 instruct vmin2F(vecD dst, vecD src1, vecD src2)
18092 %{
18093   predicate(n->as_Vector()->length() == 2 && n->bottom_type()->is_vect()->element_basic_type() == T_FLOAT);
18094   match(Set dst (MinV src1 src2));
18095   ins_cost(INSN_COST);
18096   format %{ "fmin  $dst,$src1,$src2\t# vector (2F)" %}
18097   ins_encode %{
18098     __ fmin(as_FloatRegister($dst$$reg), __ T2S,
18099             as_FloatRegister($src1$$reg),
18100             as_FloatRegister($src2$$reg));
18101   %}
18102   ins_pipe(vdop_fp64);
18103 %}
18104 
18105 instruct vmin4F(vecX dst, vecX src1, vecX src2)
18106 %{
18107   predicate(n->as_Vector()->length() == 4 && n->bottom_type()->is_vect()->element_basic_type() == T_FLOAT);
18108   match(Set dst (MinV src1 src2));
18109   ins_cost(INSN_COST);
18110   format %{ "fmin  $dst,$src1,$src2\t# vector (4S)" %}
18111   ins_encode %{
18112     __ fmin(as_FloatRegister($dst$$reg), __ T4S,
18113             as_FloatRegister($src1$$reg),
18114             as_FloatRegister($src2$$reg));
18115   %}
18116   ins_pipe(vdop_fp128);
18117 %}
18118 
18119 instruct vmin2D(vecX dst, vecX src1, vecX src2)
18120 %{
18121   predicate(n->as_Vector()->length() == 2 && n->bottom_type()->is_vect()->element_basic_type() == T_DOUBLE);
18122   match(Set dst (MinV src1 src2));
18123   ins_cost(INSN_COST);
18124   format %{ "fmin  $dst,$src1,$src2\t# vector (2D)" %}
18125   ins_encode %{
18126     __ fmin(as_FloatRegister($dst$$reg), __ T2D,
18127             as_FloatRegister($src1$$reg),
18128             as_FloatRegister($src2$$reg));
18129   %}
18130   ins_pipe(vdop_fp128);
18131 %}
18132 
18133 instruct vround2D_reg(vecX dst, vecX src, immI rmode) %{
18134   predicate(n->as_Vector()->length() == 2 && n->bottom_type()->is_vect()->element_basic_type() == T_DOUBLE);
18135   match(Set dst (RoundDoubleModeV src rmode));
18136   format %{ "frint  $dst, $src, $rmode" %}
18137   ins_encode %{
18138     switch ($rmode$$constant) {
18139       case RoundDoubleModeNode::rmode_rint:
18140         __ frintn(as_FloatRegister($dst$$reg), __ T2D,
18141                   as_FloatRegister($src$$reg));
18142         break;
18143       case RoundDoubleModeNode::rmode_floor:
18144         __ frintm(as_FloatRegister($dst$$reg), __ T2D,
18145                   as_FloatRegister($src$$reg));
18146         break;
18147       case RoundDoubleModeNode::rmode_ceil:
18148         __ frintp(as_FloatRegister($dst$$reg), __ T2D,
18149                   as_FloatRegister($src$$reg));
18150         break;
18151     }
18152   %}
18153   ins_pipe(vdop_fp128);
18154 %}
18155 
18156 instruct vpopcount4I(vecX dst, vecX src) %{
18157   predicate(UsePopCountInstruction && n->as_Vector()->length() == 4);
18158   match(Set dst (PopCountVI src));
18159   format %{
18160     "cnt     $dst, $src\t# vector (16B)\n\t"
18161     "uaddlp  $dst, $dst\t# vector (16B)\n\t"
18162     "uaddlp  $dst, $dst\t# vector (8H)"
18163   %}
18164   ins_encode %{
18165      __ cnt(as_FloatRegister($dst$$reg), __ T16B,
18166             as_FloatRegister($src$$reg));
18167      __ uaddlp(as_FloatRegister($dst$$reg), __ T16B,
18168                as_FloatRegister($dst$$reg));
18169      __ uaddlp(as_FloatRegister($dst$$reg), __ T8H,
18170                as_FloatRegister($dst$$reg));
18171   %}
18172   ins_pipe(pipe_class_default);
18173 %}
18174 
18175 instruct vpopcount2I(vecD dst, vecD src) %{
18176   predicate(UsePopCountInstruction && n->as_Vector()->length() == 2);
18177   match(Set dst (PopCountVI src));
18178   format %{
18179     "cnt     $dst, $src\t# vector (8B)\n\t"
18180     "uaddlp  $dst, $dst\t# vector (8B)\n\t"
18181     "uaddlp  $dst, $dst\t# vector (4H)"
18182   %}
18183   ins_encode %{
18184      __ cnt(as_FloatRegister($dst$$reg), __ T8B,
18185             as_FloatRegister($src$$reg));
18186      __ uaddlp(as_FloatRegister($dst$$reg), __ T8B,
18187                as_FloatRegister($dst$$reg));
18188      __ uaddlp(as_FloatRegister($dst$$reg), __ T4H,
18189                as_FloatRegister($dst$$reg));
18190   %}
18191   ins_pipe(pipe_class_default);
18192 %}
18193 
18194 //----------PEEPHOLE RULES-----------------------------------------------------
18195 // These must follow all instruction definitions as they use the names
18196 // defined in the instructions definitions.
18197 //
18198 // peepmatch ( root_instr_name [preceding_instruction]* );
18199 //
18200 // peepconstraint %{
18201 // (instruction_number.operand_name relational_op instruction_number.operand_name
18202 //  [, ...] );
18203 // // instruction numbers are zero-based using left to right order in peepmatch
18204 //
18205 // peepreplace ( instr_name  ( [instruction_number.operand_name]* ) );
18206 // // provide an instruction_number.operand_name for each operand that appears
18207 // // in the replacement instruction's match rule
18208 //
18209 // ---------VM FLAGS---------------------------------------------------------
18210 //
18211 // All peephole optimizations can be turned off using -XX:-OptoPeephole
18212 //
18213 // Each peephole rule is given an identifying number starting with zero and
18214 // increasing by one in the order seen by the parser.  An individual peephole
18215 // can be enabled, and all others disabled, by using -XX:OptoPeepholeAt=#
18216 // on the command-line.
18217 //
18218 // ---------CURRENT LIMITATIONS----------------------------------------------
18219 //
18220 // Only match adjacent instructions in same basic block
18221 // Only equality constraints
18222 // Only constraints between operands, not (0.dest_reg == RAX_enc)
18223 // Only one replacement instruction
18224 //
18225 // ---------EXAMPLE----------------------------------------------------------
18226 //
18227 // // pertinent parts of existing instructions in architecture description
18228 // instruct movI(iRegINoSp dst, iRegI src)
18229 // %{
18230 //   match(Set dst (CopyI src));
18231 // %}
18232 //
18233 // instruct incI_iReg(iRegINoSp dst, immI1 src, rFlagsReg cr)
18234 // %{
18235 //   match(Set dst (AddI dst src));
18236 //   effect(KILL cr);
18237 // %}
18238 //
18239 // // Change (inc mov) to lea
18240 // peephole %{
18241 //   // increment preceeded by register-register move
18242 //   peepmatch ( incI_iReg movI );
18243 //   // require that the destination register of the increment
18244 //   // match the destination register of the move
18245 //   peepconstraint ( 0.dst == 1.dst );
18246 //   // construct a replacement instruction that sets
18247 //   // the destination to ( move's source register + one )
18248 //   peepreplace ( leaI_iReg_immI( 0.dst 1.src 0.src ) );
18249 // %}
18250 //
18251 
18252 // Implementation no longer uses movX instructions since
18253 // machine-independent system no longer uses CopyX nodes.
18254 //
18255 // peephole
18256 // %{
18257 //   peepmatch (incI_iReg movI);
18258 //   peepconstraint (0.dst == 1.dst);
18259 //   peepreplace (leaI_iReg_immI(0.dst 1.src 0.src));
18260 // %}
18261 
18262 // peephole
18263 // %{
18264 //   peepmatch (decI_iReg movI);
18265 //   peepconstraint (0.dst == 1.dst);
18266 //   peepreplace (leaI_iReg_immI(0.dst 1.src 0.src));
18267 // %}
18268 
18269 // peephole
18270 // %{
18271 //   peepmatch (addI_iReg_imm movI);
18272 //   peepconstraint (0.dst == 1.dst);
18273 //   peepreplace (leaI_iReg_immI(0.dst 1.src 0.src));
18274 // %}
18275 
18276 // peephole
18277 // %{
18278 //   peepmatch (incL_iReg movL);
18279 //   peepconstraint (0.dst == 1.dst);
18280 //   peepreplace (leaL_iReg_immL(0.dst 1.src 0.src));
18281 // %}
18282 
18283 // peephole
18284 // %{
18285 //   peepmatch (decL_iReg movL);
18286 //   peepconstraint (0.dst == 1.dst);
18287 //   peepreplace (leaL_iReg_immL(0.dst 1.src 0.src));
18288 // %}
18289 
18290 // peephole
18291 // %{
18292 //   peepmatch (addL_iReg_imm movL);
18293 //   peepconstraint (0.dst == 1.dst);
18294 //   peepreplace (leaL_iReg_immL(0.dst 1.src 0.src));
18295 // %}
18296 
18297 // peephole
18298 // %{
18299 //   peepmatch (addP_iReg_imm movP);
18300 //   peepconstraint (0.dst == 1.dst);
18301 //   peepreplace (leaP_iReg_imm(0.dst 1.src 0.src));
18302 // %}
18303 
18304 // // Change load of spilled value to only a spill
18305 // instruct storeI(memory mem, iRegI src)
18306 // %{
18307 //   match(Set mem (StoreI mem src));
18308 // %}
18309 //
18310 // instruct loadI(iRegINoSp dst, memory mem)
18311 // %{
18312 //   match(Set dst (LoadI mem));
18313 // %}
18314 //
18315 
18316 //----------SMARTSPILL RULES---------------------------------------------------
18317 // These must follow all instruction definitions as they use the names
18318 // defined in the instructions definitions.
18319 
18320 // Local Variables:
18321 // mode: c++
18322 // End: