mlir-hlo/tests/hlo-legalize-to-lhlo-only-d...

// RUN: mlir-hlo-opt -hlo-legalize-to-lhlo=convert-to-lmhlo-only=true \
// RUN:  -canonicalize -lhlo-legalize-tensor-load-op %s -o - | FileCheck %s

// CHECK-LABEL: func @dynamic_reshape
// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>, %[[SHAPE:.*]]: memref<3xindex>) -> memref<?x?x?xf32>
func @dynamic_reshape(%lhs: tensor<?x?xf32>, %rhs: tensor<3xindex>) -> tensor<?x?x?xf32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[DIM0:.*]] = memref.load %[[SHAPE]][%c0]
  // CHECK: %[[DIM1:.*]] = memref.load %[[SHAPE]][%c1]
  // CHECK: %[[DIM2:.*]] = memref.load %[[SHAPE]][%c2]
  // CHECK: %[[OUTPUT:.*]] = memref.alloc(%[[DIM0]], %[[DIM1]], %[[DIM2]])
  // CHECK: "lmhlo.dynamic_reshape"(%[[ARG]], %[[SHAPE]], %[[OUTPUT]])
  // CHECK: return %[[OUTPUT]]
  %result = "mhlo.dynamic_reshape"(%lhs, %rhs)
      : (tensor<?x?xf32>, tensor<3xindex>) -> tensor<?x?x?xf32>
  return %result : tensor<?x?x?xf32>
}

// -----

// CHECK-LABEL: func @dynamic_broadcast_in_dim
// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>, %[[SHAPE:.*]]: memref<3xindex>) -> memref<?x?x?xf32>
func @dynamic_broadcast_in_dim(%operand: tensor<?x?xf32>, %shape: tensor<3xindex>) -> tensor<?x?x?xf32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[DIM0:.*]] = memref.load %[[SHAPE]][%c0]
  // CHECK: %[[DIM1:.*]] = memref.load %[[SHAPE]][%c1]
  // CHECK: %[[DIM2:.*]] = memref.load %[[SHAPE]][%c2]
  // CHECK: %[[OUTPUT:.*]] = memref.alloc(%[[DIM0]], %[[DIM1]], %[[DIM2]])
  // CHECK: "lmhlo.dynamic_broadcast_in_dim"(%[[ARG]], %[[SHAPE]], %[[OUTPUT]])
  // CHECK: return %[[OUTPUT]]
  %result = "mhlo.dynamic_broadcast_in_dim"(%operand, %shape) {
    broadcast_dimensions = dense<[1, 2]> : tensor<2xi64>
  } : (tensor<?x?xf32>, tensor<3xindex>) -> tensor<?x?x?xf32>
  return %result : tensor<?x?x?xf32>
}

// -----

// CHECK-LABEL: func @dynamic_iota
// CHECK-SAME: (%[[SHAPE:.*]]: memref<2xindex>) -> memref<5x?xi32>
func @dynamic_iota(%arg0 : tensor<2xindex>) -> tensor<5x?xi32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[DIM0:.*]] = memref.load %[[SHAPE]][%c1]
  // CHECK: %[[OUTPUT:.*]] = memref.alloc(%[[DIM0]])
  // CHECK: "lmhlo.dynamic_iota"(%[[SHAPE]], %[[OUTPUT]])
  %0 = "mhlo.dynamic_iota"(%arg0) {iota_dimension = 1 : i64} : (tensor<2xindex>) -> tensor<5x?xi32>
  return %0 : tensor<5x?xi32>
}

// -----

// CHECK-LABEL: func @dynamic_pad
// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>, %[[VAL:.*]]: memref<f32>,
// CHECK-SAME:  %[[LOW:.*]]: memref<2xindex>, %[[HIGH:.*]]: memref<2xindex>, %[[INTER:.*]]: memref<2xindex>) -> memref<?x?xf32>
func @dynamic_pad(%arg0: tensor<?x?xf32>, %arg1: tensor<f32>, %arg2: tensor<2xindex>, %arg3: tensor<2xindex>, %arg4: tensor<2xindex>) -> tensor<?x?xf32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[DIM0:.*]] = memref.dim %[[ARG]], %c0 : memref<?x?xf32>
  // CHECK: %[[TMP1:.*]] = memref.load %[[LOW]][%c0] : memref<2xindex>
  // CHECK: %[[TMP2:.*]] = memref.load %[[HIGH]][%c0] : memref<2xindex>
  // CHECK: %[[TMP3:.*]] = memref.load %[[INTER]][%c0] : memref<2xindex>
  // CHECK: %[[TMP4:.*]] = cmpi slt, %[[DIM0]], %c1 : index
  // CHECK: %[[TMP5:.*]] = subi %[[DIM0]], %c1 : index
  // CHECK: %[[TMP6:.*]] = select %[[TMP4]], %c0, %[[TMP5]] : index
  // CHECK: %[[TMP7:.*]] = muli %[[TMP3]], %[[TMP6]] : index
  // CHECK: %[[TMP8:.*]] = addi %[[TMP7]], %[[DIM0]] : index
  // CHECK: %[[TMP9:.*]] = addi %[[TMP8]], %[[TMP1]] : index
  // CHECK: %[[TMP10:.*]] = addi %[[TMP9]], %[[TMP2]] : index
  // CHECK: %[[TMP11:.*]] = memref.dim %[[ARG]], %c1 : memref<?x?xf32>
  // CHECK: %[[TMP12:.*]] = memref.load %[[LOW]][%c1] : memref<2xindex>
  // CHECK: %[[TMP13:.*]] = memref.load %[[HIGH]][%c1] : memref<2xindex>
  // CHECK: %[[TMP14:.*]] = memref.load %[[INTER]][%c1] : memref<2xindex>
  // CHECK: %[[TMP15:.*]] = cmpi slt, %[[TMP11]], %c1 : index
  // CHECK: %[[TMP16:.*]] = subi %[[TMP11]], %c1 : index
  // CHECK: %[[TMP17:.*]] = select %[[TMP15]], %c0, %[[TMP16]] : index
  // CHECK: %[[TMP18:.*]] = muli %[[TMP14]], %[[TMP17]] : index
  // CHECK: %[[TMP19:.*]] = addi %[[TMP18]], %[[TMP11]] : index
  // CHECK: %[[TMP20:.*]] = addi %[[TMP19]], %[[TMP12]] : index
  // CHECK: %[[TMP21:.*]] = addi %[[TMP20]], %[[TMP13]] : index
  // CHECK: %[[OUT:.*]] = memref.alloc(%[[TMP10]], %[[TMP21]]) : memref<?x?xf32>
  // CHECK: "lmhlo.dynamic_pad"(%[[ARG]], %[[VAL]], %[[LOW]], %[[HIGH]], %[[INTER]], %[[OUT]])
  %0 = "mhlo.dynamic_pad"(%arg0, %arg1, %arg2, %arg3, %arg4) : (tensor<?x?xf32>, tensor<f32>, tensor<2xindex>, tensor<2xindex>, tensor<2xindex>) -> tensor<?x?xf32>
  return %0: tensor<?x?xf32>
}

// -----

// CHECK-LABEL: func @real_dynamic_slice
// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>,
// CHECK-SAME:  %[[START:.*]]: memref<2xi32>, %[[LIMIT:.*]]: memref<2xi32>, %[[STRIDE:.*]]: memref<2xi32>) -> memref<?x?xf32>
func @real_dynamic_slice(%arg0: tensor<?x?xf32>, %arg1: tensor<2xi32>, %arg2: tensor<2xi32>, %arg3: tensor<2xi32>) -> tensor<?x?xf32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[T0:.*]] = memref.load %[[START]][%c0] : memref<2xi32>
  // CHECK: %[[T1:.*]] = memref.load %[[LIMIT]][%c0] : memref<2xi32>
  // CHECK: %[[T2:.*]] = memref.load %[[STRIDE]][%c0] : memref<2xi32>
  // CHECK: %[[T3:.*]] = subi %[[T1]], %[[T0]] : i32
  // CHECK: %[[T4:.*]] = addi %[[T2]], %[[T3]] : i32
  // CHECK: %[[T5:.*]] = subi %[[T4]], %c1_i32 : i32
  // CHECK: %[[T6:.*]] = divi_signed %[[T5]], %[[T2]] : i32
  // CHECK: %[[T7:.*]] = memref.load %[[START]][%c1] : memref<2xi32>
  // CHECK: %[[T8:.*]] = memref.load %[[LIMIT]][%c1] : memref<2xi32>
  // CHECK: %[[T9:.*]] = memref.load %[[STRIDE]][%c1] : memref<2xi32>
  // CHECK: %[[T10:.*]] = subi %[[T8]], %[[T7]] : i32
  // CHECK: %[[T11:.*]] = addi %[[T9]], %[[T10]] : i32
  // CHECK: %[[T12:.*]] = subi %[[T11]], %c1_i32 : i32
  // CHECK: %[[T13:.*]] = divi_signed %[[T12]], %[[T9]] : i32
  // CHECK: %[[T14:.*]] = index_cast %[[T6]] : i32 to index
  // CHECK: %[[T15:.*]] = index_cast %[[T13]] : i32 to index
  // CHECK: %[[T16:.*]] = memref.alloc(%[[T14]], %[[T15]]) : memref<?x?xf32>
  // CHECK: "lmhlo.real_dynamic_slice"(%[[ARG]], %[[START]], %[[LIMIT]], %[[STRIDE]], %[[T16]])
  %0 = "mhlo.real_dynamic_slice"(%arg0, %arg1, %arg2, %arg3) : (tensor<?x?xf32>, tensor<2xi32>, tensor<2xi32>, tensor<2xi32>) -> tensor<?x?xf32>
  return %0: tensor<?x?xf32>
}

// -----

// CHECK-LABEL: func @row_reduce
// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>, %[[VAL:.*]]: memref<f32>) -> memref<?xf32>
func @row_reduce(%arg0: tensor<?x?xf32>, %arg1: tensor<f32>) -> tensor<?xf32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[DIM0:.*]] = memref.dim %[[ARG]], %c0 : memref<?x?xf32>
  // CHECK: %[[OUT:.*]] = memref.alloc(%[[DIM0]]) : memref<?xf32>
  // CHECK: lmhlo.reduce
  // CHECK-SAME: %[[ARG]], %[[VAL]], %[[OUT]]
  // CHECK: return %[[OUT]] : memref<?xf32>
  %0 = "mhlo.reduce"(%arg0, %arg1) ( {
  ^bb0(%arg2: tensor<f32>, %arg3: tensor<f32>):  // no predecessors
    %1 = mhlo.add %arg2, %arg3 : tensor<f32>
    "mhlo.return"(%1) : (tensor<f32>) -> ()
  }) {dimensions = dense<1> : tensor<1xi64>}
      : (tensor<?x?xf32>, tensor<f32>) -> tensor<?xf32>
  return %0: tensor<?xf32>
}

// -----

// CHECK-LABEL: func @column_reduce
// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>, %[[VAL:.*]]: memref<f32>) -> memref<?xf32>
func @column_reduce(%arg0: tensor<?x?xf32>, %arg1: tensor<f32>) -> tensor<?xf32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[DIM1:.*]] = memref.dim %[[ARG]], %c1 : memref<?x?xf32>
  // CHECK: %[[OUT:.*]] = memref.alloc(%[[DIM1]]) : memref<?xf32>
  // CHECK: lmhlo.reduce
  // CHECK-SAME: %[[ARG]], %[[VAL]], %[[OUT]]
  // CHECK: return %[[OUT]] : memref<?xf32>
  %0 = "mhlo.reduce"(%arg0, %arg1) ( {
  ^bb0(%arg2: tensor<f32>, %arg3: tensor<f32>):  // no predecessors
    %1 = mhlo.add %arg2, %arg3 : tensor<f32>
    "mhlo.return"(%1) : (tensor<f32>) -> ()
  }) {dimensions = dense<0> : tensor<1xi64>}
      : (tensor<?x?xf32>, tensor<f32>) -> tensor<?xf32>
  return %0: tensor<?xf32>
}

// -----

// CHECK-LABEL: func @transpose
// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>) -> memref<?x?xf32>
func @transpose(%arg0: tensor<?x?xf32>) -> tensor<?x?xf32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[DIM0:.*]] = memref.dim %[[ARG]], %c0 : memref<?x?xf32>
  // CHECK: %[[DIM1:.*]] = memref.dim %[[ARG]], %c1 : memref<?x?xf32>
  // CHECK: %[[OUT:.*]] = memref.alloc(%[[DIM1]], %[[DIM0]]) : memref<?x?xf32>
  // CHECK: "lmhlo.transpose"(%[[ARG]], %[[OUT]])
  %0 = "mhlo.transpose"(%arg0) {permutation = dense<[1,0]> : tensor<2xi64>} : (tensor<?x?xf32>) -> tensor<?x?xf32>
  return %0: tensor<?x?xf32>
}

// -----

// CHECK-LABEL: func @concatenate
// CHECK-SAME: (%[[ARG0:.*]]: memref<?x?xi32>, %[[ARG1:.*]]: memref<?x?xi32>, %[[ARG2:.*]]: memref<?x?xi32>) -> memref<?x?xi32>
func @concatenate(%a: tensor<?x?xi32>, %b: tensor<?x?xi32>, %c: tensor<?x?xi32>) -> tensor<?x?xi32> {
  // CHECK-NOT: tensor_load
  // CHECK: %[[ARG0_DIM0:.*]] = memref.dim %[[ARG0]], %c0 : memref<?x?xi32>
  // CHECK: %[[ARG0_DIM1:.*]] = memref.dim %[[ARG0]], %c1 : memref<?x?xi32>
  // CHECK: %[[ARG1_DIM1:.*]] = memref.dim %[[ARG1]], %c1 : memref<?x?xi32>
  // CHECK: %[[ARG2_DIM1:.*]] = memref.dim %[[ARG2]], %c1 : memref<?x?xi32>
  // CHECK: %[[TMP:.*]] = addi %[[ARG0_DIM1]], %[[ARG1_DIM1]] : index
  // CHECK: %[[OUT_DIM1:.*]] = addi %[[TMP]], %[[ARG2_DIM1]] : index
  // CHECK: %[[OUT:.*]] = memref.alloc(%[[ARG0_DIM0]], %[[OUT_DIM1]]) : memref<?x?xi32>
  // CHECK: "lmhlo.concatenate"(%[[ARG0]], %[[ARG1]], %[[ARG2]], %[[OUT]])
  %concat = "mhlo.concatenate"(%a, %b, %c) {
    dimension = 1
  } : (tensor<?x?xi32>, tensor<?x?xi32>, tensor<?x?xi32>) -> tensor<?x?xi32>
  return %concat : tensor<?x?xi32>
}

// -----

// CHECK-LABEL: func @gather
// CHECK-SAME: (%[[ARG0:.*]]: memref<?x?xf32>, %[[ARG1:.*]]: memref<?xi32>) -> memref<?x?xf32>
func @gather(%operand: tensor<?x?xf32>, %idxs: tensor<?xi32>)
    -> tensor<?x?xf32> {
  // CHECK: %[[ARG1_DIM0:.*]] = memref.dim %[[ARG1]], %c0 : memref<?xi32>
  // CHECK: %[[TMP:.*]] = memref.alloc(%0) : memref<?x7xf32>
  // CHECK: %[[OUT:.*]] = memref.cast %[[TMP:.*]] : memref<?x7xf32> to memref<?x?xf32>
  // CHECK: "lmhlo.gather"(%[[ARG0]], %[[ARG1]], %[[OUT]])
  %result =
    "mhlo.gather"(%operand, %idxs)
      { dimension_numbers =
        { collapsed_slice_dims = dense<0> : tensor<1xi64>
        , index_vector_dim = 1 : i64
        , offset_dims = dense<1> : tensor<1xi64>
        , start_index_map = dense<0> : tensor<1xi64> }
      , indices_are_sorted = false
      , name = "gather.71"
      , slice_sizes = dense<[1, 7]> : tensor<2xi64> }
      : (tensor<?x?xf32>, tensor<?xi32>) -> tensor<?x?xf32>
  return %result : tensor<?x?xf32>
}

// -----

// CHECK-LABEL: func @dynamic_gather
// CHECK-SAME: (%[[ARG0:.*]]: memref<?x?xf32>, %[[ARG1:.*]]: memref<?xi32>, %[[ARG2:.*]]: memref<2xi32>) -> memref<?x?xf32>
func @dynamic_gather(%operand: tensor<?x?xf32>, %idxs: tensor<?xi32>, %slice_sizes: tensor<2xi32>)
    -> tensor<?x?xf32> {
  // CHECK-DAG: %[[SIZE1_i32:.*]] = memref.load %[[ARG2]][%c1] : memref<2xi32>
  // CHECK-DAG: %[[ARG1_DIM0:.*]] = memref.dim %[[ARG1]], %c0 : memref<?xi32>
  // CHECK-DAG: %[[SIZE:.*]] = index_cast %[[SIZE1_i32]] : i32 to index
  // CHECK: %[[OUT:.*]] = memref.alloc(%[[ARG1_DIM0]], %[[SIZE]]) : memref<?x?xf32>
  // CHECK: "lmhlo.dynamic_gather"(%[[ARG0]], %[[ARG1]], %[[ARG2]], %[[OUT]])
  %result =
    "mhlo.dynamic_gather"(%operand, %idxs, %slice_sizes)
      { dimension_numbers =
        { collapsed_slice_dims = dense<0> : tensor<1xi64>
        , index_vector_dim = 1 : i64
        , offset_dims = dense<1> : tensor<1xi64>
        , start_index_map = dense<0> : tensor<1xi64> }
      , indices_are_sorted = false
      , name = "gather.71"}
      : (tensor<?x?xf32>, tensor<?xi32>, tensor<2xi32>) -> tensor<?x?xf32>
  return %result : tensor<?x?xf32>
}
PR #49970: [MLIR][DISC] bufferize DynamicReshape and DynamicBroadcastInDim Imported from GitHub PR https://github.com/tensorflow/tensorflow/pull/49970 1, add hlo-to-lhlo support for DynamicReshape and DynamicBroadcastInDim 2, add a flag `convert-to-lmhlo-only` to seperate following two case: - hlo-to-lhlo only. Simply lowers all mhlo ops to their lmhlo counterparts, do not apply any optimization (e.g. elide any buffer copy). Buffer optimization is not easy in dynamic shape world especially when involving control flow, thus we leave this to another dedicated pass. - hlo-to-lhlo-or-memref-directly. Lowers some metadata-only mhlo ops (e.g. reshape) to memref dialect directly and Lowers others to their lmhlo counterparts. Copybara import of the project: -- 562bd65a368f6194405c4ae6900e3b4388a5ec03 by Wenyi Zhao <reyizero@gmail.com>: [MLIR][DISC] bufferize DynamicReshape and DynamicBroadcastInDim 1, add hlo-to-lhlo support for DynamicReshape and DynamicBroadcastInDim 2, add a flag `convert-to-lmhlo-only` to seperate following two case: - hlo-to-lhlo only. Simply lowers all mhlo ops to their lmhlo counterparts, do not apply any optimization (e.g. elide any buffer copy). Buffer optimization is not easy in dynamic shape world especially when involving control flow, thus we leave this to another dedicated pass. - hlo-to-lhlo-or-memref-directly. Lowers some metadata-only mhlo ops (e.g. reshape) to memref dialect directly and Lowers others to their lmhlo counterparts. PiperOrigin-RevId: 377603395 2021-06-05 06:35:08 +08:00			`// RUN: mlir-hlo-opt -hlo-legalize-to-lhlo=convert-to-lmhlo-only=true \`
			`// RUN: -canonicalize -lhlo-legalize-tensor-load-op %s -o - \| FileCheck %s`

			`// CHECK-LABEL: func @dynamic_reshape`
			`// CHECK-SAME: (%[[ARG:.]]: memref<?x?xf32>, %[[SHAPE:.]]: memref<3xindex>) -> memref<?x?x?xf32>`
			`func @dynamic_reshape(%lhs: tensor<?x?xf32>, %rhs: tensor<3xindex>) -> tensor<?x?x?xf32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[DIM0:.*]] = memref.load %[[SHAPE]][%c0]`
			`// CHECK: %[[DIM1:.*]] = memref.load %[[SHAPE]][%c1]`
			`// CHECK: %[[DIM2:.*]] = memref.load %[[SHAPE]][%c2]`
			`// CHECK: %[[OUTPUT:.*]] = memref.alloc(%[[DIM0]], %[[DIM1]], %[[DIM2]])`
			`// CHECK: "lmhlo.dynamic_reshape"(%[[ARG]], %[[SHAPE]], %[[OUTPUT]])`
			`// CHECK: return %[[OUTPUT]]`
			`%result = "mhlo.dynamic_reshape"(%lhs, %rhs)`
			`: (tensor<?x?xf32>, tensor<3xindex>) -> tensor<?x?x?xf32>`
			`return %result : tensor<?x?x?xf32>`
			`}`

			`// -----`

			`// CHECK-LABEL: func @dynamic_broadcast_in_dim`
			`// CHECK-SAME: (%[[ARG:.]]: memref<?x?xf32>, %[[SHAPE:.]]: memref<3xindex>) -> memref<?x?x?xf32>`
			`func @dynamic_broadcast_in_dim(%operand: tensor<?x?xf32>, %shape: tensor<3xindex>) -> tensor<?x?x?xf32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[DIM0:.*]] = memref.load %[[SHAPE]][%c0]`
			`// CHECK: %[[DIM1:.*]] = memref.load %[[SHAPE]][%c1]`
			`// CHECK: %[[DIM2:.*]] = memref.load %[[SHAPE]][%c2]`
			`// CHECK: %[[OUTPUT:.*]] = memref.alloc(%[[DIM0]], %[[DIM1]], %[[DIM2]])`
			`// CHECK: "lmhlo.dynamic_broadcast_in_dim"(%[[ARG]], %[[SHAPE]], %[[OUTPUT]])`
			`// CHECK: return %[[OUTPUT]]`
			`%result = "mhlo.dynamic_broadcast_in_dim"(%operand, %shape) {`
			`broadcast_dimensions = dense<[1, 2]> : tensor<2xi64>`
			`} : (tensor<?x?xf32>, tensor<3xindex>) -> tensor<?x?x?xf32>`
			`return %result : tensor<?x?x?xf32>`
PR #50100: [MLIR][DISC] Bufferize DynamicIotaOp and DynamicPadOp Imported from GitHub PR https://github.com/tensorflow/tensorflow/pull/50100 support hlo-to-lhlo conversion for DynamicIotaOp and DynamicPadOp Copybara import of the project: -- c3aae94954e35d3f8ad265f619ef9765665a5115 by Wenyi Zhao <reyizero@gmail.com>: [MLIR][DISC] Bufferize DynamicIotaOp and DynamicPadOp -- adc6996d70b804d61310d56a33fac975d70c8636 by Wenyi Zhao <reyizero@gmail.com>: minor PiperOrigin-RevId: 378733284 2021-06-11 05:19:55 +08:00			`}`

			`// -----`

			`// CHECK-LABEL: func @dynamic_iota`
			`// CHECK-SAME: (%[[SHAPE:.*]]: memref<2xindex>) -> memref<5x?xi32>`
			`func @dynamic_iota(%arg0 : tensor<2xindex>) -> tensor<5x?xi32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[DIM0:.*]] = memref.load %[[SHAPE]][%c1]`
			`// CHECK: %[[OUTPUT:.*]] = memref.alloc(%[[DIM0]])`
			`// CHECK: "lmhlo.dynamic_iota"(%[[SHAPE]], %[[OUTPUT]])`
			`%0 = "mhlo.dynamic_iota"(%arg0) {iota_dimension = 1 : i64} : (tensor<2xindex>) -> tensor<5x?xi32>`
			`return %0 : tensor<5x?xi32>`
			`}`

			`// -----`

			`// CHECK-LABEL: func @dynamic_pad`
			`// CHECK-SAME: (%[[ARG:.]]: memref<?x?xf32>, %[[VAL:.]]: memref<f32>,`
			`// CHECK-SAME: %[[LOW:.]]: memref<2xindex>, %[[HIGH:.]]: memref<2xindex>, %[[INTER:.*]]: memref<2xindex>) -> memref<?x?xf32>`
			`func @dynamic_pad(%arg0: tensor<?x?xf32>, %arg1: tensor<f32>, %arg2: tensor<2xindex>, %arg3: tensor<2xindex>, %arg4: tensor<2xindex>) -> tensor<?x?xf32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[DIM0:.*]] = memref.dim %[[ARG]], %c0 : memref<?x?xf32>`
			`// CHECK: %[[TMP1:.*]] = memref.load %[[LOW]][%c0] : memref<2xindex>`
			`// CHECK: %[[TMP2:.*]] = memref.load %[[HIGH]][%c0] : memref<2xindex>`
			`// CHECK: %[[TMP3:.*]] = memref.load %[[INTER]][%c0] : memref<2xindex>`
			`// CHECK: %[[TMP4:.*]] = cmpi slt, %[[DIM0]], %c1 : index`
			`// CHECK: %[[TMP5:.*]] = subi %[[DIM0]], %c1 : index`
			`// CHECK: %[[TMP6:.*]] = select %[[TMP4]], %c0, %[[TMP5]] : index`
			`// CHECK: %[[TMP7:.*]] = muli %[[TMP3]], %[[TMP6]] : index`
			`// CHECK: %[[TMP8:.*]] = addi %[[TMP7]], %[[DIM0]] : index`
			`// CHECK: %[[TMP9:.*]] = addi %[[TMP8]], %[[TMP1]] : index`
			`// CHECK: %[[TMP10:.*]] = addi %[[TMP9]], %[[TMP2]] : index`
			`// CHECK: %[[TMP11:.*]] = memref.dim %[[ARG]], %c1 : memref<?x?xf32>`
			`// CHECK: %[[TMP12:.*]] = memref.load %[[LOW]][%c1] : memref<2xindex>`
			`// CHECK: %[[TMP13:.*]] = memref.load %[[HIGH]][%c1] : memref<2xindex>`
			`// CHECK: %[[TMP14:.*]] = memref.load %[[INTER]][%c1] : memref<2xindex>`
			`// CHECK: %[[TMP15:.*]] = cmpi slt, %[[TMP11]], %c1 : index`
			`// CHECK: %[[TMP16:.*]] = subi %[[TMP11]], %c1 : index`
			`// CHECK: %[[TMP17:.*]] = select %[[TMP15]], %c0, %[[TMP16]] : index`
			`// CHECK: %[[TMP18:.*]] = muli %[[TMP14]], %[[TMP17]] : index`
			`// CHECK: %[[TMP19:.*]] = addi %[[TMP18]], %[[TMP11]] : index`
			`// CHECK: %[[TMP20:.*]] = addi %[[TMP19]], %[[TMP12]] : index`
			`// CHECK: %[[TMP21:.*]] = addi %[[TMP20]], %[[TMP13]] : index`
			`// CHECK: %[[OUT:.*]] = memref.alloc(%[[TMP10]], %[[TMP21]]) : memref<?x?xf32>`
			`// CHECK: "lmhlo.dynamic_pad"(%[[ARG]], %[[VAL]], %[[LOW]], %[[HIGH]], %[[INTER]], %[[OUT]])`
			`%0 = "mhlo.dynamic_pad"(%arg0, %arg1, %arg2, %arg3, %arg4) : (tensor<?x?xf32>, tensor<f32>, tensor<2xindex>, tensor<2xindex>, tensor<2xindex>) -> tensor<?x?xf32>`
			`return %0: tensor<?x?xf32>`
			`}`
PR #50211: [MLIR][DISC] Bufferize RealDynamicSliceOp and ReduceOp Imported from GitHub PR https://github.com/tensorflow/tensorflow/pull/50211 support hlo-to-lhlo conversion for RealDynamicSliceOp and ReduceOp Copybara import of the project: -- c417b336670a1fc256f7026dfe8080e46d13d79a by Wenyi Zhao <reyizero@gmail.com>: [MLIR][DISC] Bufferize RealDynamicSliceOp and ReduceOp PiperOrigin-RevId: 378972113 2021-06-12 07:31:53 +08:00
			`// -----`

			`// CHECK-LABEL: func @real_dynamic_slice`
			`// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>,`
			`// CHECK-SAME: %[[START:.]]: memref<2xi32>, %[[LIMIT:.]]: memref<2xi32>, %[[STRIDE:.*]]: memref<2xi32>) -> memref<?x?xf32>`
			`func @real_dynamic_slice(%arg0: tensor<?x?xf32>, %arg1: tensor<2xi32>, %arg2: tensor<2xi32>, %arg3: tensor<2xi32>) -> tensor<?x?xf32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[T0:.*]] = memref.load %[[START]][%c0] : memref<2xi32>`
			`// CHECK: %[[T1:.*]] = memref.load %[[LIMIT]][%c0] : memref<2xi32>`
			`// CHECK: %[[T2:.*]] = memref.load %[[STRIDE]][%c0] : memref<2xi32>`
			`// CHECK: %[[T3:.*]] = subi %[[T1]], %[[T0]] : i32`
			`// CHECK: %[[T4:.*]] = addi %[[T2]], %[[T3]] : i32`
			`// CHECK: %[[T5:.*]] = subi %[[T4]], %c1_i32 : i32`
			`// CHECK: %[[T6:.*]] = divi_signed %[[T5]], %[[T2]] : i32`
			`// CHECK: %[[T7:.*]] = memref.load %[[START]][%c1] : memref<2xi32>`
			`// CHECK: %[[T8:.*]] = memref.load %[[LIMIT]][%c1] : memref<2xi32>`
			`// CHECK: %[[T9:.*]] = memref.load %[[STRIDE]][%c1] : memref<2xi32>`
			`// CHECK: %[[T10:.*]] = subi %[[T8]], %[[T7]] : i32`
			`// CHECK: %[[T11:.*]] = addi %[[T9]], %[[T10]] : i32`
			`// CHECK: %[[T12:.*]] = subi %[[T11]], %c1_i32 : i32`
			`// CHECK: %[[T13:.*]] = divi_signed %[[T12]], %[[T9]] : i32`
			`// CHECK: %[[T14:.*]] = index_cast %[[T6]] : i32 to index`
			`// CHECK: %[[T15:.*]] = index_cast %[[T13]] : i32 to index`
			`// CHECK: %[[T16:.*]] = memref.alloc(%[[T14]], %[[T15]]) : memref<?x?xf32>`
			`// CHECK: "lmhlo.real_dynamic_slice"(%[[ARG]], %[[START]], %[[LIMIT]], %[[STRIDE]], %[[T16]])`
			`%0 = "mhlo.real_dynamic_slice"(%arg0, %arg1, %arg2, %arg3) : (tensor<?x?xf32>, tensor<2xi32>, tensor<2xi32>, tensor<2xi32>) -> tensor<?x?xf32>`
			`return %0: tensor<?x?xf32>`
			`}`

			`// -----`

			`// CHECK-LABEL: func @row_reduce`
			`// CHECK-SAME: (%[[ARG:.]]: memref<?x?xf32>, %[[VAL:.]]: memref<f32>) -> memref<?xf32>`
			`func @row_reduce(%arg0: tensor<?x?xf32>, %arg1: tensor<f32>) -> tensor<?xf32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[DIM0:.*]] = memref.dim %[[ARG]], %c0 : memref<?x?xf32>`
			`// CHECK: %[[OUT:.*]] = memref.alloc(%[[DIM0]]) : memref<?xf32>`
			`// CHECK: lmhlo.reduce`
			`// CHECK-SAME: %[[ARG]], %[[VAL]], %[[OUT]]`
			`// CHECK: return %[[OUT]] : memref<?xf32>`
			`%0 = "mhlo.reduce"(%arg0, %arg1) ( {`
			`^bb0(%arg2: tensor<f32>, %arg3: tensor<f32>): // no predecessors`
			`%1 = mhlo.add %arg2, %arg3 : tensor<f32>`
			`"mhlo.return"(%1) : (tensor<f32>) -> ()`
			`}) {dimensions = dense<1> : tensor<1xi64>}`
			`: (tensor<?x?xf32>, tensor<f32>) -> tensor<?xf32>`
			`return %0: tensor<?xf32>`
			`}`

			`// -----`

			`// CHECK-LABEL: func @column_reduce`
			`// CHECK-SAME: (%[[ARG:.]]: memref<?x?xf32>, %[[VAL:.]]: memref<f32>) -> memref<?xf32>`
			`func @column_reduce(%arg0: tensor<?x?xf32>, %arg1: tensor<f32>) -> tensor<?xf32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[DIM1:.*]] = memref.dim %[[ARG]], %c1 : memref<?x?xf32>`
			`// CHECK: %[[OUT:.*]] = memref.alloc(%[[DIM1]]) : memref<?xf32>`
			`// CHECK: lmhlo.reduce`
			`// CHECK-SAME: %[[ARG]], %[[VAL]], %[[OUT]]`
			`// CHECK: return %[[OUT]] : memref<?xf32>`
			`%0 = "mhlo.reduce"(%arg0, %arg1) ( {`
			`^bb0(%arg2: tensor<f32>, %arg3: tensor<f32>): // no predecessors`
			`%1 = mhlo.add %arg2, %arg3 : tensor<f32>`
			`"mhlo.return"(%1) : (tensor<f32>) -> ()`
			`}) {dimensions = dense<0> : tensor<1xi64>}`
			`: (tensor<?x?xf32>, tensor<f32>) -> tensor<?xf32>`
			`return %0: tensor<?xf32>`
			`}`
PR #50236: [MLIR][DISC] Bufferize TransposeOp and ConcatenateOp Imported from GitHub PR https://github.com/tensorflow/tensorflow/pull/50236 support hlo-to-lhlo conversion for TransposeOp and ConcatenateOp Copybara import of the project: -- 62860e717f2a14fbd3ddfb634aa6ff132d245a72 by Wenyi Zhao <reyizero@gmail.com>: [MLIR][DISC] Bufferize TransposeOp and ConcatenateOp -- ce2ff57c1edee1172cd2f36346cc0b34ec1c7467 by Wenyi Zhao <reyizero@gmail.com>: fix PiperOrigin-RevId: 379330954 2021-06-15 03:35:47 +08:00
			`// -----`

			`// CHECK-LABEL: func @transpose`
			`// CHECK-SAME: (%[[ARG:.*]]: memref<?x?xf32>) -> memref<?x?xf32>`
			`func @transpose(%arg0: tensor<?x?xf32>) -> tensor<?x?xf32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[DIM0:.*]] = memref.dim %[[ARG]], %c0 : memref<?x?xf32>`
			`// CHECK: %[[DIM1:.*]] = memref.dim %[[ARG]], %c1 : memref<?x?xf32>`
			`// CHECK: %[[OUT:.*]] = memref.alloc(%[[DIM1]], %[[DIM0]]) : memref<?x?xf32>`
			`// CHECK: "lmhlo.transpose"(%[[ARG]], %[[OUT]])`
			`%0 = "mhlo.transpose"(%arg0) {permutation = dense<[1,0]> : tensor<2xi64>} : (tensor<?x?xf32>) -> tensor<?x?xf32>`
			`return %0: tensor<?x?xf32>`
			`}`

			`// -----`

			`// CHECK-LABEL: func @concatenate`
			`// CHECK-SAME: (%[[ARG0:.]]: memref<?x?xi32>, %[[ARG1:.]]: memref<?x?xi32>, %[[ARG2:.*]]: memref<?x?xi32>) -> memref<?x?xi32>`
			`func @concatenate(%a: tensor<?x?xi32>, %b: tensor<?x?xi32>, %c: tensor<?x?xi32>) -> tensor<?x?xi32> {`
			`// CHECK-NOT: tensor_load`
			`// CHECK: %[[ARG0_DIM0:.*]] = memref.dim %[[ARG0]], %c0 : memref<?x?xi32>`
			`// CHECK: %[[ARG0_DIM1:.*]] = memref.dim %[[ARG0]], %c1 : memref<?x?xi32>`
			`// CHECK: %[[ARG1_DIM1:.*]] = memref.dim %[[ARG1]], %c1 : memref<?x?xi32>`
			`// CHECK: %[[ARG2_DIM1:.*]] = memref.dim %[[ARG2]], %c1 : memref<?x?xi32>`
			`// CHECK: %[[TMP:.*]] = addi %[[ARG0_DIM1]], %[[ARG1_DIM1]] : index`
			`// CHECK: %[[OUT_DIM1:.*]] = addi %[[TMP]], %[[ARG2_DIM1]] : index`
			`// CHECK: %[[OUT:.*]] = memref.alloc(%[[ARG0_DIM0]], %[[OUT_DIM1]]) : memref<?x?xi32>`
			`// CHECK: "lmhlo.concatenate"(%[[ARG0]], %[[ARG1]], %[[ARG2]], %[[OUT]])`
			`%concat = "mhlo.concatenate"(%a, %b, %c) {`
			`dimension = 1`
			`} : (tensor<?x?xi32>, tensor<?x?xi32>, tensor<?x?xi32>) -> tensor<?x?xi32>`
			`return %concat : tensor<?x?xi32>`
			`}`
PR #50271: [MLIR][DISC] Bufferize GatherOp and DynamicGatherOp Imported from GitHub PR https://github.com/tensorflow/tensorflow/pull/50271 support hlo-to-lhlo conversion for GatherOp and DynamicGatherOp Copybara import of the project: -- 117a1b1bcaac7ecc5224b02863eede5c1b9618fe by Wenyi Zhao <reyizero@gmail.com>: [MLIR][DISC] Bufferize GatherOp and DynamicGatherOp PiperOrigin-RevId: 379801972 2021-06-17 04:44:21 +08:00
			`// -----`

			`// CHECK-LABEL: func @gather`
			`// CHECK-SAME: (%[[ARG0:.]]: memref<?x?xf32>, %[[ARG1:.]]: memref<?xi32>) -> memref<?x?xf32>`
			`func @gather(%operand: tensor<?x?xf32>, %idxs: tensor<?xi32>)`
			`-> tensor<?x?xf32> {`
			`// CHECK: %[[ARG1_DIM0:.*]] = memref.dim %[[ARG1]], %c0 : memref<?xi32>`
			`// CHECK: %[[TMP:.*]] = memref.alloc(%0) : memref<?x7xf32>`
			`// CHECK: %[[OUT:.]] = memref.cast %[[TMP:.]] : memref<?x7xf32> to memref<?x?xf32>`
			`// CHECK: "lmhlo.gather"(%[[ARG0]], %[[ARG1]], %[[OUT]])`
			`%result =`
			`"mhlo.gather"(%operand, %idxs)`
			`{ dimension_numbers =`
			`{ collapsed_slice_dims = dense<0> : tensor<1xi64>`
			`, index_vector_dim = 1 : i64`
			`, offset_dims = dense<1> : tensor<1xi64>`
			`, start_index_map = dense<0> : tensor<1xi64> }`
			`, indices_are_sorted = false`
			`, name = "gather.71"`
			`, slice_sizes = dense<[1, 7]> : tensor<2xi64> }`
			`: (tensor<?x?xf32>, tensor<?xi32>) -> tensor<?x?xf32>`
			`return %result : tensor<?x?xf32>`
			`}`

			`// -----`

			`// CHECK-LABEL: func @dynamic_gather`
			`// CHECK-SAME: (%[[ARG0:.]]: memref<?x?xf32>, %[[ARG1:.]]: memref<?xi32>, %[[ARG2:.*]]: memref<2xi32>) -> memref<?x?xf32>`
			`func @dynamic_gather(%operand: tensor<?x?xf32>, %idxs: tensor<?xi32>, %slice_sizes: tensor<2xi32>)`
			`-> tensor<?x?xf32> {`
			`// CHECK-DAG: %[[SIZE1_i32:.*]] = memref.load %[[ARG2]][%c1] : memref<2xi32>`
			`// CHECK-DAG: %[[ARG1_DIM0:.*]] = memref.dim %[[ARG1]], %c0 : memref<?xi32>`
			`// CHECK-DAG: %[[SIZE:.*]] = index_cast %[[SIZE1_i32]] : i32 to index`
			`// CHECK: %[[OUT:.*]] = memref.alloc(%[[ARG1_DIM0]], %[[SIZE]]) : memref<?x?xf32>`
			`// CHECK: "lmhlo.dynamic_gather"(%[[ARG0]], %[[ARG1]], %[[ARG2]], %[[OUT]])`
			`%result =`
			`"mhlo.dynamic_gather"(%operand, %idxs, %slice_sizes)`
			`{ dimension_numbers =`
			`{ collapsed_slice_dims = dense<0> : tensor<1xi64>`
			`, index_vector_dim = 1 : i64`
			`, offset_dims = dense<1> : tensor<1xi64>`
			`, start_index_map = dense<0> : tensor<1xi64> }`
			`, indices_are_sorted = false`
			`, name = "gather.71"}`
			`: (tensor<?x?xf32>, tensor<?xi32>, tensor<2xi32>) -> tensor<?x?xf32>`
			`return %result : tensor<?x?xf32>`
			`}`