[MHLO] Move broadcasts over elementwise ops

Move up dynamic broadcasts and shape computations to allow for more fusion opportunities. PiperOrigin-RevId: 364514158
2021-03-23 02:33:46 -07:00 · 2021-03-23 02:33:46 -07:00 · 54f37abc28
parent 98debb127d
commit 54f37abc28
2 changed files with 118 additions and 1 deletions
--- a/lib/Dialect/mhlo/transforms/move_up_dynamic_broadcasts_for_fusion.cc
+++ b/lib/Dialect/mhlo/transforms/move_up_dynamic_broadcasts_for_fusion.cc
@ -76,6 +76,67 @@ struct ShapeOfOpConversion : public OpConversionPattern<shape::ShapeOfOp> {
  }
 };

+// We can only move up broadcasting ops that apply to the result of a
+// shape-preserving operation. For now, we restrict this to unary operations.
+// TODO(frgossen): Generalize this to n-ary operations.
+bool isDynamicBroadcastInDimOpMovable(Value operand) {
+  Operation *producer_op = operand.getDefiningOp();
+  return producer_op != nullptr &&
+         producer_op->hasTrait<OpTrait::SameOperandsAndResultShape>() &&
+         producer_op->hasTrait<OpTrait::Elementwise>() &&
+         producer_op->getNumOperands() == 1;
+}
+
+// TODO(frgossen): Only move up broadcasting operations if there is a consumer.
+struct MoveUpBroadcastInDimOpConversion
+    : public OpConversionPattern<DynamicBroadcastInDimOp> {
+  explicit MoveUpBroadcastInDimOpConversion(MLIRContext *context)
+      : OpConversionPattern<DynamicBroadcastInDimOp>(context) {}
+
+  LogicalResult matchAndRewrite(
+      DynamicBroadcastInDimOp bcast_op, ArrayRef<Value> operands,
+      ConversionPatternRewriter &rewriter) const override {
+    // We can only move up broadcasting ops that apply to the result of a
+    // shape-preserving operation.
+    DynamicBroadcastInDimOp::Adaptor transformed(operands);
+    if (!isDynamicBroadcastInDimOpMovable(transformed.operand()))
+      return failure();
+
+    // Materialize broadcast on operands.
+    SmallVector<Value, 2> bcasted_operands;
+    Location loc = bcast_op.getLoc();
+    ArrayRef<int64_t> ty_shape = bcast_op.getType().getShape();
+    Operation *producer_op = transformed.operand().getDefiningOp();
+    for (Value operand : producer_op->getOperands()) {
+      // The broadcast only works on ranked operations.
+      auto operand_ty = operand.getType().dyn_cast<RankedTensorType>();
+      if (!operand_ty) {
+        return bcast_op.emitError()
+               << "Can only move up broadcasts over ranked tensor operands.";
+      }
+
+      auto bcasted_operand_ty =
+          RankedTensorType::get(ty_shape, operand_ty.getElementType());
+      bcasted_operands.push_back(rewriter.create<DynamicBroadcastInDimOp>(
+          loc, bcasted_operand_ty, operand, transformed.output_dimensions(),
+          bcast_op.broadcast_dimensions()));
+    }
+
+    // Create a copy of the producer op with the new broadcasted operands.
+    OperationState new_producer_op_state(
+        loc, producer_op->getName().getStringRef(), bcasted_operands,
+        bcast_op.getType(), producer_op->getAttrs());
+    Operation *new_producer_op =
+        rewriter.createOperation(new_producer_op_state);
+
+    // The original result of the broadcast now falls directly out of the new
+    // producer op. Use it instead.
+    rewriter.replaceOp(bcast_op, new_producer_op->getResults());
+
+    return success();
+  }
+};
+
 struct MoveUpDynamicBroadcastsForFusionPass
    : public PassWrapper<MoveUpDynamicBroadcastsForFusionPass, FunctionPass> {
  void getDependentDialects(DialectRegistry &registry) const override {
@ -108,12 +169,17 @@ void PopulateMoveUpDynamicBroadcastsForFusionLegality(
                          tensor::TensorDialect>();
  target->addDynamicallyLegalOp<shape::ShapeOfOp>(
      [](shape::ShapeOfOp op) { return !IsShapeOfOpMovable(op.arg()); });
+  target->addDynamicallyLegalOp<DynamicBroadcastInDimOp>(
+      [](DynamicBroadcastInDimOp op) {
+        return !isDynamicBroadcastInDimOpMovable(op.operand());
+      });
 }

 void PopulateMoveUpDynamicBroadcastsForFusionPatterns(
    MLIRContext *context, OwningRewritePatternList *patterns) {
  // clang-format off
-  patterns->insert<ShapeOfOpConversion>(context);
+  patterns->insert<ShapeOfOpConversion,
+                   MoveUpBroadcastInDimOpConversion>(context);
  // clang-format on
 }

--- a/tests/move_up_dynamic_broadcasts_for_fusion.mlir
+++ b/tests/move_up_dynamic_broadcasts_for_fusion.mlir
@ -26,3 +26,54 @@ func @shape_of_nary(%arg0 : tensor<?x32xf16>, %arg1 : tensor<?x32xf16>) {
  "use"(%2) : (tensor<?xindex>) -> ()
  return
 }
+
+// -----
+
+// Broadcasts can be moved up over shape-preserving operations.
+// CHECK-LABEL: @bcast
+// CHECK-SAME: (%[[ARG:.*]]: tensor<?x32xi16>, %[[OUT_DIMS:.*]]: tensor<3xindex>)
+func @bcast(%arg : tensor<?x32xi16>, %out_dims : tensor<3xindex>)
+    -> tensor<?x?x32xf16> {
+  // CHECK:      %[[BCASTED_OPERAND:.*]] = "mhlo.dynamic_broadcast_in_dim"(%[[ARG]], %[[OUT_DIMS]])
+  // CHECK-SAME: broadcast_dimensions = dense<[0, 1]> : tensor<2xi64>} : (tensor<?x32xi16>, tensor<3xindex>) -> tensor<?x?x32xi16>
+  // CHECK:      "mhlo.convert"(%[[BCASTED_OPERAND]]) : (tensor<?x?x32xi16>) -> tensor<?x?x32xf16>
+  %0 = "mhlo.convert"(%arg) : (tensor<?x32xi16>) -> tensor<?x32xf16>
+  %1 = "mhlo.dynamic_broadcast_in_dim"(%0, %out_dims) {
+      broadcast_dimensions = dense<[0, 1]> : tensor<2xi64> } :
+      (tensor<?x32xf16>, tensor<3xindex>) -> tensor<?x?x32xf16>
+  return %1 : tensor<?x?x32xf16>
+}
+
+// -----
+
+// Exemplary IR as it appears in the lowering with `tf.Sub` and `tf.Cast`.
+// CHECK-LABEL: @cast_sub
+// CHECK-SAME: (%[[ARG0:.*]]: tensor<?x32xi16>, %[[ARG1:.*]]: tensor<?x?x32xf16>) -> tensor<?x?x32xf16>
+func @cast_sub(%arg0: tensor<?x32xi16>, %arg1: tensor<?x?x32xf16>)
+    -> tensor<?x?x32xf16> {
+  // CHECK-NOT: convert
+  // CHECK:     %[[BCASTED_ARG1:.*]] = "mhlo.dynamic_broadcast_in_dim"(%[[ARG1]], %{{.*}})
+  // CHECK:     %[[BCASTED_ARG0:.*]] = "mhlo.dynamic_broadcast_in_dim"(%[[ARG0]], %{{.*}})
+  // CHECK:     %[[CONVERTED_BCASTED_ARG0:.*]] = "mhlo.convert"(%[[BCASTED_ARG0]]) : (tensor<?x?x32xi16>) -> tensor<?x?x32xf16>
+  // CHECK:     %{{.*}} = mhlo.subtract %[[BCASTED_ARG1]], %[[CONVERTED_BCASTED_ARG0]] : tensor<?x?x32xf16>
+  %0 = "mhlo.convert"(%arg0) : (tensor<?x32xi16>) -> tensor<?x32xf16>
+  %1 = shape.shape_of %arg1 : tensor<?x?x32xf16> -> tensor<?xindex>
+  %2 = shape.shape_of %0 : tensor<?x32xf16> -> tensor<?xindex>
+  %3 = shape.cstr_broadcastable %1, %2 : tensor<?xindex>, tensor<?xindex>
+  %4 = shape.assuming %3 -> (tensor<?x?x32xf16>) {
+    %5 = shape.shape_of %arg1 : tensor<?x?x32xf16> -> tensor<?xindex>
+    %6 = shape.shape_of %0 : tensor<?x32xf16> -> tensor<?xindex>
+    %7 = shape.broadcast %5, %6 : tensor<?xindex>, tensor<?xindex>
+        -> tensor<?xindex>
+    %8 = tensor.cast %7 : tensor<?xindex> to tensor<3xindex>
+    %9 = "mhlo.dynamic_broadcast_in_dim"(%arg1, %8) {
+        broadcast_dimensions = dense<[0, 1, 2]> : tensor<3xi64>} :
+        (tensor<?x?x32xf16>, tensor<3xindex>) -> tensor<?x?x32xf16>
+    %10 = "mhlo.dynamic_broadcast_in_dim"(%0, %8) {
+        broadcast_dimensions = dense<[1, 2]> : tensor<2xi64>} :
+        (tensor<?x32xf16>, tensor<3xindex>) -> tensor<?x?x32xf16>
+    %11 = mhlo.subtract %9, %10 : tensor<?x?x32xf16>
+    shape.assuming_yield %11 : tensor<?x?x32xf16>
+  }
+  return %4 : tensor<?x?x32xf16>
+}