|  | // Copyright (c) 2018 Google LLC. | 
|  | // | 
|  | // Licensed under the Apache License, Version 2.0 (the "License"); | 
|  | // you may not use this file except in compliance with the License. | 
|  | // You may obtain a copy of the License at | 
|  | // | 
|  | //     http://www.apache.org/licenses/LICENSE-2.0 | 
|  | // | 
|  | // Unless required by applicable law or agreed to in writing, software | 
|  | // distributed under the License is distributed on an "AS IS" BASIS, | 
|  | // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. | 
|  | // See the License for the specific language governing permissions and | 
|  | // limitations under the License. | 
|  |  | 
|  | #include <algorithm> | 
|  | #include <iterator> | 
|  | #include <memory> | 
|  | #include <string> | 
|  | #include <vector> | 
|  |  | 
|  | #include "gmock/gmock.h" | 
|  | #include "source/opt/loop_descriptor.h" | 
|  | #include "source/opt/loop_fusion.h" | 
|  | #include "test/opt/pass_fixture.h" | 
|  |  | 
|  | namespace spvtools { | 
|  | namespace opt { | 
|  | namespace { | 
|  |  | 
|  | using FusionIllegalTest = PassTest<::testing::Test>; | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | #version 440 core | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  | int[10] c; | 
|  | // Illegal, loop-independent dependence will become a | 
|  | // backward loop-carried antidependence | 
|  | for (int i = 0; i < 10; i++) { | 
|  | a[i] = b[i] + 1; | 
|  | } | 
|  | for (int i = 0; i < 10; i++) { | 
|  | c[i] = a[i+1] + 2; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, PositiveDistanceCreatedRAW) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "i" | 
|  | OpName %23 "a" | 
|  | OpName %25 "b" | 
|  | OpName %34 "i" | 
|  | OpName %42 "c" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %16 = OpConstant %6 10 | 
|  | %17 = OpTypeBool | 
|  | %19 = OpTypeInt 32 0 | 
|  | %20 = OpConstant %19 10 | 
|  | %21 = OpTypeArray %6 %20 | 
|  | %22 = OpTypePointer Function %21 | 
|  | %29 = OpConstant %6 1 | 
|  | %48 = OpConstant %6 2 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %23 = OpVariable %22 Function | 
|  | %25 = OpVariable %22 Function | 
|  | %34 = OpVariable %7 Function | 
|  | %42 = OpVariable %22 Function | 
|  | OpStore %8 %9 | 
|  | OpBranch %10 | 
|  | %10 = OpLabel | 
|  | %53 = OpPhi %6 %9 %5 %33 %13 | 
|  | OpLoopMerge %12 %13 None | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %18 = OpSLessThan %17 %53 %16 | 
|  | OpBranchConditional %18 %11 %12 | 
|  | %11 = OpLabel | 
|  | %27 = OpAccessChain %7 %25 %53 | 
|  | %28 = OpLoad %6 %27 | 
|  | %30 = OpIAdd %6 %28 %29 | 
|  | %31 = OpAccessChain %7 %23 %53 | 
|  | OpStore %31 %30 | 
|  | OpBranch %13 | 
|  | %13 = OpLabel | 
|  | %33 = OpIAdd %6 %53 %29 | 
|  | OpStore %8 %33 | 
|  | OpBranch %10 | 
|  | %12 = OpLabel | 
|  | OpStore %34 %9 | 
|  | OpBranch %35 | 
|  | %35 = OpLabel | 
|  | %54 = OpPhi %6 %9 %12 %52 %38 | 
|  | OpLoopMerge %37 %38 None | 
|  | OpBranch %39 | 
|  | %39 = OpLabel | 
|  | %41 = OpSLessThan %17 %54 %16 | 
|  | OpBranchConditional %41 %36 %37 | 
|  | %36 = OpLabel | 
|  | %45 = OpIAdd %6 %54 %29 | 
|  | %46 = OpAccessChain %7 %23 %45 | 
|  | %47 = OpLoad %6 %46 | 
|  | %49 = OpIAdd %6 %47 %48 | 
|  | %50 = OpAccessChain %7 %42 %54 | 
|  | OpStore %50 %49 | 
|  | OpBranch %38 | 
|  | %38 = OpLabel | 
|  | %52 = OpIAdd %6 %54 %29 | 
|  | OpStore %34 %52 | 
|  | OpBranch %35 | 
|  | %37 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  |  | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | #version 440 core | 
|  |  | 
|  | int func() { | 
|  | return 10; | 
|  | } | 
|  |  | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  | // Illegal, function call | 
|  | for (int i = 0; i < 10; i++) { | 
|  | a[i] = func(); | 
|  | } | 
|  | for (int i = 0; i < 10; i++) { | 
|  | b[i] = a[i]; | 
|  | } | 
|  | } | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, FunctionCall) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "func(" | 
|  | OpName %14 "i" | 
|  | OpName %28 "a" | 
|  | OpName %35 "i" | 
|  | OpName %43 "b" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypeFunction %6 | 
|  | %10 = OpConstant %6 10 | 
|  | %13 = OpTypePointer Function %6 | 
|  | %15 = OpConstant %6 0 | 
|  | %22 = OpTypeBool | 
|  | %24 = OpTypeInt 32 0 | 
|  | %25 = OpConstant %24 10 | 
|  | %26 = OpTypeArray %6 %25 | 
|  | %27 = OpTypePointer Function %26 | 
|  | %33 = OpConstant %6 1 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %14 = OpVariable %13 Function | 
|  | %28 = OpVariable %27 Function | 
|  | %35 = OpVariable %13 Function | 
|  | %43 = OpVariable %27 Function | 
|  | OpStore %14 %15 | 
|  | OpBranch %16 | 
|  | %16 = OpLabel | 
|  | %51 = OpPhi %6 %15 %5 %34 %19 | 
|  | OpLoopMerge %18 %19 None | 
|  | OpBranch %20 | 
|  | %20 = OpLabel | 
|  | %23 = OpSLessThan %22 %51 %10 | 
|  | OpBranchConditional %23 %17 %18 | 
|  | %17 = OpLabel | 
|  | %30 = OpFunctionCall %6 %8 | 
|  | %31 = OpAccessChain %13 %28 %51 | 
|  | OpStore %31 %30 | 
|  | OpBranch %19 | 
|  | %19 = OpLabel | 
|  | %34 = OpIAdd %6 %51 %33 | 
|  | OpStore %14 %34 | 
|  | OpBranch %16 | 
|  | %18 = OpLabel | 
|  | OpStore %35 %15 | 
|  | OpBranch %36 | 
|  | %36 = OpLabel | 
|  | %52 = OpPhi %6 %15 %18 %50 %39 | 
|  | OpLoopMerge %38 %39 None | 
|  | OpBranch %40 | 
|  | %40 = OpLabel | 
|  | %42 = OpSLessThan %22 %52 %10 | 
|  | OpBranchConditional %42 %37 %38 | 
|  | %37 = OpLabel | 
|  | %46 = OpAccessChain %13 %28 %52 | 
|  | %47 = OpLoad %6 %46 | 
|  | %48 = OpAccessChain %13 %43 %52 | 
|  | OpStore %48 %47 | 
|  | OpBranch %39 | 
|  | %39 = OpLabel | 
|  | %50 = OpIAdd %6 %52 %33 | 
|  | OpStore %35 %50 | 
|  | OpBranch %36 | 
|  | %38 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | %8 = OpFunction %6 None %7 | 
|  | %9 = OpLabel | 
|  | OpReturnValue %10 | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  |  | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | // 16 | 
|  | #version 440 core | 
|  | void main() { | 
|  | int[10][10] a; | 
|  | int[10][10] b; | 
|  | int[10][10] c; | 
|  | // Illegal outer. | 
|  | for (int i = 0; i < 10; i++) { | 
|  | for (int j = 0; j < 10; j++) { | 
|  | c[i][j] = a[i][j] + 2; | 
|  | } | 
|  | } | 
|  | for (int i = 0; i < 10; i++) { | 
|  | for (int j = 0; j < 10; j++) { | 
|  | b[i][j] = c[i+1][j] + 10; | 
|  | } | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, PositiveDistanceCreatedRAWOuterLoop) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "i" | 
|  | OpName %19 "j" | 
|  | OpName %32 "c" | 
|  | OpName %35 "a" | 
|  | OpName %48 "i" | 
|  | OpName %56 "j" | 
|  | OpName %64 "b" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %16 = OpConstant %6 10 | 
|  | %17 = OpTypeBool | 
|  | %27 = OpTypeInt 32 0 | 
|  | %28 = OpConstant %27 10 | 
|  | %29 = OpTypeArray %6 %28 | 
|  | %30 = OpTypeArray %29 %28 | 
|  | %31 = OpTypePointer Function %30 | 
|  | %40 = OpConstant %6 2 | 
|  | %44 = OpConstant %6 1 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %19 = OpVariable %7 Function | 
|  | %32 = OpVariable %31 Function | 
|  | %35 = OpVariable %31 Function | 
|  | %48 = OpVariable %7 Function | 
|  | %56 = OpVariable %7 Function | 
|  | %64 = OpVariable %31 Function | 
|  | OpStore %8 %9 | 
|  | OpBranch %10 | 
|  | %10 = OpLabel | 
|  | %78 = OpPhi %6 %9 %5 %47 %13 | 
|  | OpLoopMerge %12 %13 None | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %18 = OpSLessThan %17 %78 %16 | 
|  | OpBranchConditional %18 %11 %12 | 
|  | %11 = OpLabel | 
|  | OpStore %19 %9 | 
|  | OpBranch %20 | 
|  | %20 = OpLabel | 
|  | %82 = OpPhi %6 %9 %11 %45 %23 | 
|  | OpLoopMerge %22 %23 None | 
|  | OpBranch %24 | 
|  | %24 = OpLabel | 
|  | %26 = OpSLessThan %17 %82 %16 | 
|  | OpBranchConditional %26 %21 %22 | 
|  | %21 = OpLabel | 
|  | %38 = OpAccessChain %7 %35 %78 %82 | 
|  | %39 = OpLoad %6 %38 | 
|  | %41 = OpIAdd %6 %39 %40 | 
|  | %42 = OpAccessChain %7 %32 %78 %82 | 
|  | OpStore %42 %41 | 
|  | OpBranch %23 | 
|  | %23 = OpLabel | 
|  | %45 = OpIAdd %6 %82 %44 | 
|  | OpStore %19 %45 | 
|  | OpBranch %20 | 
|  | %22 = OpLabel | 
|  | OpBranch %13 | 
|  | %13 = OpLabel | 
|  | %47 = OpIAdd %6 %78 %44 | 
|  | OpStore %8 %47 | 
|  | OpBranch %10 | 
|  | %12 = OpLabel | 
|  | OpStore %48 %9 | 
|  | OpBranch %49 | 
|  | %49 = OpLabel | 
|  | %79 = OpPhi %6 %9 %12 %77 %52 | 
|  | OpLoopMerge %51 %52 None | 
|  | OpBranch %53 | 
|  | %53 = OpLabel | 
|  | %55 = OpSLessThan %17 %79 %16 | 
|  | OpBranchConditional %55 %50 %51 | 
|  | %50 = OpLabel | 
|  | OpStore %56 %9 | 
|  | OpBranch %57 | 
|  | %57 = OpLabel | 
|  | %80 = OpPhi %6 %9 %50 %75 %60 | 
|  | OpLoopMerge %59 %60 None | 
|  | OpBranch %61 | 
|  | %61 = OpLabel | 
|  | %63 = OpSLessThan %17 %80 %16 | 
|  | OpBranchConditional %63 %58 %59 | 
|  | %58 = OpLabel | 
|  | %68 = OpIAdd %6 %79 %44 | 
|  | %70 = OpAccessChain %7 %32 %68 %80 | 
|  | %71 = OpLoad %6 %70 | 
|  | %72 = OpIAdd %6 %71 %16 | 
|  | %73 = OpAccessChain %7 %64 %79 %80 | 
|  | OpStore %73 %72 | 
|  | OpBranch %60 | 
|  | %60 = OpLabel | 
|  | %75 = OpIAdd %6 %80 %44 | 
|  | OpStore %56 %75 | 
|  | OpBranch %57 | 
|  | %59 = OpLabel | 
|  | OpBranch %52 | 
|  | %52 = OpLabel | 
|  | %77 = OpIAdd %6 %79 %44 | 
|  | OpStore %48 %77 | 
|  | OpBranch %49 | 
|  | %51 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 4u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | auto loop_0 = loops[0]; | 
|  | auto loop_1 = loops[1]; | 
|  | auto loop_2 = loops[2]; | 
|  | auto loop_3 = loops[3]; | 
|  |  | 
|  | { | 
|  | LoopFusion fusion(context.get(), loop_0, loop_1); | 
|  | EXPECT_FALSE(fusion.AreCompatible()); | 
|  | } | 
|  |  | 
|  | { | 
|  | LoopFusion fusion(context.get(), loop_0, loop_2); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  |  | 
|  | { | 
|  | LoopFusion fusion(context.get(), loop_1, loop_2); | 
|  | EXPECT_FALSE(fusion.AreCompatible()); | 
|  | } | 
|  |  | 
|  | { | 
|  | LoopFusion fusion(context.get(), loop_2, loop_3); | 
|  | EXPECT_FALSE(fusion.AreCompatible()); | 
|  | } | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | // 19 | 
|  | #version 440 core | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  | int[10] c; | 
|  | // Illegal, would create a backward loop-carried anti-dependence. | 
|  | for (int i = 0; i < 10; i++) { | 
|  | c[i] = a[i] + 1; | 
|  | } | 
|  | for (int i = 0; i < 10; i++) { | 
|  | a[i+1] = c[i] + 2; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, PositiveDistanceCreatedWAR) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "i" | 
|  | OpName %23 "c" | 
|  | OpName %25 "a" | 
|  | OpName %34 "i" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %16 = OpConstant %6 10 | 
|  | %17 = OpTypeBool | 
|  | %19 = OpTypeInt 32 0 | 
|  | %20 = OpConstant %19 10 | 
|  | %21 = OpTypeArray %6 %20 | 
|  | %22 = OpTypePointer Function %21 | 
|  | %29 = OpConstant %6 1 | 
|  | %47 = OpConstant %6 2 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %23 = OpVariable %22 Function | 
|  | %25 = OpVariable %22 Function | 
|  | %34 = OpVariable %7 Function | 
|  | OpStore %8 %9 | 
|  | OpBranch %10 | 
|  | %10 = OpLabel | 
|  | %52 = OpPhi %6 %9 %5 %33 %13 | 
|  | OpLoopMerge %12 %13 None | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %18 = OpSLessThan %17 %52 %16 | 
|  | OpBranchConditional %18 %11 %12 | 
|  | %11 = OpLabel | 
|  | %27 = OpAccessChain %7 %25 %52 | 
|  | %28 = OpLoad %6 %27 | 
|  | %30 = OpIAdd %6 %28 %29 | 
|  | %31 = OpAccessChain %7 %23 %52 | 
|  | OpStore %31 %30 | 
|  | OpBranch %13 | 
|  | %13 = OpLabel | 
|  | %33 = OpIAdd %6 %52 %29 | 
|  | OpStore %8 %33 | 
|  | OpBranch %10 | 
|  | %12 = OpLabel | 
|  | OpStore %34 %9 | 
|  | OpBranch %35 | 
|  | %35 = OpLabel | 
|  | %53 = OpPhi %6 %9 %12 %51 %38 | 
|  | OpLoopMerge %37 %38 None | 
|  | OpBranch %39 | 
|  | %39 = OpLabel | 
|  | %41 = OpSLessThan %17 %53 %16 | 
|  | OpBranchConditional %41 %36 %37 | 
|  | %36 = OpLabel | 
|  | %43 = OpIAdd %6 %53 %29 | 
|  | %45 = OpAccessChain %7 %23 %53 | 
|  | %46 = OpLoad %6 %45 | 
|  | %48 = OpIAdd %6 %46 %47 | 
|  | %49 = OpAccessChain %7 %25 %43 | 
|  | OpStore %49 %48 | 
|  | OpBranch %38 | 
|  | %38 = OpLabel | 
|  | %51 = OpIAdd %6 %53 %29 | 
|  | OpStore %34 %51 | 
|  | OpBranch %35 | 
|  | %37 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | // 21 | 
|  | #version 440 core | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  | int[10] c; | 
|  | // Illegal, would create a backward loop-carried anti-dependence. | 
|  | for (int i = 0; i < 10; i++) { | 
|  | a[i] = b[i] + 1; | 
|  | } | 
|  | for (int i = 0; i < 10; i++) { | 
|  | a[i+1] = c[i+1] + 2; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, PositiveDistanceCreatedWAW) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "i" | 
|  | OpName %23 "a" | 
|  | OpName %25 "b" | 
|  | OpName %34 "i" | 
|  | OpName %44 "c" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %16 = OpConstant %6 10 | 
|  | %17 = OpTypeBool | 
|  | %19 = OpTypeInt 32 0 | 
|  | %20 = OpConstant %19 10 | 
|  | %21 = OpTypeArray %6 %20 | 
|  | %22 = OpTypePointer Function %21 | 
|  | %29 = OpConstant %6 1 | 
|  | %49 = OpConstant %6 2 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %23 = OpVariable %22 Function | 
|  | %25 = OpVariable %22 Function | 
|  | %34 = OpVariable %7 Function | 
|  | %44 = OpVariable %22 Function | 
|  | OpStore %8 %9 | 
|  | OpBranch %10 | 
|  | %10 = OpLabel | 
|  | %54 = OpPhi %6 %9 %5 %33 %13 | 
|  | OpLoopMerge %12 %13 None | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %18 = OpSLessThan %17 %54 %16 | 
|  | OpBranchConditional %18 %11 %12 | 
|  | %11 = OpLabel | 
|  | %27 = OpAccessChain %7 %25 %54 | 
|  | %28 = OpLoad %6 %27 | 
|  | %30 = OpIAdd %6 %28 %29 | 
|  | %31 = OpAccessChain %7 %23 %54 | 
|  | OpStore %31 %30 | 
|  | OpBranch %13 | 
|  | %13 = OpLabel | 
|  | %33 = OpIAdd %6 %54 %29 | 
|  | OpStore %8 %33 | 
|  | OpBranch %10 | 
|  | %12 = OpLabel | 
|  | OpStore %34 %9 | 
|  | OpBranch %35 | 
|  | %35 = OpLabel | 
|  | %55 = OpPhi %6 %9 %12 %53 %38 | 
|  | OpLoopMerge %37 %38 None | 
|  | OpBranch %39 | 
|  | %39 = OpLabel | 
|  | %41 = OpSLessThan %17 %55 %16 | 
|  | OpBranchConditional %41 %36 %37 | 
|  | %36 = OpLabel | 
|  | %43 = OpIAdd %6 %55 %29 | 
|  | %46 = OpIAdd %6 %55 %29 | 
|  | %47 = OpAccessChain %7 %44 %46 | 
|  | %48 = OpLoad %6 %47 | 
|  | %50 = OpIAdd %6 %48 %49 | 
|  | %51 = OpAccessChain %7 %23 %43 | 
|  | OpStore %51 %50 | 
|  | OpBranch %38 | 
|  | %38 = OpLabel | 
|  | %53 = OpIAdd %6 %55 %29 | 
|  | OpStore %34 %53 | 
|  | OpBranch %35 | 
|  | %37 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | // 28 | 
|  | #version 440 core | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  |  | 
|  | int sum_0 = 0; | 
|  |  | 
|  | // Illegal | 
|  | for (int i = 0; i < 10; i++) { | 
|  | sum_0 += a[i]; | 
|  | } | 
|  | for (int j = 0; j < 10; j++) { | 
|  | sum_0 += b[j]; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, SameReductionVariable) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "sum_0" | 
|  | OpName %10 "i" | 
|  | OpName %24 "a" | 
|  | OpName %33 "j" | 
|  | OpName %41 "b" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %17 = OpConstant %6 10 | 
|  | %18 = OpTypeBool | 
|  | %20 = OpTypeInt 32 0 | 
|  | %21 = OpConstant %20 10 | 
|  | %22 = OpTypeArray %6 %21 | 
|  | %23 = OpTypePointer Function %22 | 
|  | %31 = OpConstant %6 1 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %10 = OpVariable %7 Function | 
|  | %24 = OpVariable %23 Function | 
|  | %33 = OpVariable %7 Function | 
|  | %41 = OpVariable %23 Function | 
|  | OpStore %8 %9 | 
|  | OpStore %10 %9 | 
|  | OpBranch %11 | 
|  | %11 = OpLabel | 
|  | %52 = OpPhi %6 %9 %5 %29 %14 | 
|  | %49 = OpPhi %6 %9 %5 %32 %14 | 
|  | OpLoopMerge %13 %14 None | 
|  | OpBranch %15 | 
|  | %15 = OpLabel | 
|  | %19 = OpSLessThan %18 %49 %17 | 
|  | OpBranchConditional %19 %12 %13 | 
|  | %12 = OpLabel | 
|  | %26 = OpAccessChain %7 %24 %49 | 
|  | %27 = OpLoad %6 %26 | 
|  | %29 = OpIAdd %6 %52 %27 | 
|  | OpStore %8 %29 | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %32 = OpIAdd %6 %49 %31 | 
|  | OpStore %10 %32 | 
|  | OpBranch %11 | 
|  | %13 = OpLabel | 
|  | OpStore %33 %9 | 
|  | OpBranch %34 | 
|  | %34 = OpLabel | 
|  | %51 = OpPhi %6 %52 %13 %46 %37 | 
|  | %50 = OpPhi %6 %9 %13 %48 %37 | 
|  | OpLoopMerge %36 %37 None | 
|  | OpBranch %38 | 
|  | %38 = OpLabel | 
|  | %40 = OpSLessThan %18 %50 %17 | 
|  | OpBranchConditional %40 %35 %36 | 
|  | %35 = OpLabel | 
|  | %43 = OpAccessChain %7 %41 %50 | 
|  | %44 = OpLoad %6 %43 | 
|  | %46 = OpIAdd %6 %51 %44 | 
|  | OpStore %8 %46 | 
|  | OpBranch %37 | 
|  | %37 = OpLabel | 
|  | %48 = OpIAdd %6 %50 %31 | 
|  | OpStore %33 %48 | 
|  | OpBranch %34 | 
|  | %36 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | // 28 | 
|  | #version 440 core | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  |  | 
|  | int sum_0 = 0; | 
|  |  | 
|  | // Illegal | 
|  | for (int i = 0; i < 10; i++) { | 
|  | sum_0 += a[i]; | 
|  | } | 
|  | for (int j = 0; j < 10; j++) { | 
|  | sum_0 += b[j]; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, SameReductionVariableLCSSA) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "sum_0" | 
|  | OpName %10 "i" | 
|  | OpName %24 "a" | 
|  | OpName %33 "j" | 
|  | OpName %41 "b" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %17 = OpConstant %6 10 | 
|  | %18 = OpTypeBool | 
|  | %20 = OpTypeInt 32 0 | 
|  | %21 = OpConstant %20 10 | 
|  | %22 = OpTypeArray %6 %21 | 
|  | %23 = OpTypePointer Function %22 | 
|  | %31 = OpConstant %6 1 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %10 = OpVariable %7 Function | 
|  | %24 = OpVariable %23 Function | 
|  | %33 = OpVariable %7 Function | 
|  | %41 = OpVariable %23 Function | 
|  | OpStore %8 %9 | 
|  | OpStore %10 %9 | 
|  | OpBranch %11 | 
|  | %11 = OpLabel | 
|  | %52 = OpPhi %6 %9 %5 %29 %14 | 
|  | %49 = OpPhi %6 %9 %5 %32 %14 | 
|  | OpLoopMerge %13 %14 None | 
|  | OpBranch %15 | 
|  | %15 = OpLabel | 
|  | %19 = OpSLessThan %18 %49 %17 | 
|  | OpBranchConditional %19 %12 %13 | 
|  | %12 = OpLabel | 
|  | %26 = OpAccessChain %7 %24 %49 | 
|  | %27 = OpLoad %6 %26 | 
|  | %29 = OpIAdd %6 %52 %27 | 
|  | OpStore %8 %29 | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %32 = OpIAdd %6 %49 %31 | 
|  | OpStore %10 %32 | 
|  | OpBranch %11 | 
|  | %13 = OpLabel | 
|  | OpStore %33 %9 | 
|  | OpBranch %34 | 
|  | %34 = OpLabel | 
|  | %51 = OpPhi %6 %52 %13 %46 %37 | 
|  | %50 = OpPhi %6 %9 %13 %48 %37 | 
|  | OpLoopMerge %36 %37 None | 
|  | OpBranch %38 | 
|  | %38 = OpLabel | 
|  | %40 = OpSLessThan %18 %50 %17 | 
|  | OpBranchConditional %40 %35 %36 | 
|  | %35 = OpLabel | 
|  | %43 = OpAccessChain %7 %41 %50 | 
|  | %44 = OpLoad %6 %43 | 
|  | %46 = OpIAdd %6 %51 %44 | 
|  | OpStore %8 %46 | 
|  | OpBranch %37 | 
|  | %37 = OpLabel | 
|  | %48 = OpIAdd %6 %50 %31 | 
|  | OpStore %33 %48 | 
|  | OpBranch %34 | 
|  | %36 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopUtils utils_0(context.get(), loops[0]); | 
|  | utils_0.MakeLoopClosedSSA(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | // 30 | 
|  | #version 440 core | 
|  | int x; | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  |  | 
|  | // Illegal, x is unknown. | 
|  | for (int i = 0; i < 10; i++) { | 
|  | a[x] = a[i]; | 
|  | } | 
|  | for (int j = 0; j < 10; j++) { | 
|  | a[j] = b[j]; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, UnknownIndexVariable) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "i" | 
|  | OpName %23 "a" | 
|  | OpName %25 "x" | 
|  | OpName %34 "j" | 
|  | OpName %43 "b" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %16 = OpConstant %6 10 | 
|  | %17 = OpTypeBool | 
|  | %19 = OpTypeInt 32 0 | 
|  | %20 = OpConstant %19 10 | 
|  | %21 = OpTypeArray %6 %20 | 
|  | %22 = OpTypePointer Function %21 | 
|  | %24 = OpTypePointer Private %6 | 
|  | %25 = OpVariable %24 Private | 
|  | %32 = OpConstant %6 1 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %23 = OpVariable %22 Function | 
|  | %34 = OpVariable %7 Function | 
|  | %43 = OpVariable %22 Function | 
|  | OpStore %8 %9 | 
|  | OpBranch %10 | 
|  | %10 = OpLabel | 
|  | %50 = OpPhi %6 %9 %5 %33 %13 | 
|  | OpLoopMerge %12 %13 None | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %18 = OpSLessThan %17 %50 %16 | 
|  | OpBranchConditional %18 %11 %12 | 
|  | %11 = OpLabel | 
|  | %26 = OpLoad %6 %25 | 
|  | %28 = OpAccessChain %7 %23 %50 | 
|  | %29 = OpLoad %6 %28 | 
|  | %30 = OpAccessChain %7 %23 %26 | 
|  | OpStore %30 %29 | 
|  | OpBranch %13 | 
|  | %13 = OpLabel | 
|  | %33 = OpIAdd %6 %50 %32 | 
|  | OpStore %8 %33 | 
|  | OpBranch %10 | 
|  | %12 = OpLabel | 
|  | OpStore %34 %9 | 
|  | OpBranch %35 | 
|  | %35 = OpLabel | 
|  | %51 = OpPhi %6 %9 %12 %49 %38 | 
|  | OpLoopMerge %37 %38 None | 
|  | OpBranch %39 | 
|  | %39 = OpLabel | 
|  | %41 = OpSLessThan %17 %51 %16 | 
|  | OpBranchConditional %41 %36 %37 | 
|  | %36 = OpLabel | 
|  | %45 = OpAccessChain %7 %43 %51 | 
|  | %46 = OpLoad %6 %45 | 
|  | %47 = OpAccessChain %7 %23 %51 | 
|  | OpStore %47 %46 | 
|  | OpBranch %38 | 
|  | %38 = OpLabel | 
|  | %49 = OpIAdd %6 %51 %32 | 
|  | OpStore %34 %49 | 
|  | OpBranch %35 | 
|  | %37 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | #version 440 core | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  |  | 
|  | int sum = 0; | 
|  |  | 
|  | // Illegal, accumulator used for indexing. | 
|  | for (int i = 0; i < 10; i++) { | 
|  | sum += a[i]; | 
|  | b[sum] = a[i]; | 
|  | } | 
|  | for (int j = 0; j < 10; j++) { | 
|  | b[j] = b[j]+1; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, AccumulatorIndexing) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "sum" | 
|  | OpName %10 "i" | 
|  | OpName %24 "a" | 
|  | OpName %30 "b" | 
|  | OpName %39 "j" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %17 = OpConstant %6 10 | 
|  | %18 = OpTypeBool | 
|  | %20 = OpTypeInt 32 0 | 
|  | %21 = OpConstant %20 10 | 
|  | %22 = OpTypeArray %6 %21 | 
|  | %23 = OpTypePointer Function %22 | 
|  | %37 = OpConstant %6 1 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %10 = OpVariable %7 Function | 
|  | %24 = OpVariable %23 Function | 
|  | %30 = OpVariable %23 Function | 
|  | %39 = OpVariable %7 Function | 
|  | OpStore %8 %9 | 
|  | OpStore %10 %9 | 
|  | OpBranch %11 | 
|  | %11 = OpLabel | 
|  | %57 = OpPhi %6 %9 %5 %29 %14 | 
|  | %55 = OpPhi %6 %9 %5 %38 %14 | 
|  | OpLoopMerge %13 %14 None | 
|  | OpBranch %15 | 
|  | %15 = OpLabel | 
|  | %19 = OpSLessThan %18 %55 %17 | 
|  | OpBranchConditional %19 %12 %13 | 
|  | %12 = OpLabel | 
|  | %26 = OpAccessChain %7 %24 %55 | 
|  | %27 = OpLoad %6 %26 | 
|  | %29 = OpIAdd %6 %57 %27 | 
|  | OpStore %8 %29 | 
|  | %33 = OpAccessChain %7 %24 %55 | 
|  | %34 = OpLoad %6 %33 | 
|  | %35 = OpAccessChain %7 %30 %29 | 
|  | OpStore %35 %34 | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %38 = OpIAdd %6 %55 %37 | 
|  | OpStore %10 %38 | 
|  | OpBranch %11 | 
|  | %13 = OpLabel | 
|  | OpStore %39 %9 | 
|  | OpBranch %40 | 
|  | %40 = OpLabel | 
|  | %56 = OpPhi %6 %9 %13 %54 %43 | 
|  | OpLoopMerge %42 %43 None | 
|  | OpBranch %44 | 
|  | %44 = OpLabel | 
|  | %46 = OpSLessThan %18 %56 %17 | 
|  | OpBranchConditional %46 %41 %42 | 
|  | %41 = OpLabel | 
|  | %49 = OpAccessChain %7 %30 %56 | 
|  | %50 = OpLoad %6 %49 | 
|  | %51 = OpIAdd %6 %50 %37 | 
|  | %52 = OpAccessChain %7 %30 %56 | 
|  | OpStore %52 %51 | 
|  | OpBranch %43 | 
|  | %43 = OpLabel | 
|  | %54 = OpIAdd %6 %56 %37 | 
|  | OpStore %39 %54 | 
|  | OpBranch %40 | 
|  | %42 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | // 33 | 
|  | #version 440 core | 
|  | void main() { | 
|  | int[10] a; | 
|  | int[10] b; | 
|  |  | 
|  | // Illegal, barrier. | 
|  | for (int i = 0; i < 10; i++) { | 
|  | a[i] = a[i] * 2; | 
|  | memoryBarrier(); | 
|  | } | 
|  | for (int j = 0; j < 10; j++) { | 
|  | b[j] = b[j] + 1; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, Barrier) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "i" | 
|  | OpName %23 "a" | 
|  | OpName %36 "j" | 
|  | OpName %44 "b" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %16 = OpConstant %6 10 | 
|  | %17 = OpTypeBool | 
|  | %19 = OpTypeInt 32 0 | 
|  | %20 = OpConstant %19 10 | 
|  | %21 = OpTypeArray %6 %20 | 
|  | %22 = OpTypePointer Function %21 | 
|  | %28 = OpConstant %6 2 | 
|  | %31 = OpConstant %19 1 | 
|  | %32 = OpConstant %19 3400 | 
|  | %34 = OpConstant %6 1 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %23 = OpVariable %22 Function | 
|  | %36 = OpVariable %7 Function | 
|  | %44 = OpVariable %22 Function | 
|  | OpStore %8 %9 | 
|  | OpBranch %10 | 
|  | %10 = OpLabel | 
|  | %53 = OpPhi %6 %9 %5 %35 %13 | 
|  | OpLoopMerge %12 %13 None | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %18 = OpSLessThan %17 %53 %16 | 
|  | OpBranchConditional %18 %11 %12 | 
|  | %11 = OpLabel | 
|  | %26 = OpAccessChain %7 %23 %53 | 
|  | %27 = OpLoad %6 %26 | 
|  | %29 = OpIMul %6 %27 %28 | 
|  | %30 = OpAccessChain %7 %23 %53 | 
|  | OpStore %30 %29 | 
|  | OpMemoryBarrier %31 %32 | 
|  | OpBranch %13 | 
|  | %13 = OpLabel | 
|  | %35 = OpIAdd %6 %53 %34 | 
|  | OpStore %8 %35 | 
|  | OpBranch %10 | 
|  | %12 = OpLabel | 
|  | OpStore %36 %9 | 
|  | OpBranch %37 | 
|  | %37 = OpLabel | 
|  | %54 = OpPhi %6 %9 %12 %52 %40 | 
|  | OpLoopMerge %39 %40 None | 
|  | OpBranch %41 | 
|  | %41 = OpLabel | 
|  | %43 = OpSLessThan %17 %54 %16 | 
|  | OpBranchConditional %43 %38 %39 | 
|  | %38 = OpLabel | 
|  | %47 = OpAccessChain %7 %44 %54 | 
|  | %48 = OpLoad %6 %47 | 
|  | %49 = OpIAdd %6 %48 %34 | 
|  | %50 = OpAccessChain %7 %44 %54 | 
|  | OpStore %50 %49 | 
|  | OpBranch %40 | 
|  | %40 = OpLabel | 
|  | %52 = OpIAdd %6 %54 %34 | 
|  | OpStore %36 %52 | 
|  | OpBranch %37 | 
|  | %39 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | #version 440 core | 
|  | struct TestStruct { | 
|  | int[10] a; | 
|  | int b; | 
|  | }; | 
|  |  | 
|  | void main() { | 
|  | TestStruct test_0; | 
|  | TestStruct test_1; | 
|  |  | 
|  | for (int i = 0; i < 10; i++) { | 
|  | test_0.a[i] = i; | 
|  | } | 
|  | for (int j = 0; j < 10; j++) { | 
|  | test_0 = test_1; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, ArrayInStruct) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 440 | 
|  | OpName %4 "main" | 
|  | OpName %8 "i" | 
|  | OpName %22 "TestStruct" | 
|  | OpMemberName %22 0 "a" | 
|  | OpMemberName %22 1 "b" | 
|  | OpName %24 "test_0" | 
|  | OpName %31 "j" | 
|  | OpName %39 "test_1" | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %16 = OpConstant %6 10 | 
|  | %17 = OpTypeBool | 
|  | %19 = OpTypeInt 32 0 | 
|  | %20 = OpConstant %19 10 | 
|  | %21 = OpTypeArray %6 %20 | 
|  | %22 = OpTypeStruct %21 %6 | 
|  | %23 = OpTypePointer Function %22 | 
|  | %29 = OpConstant %6 1 | 
|  | %47 = OpUndef %22 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %24 = OpVariable %23 Function | 
|  | %31 = OpVariable %7 Function | 
|  | %39 = OpVariable %23 Function | 
|  | OpStore %8 %9 | 
|  | OpBranch %10 | 
|  | %10 = OpLabel | 
|  | %43 = OpPhi %6 %9 %5 %30 %13 | 
|  | OpLoopMerge %12 %13 None | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %18 = OpSLessThan %17 %43 %16 | 
|  | OpBranchConditional %18 %11 %12 | 
|  | %11 = OpLabel | 
|  | %27 = OpAccessChain %7 %24 %9 %43 | 
|  | OpStore %27 %43 | 
|  | OpBranch %13 | 
|  | %13 = OpLabel | 
|  | %30 = OpIAdd %6 %43 %29 | 
|  | OpStore %8 %30 | 
|  | OpBranch %10 | 
|  | %12 = OpLabel | 
|  | OpStore %31 %9 | 
|  | OpBranch %32 | 
|  | %32 = OpLabel | 
|  | %44 = OpPhi %6 %9 %12 %42 %35 | 
|  | OpLoopMerge %34 %35 None | 
|  | OpBranch %36 | 
|  | %36 = OpLabel | 
|  | %38 = OpSLessThan %17 %44 %16 | 
|  | OpBranchConditional %38 %33 %34 | 
|  | %33 = OpLabel | 
|  | OpStore %24 %47 | 
|  | OpBranch %35 | 
|  | %35 = OpLabel | 
|  | %42 = OpIAdd %6 %44 %29 | 
|  | OpStore %31 %42 | 
|  | OpBranch %32 | 
|  | %34 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | /* | 
|  | Generated from the following GLSL + --eliminate-local-multi-store | 
|  |  | 
|  | #version 450 | 
|  |  | 
|  | struct P {float x,y,z;}; | 
|  | uniform G { int a; P b[2]; int c; } g; | 
|  | layout(location = 0) out float o; | 
|  |  | 
|  | void main() | 
|  | { | 
|  | P p[2]; | 
|  | for (int i = 0; i < 2; ++i) { | 
|  | p = g.b; | 
|  | } | 
|  | for (int j = 0; j < 2; ++j) { | 
|  | o = p[g.a].x; | 
|  | } | 
|  | } | 
|  |  | 
|  | */ | 
|  | TEST_F(FusionIllegalTest, NestedAccessChain) { | 
|  | std::string text = R"( | 
|  | OpCapability Shader | 
|  | %1 = OpExtInstImport "GLSL.std.450" | 
|  | OpMemoryModel Logical GLSL450 | 
|  | OpEntryPoint Fragment %4 "main" %64 | 
|  | OpExecutionMode %4 OriginUpperLeft | 
|  | OpSource GLSL 450 | 
|  | OpName %4 "main" | 
|  | OpName %8 "i" | 
|  | OpName %20 "P" | 
|  | OpMemberName %20 0 "x" | 
|  | OpMemberName %20 1 "y" | 
|  | OpMemberName %20 2 "z" | 
|  | OpName %25 "p" | 
|  | OpName %26 "P" | 
|  | OpMemberName %26 0 "x" | 
|  | OpMemberName %26 1 "y" | 
|  | OpMemberName %26 2 "z" | 
|  | OpName %28 "G" | 
|  | OpMemberName %28 0 "a" | 
|  | OpMemberName %28 1 "b" | 
|  | OpMemberName %28 2 "c" | 
|  | OpName %30 "g" | 
|  | OpName %55 "j" | 
|  | OpName %64 "o" | 
|  | OpMemberDecorate %26 0 Offset 0 | 
|  | OpMemberDecorate %26 1 Offset 4 | 
|  | OpMemberDecorate %26 2 Offset 8 | 
|  | OpDecorate %27 ArrayStride 16 | 
|  | OpMemberDecorate %28 0 Offset 0 | 
|  | OpMemberDecorate %28 1 Offset 16 | 
|  | OpMemberDecorate %28 2 Offset 48 | 
|  | OpDecorate %28 Block | 
|  | OpDecorate %30 DescriptorSet 0 | 
|  | OpDecorate %64 Location 0 | 
|  | %2 = OpTypeVoid | 
|  | %3 = OpTypeFunction %2 | 
|  | %6 = OpTypeInt 32 1 | 
|  | %7 = OpTypePointer Function %6 | 
|  | %9 = OpConstant %6 0 | 
|  | %16 = OpConstant %6 2 | 
|  | %17 = OpTypeBool | 
|  | %19 = OpTypeFloat 32 | 
|  | %20 = OpTypeStruct %19 %19 %19 | 
|  | %21 = OpTypeInt 32 0 | 
|  | %22 = OpConstant %21 2 | 
|  | %23 = OpTypeArray %20 %22 | 
|  | %24 = OpTypePointer Function %23 | 
|  | %26 = OpTypeStruct %19 %19 %19 | 
|  | %27 = OpTypeArray %26 %22 | 
|  | %28 = OpTypeStruct %6 %27 %6 | 
|  | %29 = OpTypePointer Uniform %28 | 
|  | %30 = OpVariable %29 Uniform | 
|  | %31 = OpConstant %6 1 | 
|  | %32 = OpTypePointer Uniform %27 | 
|  | %36 = OpTypePointer Function %20 | 
|  | %39 = OpTypePointer Function %19 | 
|  | %63 = OpTypePointer Output %19 | 
|  | %64 = OpVariable %63 Output | 
|  | %65 = OpTypePointer Uniform %6 | 
|  | %4 = OpFunction %2 None %3 | 
|  | %5 = OpLabel | 
|  | %8 = OpVariable %7 Function | 
|  | %25 = OpVariable %24 Function | 
|  | %55 = OpVariable %7 Function | 
|  | OpStore %8 %9 | 
|  | OpBranch %10 | 
|  | %10 = OpLabel | 
|  | %72 = OpPhi %6 %9 %5 %54 %13 | 
|  | OpLoopMerge %12 %13 None | 
|  | OpBranch %14 | 
|  | %14 = OpLabel | 
|  | %18 = OpSLessThan %17 %72 %16 | 
|  | OpBranchConditional %18 %11 %12 | 
|  | %11 = OpLabel | 
|  | %33 = OpAccessChain %32 %30 %31 | 
|  | %34 = OpLoad %27 %33 | 
|  | %35 = OpCompositeExtract %26 %34 0 | 
|  | %37 = OpAccessChain %36 %25 %9 | 
|  | %38 = OpCompositeExtract %19 %35 0 | 
|  | %40 = OpAccessChain %39 %37 %9 | 
|  | OpStore %40 %38 | 
|  | %41 = OpCompositeExtract %19 %35 1 | 
|  | %42 = OpAccessChain %39 %37 %31 | 
|  | OpStore %42 %41 | 
|  | %43 = OpCompositeExtract %19 %35 2 | 
|  | %44 = OpAccessChain %39 %37 %16 | 
|  | OpStore %44 %43 | 
|  | %45 = OpCompositeExtract %26 %34 1 | 
|  | %46 = OpAccessChain %36 %25 %31 | 
|  | %47 = OpCompositeExtract %19 %45 0 | 
|  | %48 = OpAccessChain %39 %46 %9 | 
|  | OpStore %48 %47 | 
|  | %49 = OpCompositeExtract %19 %45 1 | 
|  | %50 = OpAccessChain %39 %46 %31 | 
|  | OpStore %50 %49 | 
|  | %51 = OpCompositeExtract %19 %45 2 | 
|  | %52 = OpAccessChain %39 %46 %16 | 
|  | OpStore %52 %51 | 
|  | OpBranch %13 | 
|  | %13 = OpLabel | 
|  | %54 = OpIAdd %6 %72 %31 | 
|  | OpStore %8 %54 | 
|  | OpBranch %10 | 
|  | %12 = OpLabel | 
|  | OpStore %55 %9 | 
|  | OpBranch %56 | 
|  | %56 = OpLabel | 
|  | %73 = OpPhi %6 %9 %12 %71 %59 | 
|  | OpLoopMerge %58 %59 None | 
|  | OpBranch %60 | 
|  | %60 = OpLabel | 
|  | %62 = OpSLessThan %17 %73 %16 | 
|  | OpBranchConditional %62 %57 %58 | 
|  | %57 = OpLabel | 
|  | %66 = OpAccessChain %65 %30 %9 | 
|  | %67 = OpLoad %6 %66 | 
|  | %68 = OpAccessChain %39 %25 %67 %9 | 
|  | %69 = OpLoad %19 %68 | 
|  | OpStore %64 %69 | 
|  | OpBranch %59 | 
|  | %59 = OpLabel | 
|  | %71 = OpIAdd %6 %73 %31 | 
|  | OpStore %55 %71 | 
|  | OpBranch %56 | 
|  | %58 = OpLabel | 
|  | OpReturn | 
|  | OpFunctionEnd | 
|  | )"; | 
|  |  | 
|  | std::unique_ptr<IRContext> context = | 
|  | BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, | 
|  | SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); | 
|  | Module* module = context->module(); | 
|  | EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" | 
|  | << text << std::endl; | 
|  | Function& f = *module->begin(); | 
|  |  | 
|  | { | 
|  | LoopDescriptor& ld = *context->GetLoopDescriptor(&f); | 
|  | EXPECT_EQ(ld.NumLoops(), 2u); | 
|  |  | 
|  | auto loops = ld.GetLoopsInBinaryLayoutOrder(); | 
|  |  | 
|  | LoopFusion fusion(context.get(), loops[0], loops[1]); | 
|  | EXPECT_TRUE(fusion.AreCompatible()); | 
|  | EXPECT_FALSE(fusion.IsLegal()); | 
|  | } | 
|  | } | 
|  |  | 
|  | }  // namespace | 
|  | }  // namespace opt | 
|  | }  // namespace spvtools |