--reset
# f32, bf16, f64
--mb=2
--dt=f32,bf16,f64
--dir=FWD_D,FWD_I,BWD_D
--alg=max,avg_np,avg_p
--tag=abx,aBx16b,aBx32b
--batch=set_all_small

# f32, f64
--mb=16
--dt=f32,f64
--dir=FWD_D,FWD_I,BWD_D
--alg=max,avg_np,avg_p
--tag=ABx16a16b,ABx32a32b
--batch=set_all_small

# u8, s8, s32, f16, bf16
--mb=2
--dt=u8,s8,s32,f16,bf16
--dir=FWD_I
--alg=max,avg_np,avg_p
--tag=abx,aBx16b,aBx32b
--batch=shapes_2d_small

--mb=16
--tag=ABx16a16b
--batch=set_all_small

--mb=32
--tag=ABx32a32b
--batch=set_all_small

--reset
# f32, f64, nhwc
--mb=1
--dt=f32,f64
--dir=FWD_D,BWD_D
--alg=max,avg_np,avg_p
--tag=axb
--batch=shapes_2d_small

--mb=1,16
--alg=max
--batch=set_all_small

# f16, nhwc
--mb=1,16
--dt=f16
--dir=FWD_I
--alg=max
--batch=set_all_small

# basic post op tests
--reset
--dir=FWD_I
--dt=f32,s32,f16,bf16,u8,s8
--alg=max,avg_np,avg_p
--attr-post-ops=add:s32:per_oc+sub:s8:per_tensor,add:f32+linear:-0.5:1.5
--mb=2
--tag=abx,aBx16b
--batch=shapes_3d_small

--mb=16
--tag=ABx16a16b
--batch=shapes_2d_small

--mb=32
--tag=ABx32a32b
--batch=shapes_2d_small

# int8 axb tests
--reset
--dt=u8,s8
--dir=FWD_I
--tag=axb
--alg=max,avg_np,avg_p
--attr-post-ops=,add:f32+sub:s8:per_tensor+linear:-0.5:1.5
--batch=set_all_small

# Test different src and dst datatypes
--batch=harness_pooling_different_dt

# Test layers of some key and ext GPU DL Frameworks
--reset
--batch=option_set_fwks_key_gpu
--reset
--batch=option_set_fwks_ext_gpu

# Test global pooling
--reset
--dt=f32,f16,bf16,f64
--dir=BWD_D
--tag=axb,abx,aBx16b,aBx32b
--alg=max,avg_np,avg_p
--batch=shapes_global_pooling
