# int8
--reset
--dir=FWD_B,FWD_D
--cfg=s8s8s32,s8s8s8,s8s8u8,u8s8s32,u8s8s8,u8s8u8
--attr=oscale=per_oc:2.25;post_ops='sum:0.5;relu:0.5'
--mb=2                              --batch=ip_gpu
--mb=0                              --batch=shapes_non-spatial_gpu
--attr=oscale=common:2.25;post_ops='sum:0.5;tanh'
                                    --batch=ip_1d

# f32
--reset
--cfg=f32
--mb=2
--dir=FWD_B,BWD_D,BWD_WB --batch=ip_gpu

# f32 + post_ops
--reset
--cfg=f32
--dir=FWD_B,FWD_D
--attr=post_ops='sum:2.0;relu:3.0'
--mb=2                             --batch=ip_gpu
--mb=0                             --batch=shapes_non-spatial_gpu
--attr=post_ops='sum:2.0'
                                   --batch=ip_1d
--attr=post_ops='linear:3.0:2.0'
                                   --batch=ip_1d
--attr=post_ops='tanh:0.5:1.5:2.0'
                                   --batch=ip_1d

# bf16
--reset
--cfg=bf16bf16bf16
--dir=FWD_B,BWD_D,BWD_WB --batch=ip_1d

# f16
--reset
--cfg=f16
--dir=FWD_B,FWD_D
--attr=post_ops='linear:1.0:2.0' --batch=ip_1d
--attr=post_ops='linear:2:3:0.5' --batch=ip_1d

# bf16 + f32
--attr=
--dir=FWD_B
--cfg=bf16bf16f32 --batch=ip_1d

--dir=BWD_D
--cfg=f32bf16bf16 --batch=ip_1d

--dir=BWD_WB
--cfg=bf16f32bf16 --batch=ip_1d

# bf16 + post_ops
--dir=FWD_B
--cfg=bf16bf16bf16,bf16bf16f32
--attr=post_ops='sum:0.5;relu:0.5' --batch=ip_1d
--attr=post_ops='sum:0.5;tanh'     --batch=ip_1d
--attr=post_ops='tanh:0.5:1.5:2.0' --batch=ip_1d

# diff mem tags
--batch=ip_resnet50_swfmt
