创建 Float16 和混合精度模型

将模型转换为使用 float16 而不是 float32 可以减小模型大小（最多一半）并提高某些 GPU 上的性能。可能会有一些精度损失，但在许多模型中，新的精度是可接受的。float16 转换不需要调优数据，这使其优于量化。

Float16 转换

按照以下步骤将模型转换为 float16：

安装 onnx 和 onnxconverter-common

pip install onnx onnxconverter-common

在 python 中使用 convert_float_to_float16 函数。

 import onnx
 from onnxconverter_common import float16

 model = onnx.load("path/to/model.onnx")
 model_fp16 = float16.convert_float_to_float16(model)
 onnx.save(model_fp16, "path/to/model_fp16.onnx")

Float16 工具参数

如果转换后的模型不起作用或精度较差，您可能需要设置额外的参数。

convert_float_to_float16(model, min_positive_val=1e-7, max_finite_val=1e4, keep_io_types=False,
                         disable_shape_infer=False, op_block_list=None, node_block_list=None)

model：要转换的 ONNX 模型。
min_positive_val, max_finite_val：常量值将被裁剪到这些边界。 0.0, nan, inf, 和 -inf 将保持不变。
keep_io_types：模型输入/输出是否应保留为 float32。
disable_shape_infer：跳过运行 onnx 形状/类型推断。当形状推断崩溃、模型中已存在形状/类型或不需要类型时（类型用于确定不受支持/被阻止的算子需要插入 cast 算子的位置），此参数很有用。
op_block_list：要保留为 float32 的算子类型列表。默认使用 float16.DEFAULT_OP_BLOCK_LIST 中的列表。此列表包含 ONNX Runtime 中不支持 float16 的算子。
node_block_list：要保留为 float32 的节点名称列表。

注意：被阻止的算子周围将插入从 float16/float32 到 float32/float16 的 cast 算子。目前，如果两个被阻止的算子相邻，仍然会插入 cast 算子，从而创建冗余对。ORT 会在运行时优化掉这对冗余算子，因此结果将保持全精度。

混合精度

如果 float16 转换导致结果不佳，您可以将大多数算子转换为 float16，但保留一些算子为 float32。auto_mixed_precision.auto_convert_mixed_precision 工具会找到一个最小的算子集来跳过转换，同时保持一定的精度水平。您需要为模型提供一个示例输入。

由于 ONNX Runtime 的 CPU 版本不支持 float16 算子，并且该工具需要测量精度损失，因此混合精度工具必须在带有 GPU 的设备上运行。

from onnxconverter_common import auto_mixed_precision
import onnx

model = onnx.load("path/to/model.onnx")
# Assuming x is the input to the model
feed_dict = {'input': x.numpy()}
model_fp16 = auto_convert_mixed_precision(model, feed_dict, rtol=0.01, atol=0.001, keep_io_types=True)
onnx.save(model_fp16, "path/to/model_fp16.onnx")

混合精度工具参数

auto_convert_mixed_precision(model, feed_dict, validate_fn=None, rtol=None, atol=None, keep_io_types=False)

model：要转换的 ONNX 模型。
feed_dict：用于在转换期间测量模型精度的测试数据。格式类似于 InferenceSession.run（输入名称到值的映射）。
validate_fn：一个函数，接受两个 numpy 数组列表（分别是 float32 模型和混合精度模型的输出），如果结果足够接近则返回 True，否则返回 False。可以代替或补充 rtol 和 atol 使用。
rtol, atol：用于验证的绝对和相对容差。更多信息请参阅 numpy.allclose。
keep_io_types：模型输入/输出是否应保留为 float32。

混合精度工具通过将算子簇转换为 float16 来工作。如果一个簇失败，它会被分成两半，并独立尝试两个簇。工具运行时会打印簇大小的可视化。

创建 Float16 和混合精度模型

目录

Float16 转换

Float16 工具参数

混合精度

混合精度工具参数