ONNX Runtime generate() API 问题排查

安装问题

Windows Conda 导入错误

ImportError: DLL load failed while importing onnxruntime_genai: A dynamic link library (DLL) initialization routine failed.

如果在 Windows 上的 Conda 环境中看到此问题,则需要升级 Visual Studio 的 C++ 运行时。在 conda 环境中,运行以下命令

conda install conda-forge::vs2015_runtime

执行此额外步骤后,onnxruntime-genai Python 包应能无错误运行。

Windows CUDA 导入错误

DLL load failed while importing onnxruntime_genai

在 Windows 上完成 CUDA 工具包安装后,请确保已将 CUDA_PATH 系统环境变量设置为工具包的安装路径。在 Windows 上导入 onnxruntime_genai python 模块时,将使用此变量。取消设置或错误设置 CUDA_PATH 变量可能会导致 DLL load failed while importing onnxruntime_genai

Transformers / Tokenizers 与 ONNX Runtime generate() 的不兼容性

RuntimeError: [json.exception.type_error.302] type must be string, but is array

仅当您使用模型构建器生成模型时才会发生,而不是下载的模型。

HuggingFace transformers 版本 4.45.0 中发生了一项更改,导致与 onnxruntime-genai 版本 0.4.0 及更早版本不兼容,已在 0.5.0 中解决。您可以使用两种替代方法来解决此问题

  • 选项 1:将您的 transformers 版本降级到低于 v4.45.0 的版本(引入上述 更改 的版本)
  • 选项 2:从源代码构建 onnxruntime-genai,使用这些说明 从源代码构建