安装 ONNX Runtime generate() API
Python 包安装
注意:您的环境中只能安装这些软件包组(CPU、DirectML、CUDA)中的一个。
CPU
pip install onnxruntime-genai
DirectML
pip install onnxruntime-genai-directml
CUDA
如果您正在安装 onnxruntime-genai 的 CUDA 版本,则必须安装 CUDA 工具包。
CUDA 工具包可以从 CUDA Toolkit Archive 下载。
确保 CUDA_PATH
环境变量设置为您的 CUDA 安装路径。
CUDA 12
pip install onnxruntime-genai-cuda
CUDA 11
要在 CUDA 11 中使用此 API,您需要从源代码构建并安装。
Nuget 包安装
注意:在您的项目中只需安装这些软件包(CPU、DirectML、CUDA)中的一个。
前提条件
ONNX Runtime 依赖项
ONNX Runtime generate() 0.3.0 及更早版本与核心 ONNX Runtime 二进制文件捆绑在一起。从 0.4.0 版本开始,软件包被分离,以提供更灵活的开发体验。
CPU
dotnet add package Microsoft.ML.OnnxRuntimeGenAI
CUDA
注意:0.3.0 及更早版本仅支持 CUDA 11,而 0.4.0 及更高版本仅支持 CUDA 12。
dotnet add package Microsoft.ML.OnnxRuntimeGenAI.Cuda
DirectML
dotnet add package Microsoft.ML.OnnxRuntimeGenAI.DirectML