安装 ONNX Runtime generate() API
Python 包安装
注意:在您的环境中,这些软件包集(CPU、DirectML、CUDA)中只能安装一个。
CPU
pip install onnxruntime-genai
DirectML
pip install onnxruntime-genai-directml
CUDA
如果您要安装 onnxruntime-genai 的 CUDA 变体,则必须安装 CUDA 工具包。
CUDA 工具包可以从 CUDA Toolkit Archive 下载。
确保 CUDA_PATH
环境变量设置为您的 CUDA 安装位置。
CUDA 11
pip install onnxruntime-genai-cuda --index-url https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/onnxruntime-cuda-11/pypi/simple/
CUDA 12
pip install onnxruntime-genai-cuda
Nuget 包安装
注意:在您的项目中,这些软件包(CPU、DirectML、CUDA)中只能安装一个。
先决条件
ONNX Runtime 依赖项
ONNX Runtime generate() 0.3.0 及更早版本捆绑了核心 ONNX Runtime 二进制文件。从 0.4.0 版本开始,这些软件包是分开的,以提供更灵活的开发者体验。
CPU
dotnet add package Microsoft.ML.OnnxRuntimeGenAI
CUDA
注意:0.3.0 及更早版本仅支持 CUDA 11,而 0.4.0 及更高版本仅支持 CUDA 12。
dotnet add package Microsoft.ML.OnnxRuntimeGenAI.Cuda
DirectML
dotnet add package Microsoft.ML.OnnxRuntimeGenAI.DirectML