安装 ONNX Runtime generate() API

Python 包安装

注意：您的环境中只能安装这些包中的一套（CPU、DirectML、CUDA）。

pip install onnxruntime-genai

pip install onnxruntime-genai-directml

如果您安装 onnxruntime-genai 的 CUDA 变体，则必须安装 CUDA 工具包。

CUDA 工具包可以从 CUDA 工具包归档下载。

请确保 CUDA_PATH 环境变量已设置为您的 CUDA 安装位置。

pip install onnxruntime-genai-cuda

要将此 API 与 CUDA 11 一起使用，您需要从源代码构建并安装。

注意：您的项目中只能安装这些包中的一个（CPU、DirectML、CUDA）。

ONNX Runtime generate() 版本 0.3.0 及更早版本与核心 ONNX Runtime 二进制文件捆绑在一起。从 0.4.0 版本开始，包被分离，以提供更灵活的开发体验。

dotnet add package Microsoft.ML.OnnxRuntimeGenAI

注意：版本 0.3.0 及更早版本仅支持 CUDA 11，版本 0.4.0 及更高版本仅支持 CUDA 12。

dotnet add package Microsoft.ML.OnnxRuntimeGenAI.Cuda

dotnet add package Microsoft.ML.OnnxRuntimeGenAI.DirectML