跳到主要内容
Link - ONNX 运行时
Menu - ONNX 运行时
Expand - ONNX 运行时
(external link) - ONNX 运行时
Document - ONNX 运行时
Search - ONNX 运行时
Copy - ONNX 运行时
Copied - ONNX 运行时
ONNX Runtime
安装 ONNX Runtime
开始使用
Python
C++
C
C#
Java
JavaScript
Web
Node.js 绑定
React Native
Objective-C
Julia 和 Ruby API
Windows
移动设备
设备端训练
大型模型训练
教程
API 基础
加速 PyTorch
PyTorch 推理
多目标推理
加速 PyTorch 训练
加速 TensorFlow
加速 Hugging Face
部署到 AzureML
部署到移动设备
使用 YOLOv8 进行目标检测和姿态估计
Android 上的移动图像识别
提高移动设备上的图像分辨率
iOS 上的移动目标检测
ORT 移动模型导出助手
Web
使用 ONNX Runtime 构建 Web 应用
'env' 标志和会话选项
使用 WebGPU
使用 WebNN
使用大型模型
性能诊断
部署 ONNX Runtime Web
故障排除
使用 ONNX Runtime 和 Next.js 对图像进行分类
JavaScript 中用于 BERT 任务的自定义 Excel 函数
部署到 IoT 和边缘设备
在 Raspberry Pi 上部署 IoT
部署传统机器学习
使用 C# 进行推理
C# 基础教程
使用 C# 推理 BERT NLP
使用 C# 配置 CUDA 以用于 GPU
使用 C# 进行 ResNet50v2 图像识别
使用 C# 进行 Stable Diffusion
使用 OpenVINO 在 C# 中进行目标检测
使用 C# 进行 Faster RCNN 目标检测
设备端训练
构建 Android 应用
构建 iOS 应用
API 文档
构建 ONNX Runtime
为推理而构建
为训练而构建
使用不同的 EP 构建
为 Web 而构建
为 Android 而构建
为 iOS 而构建
自定义构建
生成 API(预览版)
教程
Phi-3.5 视觉教程
Phi-3 教程
Phi-2 教程
使用 LoRA 适配器运行
DeepSeek-R1-Distill 教程
在高通骁龙设备上运行
API 文档
Python API
C# API
C API
Java API
操作指南
安装
从源代码构建
构建模型
为骁龙构建模型
故障排除
迁移
参考
配置参考
适配器文件规范
执行提供者
NVIDIA - CUDA
NVIDIA - TensorRT
Intel - OpenVINO™
Intel - oneDNN
Windows - DirectML
高通 - QNN
Android - NNAPI
Apple - CoreML
XNNPACK
AMD - ROCm
AMD - MIGraphX
AMD - Vitis AI
云 - Azure
社区维护
Arm - ACL
Arm - Arm NN
Apache - TVM
瑞芯微 - RKNPU
华为 - CANN
添加新的提供者
EP 上下文设计
NVIDIA - TensorRT RTX
扩展
添加算子
构建
性能
调整性能
性能分析工具
日志记录与追踪
内存消耗
线程管理
I/O 绑定
故障排除
模型优化
量化 ONNX 模型
Float16 和混合精度模型
图优化
ORT 模型格式
ORT 模型格式运行时优化
Transformer 优化器
使用 Olive 进行端到端优化
设备张量
生态系统
Azure PyTorch 容器 (ACPT)
参考
发布
兼容性
算子
算子内核
贡献算子
自定义算子
精简算子配置文件
架构
引用 ONNX Runtime
ONNX Runtime 中的依赖管理
GitHub 上的 ONNX Runtime 文档
ONNX Runtime
安装
开始使用
教程
API 文档
YouTube
GitHub
教程
加速 Hugging Face
加速 Hugging Face 模型
ONNX Runtime 可以加速流行 Hugging Face NLP 模型的训练和推理。
加速 Hugging Face 模型推理
通用导出和推理:Hugging Face Transformers
在 CPU 上加速 GPT2 模型
在 CPU 上加速 BERT 模型
在 GPU 上加速 BERT 模型
更多资源
博客文章:使用 Hugging Face 和 ONNX Runtime 实现更快更小的量化 NLP
博客文章:使用 Hugging Face Transformers 和 ONNX Runtime 加速您的 NLP 管道