跳到主要内容

ONNX Runtime
安装 ONNX Runtime
开始使用
教程
API 文档
构建 ONNX Runtime
生成 API（预览版）
执行提供者
扩展
- 添加算子
- 构建
性能
生态系统
- Azure PyTorch 容器 (ACPT)
参考
ONNX Runtime 中的依赖管理

GitHub 上的 ONNX Runtime 文档

本网站使用 Just the Docs，一个 Jekyll 文档主题。

ONNX Runtime
安装
开始使用
教程
API 文档
YouTube
GitHub

教程
加速 Hugging Face

加速 Hugging Face 模型

ONNX Runtime 可以加速流行 Hugging Face NLP 模型的训练和推理。

加速 Hugging Face 模型推理

通用导出和推理：Hugging Face Transformers
在 CPU 上加速 GPT2 模型
在 CPU 上加速 BERT 模型
在 GPU 上加速 BERT 模型

更多资源

博客文章：使用 Hugging Face 和 ONNX Runtime 实现更快更小的量化 NLP
博客文章：使用 Hugging Face Transformers 和 ONNX Runtime 加速您的 NLP 管道

有关文档问题，请提交问题。

在 GitHub 上编辑此页面