ONNX Runtime 发布路线图
ONNX Runtime 每季度发布一次。补丁版本会在主版本之间根据需要发布。
上一个版本
1.20.0
发布日期:2024年11月1日
进行中版本
1.20.1
发布日期:2024年11月20日
下一个版本
1.21
发布日期:2025年2月
公告
- onnxruntime-gpu v1.10.0 将从 PyPI 中移除。 我们已达到 onnxruntime-gpu 的 PyPI 项目大小限制,因此我们将移除我们最旧的软件包版本以释放必要的空间。
- ONNX Runtime v1.20.0 现已正式发布。 有关发行说明、资产等更多信息,请访问我们的 GitHub 发布页面。
版本更新
我们计划升级 ONNX Runtime 对以下各项的支持(其中第一个值是先前支持的最高版本,第二个值是将在 ORT 1.20.1 中添加的版本支持)
- QNN SDK 2.27 --> 2.28
- DirectML 1.15.2 --> 1.16
- ONNX 1.17 支持将在未来的版本中包含。
主要更新
除了各种错误修复和性能改进外,ORT 1.20.1 还将包括以下更新
- 以下内核的 CPU FP16 实现修复:LayerNormalization、SimplifiedLayerNormalization、SkipLayerNormalization、SkipSimplifiedLayerNormalization。
- Python 量化工具更新。
- 新的 QNN SDK 版本支持。
功能请求
要请求将新的 ONNX Runtime 功能包含在未来的版本中,请通过 GitHub Issues 或通过 GitHub Discussions 提交功能请求。
为了确保您的请求得到尽可能快的处理,请
- 包含详细的标题。
- 在您的请求正文中提供尽可能多的详细信息(例如,该功能的使用案例、需要该功能的平台或 EP 等)。
- 如果您知道,请应用与相应的 ONNX Runtime 区域相对应的标签(例如,“platform:mobile”、“platform:web”、“ep:CUDA”等)。
注意:此页面上列出的所有时间表和功能都可能会发生变化。
ONNX Runtime 1.20.1
暂定发布日期 11/20/2024
公告
- onnxruntime-gpu v1.10.0 将从 PyPI 中移除。 我们已达到 onnxruntime-gpu 的 PyPI 项目大小限制,因此我们将移除我们最旧的软件包版本以释放必要的空间。
构建系统 & 软件包
1.20.1 版本没有计划新功能。请关注 1.21 版本的功能。
核心
1.20.1 版本没有计划新功能。请关注 1.21 版本的功能。
性能
1.20.1 版本没有计划新功能。请关注 1.21 版本的功能。
量化
EPs
CPU
- 修复以下内核的 CPU FP16 实现:LayerNormalization、SimplifiedLayerNormalization、SkipLayerNormalization、SkipSimplifiedLayerNormalization。
QNN
- QNN SDK 2.28.x 支持。
DirectML
- DirectML 1.16 支持。
移动
1.20.1 版本没有计划新功能。请关注 1.21 版本的功能。
Web
1.20.1 版本没有计划新功能。请关注 1.21 版本的功能。
generate() API
1.20.1 版本没有计划新功能。请关注 1.21 版本的功能。
扩展
1.20.1 版本没有计划新功能。请关注 1.21 版本的功能。
Olive
1.20.1 版本没有计划新功能。请关注 1.21 版本的功能。