ONNX Runtime 发布路线图

ONNX Runtime 按季度发布。必要时,在主要版本之间发布补丁版本。

上一版本
1.20.0
发布日期:11/1/2024
正在进行中的版本
1.20.1
发布日期:11/20/2024
下一版本
1.21
发布日期:2025 年 2 月

公告

  • onnxruntime-gpu v1.10.0 将从 PyPI 中移除。 我们已经达到了 onnxruntime-gpu 在 PyPI 上的项目大小限制,因此我们将移除最旧的包版本以释放所需空间。
  • ONNX Runtime v1.20.0 现已正式发布。 有关版本说明、资产等信息,请访问我们的 GitHub 发布页面

版本更新

我们计划升级 ONNX Runtime 对以下版本的支持(第一个值是之前支持的最高版本,第二个值是将在 ORT 1.20.1 中添加的支持版本)

  • QNN SDK 2.27 --> 2.28
  • DirectML 1.15.2 --> 1.16
  • ONNX 1.17 支持将包含在未来的版本中。

主要更新

除了各种错误修复和性能改进之外,ORT 1.20.1 还将包含以下更新

  • 以下内核的 CPU FP16 实现修复:LayerNormalization, SimplifiedLayerNormalization, SkipLayerNormalization, SkipSimplifiedLayerNormalization。
  • Python 量化工具更新。
  • 新增 QNN SDK 版本支持。

功能请求

要请求在未来版本中包含新的 ONNX Runtime 功能,请通过 GitHub Issues 或通过 GitHub Discussions 提交功能请求。

为确保您的请求尽快得到处理,请

  • 包含详细的标题。
  • 在您的请求正文中提供尽可能多的详细信息(例如,该功能的使用场景、需要该功能的平台或 EP 等)。
  • 如果您知道,请应用与相应 ONNX Runtime 领域相对应的标签(例如,“platform:mobile”、“platform:web”、“ep:CUDA”等)。

注意:本页面列出的所有时间表和功能都可能发生变化。

ONNX Runtime 1.20.1

暂定发布日期 11/20/2024

公告
  • onnxruntime-gpu v1.10.0 将从 PyPI 中移除。 我们已经达到了 onnxruntime-gpu 在 PyPI 上的项目大小限制,因此我们将移除最旧的包版本以释放所需空间。
构建系统与包

1.20.1 版本没有计划中的功能。敬请关注 1.21 版本的功能。

核心

1.20.1 版本没有计划中的功能。敬请关注 1.21 版本的功能。

性能

1.20.1 版本没有计划中的功能。敬请关注 1.21 版本的功能。

量化
  • 引入 get_int_qdq_config() 辅助函数以获取 QDQ 配置 (#22677)。
  • 更新 QDQ Pad, Slice, Softmax (#22676)。
  • 处理带有预量化权重的输入模型 (#22633)。
  • 通过调整权重的比例防止 int32 量化偏差截断 (#22020)。
EPs

CPU

  • 修复以下内核的 CPU FP16 实现:LayerNormalization, SimplifiedLayerNormalization, SkipLayerNormalization, SkipSimplifiedLayerNormalization。

QNN

  • 支持 QNN SDK 2.28.x。

DirectML

  • 支持 DirectML 1.16。
移动端

1.20.1 版本没有计划中的功能。敬请关注 1.21 版本的功能。

Web

1.20.1 版本没有计划中的功能。敬请关注 1.21 版本的功能。

generate() API

1.20.1 版本没有计划中的功能。敬请关注 1.21 版本的功能。

扩展

1.20.1 版本没有计划中的功能。敬请关注 1.21 版本的功能。

Olive

1.20.1 版本没有计划中的功能。敬请关注 1.21 版本的功能。