欢迎使用 ONNX Runtime

ONNX Runtime 是一个跨平台的机器学习模型加速器，具有灵活的接口以集成硬件特定库。ONNX Runtime 可与来自 PyTorch、Tensorflow/Keras、TFLite、scikit-learn 和其他框架的模型配合使用。

如何使用 ONNX Runtime

ONNX Runtime 推理功能支持微软在 Office、Azure、Bing 等关键产品和服务以及数十个社区项目中的机器学习模型。

ONNX Runtime 推理的用例示例包括

前提很简单。

即使没有第 3 步，ONNX Runtime 通常也能提供比原始框架更好的性能。

ONNX Runtime 对模型图应用多项图优化，然后根据可用的硬件特定加速器将其划分为子图。核心 ONNX Runtime 中的优化计算内核可提供性能改进，分配的子图可从每个执行提供程序获得进一步加速。