heliacore bg mobile
heliacore bg desktopheliacore visual desktop scaled

heliaCORE – 面向边缘AI的优化内核

Ambiq AI 的内核加速

heliacore kv mobile

heliaCORE™ 是 Ambiq 为 Ambiq SPOT SoC 优化的神经网络内核层,通过高效的 AI Kernels 和全面的操作子加速功能,使开发人员能够在资源受限的边缘设备上快速将 AI 产品推向市场。 与 MLPerf Tiny 相比,它支持的算子实例数量约为其 12 倍,覆盖了更多现实场景中的 AI 工作负载。

heliaCORE 亮点

01

行业标准工作流程

heliaCORE 基于 Arm® CMSIS-NN 生态系统构建,确保与行业标准的嵌入式 AI 开发流程兼容。

02

广泛的现实世界AI验证

heliaCORE 通过验证超过 40 个 AI 模型、53 种操作员类型、247 个不同操作员以及 963 个操作员实例,有助于在超出典型基准测试条件的情况下提高部署的可预测性。

03

MVE 和 DSP 加速

针对 ARM Cortex-M 平台使用经过优化的 AI 工作负载,优先采用 heliaCORE Cortex-M55 MVE 加速技术,同时为不支持 MVE 的旧版 Apollo 硬件保留针对 DSP 优化的实现方案。

04

与 HELIA AI 无缝集成

通过统一的、针对芯片优化的内核平台,降低了边缘AI部署的复杂性,该平台为heliaRT和heliaAOT提供支持,并兼容CMake、CMSIS-Pack、Zephyr和neuralSPOT-X工作流。

卷积与矩阵乘法核

该基准测试展示了heliaCORE在Apollo510(Cortex-M55)上通过标量参考、DSP和MVE执行路径所实现的性能。 由于这三条路径均在同一款 SoC 上以相同的时钟频率运行,因此测试结果能够直观地进行“同类对比”,清晰展现每条指令集架构(ISA)优化路径所带来的性能提升。

HeliaCORE diagram desktop

设计资源

heliaCORE 开发者中心—— 探索分步指南、实践示例和性能基准测试,快速启动 heliaCORE 集成。
Ambiq AI 中心——深入了解 neuralSPOT® AI SDK 和工具包,以及我们的 heartKIT、sleepKIT 和 soundKIT ADK

其他文档

  • 设置收藏夹
  • 获取更新通知
  • 使用搜索过滤器

视频库

hqdefault
hqdefault
hqdefault

常见问题解答

  • heliaCORE 是经过优化的内核基础。 heliaRT 是 Ambiq的 用于在设备上执行AI推理的运行时路径,作为 LiteRT ,用于微控制器,同时在使用 heliaCORE 作为底层实现。 heliaAOT 是 Ambiq的 预编译器路径,支持 LiteRT flatbuffers 并生成同样依赖于 heliaCORE。

  • 像Arm的CMSIS-NN这样的现有工具虽然提供了坚实的行业标准基础,但它们 并非 专为 Ambiq的 特定芯片,也非针对Ambiq客户 实际部署的。 heliaCORE 是在 CMSIS-NN 的基础上构建的,而非取代它,既保留了工程师们熟悉的 API和文档,同时补充了通用工具所缺乏的Apollo专用调优和支持范围。

  • 每个新的 在 Ambiq 芯片上运行的边缘 AI 项目,此前都需要团队手动组装、集成和 优化 软件栈,通常需要数月时间才能开始实际的产品开发工作。 heliaCORE 提供了预集成且预优化的基础架构,因此团队可以 , ,而无需重新构建基础设施 他们 已经构建过的基础设施。

  • MLPerf Tiny 是业界公认的边缘 AI, 它测试了5个模型和总计80项操作。Ambiq已验证 heliaCORE 针对一套具有行业代表性的40余种模型和963个运营商实例, 约12 是行业基准测试运行量的X倍。这一差距反映了基准测试所涵盖的内容与实际产品能够运行的内容之间的差异。

  • 一款产品 仅针对 仅针对标准基准测试进行优化的产品,如果这些基准测试 未能 反映生产环境的复杂性,那么该产品在实际应用中仍可能表现不佳。 Ambiq的 内部性能分析发现,即使核心算子已得到充分优化,围绕主要计算的操作——如填充、激活、归约和重塑——在实际工作负载中仍会消耗大量处理时间。 heliaCORE 针对的是整个管道,而不仅仅是基准测试所衡量的部分。

  • heliaCORE 是基础,一个经过优化的内核层,其他所有组件都构建于此之上。 heliaRT 是运行时路径,利用AI技术进行设备端推理 heliaCORE 在底层支持,在设备上执行AI推理的运行时路径。 heliaAOT 是预编译路径,在代码发布前就将其效率固化其中——同样由 heliaCORE. 试想一下 heliaCORE 作为引擎,以及 heliaRT 以及 heliaAOT 作为两种 不同的方式 来驱动它。

  • 是的。 heliaCORE 既包括针对当前一代Apollo SoC的MVE加速,也包括针对上一代设备的DSP加速。两代产品均未被忽视。

  • 两者都有。 heliaCORE 该系统基于Arm的CMSIS-NN(一个开放的、符合行业标准的生态系统)构建,并完全保留了其API、文档和许可条款。Apollo特有的内核调优、扩展的操作符支持以及平台集成,都是Ambiq在此开放基础之上添加的功能。

  • heliaCORE 该服务现已向 Ambiq 的客户和合作伙伴开放。相关文档和访问方式可通过 Ambiq 的 GitHub 页面 以及在 www.ambiq.com/AI/heliaCORE

准备下载