昨天ARM发布了全新的Cortex-A78、Cortex-X1 CPU和全新的Mali-G78 GPU。同时,我们还看到了最新Ethos-N78 NPU。在过去的几年里,机器学习加速器在行业内的爆发式增长,不同的IP解决方案层出不穷。尤其是在移动领域,有大量不同的SoC厂商自主开发的定制解决方案,其中包括高通、海思、联发科和三星LSI等厂商的设计。对于没有设计能力的厂商来说,如果没有自己的IP部署能力,还可以从ARM这样的IP厂商那里获得授权。
N78性能和效率上都有相当大的提升。新的设计比最大的N77配置要高得多,现在能够在高达10TOPs的原始计算吞吐量下提供2倍的峰值性能。ARM对NPU的设计进行了改进,采用各种新的压缩技术,每条推理的外部内存带宽提高了40%,从而提高了N78的功耗效率。N78的强项是该IP在不同配置选项中的性能扩展能力。该IP有4个不同的性能点,或者说是4种不同的引擎配置,从最小的1TOPs配置,到2、5,再到最大的10TOPs配置。这对应的是512、1024、2048和4096个单元的MAC配置整体设。
在架构上,N78最大的改进在于它在引擎中处理数据的方式,使得新的压缩方式,不仅可以对NPU之外的数据进行全新压缩,提升DRAM带宽,还可以对NPU本身内部的数据进行移动,提高了性能和功耗效率。得益于更高的性能密度和功率效率,代代性能提升平均为25%,再加上双倍的峰值性能配置,意味着它有可能代表着终端设性能大幅提升。
分析NPU在竞争格局中的表现如何是相当困难的,尤其是在ARM的情况下,因为我们还没有看到第一代NPU的硅片设计。ARM提出的一个有趣的观点是,在这个领域,软件比其他任何东西都重要,一个糟糕的软件栈可能会毁掉一个好的硬件设计。ARM提到,他们已经看到有厂商采用了自己的Ethos IP,并因此放弃了竞争对手的设计。ARM表示,他们在软件方面投入了大量的资源,以方便客户真正正确地利用他们的硬件设计。
ARM公司的新Ethos-N78已经被授权给客户,他们正在用它进行设计,最早一批产品将在2021年华出现在面前。
消息,腾讯混元宣布开源手机端离线种语言的翻译大模型压缩至440MB,无需联网,用户下载后即...
2 香港金融管理局警告:HKDAP和HSBC代币未获消息,香港金融管理局警告称,使用HKDAP和HSBC标识的代币并未由获得许可的稳定币发行方发行...
3 世界黄金协会:一季度全球实物黄金ETF维消息,世界黄金协会发布的2026年一季度《全球黄金需求趋势报告》显示,一季度全球实物黄金...
4 Tether CEO:未来将需要数万亿日常支付消息,Tether首席执行官Paolo Ardoino表示,未来将需要数万亿的日常支付,涉及数十亿人和AI代理...
5 韩国国税厅将于明年1月正式实施虚拟资产韩国国税厅已正式着手虚拟资产课税准备工作,目标是明年1月起正式施行。国税厅正在确保交...
6 f2pool:莱特币网络因无效交易出现临时链消息,据f2pool官方消息,莱特币网络于2026年4月25日因涉及无效mweb交易而出现异常活动,并导致...
7 阿联酋宣布退出OPEC,油价受影响消息,阿联酋宣布将于2026年5月1日退出OPEC,这一决定被认为是油气卡特尔数十年来遭受的重大...
8 0x6048...d1d3:BTC午间急拉收割某高杠杆巨鲸消息,BTC今晨持续反弹,午间再度拉涨,短时触及7.74万美元。过去10分钟内,Hyperliquid平台上某...
9 Bitget新增奥克洛OKLO、科磊KLAC等热门股票消息,Bitget宣布新增奥克洛、科磊等热门股票合约,最高支持20倍杠杆。为满足市场对美股AI基...
10 阶跃Step Image Edit 2上线:3.5B参数打赢12B消息,阶跃星辰发布新一代轻量级图像生成编辑模型Step Image Edit 2,参数量仅3.5B,在实测中超...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。