当前位置:主页 > 聚焦 >

比cuML最高提速208倍,加州大学伯克利分校等开源经典ML加速库FlashLib

时间:2026-05-27 20:19:22

  消息,OneMillion_AI发文称,加州大学伯克利分校等发布的开源机器学习加速库FlashLib,覆盖15个高层算子,旨在为机器学习工作流与智能体场景提供高性能加速。基于Triton与Cutedsl,FlashLib在H200 GPU上针对KMeans、KNN等算子,较英伟达cuML 25.10实现最高208倍的峰值提速。在H200 GPU测试中,Flash-KMeans效率达到峰值FLOPS的61%,Flash-KNN则达到HBM显存带宽的85.2%。FlashLib在KMeans聚类中提速26倍,在KNN检索中提速19倍,在HDBSCAN聚类中提速40倍,并在TruncatedSVD分解中实现208倍的峰值加速。FlashLib还引入性能预测API,仅用约5微秒的CPU耗时即可精准估算工作流的运行时长与显存开销,已在GitHub开源。

热点推荐
1 新钱包存入63万美元USDC并开设290万美元

消息,某用户创建了一个新钱包,存入约63万美元的USDC,并以10倍杠杆开设了290万美元的XRP空单...

2 未知钱包转入1349枚BTC,价值约8123万美元

消息,据Whale Alert监测,未知钱包刚刚转入1,349枚BTC,按实时价格计算约合81,232,738美元。...

3 美国国税局发布加密资产没收通知,涉及

消息,吴说获悉,美国国税局刑事调查部门于6月26日发布官方没收通知,列出多笔已扣押并拟...

4 OpenAI账号与计费系统同步故障:ChatGPT网页

消息,OpenAI账号与计费系统出现同步故障,导致ChatGPT网页端服务等级混乱与API限流加剧。部分...

5 Anthropic:美国政府通知可重新部署Claude

消息,吴说获悉,Anthropic官方发文称,美国政府已通知公司,其最强网络安全模型Claude Mythos...

6 Binance Charity向委内瑞拉地震受灾地区捐赠

消息,据Binance官方博客称,受6月25日委内瑞拉北部连续地震影响,Binance Charity将向受灾地区用...

7 Bithumb被罚210亿韩元,SBI收购Bitbank

消息,韩国监管机构对Bithumb处以210亿韩元的罚款,原因是其在用户数据转移中未获得单独同意...

8 加密市场崩盘:24小时内清算895万美元

消息,本周加密市场崩盘,导致约895万美元的资金被清算,比特币价格跌破6万美元,市场总市...

9 OpenAI考虑最早于2027年进行IPO

OpenAI的目标是在今年秋季上市,而Anthropic正在考虑最早于10月进行IPO。知情人士表示,近期科技...

10 XBIT DEX:乌拉圭vs西班牙预测票焦点比赛

消息,XBIT DEX发文称,预测票焦点比赛奖金池为10,000美元,乌拉圭对阵西班牙。市场赔率显示,...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。