当前位置:主页 > 聚焦 >

比cuML最高提速208倍,加州大学伯克利分校等开源经典ML加速库FlashLib

时间:2026-05-27 20:19:22

  消息,OneMillion_AI发文称,加州大学伯克利分校等发布的开源机器学习加速库FlashLib,覆盖15个高层算子,旨在为机器学习工作流与智能体场景提供高性能加速。基于Triton与Cutedsl,FlashLib在H200 GPU上针对KMeans、KNN等算子,较英伟达cuML 25.10实现最高208倍的峰值提速。在H200 GPU测试中,Flash-KMeans效率达到峰值FLOPS的61%,Flash-KNN则达到HBM显存带宽的85.2%。FlashLib在KMeans聚类中提速26倍,在KNN检索中提速19倍,在HDBSCAN聚类中提速40倍,并在TruncatedSVD分解中实现208倍的峰值加速。FlashLib还引入性能预测API,仅用约5微秒的CPU耗时即可精准估算工作流的运行时长与显存开销,已在GitHub开源。

热点推荐
1 与a16z关联的钱包提取12,780枚ETH,价值约

与风险投资公司a16z关联的钱包刚刚提取了12,780枚ETH,按当前价格计算,价值约2122万美元。...

2 AAVE V4存款突破2亿美元新高,贷款接近6

消息,据数据,AAVE V4的存款创下超过2亿美元的新高,贷款总额接近6000万美元。超过2/3的存款...

3 分析师:以太坊基金会裁员20%领导层动荡

消息,以太坊基金会宣布裁减约20%的员工,削减54个职位,作为广泛重组的一部分。此次裁员是...

4 鲁比尼推出由Atlas America Fund支持的代币化

鲁比尼推出名为USAFi的数字代币,该代币由其管理的Atlas America Fund支持。Atlas America Fund规模约为...

5 Kalshi将印度纳入限制地区名单

消息,Kalshi已将印度纳入其55个限制地区名单,几个月前印度当局曾警告VPN。根据更新的成员协...

6 Tanya Denisova加入Agora担任运营主管

前Robinhood Crypto首席运营官Tanya Denisova加入稳定币公司Agora担任运营主管,并将在美国货币监理署...

7 Bitget推出Ondo股票代币至rToken股票现货补贴

消息,Bitget宣布推出Ondo股票代币至rToken股票现货补贴置换服务,旨在优化股票资产交易体验。...

8 分析师:比特币价格重测70000美元的强信

消息,比特币价格在分析师预测重测70000美元的强信号下,保持在其长期支撑位之上,给交易者...

9 美联储主席Warsh将于7月14日国会作证

消息,美国众议院金融服务委员会发布的听证通知显示,美联储主席Kevin Warsh将于7月14日美东时...

10 Binance将于6月29日上线MVLL、TQQQ和SQQQ永续合

消息,Binance Futures将于6月29日上线MVLL/USDT、TQQQ/USDT和SQQQ/USDT美元本位TradFi永续合约,标的分别...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。