消息,智谱发文复盘GLM-5系列模型在coding agent场景下出现乱码、复读和生僻字的问题。自3月起,用户反馈异常仅在高并发、长上下文任务中触发。智谱称其推理系统每天承受数亿次coding agent调用。经过排查,团队定位到两个独立的竞态bug。第一个bug出在pd分离架构,解码侧超时中止请求后回收kv cache,但预填充侧的rdma写入未结束,新请求覆盖旧数据。修复方法是在回收前加显式同步,异常率从万分之十几降至万分之三以下。第二个bug出在hicache,加载和计算两条流水线缺少同步点,计算侧可能在数据未加载完毕时读取。修复后异常完全消失,补丁已提交sglang社区。团队还发现,投机采样的接受率指标可作为异常检测信号,乱码时草稿token几乎全被拒绝,复读时接受率偏高。
消息,Kast公司宣布任命前美国证券交易委员会高级顾问Stephanie Allen为政策与沟通负责人,以支...
2 深交所本周对10起上市公司重大事项进行消息,深交所公告,本周共对207起证券异常交易行为采取了自律监管措施,涉及盘中拉抬打压...
3 千问开源Qwen消息,千问团队开源的Qwen-Scope是一套针对Qwen3和Qwen3.5系列训练的可解释性模块。该模块通过在...
4 智谱复盘GLM消息,智谱发文复盘GLM-5系列模型在coding agent场景下出现乱码、复读和生僻字的问题。自3月起...
5 WLFI社区投票锁定620亿代币,价格下跌15消息,WLFI代币在过去24小时内下跌约15%,原因是社区正在就一项锁定超过620亿代币的治理提案...
6 路透调查:油价冲击亚洲货币,印尼盾空消息,据路透社调查,由于油价剧烈波动对亚洲货币构成压力,加剧了市场对通胀、对外收支...
7 某巨鲸止盈1170万美元规模ETH空单,平仓价消息,某巨鲸在hyperliquid平仓1170万美元规模的ETH空单,平仓均价为2249美元,录得盈利约24.6万美...
8 开源编辑器Zed发布1.0:放弃Electron,用R消息,开源编辑器Zed宣布发布1.0版本,放弃Electron,采用Rust和GPU渲染从零重写。Zed由ATOM编辑器...
9 美联储维持利率不变,政治施压降息计划消息,美联储在最新会议上决定将利率维持在3.50%-3.75%不变,延续其观望策略。研究主管Matth...
10 新创建钱包在过去24小时内收到312枚比特过去24小时内,两个新创建的钱包共收到312枚比特币,按当前价格计算,价值约2362万美元。...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。