当前位置:主页 > 快讯 >

“AI”之眼,一场视觉智能的进化 2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列

时间:2025-08-06 19:34:06

  WAIC 世界人工智能大会展会上熙熙攘攘,格灵深瞳CEO吴一洲发现会场比往年更热闹,现场的人和产品的画像更丰富,而且许多大公司展现出的AI单点应用深度也让人印象深刻。AI应用真正走进产业的脉络更为清晰了。

  在2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列的直播中,吴一洲与联合创始人刘湘明聚焦视觉智能的进化和AI技术升级下的技术厂商展开对话。

  格灵深瞳一直深耕视觉算法和多模态大模型技术研发,经历过上一个技术时代的技术企业在这一波智能浪潮中有明显不同的感受——产品有了“成长性”。吴一洲在对话中反复强调的一点是:要让产品能用起来、用得好,而且有持续性的成长性。这不仅是格灵深瞳对产品的要求,也是作为技术厂商与客户共创的愿景。

  “以前,我们会给客户一个通用工具,现在有了智能体Agent之后,变成了个性化、有记忆的工具,相当于一个搭档、一个执行合伙人,应用上更细化、更成熟了。”吴一洲介绍说,经过近几年的演进,格灵深瞳构建了由模型、算法、软硬一体的产品和服务形成的端到端的体系。不过,她仍然非常理性,认为当前AI距离真正的落地应用、在行业里跟专家超融合一样去深化应用,还有一段距离,这是在不断与客户共创的过程中得出的越发清晰的认知。

  AI应用尚不成熟的局面,也给产品解决方案提供商带来一个挑战:过去按许可证付费的逻辑,今天演变成了为效果、性能付费等等有待明确的标准。

  “现在收费标准确实非常离散。现在主要面临三重困境:一是定价标准缺失,服务价值缺乏行业基准;二是商业模式模糊,介于基础设施、技术服务、产品工具以及咨询服务之和;三是双向预期偏差,客户对效果认知不统一,供应商服务成熟度待验证。这个问题本质是产业成熟度问题,需经历服务定价的帕累托优化过程。”吴一洲坦言,这是供需双方对最终把工具实际用起来、并且是可持续用起来,要付出的时间和成本预期能不能一致的认知问题。

  AI时代变化不定,吴一洲更相信掌握技术的自主权,同时也保持与生态合作、互助互利的开放态度,在既有的金融、泛安防、政务、体育四大优势领域继续深耕。“硬件、数据采集以及持续优化、认知、服务、大规模部署、大规模算法升级、大规模调试的难点……”吴一洲坦言,“坑”其实是数不尽的,而且面向不同客户、不同场景的“坑”其实不太一样,“我们积累的经验是在一些特定的行业、场景里深耕下去,尽量跟客户一起少踩一些‘坑’,但其实没有捷径可走。”

  05:55 在赛道中跑出身位优势的关键

  09:13 那些年踩过的“坑”

  21:42 如何让能力基础不同的客户都跑起来?

  28:34 市场、技术、客户不断变化,战略重点如何调整?

  31:39 技术要自主,但界限在哪里?

  34:25 收费、交付的挑战如何解决?

  第一个感受还是火爆,而且是多方位的。以前是深度参与AI产业的人关注这个大会,现在有各种年龄、各种职业、各种产业里的人都涌向了这个大会。大家都在观察有没有新的事物、新的应用、新的思想。

  第二,明显感觉产品越来越丰富,更具象化了。从单纯关注模型、智能体,到现在我们看到了具身智能、企业级应用、个人助理,以及端到端的产品,能感觉出来大家在AI的这片土壤里长出了很多新鲜的事物,也给我们带来了很多的新想法。

  我观察了一些大厂的成果,像头部科技企业展台突破单纯AI模型展示,深度融合云计算与大数据时代的技术积淀。其中蚂蚁集团呈现的业务视角下的AI应用实践,为行业深度集成提供了一些重要参考。国家电网展区是展示AI与核心业务的深度融合范例,其在分拣机器人等硬件设备中实现原生级创新,印证“专家型转型”理念---即AI系统需与行业专家形成智能规划与决策层面的深度协同。此外,消费级AI硬件展区直观呈现大模型技术的生活化应用路径,具有普适性示范价值。

  我们只能说在某一些具体的场景下是有优势的,直白地说,现在谈优势还为时尚早。

  我们是视觉、小模型CV算法起家,从2019年开始布局大模型,尤其是视觉大模型基座,这两年我们也推出了自己的Glint-MVT视觉基础模型。可以看到,我们其实一直在坚持布局AI视觉这部分,我们认为这是多模态以及人工智能应用中不可分割的一部分。AI不只有语言的部分,还有感知的部分,而且感知部分占比还是很高的。

  在坚持这样一个主赛道的情况下,我们做了很多产品,我觉得真正在场景中有优势,还是要让产品能用起来、用得好,而且持续性的有成长性。原来工具类的产品每一次升级是靠新版本发布,但AI自身有一种迭代能力,不是单纯靠外界编程的。

  在小模型时代,我们的迭代力是不够的。现在我们替换了自己的大模型、以及很多生态合作伙伴一起拥抱了大模型基座之后,明显能感受到冷启动的能力,以及自身每一次发布新版基座模型的时候,上面的算法本质上有了一次新的演变,我们能感觉到它自己有成长性了,就像一个孩子一样生长的力量。

  可能谈得上一些优势的地方,是我们对于工程化、成本,以及过程中踩过的“坑”、怎么规避踩“坑”,还有对团队的配置、对事物的理解,我觉得是有经验的。

  我们也构建了模型、算法、软硬一体的产品、服务这么一套端到端的体系。但是离真正的深化应用、在行业里跟专家超融合一样去深化应用,我觉得还是有一点进程的。

  抽象提炼来说,有以下几点。

  第一,硬件,在各种 GPU 上适配,是一个大家都面临痛苦的点。第二,数据采集以及持续优化,不同的人标注能力不一样,出来的结果不一样。第三,认知,以前人们可能期待短期内达到测试结果,现在大家更关注如何系统性构建AI应用的体系,这个过程之中可能也会诞生新的“坑”,但至少大家对短期测试效果的追逐更理性了一些。第四,服务。以前信息化建设过程中,服务的“坑”是安装部署实施,但现在的服务,更多的是专家跟客户一起共同解决问题、共同成长,这个挺难的。而且,对于这样一个服务的付费价格的认知也是不太一致的,客户可能认为这是一个单纯的售后服务,但其实不是,这样的服务是决定产品能不能用好的最关键的点。

  当然,我们还面临大规模部署、大规模算法升级、大规模调试的难点……“坑”其实是数不尽的,而且不同客户、不同场景的“坑”其实不太一样。我们积累的经验是在一些特定的行业、场景里深耕下去,尽量跟客户一起少踩一些“坑”,但其实没有捷径可走。

  最大的变化其实还不在于我们自身,客户的变化是最大的。这两年,客户对全面拥抱AI的热忱是非常高昂的,带来了很多畅想。

  我们跟以前的自己相比,对待新事物更有耐心了。赛道上、行业上没有大的变化,更多是从底座开始,在行业里去深化和多元化技术——从基础的模型到硬件,如何更好地嵌入到客户的业务流程使用中,如何让客户的个体化的使用感更强。以前,我们会给客户一个通用工具,现在有了智能体Agent之后,工具变成了个性化、有记忆的,相当于一个搭档、一个执行合伙人,应用上更细化、更成熟了。

  第二个比较大的变化,我们以视觉起家,在拥抱当前非常明确的多模态趋势时,也做了很多调整:第一,我们要吸纳更多人才进来,现在的年轻人对大模型、智能体的接受程度、拥抱程度、热忱是非常高的。我们的团队在更加年轻化,我们也鼓励大家抱有充分开放的心态,热忱地拥抱各种各样的技术,核心还是得尝试。另外,对于我们做底层的同事们来说,他们一定要站在这个浪潮里面,当弄潮儿,不能过早地去评判。

  所以,格灵深瞳既保持了在行业以及应用体系的稳定性和执着,同时也是更加开放。从人才、视觉技术、生态多维度,越来越广泛,这两年都是在以交朋友为主,建立朋友圈,也充分参与别人的朋友圈,充分地打开我们的开放性。

  第一大场景还是在金融;接下来还有泛安防,也是我们始终会坚持的场景;第三,政务场景,尤其是涉及到高安全领域的政务场景,我们会做较细的深耕;我们还一直在体育训练赛道持续地发布产品,保留在To C领域的触达。

  金融客户对AI技术非常热忱,他们应该是较早系统性布局数据中心基础设施,并在风控、营销及安保等核心场景持续投入资源开展技术验证的。当前大模型时代的关键转变在于:客户不再局限单一流程优化,而是提出更深层的跨领域融合需求。

  例如,安保分析数据自然赋能风控决策体系,这种协同效应突破了传统信息化孤岛模式。其本质变革源于底层技术架构的统一化:基于大模型与智能体构建的公共基座,使原本分散的部门数据资产在应用层面实现无缝贯通。相较于大数据时代依赖人工连接“烟囱系统”的刻意整合,新范式通过统一技术基座促成业务部门视角转换——从关注系统建设归属转向聚焦使用价值,最终形成更自然的跨域协同机制。

  基础不一致,可以用不同的方式解决。对于基础非常好的客户,比如金融银行或者安防行业,很多时候客户给我们带来的启发更大,因为我们陪伴客户很多年了,会完全从客户的业务视角、从规划到落地的视角来去思考。很多时候,客户已经开始跟我们讨论更深层次的智能孪生、智能迭代的问题,比如,如何让采集行为本身具备智能,从采集到分析、决策支持整个闭环过程具备智能,带着规划演进、迭代升级。

  但是,对于一些数字化基础较弱的行业或者客户,好处是他们可以跳过很多不必要的迭代过程,直接进入智能时代。

  但核心还是认知问题,对于最终把工具实际用起来,并且是可持续用起来,要付出的时间跟成本是什么样子?本质在于大家对这个问题的预期能不能一致。

  针对前瞻型客户采用共创研发模式,将咨询环节纳入研发体系,重点突破行为数据与因果关系的采集瓶颈;面向入门级客户则提供直效型标准化产品,通过最小化使用成本建立初步价值认知,分阶段实现“可用→好用”的体验演进。这种策略既满足深度定制需求,也保障技术普惠可行性。

  有几个比较关键的要素。第一,技术跟进一定要牢牢地掌握在自己手里。所有技术的深入都是一块硬骨头,不管是我们自己的Glint- MVT视觉基础模型,还是未来要发布的多模态大模型。很多人也在问我,为什么已经有很多多模态大模型的情况下你们还要做一个?首先,这个模型肯定是有格灵深瞳的特点,比如在分析、垂直细分的工具、模型的精炼上一定是有我们自己特点的;第二,要跟进这个开放的时代,要知道怎么用、怎么去解决问题。“改一改就用了”跟“深入地自己完整走一遍这个过程”,带来的认知是不一样的,我们会走得非常扎实。相关工具也会慢慢多元化起来,而且我们会全面地开放给客户、开放给生态,互利互助。

  第二,在前面提到的四个行业,已经足够我们端到端深耕了。把任何一个行业做好,都是非常非常难的。在我设想中,再过几年,在格灵深瞳的前端行业里,可能行业专家本身所占的比例会大幅度提升,并不是单纯使用AI能力的专家。不过,距离我们跟客户在行业里真正感知和用好技术,我觉得还有一段时间。

  现在格局已经越来越明显了,决策框架基于三要素评估:资金规模、人才储备、时间成本。其实我们做视觉大模型也是跟大厂充分建立生态、互利互助的;第二,我们把自己最擅长的技术拿出来给大家用,比如今年下半年计划发布的视觉基础模型Glint- MVT的新版本,在分析处理和理解上比较好,因为我们在领域是要扎深的,这是主线;其他的,我觉得都是要靠生态,因为现在进入到深水区,每一件事情所要付出的成本以及实现难度都超乎想象。

  现在收费标准确实非常离散。现在主要面临三重困境:一是定价标准缺失,服务价值缺乏行业基准;二是商业模式模糊,介于基础设施服务与咨询公司形态之和;三是双向预期偏差,客户对效果认知不统一,供应商服务成熟度待验证。这个问题本质是产业成熟度问题,需经历服务定价的帕累托优化过程。

  关键痛点集中于两大维度:一是人才瓶颈维度,缺乏兼具决策能力与落地经验的复合型人才,理想状态是业务专家与AI专家的“双重属性融合”体现在同一个人身上;二是目标管理维度,对AI的预期目标多元且时效要求高,但落地过程中受到成本约束等因素影响,容易导致实际效果的波动,所以需要更聚焦、更纯粹地理解和解决项目的本质问题。根本解决方案在于培育AI原生思维,使技术应用成为业务决策的本能组成部分。

  
 

热点推荐
1 Base App全面开放首日新增用户超1.2万,创

消息,12 月 19 日,据 @defioasis 数据面板,12 月 18 日,Base 宣布全面开放 Base app,当日共有超过...

2 尽管有所回调,BNB 仍保持第四的位置,交

尽管 BNB 日内下跌 2.55% 至 837 美元左右,但其市值仍保持在不包括稳定币在内的加密货币第四位...

3 Eugene:大部分山寨已进下跌尾声,主流币

消息,12 月 19 日,交易员 Eugene Ng Ah Sio 在个人频道发文表示,其个人成功躲过了过去一个月的...

4 Ark Invest 昨日增持约 415 万美元 Coinbase 股

消息,12 月 19 日,据 Ark Invest Daily 数据显示,Cathie Wood 旗下 Ark Invest 于昨日共增持 17386 股 C...

5 国务院:加强分析研判虚拟货币交易涉烟

12月19日消息,国务院办公厅日前印发《关于全链条打击涉烟违法活动的意见》,其中指出:加...

6 去中心化健康网络DNAi于12月19日启动TGE,

消息,12 月 19 日,去中心化健康经济网络 DNAi 宣布于 12 月 19 日 00:00开放官网注册。消息,$...

7 分析 Curve DAO 的价格走势,CRV 正寻求再次

尽管 Curve DAO 代币 的价格在 24 小时内下跌了 2.63%,过去一周下跌了 9.9%,但其未平仓合约量却...

8 金融巨头与ADI基金会合作,共同制定机构

贝莱德、万事达卡和富兰克林邓普顿已与ADI基金会合作,将机构级区块链解决方案整合到全球...

9 Solana 开发人员测试抗量子密码技术,为未

随着量子计算逐渐成为一种切实存在的长期威胁,Solana 基金会已开始与安全公司 Project Eleven...

10 以太坊价格再创新高,分析师目标价位达

分析师 Javon Marks 指出,以太坊目前呈现出隐藏的看涨背离,目标价位可能在 8,557 美元附近。除...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。