您的位置 首页 科技

对话百川智能王小川:争取2027年上市 我们账上趴着30亿 完全足够烧

雷递网 雷建平 1月13日百川智能今日正式开源新一代医疗大模型Baichuan-M3,称在医疗领域实现了对GPT-5.2的全面超越。

雷递网 雷建平 1月13日

百川智能今日正式开源新一代医疗大模型Baichuan-M3,称在医疗领域实现了对GPT-5.2的全面超越。

对话百川智能王小川:争取2027年上市 我们账上趴着30亿 完全足够烧

百川智能称,M3还首次具备原生的“端到端”严肃问诊能力,能像医生一样主动追问、逐层逼近,把关键病史和风险信号问出来,进而在完整的信息上进行深度医学推理。评测显示,其问诊能力高于真人医生的平均水平。

百川智能CEO王小川在发布会现场表示,百川智能2025年最大的变化是组织管理专注医疗,发布M2和M2Plus,把基础的医疗增强概念稳固,把循证概念树立起来,除了推理能力以外就是循证和会问诊,2025年做了很多积累。百川智能在肿瘤领域也开了一条线,就是把最难的医学皇冠明珠做好,这就是模型本身的进步。

“百川智能账上还有30亿现金,现在以药厂的身份和医院合作,把我们的产品当做药物验证安全性和临床性,都会有Clinical Trial。”

当有媒体称,百川智能这种做法会导致资金不够烧的时候,王小川说,要看是什么标准。百川智能的患者的Companion,可能一款药十年十亿美金,成功率10%,那肯定不够烧,但美国FDA正在鼓励一个Digital Companion指导用药,药校就会提升。

展开全文

“一款老药的有效性是70%,通过算法可以提到75%,相当于发明一款新药,既不需要十年十亿美金也不会成功率只有10%,就是范式变化带来的结果。我们就是药物伴随,Follow-up。”

百川智能争取2027年上市

作为大模型6小龙之一,智谱AI和Minimax相继上市,月之暗面刚刚宣布融资5亿美元,百川智能走了一个不一样的路径,那就是专注于医疗AI领域。

王小川认为,当下,通用大模型企业的市值和商业化能力并不匹配。AI医疗是大模型竞争中很重要的力量,今天的技术范式,有自身的位置 ,AI医疗需要晚一些,也会走到上市的路径。

“今天上市的这两家企业,我觉得是踩在了通用模型的技术红利和国家科技强国的基础上的。这方向我觉得没有问题,只是市值和他们的商业化能力并不匹配。”

王小川认为,AI医疗也会是国际竞争中很重要的一股力量,百川智能希望构建这样一个商业模型,公司在商业路线和产品层面在持续推进,在上市层面,2027年会有动作。

模型可以像医生一样提问

王小川指出,AI的爆发可以造出高质量的医生水平。大家可能2023年还不太信,但2025年就开始有感觉了,所以医疗是大模型皇冠上的明珠,是很重要的场景,大模型的医疗能力一定要超过医生本身的水平。

但医疗场景存在特殊性,患者往往无法完整表述症状,而现有模型缺乏主动问诊能力。当下,AI在医疗中的定位是辅助而非替代。

当前医疗行业有4大痛点:

1,优质医生供给不足:AI的爆发有望填补这一缺口。2023年时市场对AI医疗还持怀疑态度,但到2025年已开始显现价值。

2,医患不平等:患者往往缺乏决策权和知情权,就医体验差。AI应扮演桥梁角色,帮助患者更清晰地理解病情和医生建议,而非简单取代医生。

3,基层医疗薄弱:AI赋能居家和社区医疗,有望改变“倒三角”的就医模式,推动“强基层”战略。

4,医学知识壁垒:AI可整合多学科知识,辅助医生进行MDT会诊,并利用真实世界数据推动医学研究。

据悉,从OpenAI发布医疗产品ChatGPT Health,到Anthropic推出 Claude for Healthcare,AI医疗正在提档加速,竞争也进入深水区。

百川智能也在持续突破低幻觉率、端到端问诊和复杂临床推理等核心能力,旗下医疗应用“百小应”已接入M3,面向医生与患者开放相关能力。

医生可借助它推演问诊与诊疗思路,患者及家属也可通过该应用更系统地理解诊断、治疗、检查与预后背后的医学逻辑。

构建「严肃问诊」新能力,端到端问诊超越真人医生

幻觉是这一代大模型技术范式的通病,也是AI进入严肃医疗的拦路虎。在大多数场景幻觉只是体验问题,而在严肃医疗场景可导致安全事件。

百川M3将医疗幻觉抑制前移至模型训练阶段,在强化学习过程中将医学事实一致性作为核心训练目标之一,将“知之为知之,不知为不知”直接作用于模型自身能力的形成过程。这一新的训练方法将医学事实可靠性内化为M3自身的基础能力,使其在不借助任何外部系统的情况下,依然能够基于自身医学知识进行稳定、可信的作答。

除了强推理和低幻觉,端到端的问诊能力是百川智能本次M3最重要的一项突破。2025年行业的技术共识是,用户提供更完整的上下文,模型才有更好的表现。可在医疗领域,患者很难完整表达自己的病症,需要模型像医生一样有能力把患者的混乱叙述转变成可做诊疗决策的信息。

常见的“角色扮演”的问诊方式,无法将“红旗征识别与处置”作为核心行动原则。这种不围绕关键风险点展开的信息收集,即便对话看似完整,也难以支撑安全、可靠的临床判断,从根本上偏离了医疗“安全第一”的原则。

针对这一行业困境,百川智能提出了“严肃问诊范式”与“SCAN原则”,通过Safety Stratification(安全分层)、Clarity Matters(信息澄清)、Association & Inquiry(关联追问)与Normative Protocol(规范化输出),将临床问诊中高度依赖经验的思维过程,第一次系统性地“白盒化”。

围绕SCAN原则,百川智能借鉴医学教育里长期使用的 OSCE 方法,联合 150 多位一线医生,搭建了 SCAN-bench 评测体系,该体系以真实临床经验作为“标准答案”,将诊疗过程拆解为病史采集、辅助检查、精准诊断三大阶段,通过动态、多轮的方式进行考核,完整模拟医生从接诊到确诊的全过程。相比于HealthBench,SCAN-bench是更加全流程端到端的动态评测新范式。

百川智能称,使用原生模型训练方法取代角色扮演prompt,针对GRPO无法稳定进行长对话训练的问题,设计了新的 SPAR 算法,使模型能够在有限对话轮次中,把临床真正需要的关键问题问全、问准,把风险兜住,让输出经得起复核。

以下是王小川主要讲话内容:

王小川:百川是2023年开始做大模型的,主要聚焦于医疗,当时也受到行业很多人的质疑,今天有幸邀请到大家一起讨论和分享。

基本概念就是2023年“从语言变成数学”,之前一直在做语言AI,但都是假的,我们2023年第一次认识到这是一种巨大的变革,当时行业也有一些不同的声音,就是AI到底有没有到来?

我们很清楚地知道来了,因为当时下场的时候有一封公开信,当时就在说“语言变成数学了,ChatGPT发布是为以后生命数学助力”,所以当时就想做生命模型。现在医疗已经进入主线,AI真的来了,DeepSeek让大家开始看到医疗行业有所震动。2024年跟医生谈AI的话大家都不信,而在2025年大家看到DeepSeek真的比百度靠谱很多。

年末的时候阿福发布,投了10亿来砸广告,就是从技术端到应用端都有了自己的力量。今年1月8日又开始出现OpenAI Health,功能正式上线,Claude也发布了自己的两个技术能力:一个是医疗计算,一个是Agent。

两个巨头都开始进入医疗,所以从市场的判断来看,医疗作为AI皇冠上的明珠这样的高级阶段已经开始进入应用范畴,之前做的更多的是代码,现在大家都在做医疗,所以需要聚焦和深耕。我们现在没有能力开拓多条战线,所以选择只做医疗这一件事情。

回顾一下去年的工作:我们之前就在进入儿童医院全科医疗,肿瘤医院也有各方面的合作,到今天都有肿瘤医院跟我们联合办公。去年8月发布的M2作为百川重新聚焦医疗之后的主力模型,也在行业得到很多好评。典型现象就是蚂蚁开始疯狂挖人,从技术人员到财务人员,所以属于小圈子认可技术路线图,直到M2Plus就是把循证带入进去,从推理模型到了循证模型,今年1月发布M3也是继承了之前的能力。

行业其实也有各种各样的误解,觉得AI+医疗会是什么东西?去年8月发布的时候,我们是在开源模型做到第一,但在所有模型中排名第二,落后于GPT-5,现在GPT-5已经演变到了GPT-5.2。HealthBench就是OpenAI自己发布的榜单,评价医疗临床能力,去年我们已经超过所有开源模型,包括OpenAI的两个开源模型,能够做到第一的水平。

除了幻觉和推理能力以外,大模型行业就是上下文给得越完整,输出就会越完整,幻觉也会越减少,所以要把上下文描述清楚。

但在医疗行业,患者往往是没法完整表达自己的,只是知道浅显的症状,所以就要去问医生,通过问诊把过去的病情发展问清楚。有了足够的数据以后,才能做好后面的决策、检测、诊断和结论。今天的大模型并不具有这样的能力,虽然GPT的HealthBench也会追问几个信息,并不是完整收集数据给出正确答案。因此在这种环境中,处理需要模型的推理能力减少幻觉以外,还要增加提问能力,为了给出好答案充分收集数据。

医疗行业存在这样几个痛点:

好医生不够。上一代的好大夫是通过互联网连接的方法解决,供给是充分的,而在医疗行业供给不足,因此互联网时代解决不了医疗这样的痛点问题,AI的爆发可以造出高质量的医生水平。大家可能2023年还不太信这个东西,但2025年就开始有感觉了,所以医疗是大模型皇冠上的明珠,是很重要的场景,大模型的医疗能力一定要超过医生本身的水平。

医患不平等。医疗是少有的受益和决策分离的行业,患者是受益方,决策方是医生。年轻人可能偶尔也有经历过不好的就医体验,年纪大病重的话就更麻烦了,可能排队三个小时。

医生讲得模模糊糊,听不太明白,不知道怎么选择,做手术的话医生就免责了,作为受益方很难获得良好的建议和决策权。

我们认为AI可以在其中填补医患之间的Gap,不是说医生什么都不干了,检查、手术、挂水都是医生干的事情,但我们希望让患者明明白白地看医生,对于自己的健康更多地了解,能够把医生讲的东西看得更明白。之前谈得比较少,要么就是AI取代医生,要么就是AI帮助医生,但更重要的是医患权力的让渡,医生把权力逐步让渡给患者。

其实医生都挺恐慌,私下都在嘀咕觉得AI能力超过了自己。医疗虽然复杂,但依然有机会让患者看懂。法律就够复杂的了,需要专业的律师、法官或者检察官来做,但在美国,判决有罪没罪可以是普通人来做,就是普通民众用常识判断到底有罪没罪,把法律的专业问题转化为普通人能够做决策的问题。

AI医疗会解决权力让渡的问题

我们认为AI医疗的发生既不会动医生的蛋糕,也不会让患者产生焦虑,解决权力让渡的问题,这是必然的趋势。

医生可能给出两个方案,一个保守,一个激进,或者三个医生每个方案都不一样,应该选择哪个?我们的医生足够强,能够补充各种信息,把解释做好。要是稍微浪漫一点,在印刷术发明以前,圣经只掌握在教会手里,他们解释上帝是什么,印刷术发明以后,每个人都能够拿到圣经,理解自己的信仰,也会去教会参加活动,自己为自己的信仰做主,所以患者和医生的关系在这个时代会发生变化。

中国和美国有个区别,美国有家庭医生计划,大多数人都有自己的全科大夫,小病小问题找他们,有了大病再转到专科,所以医疗行为都是发生在基层,中国人都愿意去三甲医院找最好的医生,国家不停地呼吁基层首诊,就是强基层,把基层的费用报销做得更多,医生、患者都愿意去大医院,医疗负担就会变得很重。

今后一个大的趋势就是场景发生变化,今天的苗头是大家拥有AI以后更不去基层了,小毛病自己就看了,所以强基层包括的不只是社区医院,居家也会成为自己医疗活动的阵地,有问题能够居家跟AI相应地对话和诊断,通过居家环境改变中国三级诊疗的能力。

我们总是觉得我们不懂,医生懂,其实医生有的时候也不懂,每个科室的医生都是知道局部的信息,复杂问题需要跨科室会诊。今天我们是AI for Science,以前的蛋白质解码、虚拟细胞、临床数字孪生,可以更好地建立人的模型。现在我们已经有能力更多地搜集患者的真实数据,以前就是入院即入组,进入医院以后可能进入某个科研队列,有了AI帮助以后能够做到看病即入组,更有机会做好生命模型。

百川就是促进科研、医患沟通、居家诊疗健康,把这些场景作为我们的考量。以前大家觉得大模型幻觉多,没法像医生那样提问,今天这种问题已经可以解决,模型可以像医生一样提问。

Baichuan-M3今年上半年就会帮助做出更好的医疗决策,不仅是医生,可能也会帮助患者做出决策,这就是我们想推动的事情,能够有医生陪着你,时时刻刻照顾你。

以下是交流核心环节:

提问:百川智能为什么想做医疗?

王小川:生命本身就很有意思,规律已经很显著了。原来我是学计算机的,研究的是高强度计算,搞的是天气预报,但我觉得天气预报太不靠谱了,有一点变化结果就会不同。老板问我,那你想干什么?我说就搞人类基因组计划吧。真的是从2000年开始搞基因拼接算法,发现这个比天气预报还天气预报,更复杂更混沌,但结论又更清楚。一个细胞有细胞膜、细胞核,十个月以后受精卵就会变成婴儿,跟爸妈长得很像。

我当时的好奇心就在于生命比天气预报还复杂,凭什么背后有规律?所以花时间去研究,总想找到背后的数学模型,现在就需要数据驱动,语言模型能够解决智力问题,这就是我最初的动力。理论不能解释现象,你能说现象不对吗?只有理论不对,所以这是特别有意思的话题。这个时代已经很好了,前面二十年干互联网,这二十年就干人类基因。

提问:现在百川智能采用哪些数据训练?医院的还是患者的?

王小川:核心不是院内数据,而是评价系统,DeepSeek也没有天天说自己的数据是怎么来的,所以就是好的定义和训练方法的准备。我们认为让医生帮助我们生产模拟患者的评价体系,跟数据训练模型是两件事情。

之前GPT是找了262个国家做到HealthBench的评测集,我们也有百川SCAN的评测集,系统自己就会知道怎么改进,范式决定怎么使用这些数据。

构建「严肃问诊」新能力

提问:OpenAI很快就要开放医疗档案,国内阿福也有在做,百川智能建立起了模型体系,但会不会因为数据量的差距让模型迭代相对没有那么快?

王小川:有了个人档案当然没有问题,但不是数据就可以形成训练阿福的模型,档案就是更加个性化,跟用户多少没什么关系,用户更多以后至少团队能够通过问答推动产品改进,就像以前的产品一样,通过用户反馈进行改进也是技术层面的事情,所以有机会优化产品,但不代表能够推动模型的进化。

今天的Gemini发展得非常快,没有那么大的数据量也做起来了,所以还是技术驱动。今天有些东西是被证明是真的,有些东西是被证伪的。

阿福更多的是做生态,有了用户以后,这是最容易获得的红利收益,不是技术本身。

提问:百川智能接下来的路想怎么走?

王小川:我们跟阿福不太一样,阿福还是泛健康的概念,健康这个词就是很泛的概念,居家至少能够取代家庭医生。

提问:要是做To C产品,早期怎么培养用户心智?因为市面上有很多医疗,可能阿福泛健康也被当做医生来问。

王小川:需要三个事情发生:要有一定的广告宣传投入,我们也会适量增加。要有医生的认可,阿福跟我们的路线不一样,老医生都是无感的,我们希望医生和患者是一体两面,共享一款产品,要让专家点头,而不只是患者鼓掌。产品做好以后确实能够取得一定的口碑效应,GPT可以发现自己多年以前误诊的对象,就是从接口说话。

提问:百川智能商业化做得怎么样?

王小川:今天上市的两家是踩在了通用模型的技术红利和国家对于科技强国扶持的基础上。AI医疗也是同样,属于今天大模型竞争的重要力量。可以说从技术范式再到国计民生的意义,从通用AI的概念来说更早一些,未来我们也会走到上市这条道路上。

提问:现在国内医疗AI赛道越来越火,你们怎么做好自己的护城河?

王小川:护城河分为三个部分:模型做得足够好,今天屡试不爽就在于模型领先一代,就像教育的好学区,我们的领先度是可以保证的。解决问题的切入点,我们更愿意切入严肃、高价值的场景,大厂和创业公司不一样,毕竟有职业团队,需要的是更加安稳的方案,大创新靠小厂,小创新靠大厂,必须切入我们认为有高价值的事情,共识不是我们优先的突破点,而大厂更多的是注重共识,路线图和产品形态是不一样的。

今年的核心就是模型迭代和落地

提问:2026年,各家厂商都在上市,宣布自己的融资情况,你们怎么评价百川现在的状态?

王小川:百川去年最重大的变化就是组织管理专注医疗,发布M2和M2Plus,把基础的医疗增强概念稳固,把循证概念树立起来,除了推理能力以外就是循证和会问诊,去年做了很多积累,M2和M2Plus,包括今年的M3都是在去年的基础上夯实,我们在肿瘤领域也开了一条线,就是把最难的医学皇冠明珠做好,所以就是模型本身的进步。

今年的核心就是模型迭代和落地,帮助患者做决策的能力和居家陪伴的健康看护能力,我们都会进一步落地,医疗AI也是肉眼可见的未来最重要的应用场景。

百川智能是药物伴随,Follow-up

提问:很多医疗问题不只是技术的问题,百川智能在技术之外,有没有和监管机构建立信任?

王小川:会有,我们跟三甲医院、基层医院都有沟通。我们在药厂都有临床实验,没有哪个互联网AI公司在干这个。

我们就是以药厂的身份和医院合作,把我们的产品当做药物验证安全性和临床性,都会有Clinical Trial。

提问:30亿好像不够烧。

王小川:够烧,要看是什么标准。我们是患者的Companion,可能一款药十年十亿美金,成功率10%,那肯定不够烧,但美国FDA正在鼓励一个Digital Companion指导用药,药校就会提升。

一款老药的有效性是70%,通过算法可以提到75%,相当于发明一款新药,既不需要十年十亿美金也不会成功率只有10%,就是范式变化带来的结果。我们就是药物伴随,Follow-up。

提问:您觉得OpenAI的医疗服务进国内的概率大吗?

王小川:不大,OpenAI在中国就没有生命力,ChatGPT本来就被封了。

———————————————

雷递由媒体人雷建平创办,若转载请写明来源。

本文来自网络,不代表大火龙新闻网立场,转载请注明出处:http://www.suned.cn/87331.html

作者: wczz1314

为您推荐

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部