爱色电影 前百度AI大牛亲述:押注十年,踩坑无数后,签下200家三甲病院
发布日期:2025-04-22 07:49 点击次数:186
爱色电影
作家丨刘杨楠
裁剪丨巴里
图源丨文心一言
岂论是早些年的信息化,照旧今天的大模子,本领转换世界的纷乱叙事里,医疗概况都是最难啃的"硬骨头"。
数据壁垒高筑、场景复杂多变、容错率趋近于零 ...... 但因其内含的巨大生意价值和社会价值,多年来都诱骗着无数创业者奔赴其中。
2016 年创办左医科技的张超,等于其中之一。张超毕业于电子科技大学,曾经担任百度 NLP 常识挖掘标的的认真东谈主、常识图谱群众,曾经任新国大的磋商助理。
左医科技是一家常识图谱和医疗大模子协同驱动的医疗科技公司,其客户曾经隐秘宇宙 200 多家三甲病院,其中 40% 是 top100 的病院,包括北京协和病院、武汉同济病院、中国医大一院、四川省东谈主民病院、重庆医科大学从属儿童病院等。
创业十年,张超从未离开本领一线,他简直能横暴捕捉到每一次本领转机的信号,却也无法跳出医疗科技变现难的无边困境。
踩了无数坑之后,张超深知:"一件事能不可作念成,时机很遑急。"
在" AI 大夫"这个最火热的新趋势里,他延续着又名本领创业者对本贯通径的横暴感觉,押注"端到端 + 场景"深度连合的本贯通线。同期,他也用更多元气心灵钻研生意模式,试图在传统的医疗做事模式以外,给公司探索更多生意思象。
一、押宝"端到端"
2020 年,左医科技第一次尝试把 Transformer 用在医患对话上,建设了一款智能问诊程序,里面称之为" AI Doctor(AI 大夫)"。
张超我方也目下一亮:"切躯壳验后会发现,在 Transformer 出现之前,悉数的东谈主机交互都很‘傻’。"
其后,张超带团队尝试在 GPT-2 上作念微调,发现服从可以,但资本太高,加之 GPT-2 参数范围较小,微调很难冲破性能天花板。团队又在国内的一系列模子上尝试微调,发现服从都不睬思。"那时就有些怀疑这条道路了,但目前看来是那时候国内的模子本领如实不行。"张超坦言。
时刻到了 2022 年,在 ChatGPT 发布前,OpenAI 发布 instructGPT 时,左医的本领团队曾经小心到其性能有很大跃升。"但咱们第一响应是不信,因为谷歌之前发了好多酷炫的 demo,都莫得信得过落地。"张超暗示,直到我方信得过体验了 ChatGPT,才信服 AI 本领竟然迎来了历史性转机。
首先,左医科技曾尝试我方试验模子,但很快发现,公司很难永远撑持范围如斯之大的数据和算力插足。
于是,左医科技实时住手试验,转而在开源模子的基础上试验医疗界限的垂类模子。经过一系列测评后,左医在宽广开源模子中礼聘了通义千问。
2023 年 5 月,左医科技发布了医疗垂类大模子,并讹诈落地于四川省东谈主民病院、北京天坛病院等百强病院。
DeepSeek 出圈后,左医科技曾经尝试在 DeepSeek 上连续试验,但团队衡量之后,照旧礼聘连续基于通义千问作念试验。
由于 LLaMA、通义千问等繁密模子引颈的开源波澜曾经酿成了熟识的开源生态,而 DeepSeek 系列为 MoE 架构,属于寥落模子,其开源生态相对不熟识,本来走繁密模子道路的团队若思颐养道路,就要濒临更大的工程艰巨。另外,从本质的场景需求研究,张超认为,对医疗场景而言,参数范围可能不需要太大。
但跟着通用模子不断普及,对于"垂直模子是否会被替代"的磋商也运转沸沸扬扬。
退一步看,垂直模子之是以会引颈一波小高涨,本色是因为通用模子在获得稀奇数据方面存在遮盖,只好这个问题不虞理,垂直模子就会有其特定的价值。"比如 DeepSeek 在医疗方面幻觉很重,潜入比 OpenAI o1 差好多,是因为 OpenAI 有特意的医疗团队。"张超说。
不外,张超坦言,跟着通用模子不断迭代,将来留给垂直模子的糊口空间如实会越来越小,但这并不意味着要径直烧毁垂类模子。"飞机比火车跑得快,但火车总能去到一些飞机去不了的地点。将来作念垂类模子的东谈主要思一思,哪些事情是通用模子作念不到的。"
2024 年 12 月 23 日,张超在一又友圈发布了一个左医 GPT-o1 版的内测视频,其医疗会诊服从比拟指示模子普及 15% 以上。但 DeepSeek-R1 发布后,左医就烧毁就发布该推理模子。
张超认为,参考 Deep Research 围绕中枢场景打造端到端的讹诈会是将来遑急的标的。
目前,AI 在医疗界限的落地有三种进阶形态:辅导词、责任流和端到端。
市面上好多居品都通过"辅导词"或"责任流(Workflow)"来收尾健康商讨的 AI 居品,但这类料理决议容易在多要领历程中累积诞妄,裁减合座准确率,也很难知足越来越复杂各种的医学场景。
张超暗示:"这两条道路都需要东谈主类参与盘算,东谈主的本相识禁止智能讹诈的本领。而端到端推理能够让模子卓越东谈主的本领的禁止。"
2024 年 12 月,左医科技运转探索端到端试验的 AI Agent,通过深度强化学习整合 CoT(Chain of Thought 推理)、智能交互、器具调用和常识检索等历程,让 AI 大夫在面对简直就医场景时,能自愿"思主义"查找信息和详细分析,从而作念出更稳健临床逻辑的判断。
"端到端推理和场景深度连合本色不是在作念模子,而是把模子本领和场景数据融在一皆,最终以 Agent 的形态呈现。"张超暗示。
图片开首:左医科技
而端到端的壁垒,很大一部分在于构建数据集的本领。张超坦言:"数据清洗的过程就像‘和面一样’,水多了加面,面多了加水,本色上是一个条目熟练度的工种。"
换言之,数据清洗信得过的 Know-how 在于,无数次实操过程中累积的"错题集"。张超举了一个形象的例子,病历是好多模子试验主要的数据开首,但简直的病历有时会写明病理,这就会给模子"漏题",因此要把病历中解释病理的部分删去,再喂给模子。
近期,左医科技通过端到端构建的 Agent 曾经在重庆医科大学从属儿童病院落地,两边推出了"重儿 · 小乙 AI 家庭大夫"。同期,左医科技还推出了儿科循证常识库,基于国表里儿科指南、群众共鸣、教科书等高质地专科数据源构建,并由专科团队核验,保留明晰可追思的援用开首;能够读懂翰墨、识别查抄论述,并阐发需要自动推选患教视频、提供预约挂号等做事。
张超暗示,常识的开首和组织面孔,相似会影响 RAG 裁减幻觉的服从。"构建高质地的 RAG 细目不可绵薄把互联网数据堆进去。即使是学术论文,也并非全篇都有援用价值。"张超暗示。
多年来,左医科技累积了多种数据开首,包括互联网数据,听译机器东谈主齐集的简直的医患交流数据,以及模子在赞助会诊过程中生成的数据。同期,左医科技会借助多年来累积的群众资源,在海量原始数据中提真金不怕火最有价值的信息,一篇论文中可能只提真金不怕火 10 条信得过有价值的数据纳入 RAG,以此来最猛进程普及模子对常识的讹诈。
二、B 端保利润,C 端求增长
不容争辩," AI 大夫"是大模子赋予悉数这个词医疗行业的新故事,创业邦在此前的著作中曾梳理了 AI 大夫的阛阓近况,可谓是"八仙过海,大显武艺"。
在张超看来,AI 大夫在病院的落地纪律应是:全科 - 专科 - 专科群众。
从行业发展历程来看,医疗信息化的过程亦然从全科渐渐向专科渗入的。但张超并未给这个论断附加太多合感性。他坦言:"一个东谈主作念什么事,很猛进程上取决于他手里的资源。咱们累积了无边全科数据,从全科切入是水到渠成的终结。"
目前,左医科技正在探索 AI 大夫在专科的落地,并当先在儿科达成邻接。张超娇傲,某种进程上,这亦然一个无心插柳的终结。"重庆医科大学从属儿童病院指点相配认同这个标的,方针一致,更好实施。"张超暗示。
他进一步暗示,在医学界,儿科是一个很好的磋商界限,因为好多萧疏疾病都在儿科发现,儿童在好多疾病上症状也不够典型。但正因为它很难,是以在生意化过程中要更郑重,举例好多药都不可给儿童用。从这极少上说,儿科并非一个很好的生意化场景。
在儿科以外,左医科技还同步尝试了形式以及内分泌、妇科、呼吸科、神经内科等大内科,将来也会缓缓鼓励 AI 大夫在各科室的落地。
但张超娇傲,公司接下来会渐渐调整生意化要点。
目前,左医科技曾经能够给病院提供隐秘"诊前、诊中、诊后"的全历程做事,隐秘宇宙 200 多家三甲病院,其中 top100 的病院达 40%。但张超感受到,刻下的医疗信息化阛阓正越来越"卷"。
"病院临床条目太高了,好多信息化本领作念不到。另外,病院的用户流量不才降,医改计谋变化迤逦导致病院收入裁减,他们插足到信息化转型的每一分钱都会更严慎,加上三甲病院等优质医疗资源本就稀缺,病院和某家邻接后,其他家厂商很难再进来。"
这种情况下,部分厂商会礼聘"破釜千里舟",径直给病院免费送软件,送做事。"但这么终究不是永远之计,"张超说,"以致目前一些病院部署 DeepSeek 一体机都是在浪花钱,本色依然是一个很重商务的模式。软件面孔必须要作念到 90% 以上的毛利,不然一定是亏的。"
在此配景下,左医科技将来会在 B 端会争取更多利润,保留预问诊、分导诊、语音转写病历等法式化进程高,且客户反响好的面孔,把面孔"作念少、作念深、作念精"。"你无谓去追赶马,当你有一派草原,马当然会来找你。"
接下来,左医科技会重点在 C 端找新的增长弧线。
从 2023 年运转,左医就尝试以 B 端带动 C 端,基于端到端本领打造的 AI 大夫,与宁夏中卫市、银川市、北京西城区卫健委签约,将" AI 大夫"升级为" AI 家医",以此渐渐累积流量和数据。
张超娇傲,现阶段,左医科技的 C 端居品经受会员订阅收费的模式。将来流量实足大之后,还可以探索更多生意模式,比如 AI 大夫阐发和用户的交互数据为用户推选个性化的健康类居品。
具体到医疗历程上,张超坦言,将来会将重点放在"诊前"和"诊中"。
他进一步解释谈,从用户习尚来看,诊后的主要场景是慢病料理,但除了肿瘤等疾病外,慢病大多是生活习尚导致的,绵薄的东谈主机交互很难信得过转换什么;从生意模式来看,慢病料理最终的受益方是政府医保基金,而医保基金分派是一件很严肃的事情。
不外,就短期来看,获得流量仍是左医科技探索 C 端落地的关节关卡。而怎样买通 C 端讹诈的生意闭环,亦然当下最困扰张超的问题。
三、一位本领创业者的自白
十年前,张超还在百度当然话语处理(下文简称" NLP ")部门担任资深研发工程师、文本常识挖掘标的本领认真东谈主以及常识图谱实体建模群众。
但张超不知足于大厂相对沉静的生活,笼统生出创业的冲动。在公司里面一次 IBM 科学家的共享会上,张超无意发现,海外有团队正在探索用 NLP 本领赞助医疗会诊的讹诈。
于是,张超产生了一个今天看来"不切本质"的思法:医疗是一个常识驱动的界限,而我方又擅长常识图谱本领,只好有实足的医疗数据,构建一个能作念各种推理的概率模子,概况就能达到赞助会诊的方针。
"本色上照旧合计,手里有一把锤子,而医疗这个钉子还可以。"张超说,"毕竟连马云那时都在说,‘下一个能卓越我的东谈主,一定出目前医疗健康行业’。"
但信得过启动创业后,张超发现,我方思得太绵薄了。那时的张超,简直对医疗一无所知。医疗数据奈何获得,病历奈何看,会诊奈何作念,以致到了病院该找谁谈邻接都稀里糊涂。
无奈之下, 张超从我方最熟悉的本领切入,没数据就从公开渠谈爬数据。但很快,团队发现公开数据服从太差,只可硬着头皮思主义找病院要数据。
彼时正处国内医疗信息化的高涨,涌现了好多第三方医疗信息化厂商。
那时,一家肿瘤大数据平台当先向张超递出橄榄枝:"你们能不可作念一个病历结构化的系统?"这是张超接到的第一个客户需求,但他发现,我方悉数看不懂病历。"说白了有点一头扎猛了,咱们只掌持了一些本领,但在医疗界限的默契简直空缺。"
文爱聊天其后,在投资东谈主的引荐下,一位医疗销售东谈主员加入左医。2017 年,左医渐渐运转和第三方医疗信息化厂商邻接,左医提供本领,信息化厂商和病院疏通提供数据。张超及团队东谈主员也在面孔磨合中渐渐累积医疗默契。
今天回看,左医作念了好多超前的本领,包括目前火热的 CDSS(临床赞助会诊系统)、预问诊系统、听译机器东谈主等,但由于本领和生意环境不熟识,最终都莫得引起实足的阛阓反响。
客不雅来看,医疗信息做事本色上要濒临悉数软件厂商都会濒临的生意逆境——重商务、强定制化的面孔制委用,左医一度也堕入"作念得越多,幸亏越多"的困境。"张超我方复盘发现,创业早期如实花了好多钱,作念一些不该作念的面孔,找了一些本不需要的东谈主。
"本领创业者太思用本领料理悉数事情了,而况会对本领的短期逾越更乐不雅。之前咱们一直思憋个大招,总思作念新的东西,合计有了更牛的本领是不是就能转换公司的境况。"张超说。
但事实评释,至少在医疗行业,病院不单需要性能拉爆的"满血"本领,更需要保证诞妄率最低,且能够永远矫健供应的厂商。直到目前,左医科技卖得最佳的居品仍是五六年前建设的。
而将来,更多故事会发生在 C 端。对于悉数这个词医疗做事行业来说,C 端概况都是一个全新的世界:怎样获得流量,怎样看护用户粘性,怎样找到合理的收费模式?一切都尚待摸索。
"对于我来说,创业莫得回头路。"张超说,"一件事能不可作念成,时机很遑急。咱们之前对时机主办得不够好,但目前咱们踩了实足多的坑,阛阓需求也很新生,我信托咱们接下来的路会走得更稳。"
本文为创业邦原创,未经授权不得转载爱色电影,不然创业邦将保留向其讲求法律职守的职权。如需转载或有任何疑问,请干系 editor@cyzone.cn。