爱电竞

你的位置:爱电竞 > 产品展示 >

杨红霞创业征程:着力降低预训练门槛,探索路径重塑行业格局

发布日期:2025-11-22 11:06:42|点击次数:150

一家还没正式产品的公司,仅凭一个“去中心化AI”的梦想,就融资20亿美金,估值冲到120亿美金? 这不是天方夜谭,而是2025年2月发生在美国硅谷的真实事件,主角是前OpenAI的CTO。

让人惊讶的是,几乎在同一赛道,一位从阿里和字节大模型核心岗位离开的中国女性科学家,不仅早在一年前就开始了类似的探索,还已经开源发布了多项关键技术成果。 她叫杨红霞,她的新公司InfiX.ai正在挑战一个根深蒂固的观念:大模型预训练,只能是少数顶尖玩家烧钱的算力竞赛。

“模型知识的注入只发生在预训练阶段,后训练提供的是规则。 ”杨红霞用了一个犀利的比喻,“这好比预训练是8年制的医学博士生涯,后训练只是临床实习。 ”这意味着,仅仅用企业自己的数据去微调一个现成的中心化大模型,就像让一个只实习了几个月的医生去处理疑难杂症,产生“幻觉”是必然结果。

2023年中,还在字节跳动负责大模型研发的杨红霞,清晰地看到了中心化模型的落地鸿沟。 她发现,那些耗资巨大训练出的通用大模型,在真正进入企业时水土不服。 尤其对于数据敏感型客户,比如医院或金融机构,他们的核心数据根本无法上传到公有云上供中心化模型学习。 而业界通行的微调方案,治标不治本。

一个现实的挑战是成本。 想象一下,在搜索推荐广告这种每秒承受海量流量的场景里,每一次请求都去调用一个万亿参数级别的庞然大物,其成本是任何企业都无法承受的。 这让她意识到,必须在模型规模和部署成本之间找到新路径。 经过一系列实验,她的团队在2024年初验证了一个关键判断:在特定的垂直领域内,一个几十亿参数的小模型,其表现完全可以超越万亿参数的通用大模型。

这个发现成为了她创业的基石。 2024年7月,杨红霞从字节跳动离职,创立了InfiX.ai。 她没有将公司设在创业氛围狂热的北京或深圳,而是出人意料地选择了香港,并加入了香港理工大学。 在她看来,这是一个“极具性价比”的决定。

香港拥有五所QS排名前100的高校,人才密度全球领先,这让她快速组建起一支约40人的精锐团队。 同时,香港的产学研计划提供了丰厚的资金和算力支持,她的团队甚至获得了香港数码港超算中心90%的算力费用减免,这在大陆是不可想象的。

杨红霞为InfiX.ai规划的技术版图相当宏大,其核心是“去中心化”和“模型融合”。 近期,她的团队开源了四款关键技术组件,展示了这条新路径的可行性。

第一款是全球首个FP8低比特训练“全家桶”(InfiR2 FP8)。 传统大模型训练普遍使用FP16/BF16计算精度,而FP8技术像是在不损失营养(模型性能)的前提下,把“米粒”变得更小、更紧凑,让锅(算力)热得更快。 实测数据显示,该技术能将训练速度最高提升22%,显存占用峰值最高降低14%。 这意味着,训练大模型的门槛和成本被实质性砍了一刀。

第二项是模型融合技术(InfiFusion)。 它的目标是让不同机构训练出的、不同尺寸和结构的“专家模型”能够像乐高积木一样组合起来,形成一个知识更全面的“超级模型”,从而避免重复训练带来的巨大资源浪费。 杨红霞的团队甚至首次提出并验证了模型融合的“缩放定律”,让这个过程从凭经验的“艺术”变成了可预测的“科学”。

为了证明技术的威力,杨红霞选择了一个最硬的骨头来啃,医疗,而且是医疗中最复杂的癌症领域。 她认为,只有在这种高挑战性的领域,模型能力的区分度才能真实显现。 团队开发的医疗多模态大模型训练框架InfiMed,仅用30亿参数,就在多项医学基准测试中超越了谷歌发布的40亿参数模型MedGemma-4B-IT。 这充分证明了“小模型”在垂直领域的巨大潜力。

此外,多智能体系统InfiAgent能够自动分解和分配复杂任务,降低了AI智能体系统的开发门槛。

尽管技术思路超前,但杨红霞的创业之路并非一帆风顺。在初期,向投资人和合作伙伴解释“去中心化”和“模型融合”的概念需要费不少口舌,当时国内大模型赛道仍信奉“大力出奇迹”。 但转机来得很快。 2025年2月,前OpenAI CTO Mira Murati成立新公司Thinking Machines Lab并获得天价融资的消息,像一阵强风,瞬间吹散了许多疑虑。

市场态度发生了明显转变。 InfiX.ai的第二轮融资从提出增资到完成,只用了短短两周时间,并且出现了超募。 杨红霞透露,公司目前的估值是“几亿美金”,她特意补充道:“相比TML已经120亿美金的估值,我们非常便宜。 ”这背后,或许也反映了不同市场对同一技术路线截然不同的定价逻辑。

对于未来模型的形态,杨红霞有一个生动的类比:中心化模型就像过去的巨型计算机,它强大且引领技术突破;而去中心化模型则像后来的个人电脑和智能手机,它让技术真正普及到每一个人手中。 她坚信,两者会长期共存,但去中心化是让AI遍地开花的必然路径。

那么,当未来某天,我们真的可以像在应用商店下载APP一样,轻松为自家工厂或诊所组合、训练一个专属AI时,那些今日的算力巨头的护城河,还剩下多宽? 这场由技术理想主义者掀起的“平民化”革命,最终会指向一个由社区共建、共享的AGI,还是会在打破旧垄断的同时,催生出新的权力中心? 这个问题,或许值得每一个关注技术命运的人思考。

Powered by 爱电竞 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024