
"清华系"是具身智能领域里绕不外去的大山,这座大山上刻着星河通用的王鹤、星动纪元的陈建宇、它石智航的陈亦伦、加快进化的程昊、千寻智能的高阳等一长串闪光的名字,据清华电子系统计,其学友创办的具身筹商企业已近 20 家。而清华系的疆城里,AIR(清华大学智能产业商讨院)的定位则愈加明确。它不仅产出学术论文,更效率于把实验室的前沿工夫塌实地铺进产业。它石智航的陈亦伦就曾是 AIR 智能机器东谈主场地的首席科学家。
2026 年头,"具身智能"被肃穆写入"十五五"筹备撮要,成为国度计谋级别的将来产业。与此同期,一批在企业商讨院深耕多年的科学家,也选拔陆续回到国内高校,从单纯的企业商讨体系重新走进一批兼顾学术商讨和产业培植的高校商讨院。
曹婷的选拔正是清华 AIR。

曹婷,清华大学智能产业商讨院施展注解,北京市高级次引进东谈主才
在微软商讨院责任了七年,2025 年夏天,曹婷成为清华大学智能产业商讨院(AIR)的施展注解。多年来,她历久聚焦 "极致智能密度" 与 "顶尖践诺性能" 的中枢办法,在智能计较前沿领域持续攻坚,打破极低比特模子量化、基于查表的大模子高效推理、全帧率及时多模态大模子架构、存算一体模子加快器等一系列重要工夫,构建起从算法到硬件鼎新的完满工夫体系。
在微软时代,这些工夫的诳骗使她能提醒团队在业界初度赋能复杂神经汇集模子从云霄移动得手机、PC 以致 IoT 设备上,奇迹于百万用户,保护用户阴私的同期勤俭百亿次的云霄调用老本。但此次,她作念出了新的选拔。
咱们还独家获悉,曹婷施展注解及团队正筹划孵化一家新公司,专注于不错持续进化的物千里着牢固能体,新公司面前仍在筹备阶段。
以下为与曹婷施展注解的对话全文,略有删减:
从工业商讨院到高校
创投家:您那时选拔来清华也在媒体引起了不小的关注,为什么选拔在这个时候来清华?
曹婷:企业商讨院对我来说,是一段相当进军、也相当感德的阅历。岂论是在华为照旧在微软,我都阅历了从前沿商讨到系统落地、再到信得过被大领域用户使用的完满历程。你会看到一个工夫何如从论文里的想法,变成不错在手机、PC、IoT 设备上踏实运行的智力,也会泄漏体会到,我方的责任被百万、千万用户用起来是什么嗅觉。这种磨练和建立感,对我今天作念好多判断都相当进军。
但到了奇迹生计的这个阶段,我会更想跳出依然老练的旅途,去界说新的问题,探索新的居品场地和诳骗空间。企业商讨院让我把一个明晰的问题作念到极致,而接下来我更想去作念那些还莫得循序谜底、也还莫得东谈主把旅途信得过走通的事情。具身智能这件事,正在从 " 设想 " 变成 " 不错作念 ",不是五年后,是面前。这个判断让我合计,面前进来,时机是对的。
清华 AIR 刘云新淳厚比我早几年作念这个选拔,他在 MSRA 责任了快要二十年,亦然我在端侧智能方朝上最进军的互助者之一。他五年前来到这里,对我震撼很大。一个在工业界深耕这样多年的东谈主,选拔把后半程放在学术商讨和产业培植上,背后一定有很深的判断。这也让我更抖擞在这个时刻点来到清华,去作念一些更历久、也更难的事情。
创投家:清华 AIR 这边,跟企业商讨院最大的不同在何处?
曹婷:我合计是问题的起原和时刻圭表不同样。企业商讨院濒临的,通常是依然有居品基础、有效户场景、有业务要点的问题空间。商讨院要作念的是何如建议一个新想法,而是把它变成不错进入居品链条、进入系统栈、最终奇迹实在用户的智力。我好多对于工夫价值的判断,都是在这样的磨练里变成的。
而清华 AIR 引诱我的地方,在于它能让我把商讨、产业和历久问题界说放在团结个坐标系里想考。具身智能被写入‘十五五’筹备,不是因为它是一个动听的见地,而是因为它关连到中国下一步的产业竞争力。制造业的柔性升级、物流的无东谈主化、动力才略的巡检、老龄化社会的照护,这些问题都不是靠传统自动化就能处理的,它们需要信得过的物千里着牢固能。
是以对我来说,来到清华 AIR,不是离开产业,而是把视角再往前推一步,有耐烦去作念五年以致十年后国度和社会信得过需要的事情,这少许对我相当有引诱力。
具身智能的窗口与缺口
创投家:具身智能写进了国度筹备。你合计这个时刻节点选得准吗?
曹婷:我合计这个时刻点选得相当准。具身智能今天被写进国度筹备,是因为它依然进入了一个从前沿探索走向产业布局的重要阶段。机器东谈主本质迟缓训练,老本和踏实性都在改善;中国又恰巧领有全球最完满的制造业体系、最强的供应链协同智力,以及在如制造业、物流、养老、城市治理这些密度最高、类型最丰富的实在诳骗场景。这样的组合,在别的国度并辞谢易同期具备。
是以中国今天鼓动具身智能,有点像当年布局电动车。信得过进军的不是某一个单点工夫,而是工夫训练度、产业基础、场景需乞降政策牵引在团结个时刻点变成了协力。一朝这种协力出现,产业窗口通常很快就会大开,通常不会持续太久。谁能尽快把信得过有价值的东西作念出来,谁就有契机界说下一阶段的产业形状。
创投家:你说的 " 有价值的东西 ",指的是什么?
曹婷:信得过能在绽开宇宙里持续进化的物千里着牢固能体。
面前的具身智能,本质上还停留在器用阶段。哪怕 VLA 不详宇宙模子磨练得很强,它们大都照旧在作念拧螺丝、搬运、分拣、捏取这类单点任务,像一个器用箱,但还不是一个信得过会成长的可靠职工。
市集信得过需要的,是能在实在岗亭上、在和物理宇宙反复交互中,能我方归来素质、发现问题、修正策略。比如今天清管谈,下一次就会记取何处容易打滑,要动作幅度小少许、慢少许;今天打扫卫生间,下次就会记取污渍漫衍和台面材质,知谈何如擦更稳、更不伤名义。脱离器用,越来越像一个圭表职工,才是具身智能面前急缺的那一块。
创投家:你看这个赛谈,有莫得什么人人低估不详规避的问题?
曹婷:物千里着牢固能体决定具身能不可简直落地,但恰正是这点是人人坑诰的,讲的少,作念的更少,作念起来极具挑战。
数字宇宙里的智能体,好多时候濒临的是踏实接口和细目例则;但物理宇宙不是这样,磨练时没见过的情况每天都会出现,况且每台机器本质、每个场景、每次交互都不同样。它不可只靠预磨练的模子,素质必须在实在环境里我方去摸索和持续蕴蓄,才能在我方的场景下把每台本质智力进展好。
也正因为这样,物千里着牢固能体比数字智能体更必要,也更难。难点不仅仅让机器作念移动作,更难的是让它在实在交互中蕴蓄素质、变成精良,并把这些素质移动成下一次更稳、更好的践诺。何如领会物理环境,何如示意交互素质,何如构建历久多模态精良,何如变成持续进化的闭环,milansports这些问题到今天都还莫得训练解法,而这正是咱们提早插足、也已看到初步后果的场地。
创投家:产业侧还有哪些现实的贫苦?
曹婷:上头说的物千里着牢固能体,其实科研侧和产业侧都绕不开。在产业侧,还有另一个相当具体的矛盾:信得过有效的物千里着牢固能体需要在端侧部署。
你可能会想,数字智能体能部署在云霄,为什么物千里着牢固能体要在端侧?一是延长,机器东谈主的输入是物理宇宙、是团结的视频、点云、传感器等等这些多模态的数据,往云霄传个几帧数据十几秒可能就往日了,根蒂不可接济及时动作的生成;二是汇集,好多实在场景是弱网或离网的,比如刚提到的管网清洁场景;三是阴私,岂论是家庭场景照旧工业场景,用户图像敢不敢传到云霄去?
是以具身智能体必须在端侧跑。但端侧的算力是有限的。这就条目你在模子的推理效率上作念到极致,不是 " 差未几 ",是信得过的极致。这个软硬件协同的挑战,正是咱们团队的坚定。
从实验室再回到产业中去
创投家:你们是何如想考这些挑战的?
曹婷:咱们不是把物千里着牢固能当作一个单点模子问题,而是把它当作一条完满的智力链。
物千里着牢固能体要信得过开拓,至少有几件事要同期作念好:它得持续领会物理宇宙正在发生什么,得凭据现时任务和过往素质组织步履,得把一次次交互千里淀成可复用的技巧,还得能在端侧信得过跑起来,这是咱们面前要打破的工夫中枢。
第一是及时领会。具身智能体要一边领会事件何如发生,一边决定下一步动作何如触发。比如倒水,水位到何处该停生成新的动作,当下就要判断。这里最难的是,证实复杂度很高,但又不可为了准确率抛弃及时性,是以咱们一直在作念流式视频领会并发表 Streammind、Em-Garde 等系列责任,但愿让系统信得过具备‘ prompt the world ’的智力。
第二是智能体自身的智力。光看懂还不够,它还要结合往日的素质精良、现时的任务、环境不雅测和历史动作,持续爱戴一个内在持久气象,知谈下一步该拆成什么子任务、该生成什么输入、该何如把有限的具身智力高效使用。这部分咱们也发表了 AdaNav VLN 等责任,通过自主想考爱戴内在气象和任务拆解。
第三是精良和素质索取。对物千里着牢固能体来说,memory bank 要和具体本质的智力范围、动作戒指和环境响应沿途责任。它要作念的是在反复交互里不断筛掉冗余和噪声,把信得过有效的素质提真金不怕火成踏实的技巧,同期爱戴一个前后一致的历久精良。比如刚才提到的它谨记‘某次走滑了’,在这类大地上应该小步走、减慢走。这个场地咱们发表了像 AVA 等责任,近期也将有更多后果展示。
临了是端侧高效部署。物千里着牢固能体必须在端侧及时感知、及时决策、及时践诺,这就条目悉数系统在算力、时延和能耗上都作念到相当极致。咱们把领会、决策、精良和部署放在团结个闭环里沿途作念。这部分是咱们组的传统坚定,发表了一系列如 T-MAC、BitDistiller、Pregated-MoE、LUT Tensor core 等出圈的责任,被一百多家媒体转发,被集成到各式大模子推理框架,获取几万颗星。
创投家:你们在上头几个场地作念到了什么进度?
曹婷:面前咱们的前期考据戒指相当可不雅,在业界和社区共认最难的长程复杂任务评测基准上,任务完成精度比行业里比拟主流的决议率先两三倍;在端侧推理速率上,是主流决议的四倍以上。
更进军的是物千里着牢固能体持续演进的效果。咱们作念过实验:机器东谈主在一个环境里反复践诺相似任务,每次失败后从精良里学习,任务精度持续提高,最高能提高稀疏 20 个百分点。这不是重新磨练,是信得过的在线演进。
创投家:是以这些工夫也会产业化?
曹婷:是的,咱们正筹划孵化一家公司,把这些年蕴蓄的持续进化智力从实验室带到产业中去。面前还在筹备阶段,在和一些投资东谈主构兵。AIR 自身便是产业商讨院,只作念论文不是咱们的相当,工夫要简直落地,有产业,有移动,才算完成闭环。
创投家:作念这件事,你们的上风是什么?
曹婷:我合计咱们的上风,滥觞是全栈。物千里着牢固能体落地不是单作念模子就行,它一定是算法、系统、硬件沿途协同,磨练、推理、部署都要买通,这个智力不是哪个组都具备的。咱们往日历久作念端侧智能和高效推理,是以从一运行看这个问题,就会同期讨论它何如训、何如跑、何如信得过部署到本质上。
咱们也不是只会作念论文。组里好多同学和互助伙伴都有头部基模团队的素质,也一直在实在场景里打磨工夫,是以从前沿模子到工程结束、再到产业落地,这条链路咱们是比拟完满的。另外更进军的便是面前清华 AIR 的平台上风。
清华的学生有顶尖的创造力,这在莫得现成谜底的领域是稀缺资源。互助伙伴上,刘云新淳厚在 AIoT 和端侧智能有二十年蕴蓄,IEEE Fellow,在微软时咱们便是团结个团队的互助者,面前咱们依旧在沿途打破物千里着牢固能体工夫。咱们还有好多外部互助者,比如南大的吴昊商讨员,他读博士的时候就在我组里作念 research intern,责任后又来到 MSRA 打听,咱们一直缜密互助,面前他依然是中央部委高级次鼎新东谈主才了。
诚然还有清华 AIR "产学研买通"的定位,让咱们能持续构兵企业实在场景的数据和需求,比如物流、动力、环境等中国独到的丰富场景,是商讨物千里着牢固能体不可或缺的泥土。
创投家:你有莫得设想过,十年后具身智能是什么姿首?
曹婷:我不太心爱把十年后的事情说得太具体,容易过于乐不雅。我合计具身智能可能像十多年前的电动车同样,都处在一个重要拐点上:工夫运行过线,产业链运行补皆,实在需求运行鸠合出现,政策也运行把它放到更高的计谋坐标里。一朝这几股力量汇合,后头的发展通常会比好多东谈主想得更快。今天人人看到的,可能照旧一些单点智力和演示;十年后信得过进军的,是它会不会变成制造、物流、动力、家庭奇迹这些场景里的默许智力。
到阿谁时候,东谈主们关怀的可能不再是‘这是不是具身智能’,而是它依然当然地在那里责任了。工场里高危、访佛、无聊的任务被接往日,物流和巡检系统不错更自主地运行,家庭里一些照护和辅助性的责任有东谈主分摊,好多以前只可靠东谈主硬扛的事情,运行有了新的解法。信得过训练的工夫,临了都不是因为见地响亮,而是因为它改造了社会运行的方式。
是以我面前更关怀的,是十年后咱们能不可简直把一些进军场景作念出来,让物千里着牢固能体在实在宇宙里踏实责任、持续进化米兰,变成社会基础智力的一部分。要是这件事能发生,我会合计今天作念的好多选拔都是值得的。
乐橙体育(中国)官网入口