清华大学联合北京大学、维信诺合作研发的全球首款柔性存算芯片FLEXI,近日登上国际期刊《自然》。该芯片首次在柔性平台实现存内计算架构,面向AI与神经网络推理应用场景,开启柔性AI计算硬件的新时代。

一张薄如纸片、能卷在手指上的柔性芯片(不是柔性印刷电路板,是柔性集成电路),能做什么?

图片

这是全球首款可大规模量产的柔性AI芯片,厚度仅25微米(相当于人类头发丝直径的1/4),能够承受超过4万次180度对折弯曲而性能无衰减,单芯片成本低于1美元。

这一突破彻底颠覆了传统硅基芯片的刚性局限,为可穿戴医疗、柔性机器人、物联网终端等新兴应用提供了真正的“智能大脑”。

图片

在可穿戴设备中实时识别心律失常?在柔性机器人中执行复杂感知?在未来的智能贴片、电子皮肤、长期贴身健康监测系统中,作为“大脑”独立完成人工智能推理?

柔性电子器件因其超薄、轻质、可贴合、可定制及低成本等优势,正深刻改变可穿戴医疗、植入式神经记录、人机交互和物联网等应用形态。近年来,稳定且高良率的薄膜晶体管(TFT)技术使在柔性基板上大规模集成电路制造成为可能。同时,柔性多模态传感与本地协同处理的深度融合,以及高性能边缘智能的快速发展,对能够高效加速神经网络推理的柔性处理器提出了迫切需求,而传统硬件架构在能效、可靠性和机械适应性方面面临显著挑战。

针对上述瓶颈,清华大学集成电路学院任天令教授团队提出了FLEXI——面向边缘智能加速的柔性数字存内计算芯片。FLEXI采用低温多晶硅(LTPS)CMOS工艺制造,兼具轻薄、低成本和高能效等优势。该系列包括FLEXI-1(1 kb)、FLEXI-4(4 kb)和FLEXI-32(32 kb)三种规格,最多集成约26.5万个晶体管。每颗柔性芯片在单一基片上集成了SRAM存储阵列、计算单元及外围电路。通过覆盖制造工艺、电路结构与算法设计的跨层级协同优化(CLCO)策略,FLEXI实现了稳定、高速、并行的点积运算,在工艺波动与机械形变条件下仍保持优异的精度、面积效率与能效表现。

图片

图1.基于LTPS-TFT技术的柔性晶圆与芯片结构示意图

这项成果发表在《Nature》杂志(链接见文末),代表着柔性计算迈向了全新的阶段,为柔性电子产品的现代化应用开启了新的纪元。

01

一枚能弯折的人工智能芯片,为什么意义重大?

半导体技术已经成为现代社会不可或缺的基石,而我们每天使用的电子设备—手机、电脑、甚至卫星导航、空间站等大型设备——内部的核心模块几乎都是同一种类型的芯片:刚性基底的硅基芯片。

它们性能强大,但也有一个显著特征:硬、脆,形状固定。只要轻微弯折,传统电路就可能瞬间失效

柔性电子技术正是在这样的问题下诞生的。通过采用柔性的基底材料,如铟镓锌氧化物,柔性电子技术通过特殊工艺制成薄膜晶体管,让芯片像一张纸一样柔软,可以贴合在不均匀的表面上

图片

这带来了大量全新的应用想象:

  • 医疗监测设备可以贴合在患者的身体上,实时、全天候实现健康守护;

  • 机器人的关节等部位植入了柔性可弯曲芯片,支持它们在不断改变姿势的情况下稳定工作;

  • 柔性芯片能以低成本、大面积、可贴附的方式融入物联网,实现大规模的数据采集……这些都是传统硅基芯片无法实现的场景。

而随着人工智能席卷各行业,越来越多的应用场景需要设备能够自己判断、自己处理信息,而不是把数据传回手机或服务器。无论是心率异常监测、环境采集,还是柔性机器人需要的自平衡、自主控制,这些都离不开神经网络推理。

可以往的柔性计算芯片均为传统处理器,由于运算频率低、难以大规模并行运算、大量数据搬运等问题,它们无法实时完成复杂的人工智能推理任务,难以满足实际应用的实时性,节能性需求。

所以尽管柔性电子技术在传感和可穿戴领域带来了大量创新可能,但缺少一颗真正意义上的“柔性人工智能芯片”,它们就无法从“能感知”走向“能思考”。

02

这颗柔性人工智能芯片,到底有多厉害?技术突破在哪?

FLEXI芯片的技术突破体现在多个方面。首先,其基于低温多晶硅薄膜晶体管技术,实现了芯片的极致轻薄与柔韧性。最小版本的FLEXI-1芯片面积仅31.12平方毫米,集成10628个晶体管,可在超低功耗模式下运行,功耗低至55.94微瓦。其次,在体系结构上,FLEXI采用高度可扩展的模块化存算一体架构。每个模块由6T-SRAM单元及嵌入式、可重构的本地处理单元(RLPU)构成。RLPU由四个n型晶体管和两个作为本地放大器的反相器组成,利用紧凑的动态逻辑完成计算结果感知,并以单比特形式输出。多个RLPU的输出经总线路由并由上拉p型晶体管汇聚,实现多位并行计算。该模块化设计支持在单个宏单元中灵活扩展位宽与分区规模,各模块并行计算部分乘积,最终汇总得到运算结果,从而高效支持神经网络中的单指令多数据(SIMD)运算。为降低神经网络权重反复写入带来的能耗与时延开销,研究团队针对不同存储容量设计了一组轻量级神经网络模型,实现权重的片上一次性部署。这些模型可在FLEXI芯片上高效处理心电信号、数字、语音、图像及多模态生理信号等多种数据类型,即使在最小规模的FLEXI-1芯片上亦可稳定运行。

图片

图2.FLEXI存内计算架构电路;结合量化感知训练与贝叶斯优化的双环训练策略;芯片上权重分布可视化

在性能测试中,FLEXI芯片表现卓越。它可承受超过4万次180度弯曲(弯曲半径1毫米)而性能无衰减,功耗波动小于3.5%,并在长达6个月的持续运行中保持稳定。这些特性使得FLEXI芯片在可穿戴健康监测、柔性机器人及脑机接口等领域具有广泛应用前景。实验结果表明,FLEXI所采用的6T-SRAM单元具有对称的电压传输特性和近轨到轨输出能力,亚稳态电压增益约为80,实现可靠的双稳态存储。芯片可在2.5–5.5 V电源电压范围内稳定运行,并在半径1 mm、180°对折条件下经受超过4万次弯折循环而性能无明显退化。在FLEXI-1上,研究团队展示了高性能模式(12.5 MHz、2.52 mW)与超低功耗模式(1.19 MHz、55.94 μW)。此外,FLEXI在10¹⁰次固定与随机输入乘法运算中实现零错误运行,整体良率约为70%–92%,单芯片成本低于1美元,并具备长期运行稳定性。与已报道的柔性计算芯片相比,FLEXI的时钟频率提升5.7–11.2倍,能量延迟积(EDP)降低87.8%–99.1%;相较于同步CPU,其频率提升15.7–27.5倍,EDP降低3–4个数量级。高性能、低功耗与优异机械可靠性的结合,使FLEXI成为面向边缘人工智能应用的极具潜力的柔性计算平台。

图片

图3. 6T-SRAM柔性单元显微图、电路结构及传输特性;FLEXI-4在存算模式下的Shmoo测试;FLEXI-4经受43000次折叠测试过程中的性能监测;FLEXI系列芯片与其他柔性计算芯片的综合性能对比

FLEXI芯片的应用场景十分广泛。在可穿戴健康监测领域,单个容量仅1千比特的柔性芯片即可实现99.2%准确率的心律失常检测,为远程医疗和健康管理提供了有力支持。在日常活动监测中,结合4通道EDCNN模型,该芯片对坐、站、走、跑等动作分类准确率达97.4%,展现了其在运动监测和康复训练领域的潜力。在应用验证方面,FLEXI可在边缘环境中实现高效、本地化的即时数据解释。研究团队将其用于日常活动的连续监测与识别,展示了在便携式高保真生理监测和多模态传感器内计算中的应用潜力。团队采集了10名受试者在坐姿、紧张、步行、慢跑和骑行等状态下的心率、呼吸频率、体温及皮肤水分等多模态生理信号,经预处理后构建轻量级四通道卷积神经网络,并在FLEXI-1上实现一次性片上部署。通过量化感知训练,该模型在测试集上取得97.4%的分类准确率。

图片

图4. FLEXI用于日常活动监测与分类的系统流程:数据采集、预处理、神经网络训练与片上推理;可一次性部署的四通道卷积神经网络结构;FLEXI-1不同电压条件下单次推理的延迟与能耗

总体而言,FLEXI是一种基于LTPS-TFT技术的柔性数字存内计算芯片。通过工艺-电路-算法协同优化,FLEXI在实现神经网络一次性部署的同时,兼具高可靠性、卓越能效、高成品率(70%–90%)与良好可扩展性。该芯片在高频计算、极端机械应力及加速老化条件(-40至+80 °C温度循环、90%相对湿度、UVA-340及全光谱辐照)下均保持稳定、无误差运行,并展现出超过6个月的长期稳定性。相关成果为柔性电子器件在移动医疗、嵌入式智能及其他边缘计算场景中的应用奠定了坚实基础。

图片

图5.Nature News & Views中对本工作柔性存算芯片与传统计算机硬件的对比

03

超百亿次运算零错误

FLEXI芯片采用互补金属氧化物半导体(CMOS)低温多晶硅(LTPS)工艺,可直接在柔性基底上制造,兼具低功耗、低成本和高集成度优势。

该柔性芯片采用柔性聚酰亚胺基底,柔性基底与器件原生融合为一体,解决了传统硬质芯片或软硬结合方案的弊端。相较于传统硅基芯片,其轻便、成本低、适应性强,尤其适用于穿戴设备、电子皮肤、具身智能机器人等场景。

技术层面,FLEXI芯片首次将时钟频率提升到10MHz以上的水平,大幅提升运算速度与能效,使柔性芯片的算力首次跃升到本地、实时运行人工智能模型的水平,特别适合端侧AI硬件的应用。

实测数据显示,FLEXI芯片在超过4万次弯折后仍能稳定运行,在超百亿次运算中做到零错误,且在2.5-5.5V电压波动、-40℃至80℃的温度变化、90%的相对湿度乃至紫外线环境下都保持了稳定状态。应用验证方面,该芯片已成功实现心律失常检测(准确率99.2%)与人体活动分类(准确率97.4%)等任务,展示了其在低功耗条件下开展本地智能处理的应用潜力,让柔性电子真正从“能感知”走向“能思考”。

业内分析,该技术填补了柔性电子领域AI专用计算硬件的空白。未来通过新型半导体材料应用、功率门控技术优化等,有望进一步提升性能。若能持续优化生产良率与芯片尺寸,将推动可穿戴健康设备、物联网终端等领域的产业升级与技术革新。

值得一提的是,FLEXI芯片采用维信诺自主研发的CMOS LTPS驱动背板工艺制造,证明了采用平板显示工艺制备高性能柔性集成电路的可行性,为柔性电子奠定了工艺基础。

04

技术与市场仍是两大关口

自2022年8月起,依托维信诺4.5代柔性显示面板中试产线,维信诺与清华大学团队历经两年协同攻关,打通了芯片设计、芯片制造、芯片交付、芯片测试的全链路工作。通过多次工艺迭代与优化,确保芯片性能达成设计目标,并协助清华大学团队顺利完成后续机械及环境可靠性测试,进一步验证了芯片的稳定性与适用性。

FLEXI芯片在柔性智能应用场景的想象空间广阔:智能医疗领域,柔性亲肤监测设备实时采集、分析心电、脑电、肌电等信号,助力个人健康管理;柔性机器人领域,柔性芯片完美贴附于关节与灵巧手表面,在动态弯曲中仍能保持稳定控制与决策;泛在物联网领域,低成本柔性传感贴片大面积部署,赋予日常表面感知计算能力,开启端侧实时环境智能交互;人机交互领域,柔性显示集成柔性芯片与传感,形成“感存算显一体化”的数字化智能交互新时代。

量产时间表如何?产业化落地还将面临哪些挑战?柔性芯片在未来两到三年内尚难以实现大批量产业化,主要瓶颈来自技术与市场两端。

技术层面,受限于柔性工艺线宽线距,柔性芯片的性能与成熟硅基芯片仍存在代际差距,需通过提升电路密度、优化架构设计来缩小差距。市场方面,适用场景仍处探索阶段,正如AI大模型尚未形成稳定产值,柔性芯片的应用路径同样需要时间培育。

对于后续规划,未来维信诺将继续与学校合作,持续提升柔性芯片性能,并进一步验证集成多功能模块的柔性SoC(SystemonChip,片上系统)。维信诺也将在夯实自身内功的基础上,积极探索特定场景产业化落地的可能性。产业化路径将延续实验室—中试—量产的递进模式,借鉴公司在Micro LED领域积累的孵化经验,稳步推进落地。

05

从中国出发,走向柔性智能的新范式

这枚柔性人工智能芯片看上去像一片薄薄的贴片,但内部却配备了解决人工智能运算问题的钥匙——存内计算架构

来自清华大学和北京大学的研究团队在柔性薄膜晶体管平台上构建了新型的数字存内计算架构,大幅提高了柔性芯片的运算速度与能效;并通过对计算单元与数据流的重新设计,使得数据无需在存储器和处理器之间频繁搬运,从而显著降低了功耗与延迟,让柔性芯片的算力显著提升到能够运行神经网络模型的水平。

得益于这些创新,这颗薄如纸片、可随意弯折的柔性芯片,第一次具备了独立运行人工智能模型的能力,能够完成心律失常检测、动作识别等神经网络推理任务,真正让柔性电子从“只能感知”迈向“能够思考”

柔性电子与人工智能的结合,正在打开一个全新的技术方向。

从最初的柔性传感器和可穿戴设备到具“柔性”身智能,到如今能够独立完成人工智能推理的柔性芯片,人们对“电子设备的形态”也正在重新想象——它们不再局限于平坦、刚性的硅基,不再被机身结构束缚,而可以像贴片一样贴在皮肤上,像薄膜一样附着在环境中。

1月28日,上述研究成果以“一种用于边缘智能的柔性数字存内计算芯片”(A flexible digital compute-in-memory chip for edge intelligence)为题,发表在国际顶级学术期刊《自然》(Nature)上。

研究成果获得了《自然》(Nature)的“新闻与观点”(News & Views)栏目专题报道。柔性电子专家克里斯·米尼(Kris Myny)和杰哈德·布瓦卡兹(Djihad Bouakaz)发表新闻“用于可穿戴技术的可弯曲AI芯片”(A bendable AI chip for wearable technology),高度评价本工作“通过对芯片制造工艺、电路设计和运行算法的全面优化,将柔性电子技术推向了新的高度…报道了在柔性基板上直接实现AI芯片的方案,填补了柔性电子技术领域的重大空白,为人工智能应用提供了专用、可扩展且低功耗的计算硬件…为面向边缘计算的超低成本AI系统开辟了道路”。

清华大学集成电路学院2021级博士生闫岸之、2021级硕士生闫涧澜、2022级硕士生沈鹏辉,以及北京大学集成电路学院2023级博士生符一涵为论文共同第一作者;清华大学集成电路学院任天令教授、清华大学信息国家研究中心刘厚方副研究员及北京大学人工智能研究院燕博南助理教授为共同通讯作者。清华大学集成电路学院杨轶副教授等为论文共同作者。清华大学为本论文的第一单位。

该研究得到国家自然科学基金委员会、科技部、北京信息科学与技术国家研究中心及北京市自然科学基金委员会等机构的支持。

这项来自中国的最新成果,是这一发展趋势中的重要一步。它展示了柔性电子在智能化方向上的巨大潜力,也说明在材料、器件、架构与算法的共同推动下,柔性芯片有望代替传统芯片,真正走向大规模应用。

论文链接:

图片

https://www.nature.com/articles/s41586-025-09931-x

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐