
几何原理
作者 | AutoMat团队
投稿单位 | 清华大学
编辑丨ScienceAI
在材料科学的微观世界里,电子显微镜已能把原子「拍」得一清二楚;然而「看见」并不等于「理解」。要把这些亚埃级图像转成计算可用的晶体结构,研究者仍需逐像素判读、手工搭建模型、比对参考模板。这个流程动辄耗费数小时到数天,且极易被噪声与元素重叠误导。这一解析瓶颈使得高分辨成像与理论模拟之间始终存在一道「真空带」。
最新工作 AutoMat 则试图用 AI 来填平这条鸿沟。AutoMat 团队构建了一个「电镜智能代理」:它接收原始 STEM 图像,先用模式自适应去噪网络澄清信号,再通过物理约束检索模板、对称感知重建原子坐标,最终输出标准 CIF 并借助机器学习势能模型给出形成能等关键物性。整个链条仅需数分钟,就能完成过去依赖人工的「显微成像 → 结构重建 → 性质预测」。
为了量化成效,作者们搭建了二维材料基准 STEM2Mat-Bench(超 450 种材料)——单层结构可最大限度减少多重散射与投影歧义,便于评测算法极限。
结果显示,AutoMat 在结构误差与能量预测上均大幅优于现有多模态大模型及专用工具 AtomAI;在最难的低剂量三元素场景下仍能稳定输出可用结构。由此,实验观测首次与计算模拟形成高通量闭环,为「AI-驱动的材料发现」打开了真正的高速通道。
STEM2Mat-Bench:构造专为显微→模拟打造的基准
超过 450 种高置信二维材料 | 覆盖 67 种元素
统一三元组:图像 – 结构 – DFT 能量
难度梯度↗(Tier 1 → 3):从单元素高剂量到三元素低剂量
让模型在「图像→结构→性质」全链路上一站式考核。
借助 STEM2Mat-Bench,AutoMat首次展示了在全难度段稳定重建与精准预测的能力,也为后续算法提供了统一、公正的比拼赛道。
AutoMat四步闭环——桥接显微镜与计算模拟的智能 Agent
性能评估:AutoMat压倒性超越现有技术
为评估 AutoMat,团队设置三条基准线:
一是多模态视觉‑语言模型(GPT‑4.1 mini、Qwen 2.5‑VL‑32B、LLama 4V‑17B、ChemVLM‑8B),输入固定提示与 STEM 图像直接推断材料性质,用于衡量「图像→性质」推理水平;
二是 AtomAI,仅通过分割网络定位原子中心并结合分辨率拟合晶格,专门考察结构重建精度;
三是「Label CIF + MatterSim MLIP」,即将真实 CIF 喂入机器学习势能模型,给出形成能误差的理论最优上限。AutoMat 在形成能预测上的平均绝对误差(MAE)为 332 ± 12 meV/atom(分层级为 344、320 和 333 meV),虽仍高于理论最佳值(48 meV),但远低于视觉-语言模型普遍数 eV 级别的误差,且后者误差随任务难度显著增加,验证了基准设计的合理性。进一步提升结构重建精度后,AutoMat 有望逼近理论误差范围,充分满足下游性质预测需求。
对于结构重建,AutoMat 实现了大约 0.11 A 的平均投影 RMSDxy,比 AtomAI(43-44 A)低两个数量级,大多数偏差可通过最终松弛校正。
成分正确性方面,AutoMat 在各层级上平均达到 83%(具体为 88.9%、85.9%、73.1%),而 AtomAI 仅在简单的 Tier 1 情况下达到不到 2.7%。
结构成功率方面,考虑空间和成分一致性,AutoMat 总体达到 83.2%(各层级为 85.0%、84.0%、73.1%),而 AtomAI 几乎不能产生有效结构。
总结来说,AutoMat 不仅优于所有现有基线,而且在具有挑战性的 Tier 3 场景中保持高性能,这些场景涉及多元素组成和低成像剂量,展示了其在整个基准范围内的稳健性和泛化能力。
挑战和未来路线
瓶颈 ① | 模板检索失灵(39.3 %)
检索未命中正确晶体,导致原子排布与元素完全错位,形成能误差最高飙至 3130meV / atom(典型案例:U-F-O 结构被错配为 P-系模板)。
瓶颈 ② | 下游重建崩溃(60.7 %)
模板虽正确,但 2D 投影重叠或 C/O 等近似元素对比度过低,触发原子混淆、结构松弛失真,CIF 直接输出失败。
下一步优化
不确定性检索 + 多候选融合:先扩宽匹配范围,再用置信度筛选,提高模板命中率。
3D-aware & 多模态融合:补足 z 轴深度信息,强化复杂体系的结构保真度与性质预测准确性。
迈向“智能实验室”愿景
1.实验-模拟-AI 全闭环
AutoMat 负责 表征 → 结构 → 物性 的实时推断;
机器人合成平台自动制备候选材料;
在线表征(XRD、EELS、原位光谱)即时回流数据;
LLM/贝叶斯优化代理决策下一轮实验,实现「自驱迭代」。
2.扩展能力版图
3D 体相 & 缺陷/界面:深度学习重建算法 + 断层电镜(ET)数据,解决真实晶体块材与界面问题
多模态数据融汇:将谱学、成像、热分析等多源信息拼成「材料全息图」,提高预测精度;
高通量并行:结合固定床 / 微反应器阵列,日级别筛选上百组合物,实现催化与能源材料的快速迭代。
3.数据标准 & 开放平台
建立统一「图像-结构-性质」数据协议,兼容 AutoMat 与机器人实验记录;
开放 API 与 Benchmark,促成跨实验室协同与模型可重复验证。
未来图景:显微镜不再只是观测工具,而是闭环反馈设计方案和材料的重要一环;AutoMat 则成为连接表征、合成与计算的「中央神经」,驱动材料研发像自动驾驶一样自我学习、持续优化。
代码:https://github.com/yyt-2378/AutoMat
数据集:https://huggingface.co/datasets/yaotianvector/STEM2Mat
论文:https://arxiv.org/abs/2505.12650