让 Claude 成为化学家:Anthropic 最新尝试,从解读核磁共振谱开始
AI 在化学领域的应用一直备受期待,但真正落地却面临数据稀疏、格式不一、付费壁垒等重重阻碍。近日,Anthropic 宣布与顶尖合成、计算及分析化学家合作,致力于提升 Claude 的化学能力。作为该计划的首项成果,化学家 David Kamber 深入评估了 Claude 在解读 核磁共振谱(NMR)——化学家最常用的分析工具之一——上的表现。
化学家的多语言困境
化学家日常需要在多种“化学语言”间切换:白板上的手绘结构、仪器读数、数据库查询字符串、专利与论文中的技术符号。每种表示都编码了相同的化学信息,但需要不同的熟练度。例如,咖啡因的草图能让人一眼看出它与腺苷(人体困倦信号)的相似性,从而预测其阻断受体的提神机制;但同一张草图却无法区分外观极其相似的分子。
精准识别分子至关重要
化学渗透于我们生活的方方面面——从食物、药品到乳液、油漆和塑料。同样的原子,重排少数化学键,葡萄糖就变为果糖——两者分子式相同,却经由完全不同的代谢途径处理。将分子翻转成镜像,镇静剂可能变成致畸剂,正如沙利度胺悲剧所揭示的。化学家的日常工作依赖于在各种表示间准确读取这些信号。
AI 的潜力与现实的鸿沟
在不同表示间转换——从图中追查结构、将仪器读数与预期产物比对、以正确符号查询数据库——耗时且难以规模化。化学文摘社(CAS)作为最大的化学注册数据库,已收录超过 2.9 亿种 已公开物质,且每天新增约 1.5 万种。AI 有望承担这一研究负担,但在化学领域仍主要停留在理想阶段。多年来,机器学习工具一直被定位为逆合成分析、反应预测和性质估计的变革者,但所需数据难以获取:零结果数据稀疏、格式不一致,且被付费期刊(及非结构化的支持信息)锁在付费墙之后。
Claude 的 NMR 解读初探
NMR 谱是化学家确认分子结构的关键手段。Claude 被要求分析真实 NMR 谱图并推断分子结构。初步结果显示,Claude 能够识别常见官能团、耦合模式,甚至在某些情况下正确指认分子,但在处理复杂多重峰、溶剂效应和噪声时仍有明显短板。Anthropic 表示,后续将通过针对性微调、引入化学领域知识图谱和检索增强生成(RAG)来持续改进。
行业意义与展望
让 AI 真正理解化学语言,不仅将加速药物发现、材料设计和合成路线规划,更可能重塑化学研究的工作流——从文献调研到实验设计再到数据分析,AI 可以作为化学家的“数字副手”大幅提升效率。Anthropic 此次聚焦于基础技能(如 NMR 解读),而非直接押注逆合成等高大上应用,体现了务实的技术路线。如果 Claude 能可靠地完成这些基础任务,那么更复杂的化学推理便有了坚实的数据根基。
