
有机化学硕博经验分享(21):整理实验数据与撰写Supporting Information
2025年08月10日 17 次浏览一、关于Supporting Information
每个课题组都有特定的SI格式,每份文章的一作的整理习惯也不相同,所以不同课题组的SI观感可能会大相径庭,同一课题组不同时期乃至不同人的工作的SI也可能会有明显区别。因此,本章仅为一家之言,需要各位读者以所在课题组的习惯格式为主,批判学习本部分。换言之,我做得不一定好,你的导师点头才叫好。
SI主要包含如下部分:题目与目录页+General Information(通用信息)+篇幅所限而未能涵盖的正文图表+重要配体/催化剂的制备与表征+原料制备方法和数据+关键反应操作和产物数据+化学转化操作和产物数据+控制实验细节/机理推测+理论计算+XRD信息+参考文献+所有化合物核磁谱图/HPLC(外消+手性)。具体内容和出现顺序取决于工作性质和课题组习惯,例如外消方法学就不会出现HPLC的信息;Article篇幅够长,一般不会像Communication一样把(详细的)条件筛选和不成功底物等信息塞进SI里。有的课题组把关键反应和产物数据放在前,原料数据放在后。
学生需要整理的部分,一定包括所有需要表征的化合物数据(催化剂、配体、原料、产物、衍生化、控制实验等),大概率包括将本课题的实验部分梳理成PPT(有自行绘制的Table+Scheme+Figure且给出初步、明确结论),可能需要整理文字版实验操作(包括化学转化),不太可能需要自己整理详细的背景文献或写论文草稿(取决于课题组习惯)。
二、小GI,大门道
General Information(GI)大部分是试剂、耗材、测试仪器的品牌,核磁定标值、耦合常数和峰型等大路边话,但不可掉以轻心。
作为读者,GI主要看有没有“如无说明,所有反应均在无水无氧下进行”(All reactions are carried out under Argon atmosphere unless specified. 等),但有些至关重要的信息隐藏在GI的拜年话里。比如,有一份非常优秀的ACIE,产物硼酯在硅胶上会变坏,作者发现过柱的硅胶在105℃下烘干24小时可以最大程度减少产率损失。该条就写在GI里不仔细看很难发现,真去重复反应可能踩坑。探索反应时,作者筛选过硅胶品牌和含水量对过柱收率的影响,发现多种国产硅胶损失偏大,如此细节很少有人能想到。
作为作者,GI若是善加利用可以减少很多麻烦。特别是把实验加料、药品和后处理的共同、相似的细节补充进GI,具体写作时可以变得轻松。例如一些已报道原料、催化剂和配体的制备,可以写进GI并引用参考文献。某种程度上,GI是一份免责声明,例如“所有反应都在手套箱进行”,意味着反应可能对无水无氧要求极高,单排管+气球可能重复不出来;光反应都在光反应器中,低温反应在低温反应槽里进行72小时等条件也是如此。
三、实验数据的管理
整理实验数据,不仅包括尽可能详尽、标准、准确的Word版,还包括原始数据(氢/碳/氟谱文件夹;高分辨、HPLC、红外、紫外吸收、荧光发射等数据文件或报告)、整理过后的数据文件(.mnova文件等)和实验记录本(拍照或扫描pdf)。另外,旋光、熔点等无法生成电子文件的实验测定要保留第一手记录,随时备询。
数据要有严格、清晰的管理。无论文章整理到什么程度,每一个化合物最可靠的“身份证”就是实验记录本编号。文章中涉及的每一个化合物的氢谱+碳谱+氟谱(如果含氟)、高分辨质谱、HPLC等任何原始数据都要以记录本编号命名。测定熔点、旋光等的原始记录也要用记录本编号区分化合物。每一个分离、回收得到的化合物的外标签都要有记录本编号。可以说,一个记录本编号,就能串起一个化合物的虚拟数据与现实状态,一找一准,繁而不乱。
一般所有文件要放在同一个文件夹里。以一份外消的工作为例:
①原料、产物、中间体、化学转化、机理实验等分别设置五个文件夹。上述文件夹中每一个化合物的数据文件夹的名称之前都要包含一个数字作为区分。我习惯把原料编为1,中间体编为2,产物编为3,特殊或另一类产物编为4,机理实验编为5,转化编为6或在产物的基础上加a/b/c。
② 每个化合物所有数据放在同一个文件夹中,文件夹命名要包含化合物性质(原料/产物/中间体等)+官能团取代情况+记录本编号。
例如,第四本记录本第125页有个炔烃一侧间溴对甲基的产物,我会把文件夹名称写作“3 alkyne_3-Br_4-Me-C6H3 04-125”。其中3表示“产物”,alkyne_3-Br_4-Me-C6H3 表示“官能团取代情况”,04-125是记录本编号,三部分以空格连接。同样,若该产物的原料来自第四本第103页,原料文件夹命名为“1 alkyne_3-Br_4-Me-C6H3 04-103”,注意原料和产物的“官能团取代情况”的字段是一样的,不可擅自改动。
对于其他部分的取代基情况,可从不同角度入手:季碳一侧可写成“keto_ester”(由酮酸酯引入)或“quat-”(分子的季碳片段);酰基受体一侧可写成“ketone”(由酮制成查耳酮再引入)或“acyl”(分子的酰基片段);芳基供体一侧可写成“aldehyde”(由醛制成查耳酮再引入)或“aryl_donor”;分子间反应的硼酸一侧可以写成“BA”等。对于区域异构体,可以加上“side”(与某一侧反应)或“cap.”(被xx捕获)等解释性文字。请读者结合课题特质与个人习惯,灵活、清晰地编辑化合物文件夹名称。
再比如,第5本记录本第78页有个重要的中间体,从取代基角度形容起来复杂。不过,这个中间体是通过偶联意外得到的,所以我会把文件夹名写成“2 NCD by_Sonogashira 05-78”,其中NCD是中间体的化学名缩写。这种用反应种类给化合物编号分类的策略还可以用在化学转化上:第6本第7页有个模版产物的Wittig反应的衍生化,产物就可写作“3a Wittig 06-07”或“6 Wittig_from_3 06-07”。
注意,同一个课题保持编号的逻辑、格式一致。便于查找。
③化合物数据文件夹下,仍要用记录本编号命名、管理一切文件。记录本编号格式“姓名缩写-本数-页码”,例如一个叫Xu Wen-Bin的人在第六本记录本的第120页做了某个反应,这个反应的编号就是xwb-06-120。那么,反应产物的核磁氢谱命名为xwb-06-120-H,碳谱是xwb-06-120-C,氟谱是xwb-06-120-F。除了核磁,还应包括实验记录本扫描件/照片、高分辨质谱报告和处理后的核磁文件(.mnova或NUTs的$文件)等。手性工作还要包括HPLC报告。上述文件都要用实验记录本编号命名,如图所示:
特别强调,一个文件夹内只能有一个化合物。如果某个反应的两个产物都被收录到文章中,那么记录本编号后加上1或2作区分,例如“3 aldehyde_3-F-C6H3 03-124-1”或“6 chain_extension 07-09-2”等。高分辨文件分别保存在对应文件夹,不要搞混;两文件夹中的实验记录本扫描件是一样的。
特别地,NUTs不能打开文件路径中包含 ’ 或`(读作“撇”、“拔”等)的文件。化合物需要加 ’ 或`区分异构体的话,建议换成+。
④日常打核磁,经常遇到一个反应有多个产物的情况。我习惯用以过柱所得spot顺序命名xwb-06-120-H下的No.文件夹:第一个点记为1,第二个记为2,以此类推。如果第三个点打了多次才拿到纯谱,第一次的No.文件夹记为3(第三个点),第二次记为32(第三个点打第二次,我有时也记作31),第三次记为33,以此类推。
再次强调,如果该反应多个产物同时被文章收录,建议单独提取出来,使一个核磁文件夹下只有一个核磁数据,避免混淆(命名参照第③条)。
四、化合物数据部分的组成和格式
以下均为个人经验,需要读者结合所处课题组习惯自行判断。
格式:大多数数据部分选择“两侧对齐”,字体使用Times New Roman。不同部分之间用英文分号分隔,最后一个数据用英文句号结尾。
换行与着重显示:不同数据之间回车换行和整段撰写等风格兼有,笔者倾向于换行;使用方法(Method A/B/C)、氢谱(1H-NMR)、碳谱(13C-NMR)、氟谱(19F-NMR)和高分辨(HRMS-ESI)等开头字段,着重显示(加粗/下划线)与着重显示者各半,笔者倾向于加粗显示。
已知化合物只需提供氢谱数据和引用参考文献,一般不需要提供碳谱,一定不用做质谱。节省经费。
按照各要素出现顺序:
① 化学名:ChemDraw根据绘制的结构式自动生成,大多数情况下放在结构式前边。注意:同一个化合物,不同版本的ChemDraw生成化学名可能不一样,选取导师或实验室公用电脑所用ChemDraw版本为准;化学名一旦出现必须加粗,其中R/S、E/Z、tert、N/O(原子)等必须斜体,复制粘贴时容易丢失格式,仔细检查;有些课题组觉得化学名多余,从来不写。笔者倾向于不写化学名。
② 结构式:ChemDraw绘制,注意格式(File→Apply Documents Settings From→ACS Document 1996);结构式不能在Word中被粘贴为图片(操作点黑边白色圆圈)而应是ChemDraw文件(操作点黑色方块),调整格式时在Word里频繁复制、粘贴如不注意可能变成图片;结构式既可以居中对齐,也可以左对齐;结构式可以不包含编号。笔者倾向于居中对齐、不含编号。
③ 化合物编号:编号最多会出现三次,即化学名后(加括号)、结构式内(画在ChemDraw里字体Arial)或下侧(写在Word里字体与SI一致)和开头叙述文字中(Compound xx is synthesized…)。有的课题组喜欢让编号出现三次,有的只出现一次,但无论出现在哪、出现多少次都要加粗。出现越频繁,一旦改动工作量巨大,一定小心。笔者倾向于在结构式内出现一次,叙述时说“The entitled compound”或不用文字叙述直接上产量产率。
④ 合成方法、产量产率、柱层析情况:有的课题组用一句话叙述,有的直接简单列举。笔者倾向于后者。Prepared by Method A. Yield: 2.56 g, 66%. PE/Et2O/DCM = 40/1/4 to 20/1/3. 既简便又清晰,还不会有任何歧义,硅胶情况写在GI就可以。一些课题组习惯先写上反应的“序列号”,也就是实验记录编号;另一些课题组把每个关键反应做两次并如实写下两次的产量和产率。笔者对两者表示赞赏。
注意,越来越多的课题组要求在Yield后详细写明使用了哪些原料,用了多少等。笔者表示赞同并倾向于简便写法,即在括号中写上原料的编号、质量和摩尔数(based on S1: 2.63 g, 8.53 mmol);有些课题组不提供洗脱剂情况,但给出展开剂+比移值,也可接受。
⑤ 熔点:以熔程的形式展示。一般放在淋洗剂和Yield之间,少数情况放在其他地方(甚至是最后)。也有一些组从不测熔点。
⑥ HPLC:大多数课题组选择一段文字叙述。主要包括HPLC品牌、色谱柱品牌与种类、洗脱剂比例、流速、紫外检测器波长、保留时间等。不同之处在于ee或er值有的放在yield后,有的与HPLC放在一起。有些课题组习惯将HPLC放在核磁谱图乃至质谱之后。
⑦ 核磁(氢/碳/氟谱):各组变数颇多,难以论说。笔者倾向于氢/碳/氟谱分段显示;开头字段加粗;碳谱和氟谱强调对氢去耦(加入{1H});碳/氟谱核磁兆数以Mestrenova导出值-1为准;氘代溶剂显示为分子式;化学位移符号δ之前加冒号;化学位移之间用长横线(–)而不是短横线(-)连接;用分号分隔不同数据;结尾用ppm作为单位。一般不需要归属氢和碳。峰型和耦合常数计算,参见先前章节。
⑧ 红外:大多数课题组不测红外。部分课题组习惯测,但有的写单位(cm-1)有的不写,有的写测定方式(薄层法 thin-layer)有的不写。
⑨ 高分辨质谱:不同课题组格式也差不多。笔者倾向于在电离方式(ESI/EI等)之后写明[M+Na/K/H/O2]+等分子式变化;(变动后的)分子式带电荷,各元素按碳、氢、氧、氮、硫、卤素(氟、氯、溴、碘)和加合离子(Na⁺、K⁺、H⁺、NH₄⁺)的顺序排列。具体参见第二十章。
五、优秀SI鉴赏
SI的整理格式,每个课题组各有特色。本部分选择国内权威课题组代表性工作的SI,与大家一起学习。图中,笔者用彩笔对要点进行强调。
① 课题组X1
② 课题组H
③ 课题组B
④ 课题组C
⑤ 课题组X2
⑥ 课题组W1
⑦ 课题组K
⑧ 课题组W2
⑨ 课题组F
希望大家能从上述的精彩工作中获得收获,最终创造出属于自己的顶刊,顺利毕业。