- 回望·继承·凝聚·奋进:“我与近红外的故事”文集
- 中国仪器仪表学会近红外光谱分会
- 13443字
- 2025-02-25 11:00:12
意外的近红外应用纯粹之旅——分享在欧美工业界20年的经历
前言
当我还在大学做最后一年的课题研究时, 除了对环境污染及临床化学的应用感兴趣外, 同时也对一篇出自科学期刊的文章印象深刻, 那是有关过程分析和化学测量的介绍 (Science, p312, Vol 226, 1984)。当时也没有特别留意。到出国留学之后, 冥冥中的安排,我一脚踏入光谱过程分析的世界里。当然二十多年的近红外光谱应用生涯非几页纸可说完,加上最近工作实在繁忙,交稿在即,借助近红外平台分享我在美国各个工作期间的近红外应用琐事和心得,其实每份工作成功或失败经历都值得纪念,希望以后有机会再分享本文之后在美国Barr Laboratories (现为Teva Pharma)、美国先灵葆雅公司(Schering-Plough)(现为 Merck & Co 默克药厂)、英国葛兰素史克公司(GlaxoSmithKline-新加坡分厂)工作时的经历。
美国的近红外研究生涯初开始
“误入歧途”——选择专业和导师
1985年赴美留学之前,我的研究所计划是分析化学、临床分析或是环境分析均是我考虑的目标。然而进入美国罗得岛大学的化学系之后,面临的分析化学抉择却影响我的一生科研方向。当时系上有两位叫布朗的教授。一位是色谱(HPLC)的Phyllis Brown, 我佩服她的原因主要是她结婚生子之后才开始攻读研究所的学位,最后成为HPLC在药物生化分析的大师。现在药典中化学分析的标准仪器色谱技术,就是她在上世纪70年代开始奠立起来的!可惜那时她的研究生太多,无法适时加入。系上另外一位教授是Chris W Brown,主攻分子光谱分析以及化学计量学应用,曾和红外光谱大师Peter Griffiths先后做博士后研究,20世纪70年代申报政府研究经费时最为称道的是以红外光谱指纹辨识海岸石油污染方法,因为每艘货船的油料独特,因此可判断出港湾附近油料污染源自何处。研究进展到以迷你计算机计算取代肉眼判读,因此他的实验室有一台像电冰箱的Nova mini-computer及卡片阅读机,而他的研究方法也成为美国海岸防卫队的海洋油污来源检测法。布朗教授也与工业界合作,曾经是那时首屈一指的Bio-Rad Digilab FTIR公司和Beckman紫外-可见光仪器公司的技术顾问,因此教研室的各种光谱仪器比较齐全。我那时抱着光谱分析不就是看图说故事的心理意外地进入分子光谱和计量学世界,在之后的三十年中,我开始了参与杰出学者的百家争鸣、评估各种技术的特性、发展现场光谱应用和观看仪器厂商起起落落的惊奇之旅!
比耳定律和化学计量学的初步较量
第一次接触到近红外数据分析之际,我一直百思不解的是在大学本科所接触到的一个非常简单的比耳定律(Beer-Lambert Law)。为什么一旦涉及部分光谱区域,就必须处理矩阵排列,诸如反矩阵,真的把我搞得晕头转向!所以初步学习中,实在是入门困难。尤其当时导师倡导所谓的P-Matrix(反最小平方差-就是现在常用的多变量线性回归)定量校正模型,虽自成一格,但也需要符合光谱波长数目小于或等于样品数目。因此我们釆用“优化选择波长数”和“傅里叶变换”来降低波长数目。记得在那一段日子中,导师常常和另一位提倡K-Matrix(最小平方差)的研究学者David Haaland互相辨证K-Matrix或P-Matrix的方法优劣。这种争议出现在不同的科学论文或会议中,直到PCR/PLS普及之后才勉强终结战火。化学系的另一位教授James Fasching也曾开过化学计量学的研究课程,我也曾经有幸研究他的教材以及在迷你计算机上执行AUTHUR图形识别程序(那时和SIMCA分庭抗礼)。在研究所中,第一次使用的近红外光谱仪是未完全商业化的Bio-Rad Digilab的FT-NIR。由于是初试仪器,所以教研室的每位研究生必须学习如何开机,进行双手微调干涉仪的性能。虽然歩骤有点繁琐,但是在我早期收集不同近红外光谱数据库中,高分辨率(4cm-1)的图谱的确给了我们对近红外光谱所代表官能机结构的启发,例如CH2和CH3在芳香族和非芳香族的差别,以及水分中自由水和约束水的影响等!这些近红外光谱库也造就了我未来和另外一位近红外专家Louis Weyer(她最近发表解析近红外谱图的书,国内有中译版)的合作!直到1990年左右,我们得到另一台捐赠的Pacific Scientific NIRSystems光栅型近红外分析仪,我的师弟妹们才开始增加近红外应用的范围。
纯物质在哪里? 初探混合物数据库鉴别
在研究所中第一次近红外应用是建立中红外及近红外的标准光谱库,然后进行混合物鉴别(Mixture Library Search)!当时的研究思路是,在一般图谱搜寻时,如果未知物是混合物,传统的一对一比对方式无法有效检测出目标物。因此如何利用化学计量学来定性“分离”出混合成分是研究重点。初期时以C语言处理光谱数据,一个含有3300个气相光谱数据,仅仅是进行主成分分析,在IBM第一代计算器(8086/8088处理器)下的运作就需要至少7个小时,还得配上基于目标光谱重建的验证。所以对早期不懂程序语言的我,又意外地为光谱分析而学习C语言!然而这项当初想法简单的研究以为到此为止,谁知道在我未来的工业职涯发展中,却总是出现“混合物分析”的实际体验!
搞点在线分析——近红外技术测量天然气
除此之外,我的第一个近红外实际化工应用则是和美国天然气研究中心合作,以近红外光谱仪计算天然气的热含量,目的是取代传统的气相色谱分析。其计算方式是基于近红外光谱定量预测不同烷类含量,配合温度、压力及相对压缩系数计算而成。我们先在100psi、250psi和500 psi压力下以偏最小二乘法回归(PLS)分别计算,由于各气体的压缩比例不同, 温度也不同, 后来进展再以非线性的人工神经网络综合不同压力计算。那时候实验室有至少30个标准气体钢瓶,用来做建模之用,因此做实验时必须小心考虑高压气体(500psi)的爆炸性!不过从单独气体样品池到光纤在线分析,我们总算熬了过去而没有意外!直到最近还有朋友在质疑近红外是否可以做气体分析,答案是肯定的!而且我们的研究证明可以用较为便宜的二极阵列近红外取代高分辨率的FT-NIR。
药物溶出度定量测定,第一次跟C语言说再见
在毕业前最后的一篇论文是以当时Beckman的最新型二极阵别紫外可见光仪器做药片溶出度试验。当然药典中规定单成分分析可直接用紫外光谱仪定量,而多组分(如感冒头疼止咳药)药物则须以液相色谱分析。我们以化学计量学模型预测溶出度,并可呈现较高密度的溶出度曲线。但是这项研究最具挑战之处是我必须重写C语言,控制抽取循环样品,仪器测量,移动样品池,收集光谱,预测浓度,以达到自动化软件控制。这个实验及程序再开发拖延了我半年,完成之后,布朗教授也体会到“宁为光谱分析专家,不为计量学程序开发”的决心,教研室也正式向C语言说再见,学弟学妹们也松了一口气。
其他指导应用工作:水质分析,生物检体,生物发酵,纺织品等
当我开始成为大师兄级别后(意味着应该毕业滚蛋),我也和师弟师妹们讨论指导他们研究的方案。林杰博士来自厦门大学海洋化学专业,所以他“致力”于以近红外技术测试水溶液的pH值、温度及离子度!当时我们就评估近红外的光谱变化是来自于氢键的“间接”影响水分子的OH结构,但是闲暇之余,我们常常调侃林师弟用5万美金的近红外去当温度计或pH meter! 师妹葛振方博士毕业于上海复旦大学,她则致力于以近红外分析生物检体,包括子宫颈抹片和那时候非常具有潜力的无损血糖分析,她和德国一家生技公司合作测试眼球内溶液和血糖关系,实验室看着大大的牛眼球,却始终无法有一致性的结果。现在葛博士在美国FDA工作,也算是我的GMP咨询好友。教研室另外一位师妹李悦博士,研究方向放在近红外非线性神经网络为主的生物发酵模型,并且曾经和美国AT&T合作以近红外在线监控清洁半导体晶圆的有机溶剂质量,她的表现也令AT&T惊喜。另外一位来自台湾大学的陈淇旭博士,我曾经指导他利用近红外分析纺织品的组成和色素的研究,原本想法是我们的教研室缺乏HPLC或GC,因此纺织品成分和色素鉴别不需标准方法,结果研究发表之后意外地成为得奖论文,而陈博士现在也如愿以偿地成为美国辉瑞药厂的过程分析经理。因此我在研究所早期的学习中,和师弟师妹们的互动良好,尤其在研究所及工业界的合作,受益良多(注:美国高校和工业界合作的转化成功率超过10%,尤其是光谱分析应用,但是往往由于机密性,不会发表公开科技论文,一般美国教授并不介意,因为合作有经过学校认可的经费支出,可以列入升等资格)。
早期工业界阶段: 烟草制造研发, 开启职业生涯
有钱好办事——大手笔采购各种设备与烟叶烟丝在线水分分析
在1991年完成博士论文之后,我就直接到美国中部田纳西州的美国烟草制造公司(US Tobacco)上班。那段在研发部门的时间,相比我以前在研究所经费捉襟见肘的情况简直是天壤之别。除了购买几套昂贵的化学计量学软件外,也购买了两台福斯NIR Systems,主要分析烟叶中的烟碱及其相关成分、含水量及灰分等,目的是提供QC作为常规之用。因此在此项目中,着重在模型的长期稳健性以及模型可更新性(Living Update),远远超过了在研发过程中所谓的可行性评估。由于烟草化性必须呈报给美国农业部,所以在方法研究上也引进了一般在药厂中所规划的分析方法验证概念,以确认定量模型不仅在建模中必须注意校正集和验证集的误差,而且必须考虑其专一性、线性、准确性、重复性和稳健性等因素。当延伸项目至工厂车间内,线上过程分析则多半集中在以滤光片为主的近红外烟草水含量快速检测。有时候发现仪器准确性并不十分稳定,经过研究,大部分的情况可以归属于采样点的位置不佳。由于近红外属于表面分析,如果烟叶/丝在输送带传送过久,表面水分流失太快,当然无法和标准方法一致。这是我第一次投入于在线近红外外技术,因而也积累了日后研究过程分析的基础经验。
研究烟草来源分类,与专利擦肩而过
利用近红外分辨烟草种类也是研究重点之一,由于烟草的化学成分依据品种、成长地区、气候变化和复烤方式而有所不同,我们也可以近红外技术判断其来源。当时另一比较实际的挑战工作是如何在混合不同烟叶种类的中间成品中以快速近红外技术确认其过程正确性,我也开始发展混合物模式鉴别方案,自此不再局限于单一品种的模式。当时使用的计算有PLS-DA、神经网络及主成分映对法。记得在1995年的烟草研究员年会中,我的报告也得到当时任职于美国农业部(USDA)的一位老先生的注意,建议我申报专利。可惜当初只喜欢科研而忽略了!不过我还是感谢这位名字像金庸武侠小说人物的左天觉老先生……想必国内从事烟草工作的资深研究员应该对他有印象。
早期孤独的漫游会议, 结交志同道合挚友
在20世纪90年代初期,近红外技术配合的化学计量学蓬勃成长,我记得每次参加分析会议时总是寻找有无志同道合的老中可以交流,互相切磋学习!那时美国西雅图华盛顿大学的CPAC(过程分析化学中心)/化学系的王永东博士给我极深的印象,高大英俊潇洒,他对我们现在近红外技术最大的贡献之一就是和其研究生导师Bruce Kowalski 教授(Chemometrics的大师之一)开发出多变量仪器标准化的计算,那就是现在我们耳熟能详的PDS(Piecewise Direct Standardization)模型传递方法。CPAC其他研究生,例如葛志红博士,是James Callis(1980年代以短波长近红外分析石油产品而著名)的学生,博士论文之一则是以近红外分析生物发酵过程。王子义博士也是Kowalski教授的学生,研究方向则在非线性校正模型上。可惜国内学者并不熟悉这些早期经典的近红外或化学计量学应用有国内杰出研究生的参与!另外值得一提的是那时候我经常参加不同的近红外分析和化学计量学国际学术研讨会,和那些大师以初生牛犊不畏虎的心情讨论相关议题,例如和近红外之父Karl Norris讨论近红外分析石油性质而申请专利的合适性,和Phils William讨论他在80年代傅里叶信号处理的扩充性,和Peter Griffith(红外光谱大师级学者)讨论FT和光栅型的差异性(注: Griffiths 博士早期治学较为严谨,有他参加会议,我们会很紧张。但到了2000之后,比较随和)!然而令我印象最深刻的就是参加好几届Gordon Research Conference(GRC)统计在化学化工的应用会议,见到欧洲大师级学者如Svante Wold和其第一代学生或追随者(Sijmen de Jong; Harald Martens),他们在学术上的杰出成果毋庸置疑。每位应邀讲者必须用一个小时报告,接着就是好几次轮回的两小时讨论。所以演讲者若是没有两把刷子,是很难应付接踵而来的专业讨论的。记得那时讨论美国统计及实验设计大师George E. P. Box 的一段话“All models are wrong, but some are useful”,具体可解释为“每个model都建立在一定的假设之上,所以所有的model均不能适用于所有的情况之下。只有在假设被满足时,也就是特定的情况下,可以对该特定情况的前因后果及其路径进行大致有用的描述”。虽然有其他学者不完全同意, 但衍生至多变量定量建模上,我开始思索倘若一味地追求降低校正集的误差是否真的适用于未来或未知样品?这对我日后在处理光谱模型的评估上有所启发。然而最令人吃惊的是在研讨会的晚会表现,这些学者们个个多才多艺,搞笑唱歌、古典钢琴、吉他摇滚,真可谓是“群魔乱舞”,但白天静如学究,夜晚动如疯子。当时的确颠覆我的传统思考,原来国外的教育方向与亚洲浑然不同,学习和才艺可以同时成长,研究和娱乐可以不相抵触,所以开导我未来教导自己的孩子和学生上的方式!
徜徉在自由自在的研发生涯, 开创不同应用领域
手持近红外设想“胎死腹中”
在UST的职业生涯中,早期最大的困境就是作为近红外技术推行者的角色实在很寂寞, 开始时无法完全得到共鸣。所幸身处于研发部门,公司主管给我相当大程度的自由,因此有时可以独立做我的研究实验。好奇心是促使我一直搜寻新技术应用的原动力。例如有一次参加烟草拍卖的场合(由美国农业部负责专卖),了解烟商只能凭借肉眼及触感经验决定烟叶的良劣。此次经历长了见识,因为我实在听不太懂拍卖官的超快速报价英文(注:如果完全听清楚,恭喜一声,你可能是标准的美国南方农民)。然而回去之后在餐厅吃饭时,突然灵机一动思索是否可以发展手提近红外仪器协助烟商在拍卖烟叶时有所客观凭借。刚好那时候我们的产品之一是釆用烟熏复烤烟叶,如果将注意力放在超高含量降烟碱以及其他相关芳香烃及糖含量上,近红外定性鉴别筛检高质量烟叶也许可行。结果实验室近红外结合主成分马氏距离为主的模型结果证明可行(注:各烟厂公司拥有自己的质量指标)。可惜这个计划虽然立意良好,却由于当时(1994年)软硬件的限制(尤其是计算器)和公司不愿现场分析而得罪烟农的态度,我的手持近红外研究只有胎死腹中了,但实验室的近红外快速筛检仍在收购烟叶时抽样执行检测。
近红外标准化——模型传递
在此同时,为了配合在线分析模型开发,在王永东博士的模型传递启发下,我也尝试以PDS处理不同的光谱,包括指导以前研究所学弟研究在不同采样系统(散反射样品池模型传递至过程在线光纤探头)、不同仪器设计(FT仪器传递至光栅仪器)等情况的模型转移。甚至我们也以非线性的人工神经网络进行模型传递,虽然最后效果和PDS差不多,但是所需样品和计算较为复杂。
人类肿瘤细胞切片的图形识别
另外还有一项“不务正业”的科研是探讨以近红外进行人类肿瘤细胞切片的图形识别。那时候好友王晓路博士(现美国B&W TEK董事长)自上海第二军医大学得到不同的大肠癌及子宫肌瘤的未染色细胞切片以供我分析。我利用不同的化学计量学算法可以区分正常、转型期及癌症期细胞种类。害得我花了一段时间研究病理学,满足我的好奇,心想究竟分子光谱观察癌症细胞时代表何种变化?那时认为可能与蛋白质中Amide 吸收或氢键改变有关系。无奈身为烟草化学研究人员,如果发表癌症检测文章,保证被人误解,因此隐而不发,数年之后才在会议中报告。
化学计量学与近红外分析的“魔法”
为了寻求快速编程, 我开始以MATLAB软件处理光谱数据,并且也使用Barry Wise公开发出的PLS_ToolBox(注:国内早期化学计量学的开发多半源于此工具箱,可谓功德无量)。由于计算简单快速,我痛恨的C语言和GRAMS/AI 的Array Basic程序自然而然地被放弃了。由于研发中心的分析项目多姿多彩,因此每次在会议中谈论到近红外化学计量学的计算思路,同事们起初是“有听没有懂, 半信半疑”,最后他们每次开会时只有一句话形容我的数据分析:“Dr. Lo 又在变魔术了。”所幸我的研发老板Cliff Bennet博士一直支持我的近红外加计量学魔术。有时候回想起来,UST的同事还真说对了!当我们研究近红外分析技术时,通常伴随着数据处理或解析!对于初学者而言,何尝不感觉到复杂的计算如魔术般的玄机神秘。但是入门一段时间后,我们慢慢知道魔法的来龙去脉,自己也逐渐进阶成为自成一格的“魔术师”。在此阶段中,每个人对魔术表演的方式都不一样,观众也不一样,手法各凭经验,有时各凭感觉,最后当然是期望博得满堂彩。
工业界阶段之二: 脱离烟草研究,迈入专业应用
“天上掉下来的工作”——摇身一变成为化学计量学代码开发者
老实说, 烟草行业的待遇和福利还真是不错, 职业压力也不大, 是可以终生从事的行业。无奈在上世纪90年代,美国社会开始对烟商不满,因此前景暗淡。而离开UST是一件偶然意外的经验。当我去美国加州的圣地亚哥度假时,我的好友希望我能去一家他应征过的公司(Thermo Gamma-Matrics)看看!因此我抱着好玩的心态带着我的三页履历表和他们聊聊,反正如果他们感兴趣,理论上会再安排一次正式面试行程,届时又可逛逛这个经常蓝天白云的海洋城市。然而在4个小时的非正式“面试”中,公司研发小组的5个人轮流依据我履历表上的研究方向、会议报告和发表文章一一询问,并且提出他们公司可能面临化学计量学的难题。我突然发觉这次面试比我博士论文的答辩还要辛苦!此次得到的意外经验就是“千万不要在履历表上作假”,否则有时候如果真的碰到一群研发疯子,按表操作,下场会很悲惨!无奈在当天六点结束之后他们也不讨论我下次再来面试的安排,因为我已经被莫名其妙地录取了。那时公司副总给我的录取信就是他的名片,反面写着相应的工资、奖励和预计工作时间 (可谓实时录取)!这段面试经历一度被戏谑为“天上掉下来的工作”。然而这项工作并不轻松,因为我在近红外光谱技术的学习上一直体验“软(件)硬(件)兼施”的双重需要,如今摇身一变,自软件使用者成为开发者。除了每天绞尽脑汁地思索如何克服瞬发伽马中子活化(PGNAA)元素谱图的非线性定量分析,还得编写以MATLAB为主的定性/定量的光谱数据处理程序。其中最大的挑战之一是在商业化运作前我必须确认MATLAB的mscripts不致有著作财产权侵犯的可能性。因此那时候常用的PLS -Toolbox (Eigenvecror)必须舍弃重写,而且在转换成C++后必须确认计算结果和MATLAB一致,那是我第一次和软件设计人员合作。除此之外,Thermo也支持发展手持拉曼光谱作为毒品鉴别的快速筛检方法(圣地亚哥市位于美国-墨西哥边界,毒品走私交易极为严重)。我的同事Scott Sunderland博士负责此项目,由于市面上的毒品和非法违禁品均非纯成分,往往加入淀粉、糖粉、小苏打粉或是其他添加物,于是“混合物鉴别方法”再度派上用场,协助基于拉曼技术的毒品确认。我们在美国FBI实验室分析证明混合物计算可行,他们只针对非法化学物质,而其他合法添加物并非重点。但是有2个因素造成手持拉曼计划停顿:其一是当时激光并不稳定,造成拉曼波长位移,会误导分析结果;其二是简单的掌上型计算器(Palm Pilot)的浮点运算不给力,无法进行Single Value Decomposition的计算。其中针对第一项,公司希望我能够用计量学克服,不过那时我还没有聪明到用掌上计算器解决复杂的基线标准化计算。尽管如此,Sunderland博士还是努力改良硬件,至今虽然换了不少公司,还是始终着重于手持拉曼仪器,如今布鲁克公司的手持拉曼Bravo就有他的早期努力的影响。然而在那段“软件运作”期间,顶着巨大的压力,用2台计算器工作,代价是意外地变成视茫茫而髪疏疏的程序员。因此,尽管爱死了美丽的圣地亚哥城市,但是内心深处必须有所决定,寻找可以令我再回到“软硬兼施”的职业生涯轨迹上。
工业界阶段之三: 加入默沙东制药公司PA(Process Analytics)部门
选择去位于美国东岸的默克大药厂(北美地区称默克 Merck,其他地区称默沙东)时,绝对不是意外,是我一直向往医药行业方向而努力发展的结果,因为我早在UST烟草分析项目中就已经效法制药GMP法规的分析方法验证和在Thermo公司负责计量学及在线分析。因此我时常鼓励年轻的同事或朋友在考虑切换不同领域的职场之前需要问“我是否准备好了”? 刚加入默克之时虽然知道需负责过程分析控制(Process Analytics),但不知是承接默克研究实验室(MRL)的在线分析项目,然后由我们负责转移项目至工厂车间,同时还需确认合乎GMP的架构。我那时候的经理Joep Timmerman博士人缘与能力优秀,向单位申请到许多经费,记得那时候我们4人小组拥有6台实验室近红外光谱仪、4台近红外过程分析仪、2台过程质谱仪、1台过程拉曼光谱仪、1台拉曼光谱成像及FT近红外成像光谱仪, 在当时的默克厂内可真是光谱专业大户,财大气粗。当时默克药厂只有不到10个人负责在线过程分析,但技术转移至车间的只有我们4个博士的小组,每个人主要负责两个计划,并支持其他同事的两个项目。由于是直接装置于最终生产线上,并不是所谓的小规模研发项目,因此挑战性极大,常常有不同的状况发生。
监控原料药(API)的干燥终点—— Please give me good spectra!
在过程分析中, 最关键的成功因素之一就是在动态测量时如何取到高质量的光谱。我的第一个制药在线(In-Line)近红外过程分析是监控原料药(API)的干燥终点。由于早期过程分析的近红外固体探头较为原始,我们必须自行设计高压清除附着在探头表面的自动化机制,而且法兰(Flange)也须自行焊接。默克在此干燥工艺上依赖近红外分析结果确认有机溶剂和水分含量,但是必须维持水含量到某一水平才能够避免晶型改变。每年9月至12月的生产我们都得在头一个月在分厂内值班,以确认在线系统运作无误。当然在试用时问题接踵而至,例如12英寸长的光探头在第一年结束后被某位大爷弄弯曲,自动清除粉末装置性能不佳,劣质光谱充斥而造成预测值上下跳动,建模的釆样不均匀性和标准方法的不一致性都必须件件克服。而其中所令人头疼的是近红外控制软件(4~20mA)和车间的DCS中控系统不完全匹配,偶尓发点脾气中断讯号, 造成我们小组必须时常24小时待命,提供解决方案。所幸在三年商业化生产中逐渐将项目交给分厂负责,而暂时松口气。
PAT(过程分析技术)的诞生与定量在线分析理解工艺确认预期晶型
当然身在被其他药厂朋友称为“奴隶”公司中,每个人必须吃苦耐劳的同时负责不同的过程分析项目,我的第二项在线分析项目是以近红外定量在线(On-Line)分析溶质,以确认API结晶的起始浓度,然后再加入晶种并开始降温,如此才能得到预期的晶型。自PAT角度而言, 我们必须了解工艺过程和所有关键的差异来源, 例如起始溶剂浓度和晶型的关系。自分析技术上而言,基于近红外分析而控制结晶过程则必须在严密控制的温度下,否则定量模型失效,严重时结晶沉淀会干扰流通池性能。我和研究组的同事George Zhou规划了许久,计划技术转移到新加坡分厂。当我们将分析仪和所有相关设备送到分厂后,在预计出发前的两周才发现新加坡分厂取消了安装项目计划,理由是他们有能力控制结晶过程,不需在线仪器监测。所以计划被拦腰砍断,我的新加坡一游的梦想也随之破灭。最糟的是,直到我离开默克前,我们还找不到我们留在新加坡的那台备感寂寞的过程近红外仪。即使如此,2003年我又负责技术转移另一项近红外为主的过程分析项目, 此时我们正式采用过程分析技术的术语(Process Analytical Technology)。其实PAT一词约在2002年自美国FDA发展出来,直到2004年才有正式文件。FDA定义PAT是一个系统,即作为生产过程的分析和控制,是依据生产过程中的周期性检测、关键质量参数的控制、原材料和中间产品的质量控制及生产过程确保最终产品质量达到认可标准的程序。大家也许会好奇第一个被美国FDA审批通过的PAT项目,可惜答案并不是大家所期望的光谱方法, 而是英国葛兰素史克(GSK)药厂在2004年5月批准的快速微生物检测(Rapid Microbiological Methods,RMM)。因为检测结果在24小时内就可知晓,而传统的技术检测方法却需要三到五天。可见FDA对PAT的工具思考角度并非仅包括一般的过程分析化学仪器。如果仔细体会PAT 中的术语, “分析”在学科面上必须包括化学、物理、微生物、数学、风险分析这些学科,并要将其以整合的方式导入。简言之,“分析”一词在此就是指“分析性的思维”,而不仅仅是它在分析化学中的含义。
近红外在PAT项目中实施——成功往往来自于态度
我的第三项近红外应用放在新加坡制剂厂的流化床干燥监控,立项原因是传统的温度/湿度控制和停机取样分析无法明确决定水含量干燥终点。在此项目上,是第一次用单一近红外配合multiplexer监测两台流化床干燥器。在美国总厂测试时, 我们已经考虑了光纤探头自我清洁窗口的功能和优化采样位置,并且进行一系列的质量风险评估管理。因此在PAT技术转移上软硬件的问题不常发生,只是在建模过程中如何取得较宽的水含量范围的特别方案比较琐碎。在新加坡分厂和当地的工程人员配合及培训时,和他们相融甚欢,也体会了新加坡对执行GMP法规的一丝不苟的态度,工作了3个多星期,直到整个工艺验证结束后才返回美国。当然在默克PAT小组内我也必须支持或暂时负责其他同事的项目,例如过程近红外控制制剂包衣过程终点、混合均匀度终点和在线分析纳米磨碎过程终点等。其中属在线近红外测量液相中磨碎时的粒径大小最具挑战性, 我们必须考虑监控范围以降低非线性因素, 而且必须排除批次间残留液体的干扰。最后虽然成功地执行方法验证,但是由于临床实验结果不佳, 导致从原本2或3台近红外仪器每年400批次量降到1台近红外仪器每年4批次量, 近红外分析的时效优点也就不明显了, 令我们有种非战之罪的感觉。回想在默克经历繁重冗长的过程分析项目中, 除了必须仔细规划实用性外, 最大的收获是考虑如何成功地推广PAT(包括近红外实验室方法)计划。我的个人经验是项目负责人的态度与格局。第一要求必须放下姿态, 作为技术“销售者”, 销售目的就是让车间或QC使用者可以心悦诚服地接受项目;其次项目负责人也必须具有足够的情商, 扮演部门“协调者”, 协调重点是促使各相关单位共同配合合作。通常傲慢、官僚与沟通不佳等因素会拖累项目的实现成功率, 往往令PAT工作组疲于奔命。
基本功不可疏忽——近红外QC常规分析项目
通常过程分析技术的项目耗时耗力,必须是配合不同单位与分厂人员合作,所以在转移技术时必须靠点运气才能妥善完成。为了不令我在每年的绩效评估上太难看,我同时也积极负责近红外为主的QC常规分析项目, 例如原物料鉴别、药片含水量、药片含量和药粉润滑剂含量等。这些工作比较容易上手,也较易实践。当然最具挑战性的工作是除了自己做方法开发外还得进行分析方法验证,以及支持其他分厂(例如荷兰、波多黎各、新加坡及美国的其他分厂)。当然也得包括准备符合法规要求的申请新药CMC文件。除此之外,由于小组实验室位于研发中心内,我也好奇地思考如何利用光谱分析协助或加强制药配方研究。在这个前提上,我和研究中心的同事们合作评估尝试不同的项目,例如以近红外分析药片在实验稳定性的外观变化、拉曼成像技术评估药片均匀度、近红外评估早期开发配方时API及辅料对于压片头的相对沾黏性以及生物发酵时原物料的质量问题。综合而言, 在药厂工作时, 不论是发展近红外实验室常规分析模型还是PAT过程监控模型, 我们都是战战兢兢、如履薄冰, 生怕模型不够稳定而无法执行质量放行, 后果是直接伤害近红外技术的信赖性。制药工业的光谱模型必须经得起考验, 自验证批次到未来批次均可正确预测, 如果想要优化更新模型, 绝对无法像其他工业快速实行。必须在遵循严格GMP要求下, 模型更新所需的文件准备、部门批准和评价等经常需要几个星期才能完成。
再跃升一步: 整体PAT软硬件规划设计
由于有了过去的实战经验,转战到新加坡的葛兰素史克(GSK)药厂则是另外一项将光谱分析和化学计量学结合实施的挑战,因此在这里我的任务升级到为GSK全球最新的R&D全规中试车间进行整体PAT系统设计与规划。化工车间中所有的管线和反应斧/器均有额外预留接口,可以顺利安装光纤探头,不像我过去在老旧的反应器上找不到多余的接口而无法顺利实行在线分析项目。我那时规划以1台防爆式近红外光谱监控2台干燥器, 采样方式分别为气体池和自动推送式漫反射固体探头,然后再以1台多通道近红外放在中控室透过80~120米光纤监控位于4楼及5楼的4个液体蒸馏和结晶器。在生产过程中, 我面临最大的操作挑战包括如何在不同单元操作运行时可以保持多通道近红外运行顺利 (例如蒸馏和结晶),过程软件不至于“闹情绪”罢工, 光纤探头防漏胶片不会失灵。过程近红外分析仪上线6个月之后, 中试车间的领导深具信心, 修改批次记录,将控制权连接至车间主控平台,完全以近红外数据为终点判断。当然其他PAT工具还包括过程中红外分析仪、 紫外可见光分析仪、Lasertec(粒径分析仪)等, 但是它们的实用价值没有近红外技术广泛。同样的经验也发生在GSK的新加坡车间,我和其他同事之间,甚至于和工厂PAT负责朋友彼此尊重,沟通与谦卑,令我在运行两年约20次不同新药制造研究中只失败了一次。那一次并非技术或协调不佳,而是监控干燥用的气体池阻塞。
你相信化学计量学的计算结果吗? 比较PLS回归分析在不同商业软件中的结果
另外一项有趣却很费时的研究项目则是比较化学计量学PLS回归分析在不同商业软件中的结果。从我在Gamma-Metrics工作时就开始评估PLS计算的相等性。在默克工作时的基本想法是,当使用化学计量学的PLS定量分析时,常用的光谱仪器专用软件(例如Bruker OPUS、Thermo TQ Analyst、FOSS NIR Sytems VISION等)和第三方软件(例如Unscrambler、Pirouette、GRAMS/AI、SIMCA等)是否计算一致?如果美国FDA审批方法时, 应该如何回答? 我那时利用业界通用的数据组(著名的汽油辛烷值公开近红外光谱集)比较了10种商用软件,也需学习使用10种操作,再加上PLS_Toolbox作为验证,确认软件均釆用NIPAL的PLS演算(注:如果使用其他PLS变种演算,例如SimplePLS, 结果会不一样)。基本上,如果不涉及光谱预处理,软件测试结果均一致。但如果使用Savitzky-Golay导数,包括平滑时(釆奇数点),那么如何处理光谱起始和终结区间均可能造成不同的PLS预测结果。此外我也发现某一著名计量学软件在用Savitzky-Golay导数时的归一化(normalization)可能有误,最后他们在2003年改正。当我在匹兹堡会议上报告后,同事听到其他研究人员的耳语:“大概只有默克的财力才能做这项研究吧!”虽然在默克药厂可以“软硬兼施”地应用光谱分析技术,并寻思编写比较有效益的计算方法,但是第二年老板Joep Timmermans博士忍不住告诉我“把注意力放在硬件设计,因为可编辑式计量学软件(例如MATLAB)虽然预测结果极佳,但是保守的药厂文件还是执着于符合GMP要求的软件,容易被更改的程序是不被车间接受的”。因此在之后的数年制药项目上,我是过着“吃硬不吃软”的日子,必须绞尽脑汁地专注于“如何改良取样设计以取得优质光谱”的实际方案。只有在应用多变量统计过程控制(MSPC)技术分析批次生产时, 我又可以使用商业化软件进行分析评价。
光谱仪器世界多半以投资大钱来赚小钱, 厂商合并或买卖时有所闻——仪器公司的“自我陶醉”与“破茧成蝶”
在我进入制药的世界中,光谱仪器公司在美国本土的占有率也有着不同的变化。在2000年前后,福斯NIR Systems的近红外最先完成了GMP要求的验证文件(IQ/OQ/OQ),默克早期使用福斯近红外主要是由于文件完整和支持及时,主要是那时主管销售的经理Paul Entrope热情负责,客户们有求必应。但是据我个人的观察, 福斯NIR在2000年初期如日中天时犯了一些错误:其一是对美国药典近红外 USP <1119>性能要求测试掉以轻心, 没有适时编入软件中(他们认为药典规划只是推荐而非要求);其二是美国辉瑞药厂对其穿透药片式近红外设计有意见,但是当时可能没有得到适当反映,因此辉瑞进行新近红外仪器评估, 逐渐改用其他品牌。德国布鲁克光学设计的近红外MPA获得重视,他们引以为傲的验证文件则是得到辉瑞英国分厂的支持。当时默克也决定评估新一代近红外仪器时,Thermo的Antaris第一代表现普通,ABB Bomem的近红外软件并没有得到太多青睐;Brimose的AOTF仪器多用于在线, 不适于实验室中的多功能应用,而布鲁克的MPA居然没有在同事的评估名单上。因此那时在波士顿任近红外经理的王茜博士专程为此到美国费城外围的默克厂测试而深获好评。但是Thermo的改良版Antaris Ⅱ也逐渐得到重视,加上雇用一位以客为尊的销售经理, 最后打败美国东岸营销不力的布鲁克而成为默克全球首选近红外仪器。当然各家药企也都有着不同的喜好,例如当时在过程分析技术公布前后,辉瑞药厂的实验室近红外仪器釆用布鲁克的MPA, 过程分析用近用红光谱仪却使用ABB。GSK 原料药厂的过程分析以布鲁克的Matrix为主,诺华釆用布鲁克或是Thermo, 而Sanofi-Aventis早期的过程分析则使用Brimrose的AOTF近红外。从商业竞事角度而言,仪器公司的高管们不可过于满足现况、沉迷于占有率的优势, 如果技术设计一直原地踏步、市场销售人员消极懒散或是服务支持疏忽怠作,有极大的可能被其他积极而为的仪器公司追赶而上,逐渐失去市场。
至于其他的高科技光谱技术,印象比较深刻的是美国Axsun,是一家生产MEMS为主的微型光谱仪器公司。本来觉得其系统的光谱分辨力可能和一般的二极数组仪器差不多,但是我的研究所导师布朗教授告诉我应该看看这套分辨力优于光散式仪器的新一代MEMS检测器。当Richard Crocombe博士(之前曾任职于Bio-Rad Digilab)到默克厂区介绍时,原来的想法是大量生产以压低售价到5000美金左右,因此企业在过程分析使用其微光谱仪可以“plug and play”。在当初推广时,低价和微型的确造成轰动,并成为每个会议及展览的重点。虽然立意甚佳,Axsun一直在“代工OEM”及“自有品牌系统”的商业模式上举棋不定,加上达不到量产,价格始终无法降低,自行系统设计的软件不佳,最终也只有采用OEM模式,但是公司也元气大伤。因此在近红外仪器发展史上创新技术公司在如何平衡“代工OEM”及“品牌系统”上一直存在经济矛盾和持续改进的困扰。早期的德国Carl Zeiss光谱仪部门和最近JDSU 公司 (已经改名为Viavi Solutions) 的Micro NIR也自初期的超低价位, 经历过一段“自我陶醉”的挣扎而重新改变商业模式的时段。
后语
多年的近红外分析生涯中, 开发和实施时的酸甜苦辣, 真可谓“如人饮水, 冷暖自知”, 感触良深。当然一旦成功地为使用者接受, 仿佛是自己的孩子诞生一般, 兴奋不已。我在实践过程分析时常将在线光谱分析系统理念比拟成傻瓜型相机, 消费者不会研究相机如何自动对焦或是消除红眼睛效应的原理, 他们只要按下快门就可得到清晰照片的结果。同理而言, 我想近红外分析的最终用户也是如此期望, 那就是给他一台分析仪, 具备简单的操作性、准确的预测性和长期的稳定性。问题是谁会负责辛苦的设计规划, 采样建模, 而且偶尓遭到白眼对待或怀疑? 当然是你我这一群对近红外有着无比热情和希望, 有点怨又带点悔的默默耕耘者!
最后, 改编星球大战的著名台词——愿NIR 原力与你同在 (May the NIR force be with you)!