浙江栢塑信息技术有限公司

如何用紫外法分析多组分混合物?

光谱重叠
多数小分子仅在 200–400 nm 区域有吸收峰,波段本就狭窄,当两种以上物质存在时,主峰常出现肩峰、合峰或完全重合。

基体复杂
药物制剂、食品饮料、化妆品、环境水样等实际体系中辅料众多,背景基线往往起伏不平。

传统单峰定量失效
单波长定量依赖“特异峰”。一旦失去“独占波长”,朗伯–比耳定律的简洁优势荡然无存。

核心挑战:在不借助色谱分离的情况下,如何从复杂、重叠的光谱中“拆解”出各组分的浓度信息?

1 为什么“多组分”是 UV 分析的难点?

  1. 光谱重叠
    多数小分子仅在 200–400 nm 区域有吸收峰,波段本就狭窄,当两种以上物质存在时,主峰常出现肩峰、合峰或完全重合。

  2. 基体复杂
    药物制剂、食品饮料、化妆品、环境水样等实际体系中辅料众多,背景基线往往起伏不平。

  3. 传统单峰定量失效
    单波长定量依赖“特异峰”。一旦失去“独占波长”,朗伯–比耳定律的简洁优势荡然无存。

核心挑战:在不借助色谱分离的情况下,如何从复杂、重叠的光谱中“拆解”出各组分的浓度信息?


2 解题思路总览

解决方案适用场景技术关键词
同步(Simultaneous)方程法两组分;峰位差≥10 nm经典二元线性方程
吸光度比值(Ratio-A)两~三组分;峰高差异明显消除稀释误差
导数光谱重叠严重;需中等灵敏度一阶/二阶导数零交点
多元回归/偏最小二乘(PLS)≥3 组分;谱图复杂化学计量学
梯度分辨(MCR-ALS)未知组分 + 已知组分哑变量拆分
双向校正(Dual Wavelength)一干扰,一目标ΔA 双波长差法

以下章节将按难度递进,逐一讲解原理、算式、实验设计和注意事项。


3 同步方程法(Simultaneous Equation)

3.1 数学基础

设混合物中组分 XY,选取各自吸收系数差异最大的两条波长 λ₁、λ₂,则

{Aλ1=εX1CX+εY1CYAλ2=εX2CX+εY2CY\begin{cases} A_{\lambda_1}= \varepsilon_{X1}C_X + \varepsilon_{Y1}C_Y \\ A_{\lambda_2}= \varepsilon_{X2}C_X + \varepsilon_{Y2}C_Y \end{cases}{Aλ1=εX1CX+εY1CYAλ2=εX2CX+εY2CY

联立可求 CX,CYC_X, C_YCX,CY

3.2 实验要点

  1. 选峰原则:λ₁ 对 X 敏感、λ₂ 对 Y 更敏感,且彼此相差>10 nm。

  2. 系数测定:各配纯品做 3–5 点标准曲线,取斜率即 ε 值。

  3. 适用限制:仅限二元体系;ε 交叉比例<1∶4 最佳。

3.3 应用案例

  • 对乙酰氨基酚 + 咖啡因 片剂

    • λ₁=243 nm (对乙酰氨基酚主峰)

    • λ₂=274 nm (咖啡因主峰)
      计算得两成分含量误差 < 2 %。


4 吸光度比值法(Ratio-A Method)

4.1 思路

用混合物光谱 ÷ 参考光谱(选定同一组分的吸收值),可将曲线变换为“基于比例”的新曲线,峰顶、零点更加分散,有助于选取特征波长。

4.2 实施步骤

  1. 任选被测组分 Y 纯品在 λᵣ 处的吸光度作为分母;

  2. 对混合物各波长吸光度值逐点相除;

  3. 在比值曲线上寻找对 XY 差异最大的 λₓ、λᵧ,再按同步方程法求浓度。

4.3 优点与局限

  • 优点:可在不额外稀释的情况下抵消体积误差。

  • 局限:运算增加实验员负担,对仪器噪声更敏感。


5 导数光谱技术

5.1 原理

对吸收曲线求导,峰位将出现零交叉点(zero crossing);若在该点 A′=0 for 组分 Y,而组分 X 导数 ≠0,则可用该点对 X 定量,反之亦然。

5.2 操作技巧

  1. 平滑参数:使用 Savitzky–Golay (9, 2) 或 (13, 3) 滤波,以降低微分放大噪声效应;

  2. 级数选择:一阶导数适用于轻度重叠;二阶更加锐化,但噪声更大;

  3. 光谱间隔:采样间隔 ≤ 0.5 nm,有助于高保真导数计算。

5.3 实战示例

  • 布洛芬 + 对乙酰氨基酚 悬混液

    • 一阶导数:230 nm 为布洛芬零交叉,可测对乙酰氨基酚;

    • 二阶导数:245 nm 可反向测布洛芬。
      两药在含各自 50–150 % 浓度区间,RSD < 3 %。


6 化学计量学:多元线性回归 (MLR) 与 PLS

6.1 当观测大于方程

对于三组分甚至四组分体系,同步方程法会因方程数不够而失效。
多元回归利用整段波长(n>组分数)的吸光度矩阵 A 和浓度矩阵 C 构建模型:

A=C⋅ε+EA = C \cdot \varepsilon + EA=Cε+E

其中 E 为残差噪声矩阵,通过最小二乘求 ε

6.2 建模流程

  1. 设计样本:拉丁方或正交设计,使浓度矩阵行列式非零;

  2. 采集光谱:190–400 nm,每 1 nm 采样;

  3. 划分数据:70 % 构建模型,30 % 留作验证;

  4. 评估:RMSEC(校正误差)、RMSEP(预测误差)均 < 5 %。

6.3 软件与工具

  • MATLAB® PLS_Toolbox、R 中 pls 包、Python sklearn.cross_decomposition;

  • 商用 UV 系统往往内置“一键 MLR”,但参数可调性受限。


7 高级拆谱:多元曲线分辨–交替最小二乘(MCR-ALS)

7.1 适用情景

  • 存在未知杂质或“样本数 < 组分数”;

  • 需要同时输出各纯组分的估计光谱。

MCR-ALS 通过迭代优化:

  1. 确定组分数(奇异值分解 + F-test)

  2. 初始估计光谱 → 计算浓度 → 约束非负 → 更新光谱

  3. 直至误差平方和收敛。

7.2 约束策略

  • 非负:浓度、吸收值均不应为负;

  • 闭集:总浓度恒定;

  • 平滑:光谱不应畸形振荡。

7.3 案例:三元维生素饮料

  • 维生素 B₂(λ_max 267/373 nm)、B₃(261 nm)、C(245 nm)。

  • 混合比不恒定,杂质色素未知。

  • MCR-ALS 成功分离纯谱,并给出浓度误差 < 4 %,原本单波长法误差 > 15 %。


8 实验设计要点与“拌料原则”

关键因素最佳做法
浓度水平每组分至少 5 水平,跨 20–120 %
溶剂确保所有组分完溶、光谱重现
pH染色基团电离会改变光谱:pH 波动 ≤ 0.05
温度25 ± 1 ℃,否则 ε 值可变
仪器噪声每 0.2–0.5 nm 采点,测三次平均
随机化训练样序列随机,避免系统误差

9 方法学验证(以 PLS 模型为例)

项目评价指标合格线
线性R²_cal、R²_val≥ 0.995
准确度Recovery (%)97–103
精密度RSD (%)≤ 2
专属性偏最小二乘权重图无未知峰高负荷通过
稳定性0/2/4 h 测值差异 < 2 %通过

10 软件实操小贴士

  1. 数据预处理

    • 中心化:减均值;

    • 标准化:除以标准差,抵消强弱峰权重失衡;

    • 一阶导数 + 平滑:同时解决基线偏移与重叠。

  2. 潜变量 (LVs) 选择

    • 10 折交叉验证,RMSE 连续下降至拐点 + 1 即停。

  3. 过拟合检查

    • 实测 independent 样本 RMSEP 激增→说明过拟合;削减 LV 数。


11 常见坑 & 解决方案一览

症状可能原因快速修复
模型 R² 高但外部样本误差大训练浓度设计不均拉大浓度跨度,增补极端点
ε 值不稳溶剂挥发、pH 漂移加盖 & 使用缓冲
导数光谱噪声尖刺采样间隔过大0.2 nm 间隔+SG 滤波
MCR-ALS 不收敛初始谱偏差大用纯品谱或 EFA 初估

12 应用场景扩展

  1. 药物复方制剂:布洛芬–扑热息痛–咖啡因胶囊,全光谱 + PLS 辅助释放度实时监控

  2. 饮料中维生素 C/B₂/B₃ 同时测:替代高效液相色谱,日检 500 批高通量。

  3. 化妆品防晒三剂 (BP-3、OC、TBMC):导数 + 同步方程法,一次稀释即可出含量。

  4. 废水中 NO₃⁻/NO₂⁻/有机杂质:UV-DAD 在线仪,PLS 通道输出各组分浓度,实现营养盐负荷动态预警。


13 未来趋势

  • 云端化学计量学:原始光谱直上传,云端秒级完成模型应用与结果回传。

  • 深度网络光谱分解:卷积神经网络(CNN)可在无纯品谱情况下直接预测组分分数。

  • 芯片化微光谱:Micro-UV 阵列 + PLS-On-Chip,实现掌上复方检测。

  • 自校正算法:长期漂移时,模型可根据质控样自动更新 ε 值与权重。


14 总结

  • 难点:峰重叠是多组分 UV 测定的第一障碍;

  • 思路:从“方程展开 → 数学衍生 → 多元回归 → 数据驱动”四级解决方案渐次升级;

  • 实战:同步方程 & 导数法足以解决多数二、三元体系;≥三元且基体复杂时需引入化学计量学;

  • 趋势:AI 与微型化硬件的融合将让多组分 UV 分析走出实验室,走进产线、仓库和现场。