摘 要化学品自动鉴别分类对于其安全监管十分重要,本文研究了利用近红外光谱检测技术实现化学品自动检测分类的方法。首先,在近红外光谱仪器及光源基础上,研究了几种常见化学品的光谱特征,然后,结合光谱特征提取与概率统计分析中的贝叶斯方法,研究自动鉴别分类方法,并通过验证了该方法自动分类鉴别准确性。本文所研究的方法为实现化学品的在线快速检测提供了参考,具有比较重要的应用价值。
【关键词】近红外光谱 光谱处理 化学品鉴别 贝叶斯方法
1 引言
在社会经济生活,各种化工产品及原理是属于重要是生产资料,其品种众多,数量巨大,潜在的污染安全威胁。2015年8月12日发生在天津滨海新区的爆炸事故也给化学品运输与监管提出了更高要求。为确保化学品安全,我国出台了诸多管理措施,快速有效地进行化学品筛选、检测和监管,对于保障社会经济及环境安全具有十分重要的意义。化学品快速鉴别是有效监管的前提条件,发展一种快速、准确、可实现无接触测量、针对多种化学品有效的鉴别方法,对于实现化学品有效监管十分重要。
光谱技术利用不同物质中分子键结构的吸收特征来对物质种类及浓度进行分析,不需要对样品进行预处理,不破坏试样,不用试剂,测量方式灵活,可采用透射与反射测量液态、固态样品,是一种高灵敏、高效率的快速检测方法。在近红外谱区(800~2500nm),大多数化学品均存在特征吸收峰,随着化学计量学、计算机技术的发展,近红外光谱检测技术已经发展成为一种可实现自动化测量与数据处理的智能化检测技术。近红外方法分析复杂样品时,首先需要将样品的近红外光谱与样品的结构、组成或性质等测量参数(用标准或认可的参比方法测得的),采用化学计量学法加以关联,然后建立起待测量物质的分析模型,接着对未知样品光谱进行测定,应用己经建立的校正模型来快速预测样品待测量的含量。
本文主要针对化学品自动检测与鉴别需要,研究了利用近红外光谱测量技术,结合光谱特征提取与概率统计分析中的贝叶斯方法进行鉴别分类。首先,对测量仪器及方法进行了介绍;然后,利用近红外光谱仪测量了多种化学品,并研究了其光谱吸收特征;其次研究了基于光谱特征气体与贝叶斯方法的化学品鉴别分类算法;最后验证了该方法自动分类鉴别准确性。本文所研究的方法为实现化学品的在线快速检测提供了参考,具有比较重要的应用价值。
2 实验仪器与方法
2.1 光谱测量仪器与样品
本文研究中采用采用Ocean Optics公司生产的NIR QUEST-512近红外光谱仪与DH-2000氘-钨卤组合式光源进行近红外波长范围内化学品光谱检测,仪器如图1所示。光谱仪参数:光谱采集范围:900-1700nm,分辨率1nm,测量信噪比2000:1。
光谱测量软件采用Ocean Optics配套的光谱采集处理软件SpectraSuite进行,并计算得到样品吸光度光谱,在MATLAB软件基础上编程实现光谱特征处理与编写完成。
实验试剂采集光谱的典型化学品样品包括:邻苯二甲酸二壬酯;乙酸乙酯;邻苯二甲酸二乙酯;邻苯二甲酸二烯丙酯;苯甲酸乙酯;乙醇;甲醇。
2.2 光谱特征提取与分类算法
利用近红外光谱对化学品进行分类,由于化学品成分复杂,吸收峰重叠现象比较明显,很难利用指纹谱及特征峰识别方法实现有效分类,而不同化学品之间共性特征又会造成模型过拟合。因此,本文研究中首先采用主成分分析方法提取光谱特征并选择合适的分类识别准则,进行实现有效、快速、自动识别。
算法处理流程如图2所示。
根据主成分分析步骤及结果,前3个主成分分量基本代表了化学品光谱中95%以上的信息。因此,在后续分类模型中,采用前3个主成分取代原始射光谱,可以有效降低数据维数和识别模型复杂性。
贝叶斯(Bayes)分类器的是概率分析中的一種算法,通过计算P(Cj|t),来对数据t属于类Cj的概率进行分析,根据概率论中的贝叶斯定理有:
(1)
其中,P(Cj|t)表示类Cj在整个数据空间中的出现概率。根据“属性独立性假设”,即对于属于类Cj的所有数据,它们各个属性出现某个值的概率是相互独立的。类Cj中出现数据t的概率等于其中出现t的各属性值的概率的乘积。即:
。其中,tk是数据t的第k个属性值。其次,对于P(t),即数据t在整个数据空间中出现的概率,等于它在各分类中出现概率的总和,即:
。
(2)
利用可以在模型基础上该公式就是我们最终用于判断数据t分类的方法。其依赖的条件是:从训练数据中统计出P(tk|Cj)和P(Cj)。计算它属于各分类的概率,再取其中概率最大的作为分类的结果。
3 实验结果与分析
3.1 不同化学品光谱比较
为提高光谱测量准确性,采集光谱时先采集并存储暗光谱,再采集空样品池的光谱存为参考光谱(扣除暗光谱)。然后采集各化学的原始光谱,扣除暗光谱后,从而得到样品吸收光谱。按照上述步骤采集各样品的吸光光谱如图3所示。
从图中可以看出,不同中化学品吸收光谱形状差异较大,同种化学品之间存在一定的共同特征。同时化学结构越复杂