
PMF正交矩阵因子分解软件翻译.pdf
104页文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持PMF 是一个多变量因素分析工具,它把采样数据矩阵分解成两个矩阵:系数的贡献(G)和因字数(F) ,这些因子情况需要用户利用测得的源配置文件信息,以及排放或排放清单进行解释,以识别对样品有贡献的的源类型 该方法在这里简要回顾,在其他地方更详细地描述结果使用约束:没有样品可以有显著负贡献PMF 的使用样品的浓度和用户提供的不确定度进行各个点加权此功能允许分析人员占信心在测量例如,检测限下面的数据可以被保留用于该模型中, 与相关联的调整的不确定度,以便这些数据点比测量高于检测限的数据点,对解决方案有较小的影响因 子 贡 献 和 因 字 数 使PMF模 型 目 标 函 数Q最 小 化 Q 是 PMF 的一个关键参数,两个版本的 Q 显示在模型运行Q(真)计算是包括所有点的拟合优度参数Q(鲁棒)是计算排除不符合模型的点(定义为样品的量的不确定度残差大于 4)的拟合优度参数Q(真)和 Q(鲁棒)的区别在于测试残差高的数据的影响这些数据点可能与来自源的峰值影响相关联EPA PMF 需要底层多线性多次迭代(ME) ,以帮助识别最优化的因子贡献和因字数。
这是由于在 ME 算法的性质 ,用随机生成的因子数开始搜索因子配置文件 这一因素配置文件使用梯度的方法来绘制的到最佳的解决方案的最优路径在空间方面,该模型利用观察构建多维空间,然后使用梯度的方法来遍历空间 沿着这条道路找到最佳解决方案最佳的解决方案通常是由沿着路径的最低Q(稳健)值(即最小 Q)所识别,可以被想象成一个槽的底部在一个多维的空间中由于起点的随机性(由种子值和它表示的路径来确定) ,不能保证该梯度方法总能找到多维空间 (全球最低) 的最深点; 它可能找到一个局部的最低水平为了最大限度地达到全局最小, 该模型应为一个开发的解决方案运行 20次和 100次对一个最终的解决方案,每次以不同的起点因为 Q(鲁棒)不被那些没有被 PMF 拟合的点影响,它被用作一个关键参1word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持数从多个运行选择最佳的运行此外,可变性 Q(稳健)提供了一个指示(初始运行结果是否有显著变化) , 因为用来启动梯度算法的随机种子在不同的位置如果数据提供稳定的路径到最小,则间 Q(可靠)的值在不同运行之间将会变化很小(判据) 。
在其他情况下,该起始点和由数据定义的空间的组合会影响到最小值的路径,导致 Q(鲁棒)的值变化;最低 Q(健壮) 值默认使用,因为它代表了最优化的解决方案应当注意的是 Q 值的微小的变化并不一定表示该不同的运行具有的小的差异在源成分之间由于化学成分变化或过程变化引起的变异可能会造成因子配置的显著差异在 PMF 运行中提供两个诊断去评估不同运行间的差异:内部运行残差分析和物种分布的因素总结相比那些最低的 Q(稳健)运行用户必须评估 PMF 中的所有的错误估计去理解模型结果的稳定性;算法和 ME 输出 在 Paatero 等人进行了描述 (2014 年) PMF 的解决方案的差异可以使用三种方法估计:1、 自举(BS)分析用于确定是否有一个小的观察组可以不成比例地影响解决方案 BS 误差区间包括随机误差和部分包括旋转歧义的影响 旋转歧义是由 PMF 产生的在许多方面相似的无限的解决方案引起 也就是说,对于任意一对矩阵,可以通过简单的旋转一对矩阵可产生无限变化只有一个源的贡献非负的约束,不可能限制这个空间旋转 BS 错误估计通常是坚固的和不被用户指定的样品的不确定度影响2、替换(DISP)是一种分析方法,它可以帮助用户了解解决方案的更详细的细节,包括其对微小变化的敏感性。
DISP 误差区间包括旋转歧义的影响,但不包括数据中的随机误差的影响数据的不确定度将直接影响 DISP 误差估计 因此, 向下加权的物种的误差区间很可能大3、BS-DISP(混合方式)的误差区间包括随机误差和旋转歧义的影响 BS-DISP 结果比 DISP 结果更加可靠, 因为 BS-DISP 的 DISP 相不像 DISP 本身那样强烈2word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持这些方法在三个空气污染数据集中被应用在 Brown 等人 (2014年) 本文提供了基于环保局误差估计应用的解释 Paatero 等人 (2014)和布朗等人(2014 年)文献是美国环保署的 PMF 的重要参考,两者都提供了错误估计的详细信息和他们的解释, 这只简要介绍在本指南中1.21.2 多线性发动机多线性发动机如上所述,两种常见的方案解决了 PMF 的问题,最初, PMF2解决方案(Paatero,1997)被使用在 PMF2,非负约束可能被加在因子元素和最小二乘拟合时,测量将会被单独进行基于不确定度有了这些功能,PMF2 是环境数据的受体模型的显著改进对以前的主成分分析(PCA)技术。
然而,PMF2 是有局限的,因为它被设计来解决一个非常具体的 PMF 问题在20 世纪 90 年代后期,ME,一个更灵活的方案,开发出来(Paatero,1999) 这个方案,目前在它的第二个版本,并称为 ME-2 中,包括与 PMF2 许多相同的特征(例如,用户能够进行单独的加权测量,并提供非负约束条件) ;然而,不像PMF2,ME-2 的结构使得它可以用来解决各种多线性问题,包括双线性,三线性和混合模型ME-2 是通过将两个单独的步骤结合来解决 PMF 问题首先,用户定义感兴趣的 PMF 模型的表然后,一个自动化的二次程序读取表格模型参数,并计算该解决方案当采用 EPA PMF 解决 PMF 问题, 第一步是通过由所述 EPA PMF的用户界面产生的输入文件取得一旦指定了模型,数据和用户规格由EPA PMF送入二次 ME-2 程序ME-2 解决了 PMF 的迭代公式, 最小化求和-平方对象函数,Q,通过一系列的步骤,如图 1 一个稳定的解决方案已经达到,当额外的迭代用来降低提供的 Q 值递减 通过以上三个层次的迭代, 寻求解决方案从粗到细规模迭代的第一级识别空间解决方案的整体区域在这个水平 上,Q 的变化(DQ)需要小于0.1 超过 20 个连续的步骤且不到 800 步。
第二个水平识别的最终解决方案的附近这里,3word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持dQ 的要求小于 0.005 超过 50 个连续的步骤且不到 2000 的步骤 第三级收敛到最佳的 Q 值(Paatero,2000) ,其中 dQ 的应该小于 0.0003超过 100 个连续的步骤且小于 5000 的步骤ME-2 通常需要小数据集(小于 300 的观察)的几百次迭代和高达 2000 对于大型数据集(Paatero,2000) 如果没有找到一个解决方案,满足三个层次任何一个的要求,那么解决方案是不收敛的(Paatero,2000 年) 从ME-2 的输出由 EPA PMF读取,然后格式化由用户解释此外, EPA PMF具有通过 ME-2 和 EPA PMF实现的三个错误估计方法ME-2 和 PMF2 模型的结果之间的差异已通过相同的数据集各模型的,其结果的比较应用研究在几个研究中总的来说,这些研究显示了主要成分的相似的结果,但在 PMF2 溶液中的更大的不确定度(斋戒等人, 2003) , 并使用 ME-2 更好。
盲源分离 (Kim 等人, 2007) 在最近的两个出版物,要素配置文件限制由ME-2 的应用导致了发现的来源数量较多(阿马托等人,2009;阿马托和 Hopke,2012) EPAPMF5 版本采用了最新版本的 ME-2 和 PMF 的脚本文件,该文件 通过 Pentti Paatero 在赫尔辛基和雪莱埃伯利大学几何被开发 工具(2014 年 3 月 3日;me2gfP4_1345c4.exePMF_bs_6f8xx_sealed_GUI.ini)2 2PMFPMF 的使用的使用PMF 已应用于多种范围的数据,包括 24 小时分辨率的 PM 2.5数据,气溶胶粒度分辨,沉降物,有毒气体,高时间分辨率的测量,从气溶胶谱仪(AMS)得到的和挥发性有机化合物(VOC)的数据参考部分(第9 部分)提供了PMF 引用的众多参考关于PMF 应用的更多讨论可在多元受体建模工作簿中见到(Brown 等,2007) 我们鼓励用户阅读与他们的数据有关的论文以及源解析论文 用于 PMF分析的方法已经改变了,例如限制已提供重要引用总结于表 1 中4word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。
PMF 需要一个数据集通过多个样品检测得到的一组参数例如,PMF 常用于 100 个样品以上包含 1020 个物种的 PM2.5 数据集不确定度数据集,分配了每个种类和样品的不确定度值不确定度计算使用以往的不确定度或其他可用信息例如采样精度3 3、、PMF5.0PMF5.0 安装安装4、特点特点通过 PMF5.0 可获得以下特征1 整理数据 列在表中可以通过左键点击列标题进行排序点击一次会以递增顺序对项目进行排序, 点击两次将降序排序 如果列已排序,箭头会出现在标题显示在它的排序方向2 保存图像所有图形输出可以通过右键单击图像以各种格式保存可用的格式是.GIF 及.BMP,.png 和.TIFF在同一个菜单中,用户可以选择复印或打印图形 一种堆叠图形选项也可以把因子或者时间序列结合在一个页面当“复制”时,图形将被复制到剪贴板在“打印”时,图形将自动发送到本地机器上的默认打印机当保存一个图形,会出现一个对话框,以便用户可以改变文件的路径和文件的输出文件的名称5word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持3 出图任何图形可以在新窗口中打开通过右键单击图,并选择浮动窗口。
根据需要,用户可以打开多个窗口但是,当模型参数和输出改变时,浮动窗口的图形不更新4 调整表内部分许多标签都用灰线分隔成多个部分(图 2,红色箭头指向的灰色条使用户可以调整高度和宽度) 这些部分可以通过点击灰色的线并将其拖动到所需的位置调整大小5 显示选定的数据点当用户移动光标到一个散点图或时间序列图的一个点, 点用虚线正方形括住,状态栏上显示的信息是该点的信息6 在列表和表中使用箭头键选择(点击或Tab键)一个菜单或表,键盘上的箭头键可用于改变所选择的行7 访问帮助文件大多数屏幕的左下角有一个“帮助”快捷方式 提供用户访问的帮助文件与当前屏幕有关的主要功能8 使用状态栏大多数屏幕都在窗口底部的状态栏提供了额外的信息给用户 根据所选择的选项卡,这些信息在变动各个选项卡的详细信息将在本指南后面的章节中讨论浓度屏幕上散点图的状态栏的例子显示在图 2的底部6word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持5 开始启动每次 PMF5.0 程序启动时,有关该软件的各种版权的发展信息的闪屏将显示用户必须单击 OK 按钮或按空格键或回车键继续。
EPA PMF的第一窗口是数据模型选项卡下的数据文件,如图 3,在该屏幕上,用户可以提供文件的位置信息,并进行所需的选择这个屏幕具有三个部分:输入文件(图3,1) ,输出文件(图3,2) ,和配置文件(图3,3) ,每一个在下面有详细描述 EPA PMF5.0可以读取多个站点的数据 ; 物种浓度的时间序列图或源的贡献在将显示以相同的顺序像用户提供数据那样,PMF 显示垂直线区别不同的站点在数据文件屏幕底部的状态栏显示该项目的哪部分已经完成在数据文件屏幕底部的状态栏显示该项目的部分已经完成 在任何用户输入数据文件之前,屏幕上状态栏红色显示“NO 浓度数据,没有不确定度的数据,没有基础的结果,无自举结果,无BSDISP 结果,和NO DISP 结果”当任务完成后,“否”替换为“有”,颜色变为绿色在图 3 的例子中,浓度和不确定度的文件已经提供给程序,所以前两个项目上的状态栏是绿色的基本运行,BS 运行, BS-DISP 运行,7word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持DISP 运行尚未完成, 因此最后的四个项目是红色的。
巴尔的摩 pm 文件(数据集巴尔的摩背景和数据 set_Baltimore_unc.txt)是安装包的一部分,可以在被发现在“C:\文件\ EPA PMF\Data”文件夹,如果用户使用的是默认安装模式 安装设置5.15.1 输入文件输入文件PMF 所需的两个输入文件: (1)样品的物种的浓度值和(2)样品的物种的不确定度,或用于计算不确定度的参数 EPA PMF接受制表符分隔 (.txt) , 逗号分隔值 (CSV) , 和 Excel 工作簿 (.xls 或.XLSX)文件每个文件可以被加载通过输入路径进入“数据文件”框中输入或浏览到相应的文件如果文件包含多个工作表或命名区域,用户将被要求选择他们想要使用的一个浓度的文件具有物种如行所示和日期 , 样 品 编 号 如 列 所 示 , 都 有 一 个 标 题 ( 图4 )所有标准的日期和时间被接受,他们被列在日期格式下拉列表中四个可能的输入选项被接受: (1)只用样本 ID, (2)只有日期/时间,(3)样品ID 和日期/时间, (4)不带ID 或日期/时间单位可被包括作为浓度文件中的第二标题行,但不做要求,单位不包括在不确定度文件。
如果单位是由用户提供的,它们仅被用于图形用户界面(GUI)的轴标签,不会被所用的模型使用空白单元不被接受;用户将被提示检查数据,然后再试一次;品种名称不能包含逗号如果小于-999的值被发现在数据集,程序会给出一个警告信息,但将继续进行如8word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持果这些值并不是真值或指示是缺失值, 用户应该修改程序之外的数据文件,并重新加载数据集此外,每个品种的名称必须是唯一的用户必须指定日期/时间和 ID/站点列假如它们包含在输入数据里基本PMF 功能展示了使用单一站点的数据和多站点的数据的例子示于第8.1 节多个站点的数据应当把站点和日期/时间加载到 PMF 之前进行排序线划定样品 ID 将不会被显示出来如果缺失值是出现在样品ID 之间的过渡和 “排除缺失样本”选项将会被选择;缺失过渡的样本应该被移除或“用样品中位数代替缺失的样本”的将会入选图中输入文件画面的例 3样品种类的不确定度应该包括错误,如取样和分析误差对于某些数据集,分析实验室或报告机构提供了每个值的一个不确定度估计然而, 不确定度并不总是报告,当它们不可用时,误差必须由用户进行估计。
不确定度的的计算讨论在文献等人提供的 (2007 年) EPA PMF5.0 接受两种形式的不确定度的文件:基于观察和基于方程观察为基础的不确定度文件提供每个样品中的物种的不确定度的估算 它应该与浓度文件具有相同的尺寸和第一列仍然是日期,日期时间或样本号 ;然而,不确定度文件中不包括单位如果浓度文件中有包含单位的行,该不确定度的文件将比浓9word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持度文件少一行如果浓度和不确定度的列和行标题不相符,用户将得到通知,但该程序将继续进行此外, 该程序将检查以查看在浓度和不确定度的文件中的日期或样本数是否一致如果有一个不匹配的数据,程序将不会允许进行评估如果表头是不同的,由于命名,但实际上具有相同的顺序,用户可以继续进行下一个步骤如果不是,用户应纠正 GUI 以外的问题,并重新加载这些文件负值和零不能作为不确定度值; EPA PMF将提供一个错误信息,并且用户必须从 EPAPMF中 删 除 这 些 值 , 并 重 新 加 载 该 不 确 定 度 文 件 以方程为基础计算不确定度提供EPA PMF5.0用于计算每个样品不确定度的特异性参数。
这个文件应该具有的物种分隔的行,与物种的名称(图 5) 下一行应该是物种特异性的方法检出限( MDL(方法检出限) ) ,随后是不确定度的行(物种特异性) 任一检测限或不确定度百分数都不允许零和负值如果浓度小于或等于所提供的 MDL(方法检出限) ,不确定度( UNC)的计算使用MDL(方法检出限)的固定部分(公式 5-1; Polissar 等,1998) Unc =5/6.MDL(方法检出限)如果浓度大于提供的 MDL(方法检出限) ,该计算是基于用户提供的浓度分数和 MDL(方法检出限) (方程 5-2)10word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持基于方程的样本不确定度文件 (数据集巴尔的摩等式) 已在 C: \文档\ EPA PMF\Data 文件夹中提供了该方程为基础的不确定度是有用的,如果仅 MDL(方法检出限)和误差百分比可用;然而,这种方法不会捕获与特定样品相关联的错误由方程为基础的方法计算出的不确定度,由于简化,不与巴尔的摩unc.txt 匹配用户可以在屏幕上的输入文件中指定一个缺失值指标(可以是任何数值)的数据文件。
用户不应该选择一个数字指标那可能是一个真正的浓度例如,如果用户指定的“-999”作为缺失值指示符,以及选择要替换该物种用中位数,程序将找到的数据文件中的“-999”的所有实例,并将它们用物种特异性中位数替代该程序将取代所有相关的不确定度值, 用一个比物种特异性中位数 4 倍高的不确定度如果所有样本的一个物种的丢失,该物种被自动归类为“坏”,并排除进一步分析缺少的值指示符被用在输出的文件如果显示一条消息,浓度和不确定度的文件中的日期 /时间不相匹配,用户需要检查文件的日期/时间,并能够在评估 PMF 中的数据之前,重新加载数据如果日期/时间在这两个文件是相同的,尝试以不同格式保存的浓度和数据文件,如.csv 或.txt5.25.2 输出文件输出文件用户可以指定输出目录 (“输出文件夹”) , 选择环保局PMF输出文件类型 (“输出文件类型”单选按钮) ,并定义一个输出文件的前缀(“输出文件前缀”) ,前缀将被添加到每个文件的开头;例如在图 3 的例子中,文件将被保存为Balt_profile.xls对于在用户指南中的示例中,前缀用星号(*) 输出文件类型”包括制表符分隔的文本(txt) ,逗号分隔值(。
CSV)或 Excel 工作簿(的.xls) 输出文件前缀”是将被作为任何输出文件的第一部分 ;该前缀可以包含任何字母和/或数字(例如其它字符 “ - ”和“_”是不允许的) 如果在启动一个新的运行前不改变这个前缀,警告将被显示如果输出为 Excel 工作簿被选择,两个输出文件将自动被创建由 EPA PMF在基础运行期间,并保存在由用户选择的我的文档\EPA PMF\输出文件夹:*_base.xls 和* diagnostics.xls.每一个文件有标签和 PMF11word格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持•*_base.xls – 轮廓,贡献值,残差,运行比较•*- diagnostics.xls – 总结,输入,基本运行如果选择分隔的输出, 在基本运行选项卡上的相应的信息将作为单独的文件提供并且诊断选项卡上的信息将合并到一个文件中以下列表提供关于被保存在Excel 中输出文件中的数据的细节进行引导后, 附加文件被创建和保存:(*_profile_boot) , DISP(*_DISPres1,*_DISPres2,*_DISPres3,*_DISPres4) ,BS-DISP(*_BSDISP1,*_BSDISP2,*_BSDISP3 , *_BSDISP4 ) , FPEAK ( *_fpeak ) , 和 / 或 约 束 的 模 型 运 行(*_Constrained) 。
DISP 和 BS-DISP 的这四个文件输出为是为每个 dQmax;使用了 最 低dQmax的 运 行 在 图 形 和 输 出 文 件 总 结 中 使 用 了 文 件*_ErrorEstimationSummary 提供了使用 BS,DISP,和 BS-DISP 错误估计已经完成的基本运行和错误总结 文件*_profile_boot 包含了 BS 映射到每个基础运行的次数,每一个被映射到基础轮廓的 BS 轮廓,和由 GUI 生成的所有的引导统计该文件*_fpeak 包含轮廓和每次 FPEAK 运行的贡献当多个基础模型运行完成后,默认情况下,只有以最低 Q(robust) 值运行的运行保存到输出端,但用户可以选择在输出中包含的所有运行通过取消选择“只有选定的运行输出5.35.3 配置文件配置文件EPA PMF 提供了在一个配置文件中保存优先运行和输入参数的选择用户必须对屏幕输入文件上的配置文件提供一个名称来创建一个配置文件 保存在配置文件中的信息包括数据文件屏幕的一些信息 (如,输入文件,输出文件的位置和输出文件类型) ,浓度/不确定度屏幕上的物种分类,基础模型屏幕上的所有运行规范,FPEAK 旋转屏幕,约束模型运行画面。
模型输出不保存为配置文件的一部分;然而,如果随机开始按钮被选中,模型随机起点或种子数目将被保存为了选择一个配置文件,用户可以点击“浏览”,浏览到正确的路径或键入一个路径和名称 用户也可以按“加载上次”按钮或直接按键盘上的“Enter”键加载最近使用的配置文件 “保存”和“另存为”按钮可用于将当前设置保存到现有的或新的配置文件配置文件可以被用在多台计算机或与合作者共享, 从而避免喜好一长串复制12word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持使用“浏览”按钮找到并加载配置文件浓度和不确定度的文件的位置必须在下一步确定 PMF 不存储过去的运行数据;然而, 相同结果可以很容易地通过PMF 计算只要使用相同的因子数,运行,以及固定的种子(随机开始没有被选中) 5.45.4 建议的操作顺序建议的操作顺序图形用户界面被设计当运行 PMF 模型时给用户尽可能多的灵活性但是,某些步骤必须完成以利用所提供的工具的潜能 操作的顺序主要基于标签和功能在程序中怎样安排(从左至右) (图 6,图7,图8);本用户指南中的部分也按照这个顺序。
开始使用该程序时,在其他操作可用之前,用户必须提供输入文件通过数据文件屏幕在第一次,PMF 对数据集执行时,用户应通过浓缩/不确定度,浓度散点图, 浓度时间序列和数据异常画面分析输入数据这一步通常后跟基本模型选项卡下的基本模型运行和基本模型结果;根据需要,这些步骤应重复,直到用户达到一个合理的解决方案 该解决方案使用误差估计进行评估, 以 DISP 开始,和进展到 BS 与 BS-DISP;来自误差估计方法(DISP,BS 和 BS-DISP)的输出提供了关于该方案的稳定性的关键信息 所有这三种错误估计方法都需要了解与解决方案相关的不确定度 高级用户可能希望启动以一个选定的基础运行为基础的 FPEAK 运行或限制的模型 ; 在旋转工具选项卡下,这两个选项都可用13word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持5.55.5 分析输入数据分析输入数据运行模型前有几个工具可以帮助用户分析浓度和不确定度的数据 这些工具可帮助用户决定某些物种是否应被排除或向下加权(例, 由于增加了不确定度或低信号噪声比) ,或者某些样本是否应排除在外(例如由于一个异常事件) 。
所有更改和删除应报告的在最终解决方案四个屏幕用于分析输入数据如下所述14word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持输入数据的统计和浓度/不确定散点图呈现在浓度/不确定度画面,如图 9 所示以下统计计算每个物种和显示在屏幕左边的表中(图 9 中,1) :15word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持16word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持其中,n 表示所选择的变量的非缺失值的数目; p 是感兴趣的百分位; I 是 L(N,P)的整数部分; F 表示 L(N,P)的小数部分; W1, W2 和 W3 是权重; P是在 p 个百分点;和 X1,X2... XN 表示感兴趣的变量的有序值EPA PMF的 S / N 的计算在新的版本已经进行了修订先前,在给定物种的S / N 基本上是由不确定度值的总和除以该浓度值的总和而事实上,这可能导致在某些特定情况下不同的问题。
虚高的 S / N 值将从物种屈指可数的高浓度事件获得,导致一个 S / N 实际上可能比另一个更稳定的信号的物种的 S / N 更高更为严重的是,人为的低 S / N 值可能出现在有几个遗漏值的物种上缺失值通常由非常大的不确定度值降低权重,通常(远)高于物种中的最大浓度值如果先于摄取到 EPA PMF 之前对数据做这一步,这种膨胀的不确定度值就会在 S / N 的计算中膨胀 N,从而导致 S / N 足够小,以使一个分类完美的“强”变为“弱” 后一个问题已多次在实际工作中观察到 此外, 小的负浓度值的存在,17word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持在环境数据中并不罕见,可以人为地降低 S 以致一个物种的 S / N在修改后的计算中,仅超过了不确定度的浓度值对 S / N 计算的信号部分有作用,因为浓度值基本上等于信号和噪声的总和,因此,信号是浓度和不确定度之间的区别两个计算执行来确定 S / N,其中,低于不确定度的浓度值被确定为没有信号,并且高于不确定度的浓度:浓度(Ⅺ)和不确定度( SI)之间的差值被用作信号(公式 5-3) :这个新的 S / N 的计算结果是浓度总是低于其不确定度的物种 S / N 为 0.与浓度是不确定度值两倍的, S / N 为 1,S/ N 大于 1 的通常表示一个物种“好”的信号,虽然这取决于不确定度如何进行测定。
负浓度值对 S / N 无贡献,和有屈指可数的高浓度的事件的物种将不会有虚高的 S / N虽然有许多方法来确定 S /N,在 EPA PMF 新版本所选择的一个可能会环境数据分析中更有益,与之前的版本相比,但需要提醒的是 S / N 只是许多筛选数据的分析之一基于这些统计和分析和取样问题的认识,用户可以把一个物种分类为“强”,“弱”或“坏”,通过选择该品种在输入统计数据表中(图9,1) ,并按桌面下相应的按钮(图 9,2) 此外,ALT + W,Alt + B 键和 Alt+ G 可以用来改变一个物种类别,弱,差, 或不错所有物种的默认值是“强” 分类为“弱”的物种三倍其所提供的不确定度,分类为“坏”的,在余下的分析中全部排除如果一个物种被标记为“弱”,该行显示为橙色;如果一个物种被标记为“坏”的,行高亮显示为粉色当为每个物种选择种类,用户应该考虑的是,源的存在可能对物种有贡献根据测得的文件, 点源的示踪元素可能有罕见的影响, 缺失或低于检测限的样品的数目,关于物种的收集或分析的众所周知的问题,以及物种的反应关于这些考虑的讨论在 R 等的文献中提供来源,取样和不确定度分析的18word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持详细知识是决定物种类别的最佳方式 如果对数据集的详细信息不可用, S/ N 比可以被用于一种或多种物质的分类保守地使用 S/ N 比来进行分类,如果 S / N比小于 0.5,该品种分类为“差”,如果S / N 比大于 0.5,但小于1,为“弱”对于样本提供的安装包(数据集,Baltimore_con.txt 和数据集中,Baltimore_unc.txt)的巴尔的摩的数据集,这些准则将铝,砷,钡,氯,铬,锰和硒分类为“坏”和铅,镍,钛和钒为“弱” 通过改变物种类别为“弱”或通过添加额外的模型不确定度引起用户提供的不确定的任何改变应该由用户记录并报告最终的解决方案对于熟悉 EPA PMF的用户,表 2 显示了巴尔的摩输入信息的总结,它应用在第 5 及 6 部分演示 PMF本总结信息将呈递给当学习美国环保署的 PMF5.0的新功能和结构时愿意来运行软件的用户浓度/不确定度散点图被显示在屏幕的右侧(图 9,3) ,图中显示的浓度和用户提供或 PMF 计算的不确定度之间的关系输入数据统计表格中的被绘制的因素被选择,通过点击物种行或向上和向下滚动,一次只能显示一个物种。
每个种类的统计示于表:S/ N;最小值(MIN) ,第 25,第 50,和第 75 百分位;最大值(Max) ,%模型样品(由与所选物种匹配的非缺失的样本的数目除以输入样本19word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持的总数) ,和%原始试样(由非缺失的输入样本数目除以输入样本的总数量) 例如, 如果四个位点有相等的数据点数目和没有缺失数据被摄入,且只有四个位点中的一个位点被列入建模,“%模型样本”=25%,而“%原始样本”为 100%,因为有当摄取时没有数据直接减少如果在摄入数据中有丢失的数据,而对缺失数据进行“排除整个样本”选择, 包括模拟%和%原料将会降低 最后两个值是重要的,因为 PMF 要求所有的好或弱类物种对被包括在 PMF 运行中的样品是不可缺少的 在%模型样品和%原样品可用于鉴定物种,该物种可用于限制在一个运行中使用的样本的总数X 轴是浓度,Y 轴是不确定度,并且该图表标题是物种绘制名如果用户改变一个物种分类为“弱, 该物种”浓度/不确定散点图将被更新以三倍原来的不确定度,数据点会变为橙色正方形。
如果用户改变一个物种分类为“坏”,该物种图将不会显示 典型的浓度和不确定度的关系是曲棍球棒的形状当在低浓度下 MDL(方法检出限)占主导地位的不确定度,成为线性当浓度的百分比占主导地位的不确定度不按数据的总趋势的不确定度的点,应该通过读取可用的采样和分析报告进行进一步评估用户还可以增加“额外模型不确定度(0-100%)”施加到所有物种,通过在20word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持屏幕的右下角的框中输入一个值(图 9,4) 此值包括各种误差,不考虑测量或分析误差和这两个误差被包括在用户提供的不确定度文件中 可能导致模型误差的事件包括的源配置文件变化和大气中的化学变化该模型使用“额外模型不确定度”变量来计算“sigma 西格玛”,这相当于总的不确定度(模型的不确定度加上物种/特定样品的不确定度) 如果用户指定额外的模型不确定度, 所有的浓度/不确定度的图将被更新以反映增加的不确定度 如公式 1-2 所示, 不确定度值是 PMF模型的重要输入在 该 屏 幕 上 , 用 户 还 可 以 指 定 “ 总 变 量 ” ( 图9 , 2 ),后期,程序将用它处理结果。
例如,如果所使用的数据是 PM2.5 组分的,总的变量将是 PM2.5 质量用户通过指定种类选择总变量和按输入数据统计表格下方的“总变量”按钮由于一个总变量对解决方案应该不会有一个大的影响,因此它应该给予高的不确定度因此,当一个物种被选为总变量,它的分类是自动设定为“弱”,如果用户已经在 PMF 之外调整了总变量的不确定度,并希望把它归21word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持类为“强”, 默认特性可被覆盖通过选择“强”为变量在选择“总变量”后指定的“坏”一个物种不能选择作为一个整体变量,总变量也不能指定为“坏”在浓度/不确定度屏幕的状态栏显示每一类物种的数量以及用户排除样本的百分数热键可以用来指定“强”(ALT-S) ,“弱”(ALT-W) ,“坏”(ALT-B)和“总变” (ALT-T) 用户同时可以通过单击列标题对输入的数据进行排序 点击“物种”和“种类”列对输入的数据将按照字母进行排序或反向字母顺序排列 点击其余各列按升序或降序对数据进行排序返回到原来的种排列顺序(其对应于数据文件屏所输入的浓度数据文件中列出的顺序) ,用户可以选择“不排序”(图 9,2) ,或者使用热键(ALT-U) 。
物种之间的散点图是一个有用的PMF预分析工具;物种之间的相关关系表示了类似的源类型或源位置用户应检查散点图寻找预期的关系, 以及寻找其他关系,可能表示源或源类别此浓度散点图屏幕显示两个用户指定的物种(图10)之间的散点图22word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持用户在相应的“Y 轴”或“X 轴”列表为每个轴选择物种每个轴只能选择一个物种一个一对一的线(蓝色)和线性回归线(虚线红色)显示在图上轴标签是物种名称和单位(如有提供)及图的标题是“Y 轴物种/ X 轴的物种 物种之间线性关系的一些例子指明源的影响: 铁和锌的来源钢铁生产和硫酸铵的硫酸根和铵离子来自燃煤电厂当用户将鼠标放在该点,在窗口底部的状态栏中显示日期,y 值,x 值,以及回归方程23word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持物种浓度的时间序列图(图 11)是有用的,以确定预期的时间模式是否存在于该数据中,以及是否有任何不寻常的事件通过叠加多个品种,用户可以查看是否有任何不寻常的事件是通过一组物种可能表明一个共同源存在。
用户也应当检查应被排除模型的时间序列极端事件(例如,升高的钾浓度在七月四日来自烟花 烟花影响可能在七月四日之前和之后以及除夕 (浓度升高对1月1日采样) 用户可以选择多达 10 种物种名称在浓度时间序列表中通过选中每一个物种名称的旁的复选框(图 11 中的 1) 所选的物种将被以不同颜色显示要从图中清除所有物种,用户应选择列表下面的“清除选择”垂直橙色线表示每年的 1 月1 日(如适用)作为参考带有物种名称和单位的(如果有的话)的一个说明在图顶部提供 该说明对每一个选择自动更新状态栏显示选择的样品的日期和时间,如果提供了样品的 ID,样品的数目包括了总样排除的数目,以及用户排除的样品的百分数图下面的箭头按钮,或键盘上的左,右键,箭头键,可用于滚动样品如果一组样品被选择,箭头将指向第一个选择的样品,前进 /后退一个样 样品可以从分析中移除通过选择单个数据点用鼠标单击或拖动鼠标移到某个日期范围中按图下面的“排除样品”按钮将删除样本以及从所有物种中移除(图11 中的 2) 排除样品可以再次包括进来,通过选择数据点/范围上任何物种的时间序列图和按“还原样品”按钮如果一个样品从分析中移除,也不会被包含在24word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持由 EPA PMF 生成的统计信息或图中或者任何模型的输出中,但它不会从原始的用户输入文件中删除热键可以用来排除(ALT-E)或恢复(ALT-R)选择的样品一些受烟花爆竹影响的样品被排除在外:02 年 7 月 4 日,02 年 7 月 7 日,02 年 7 月 8 日, 02 年 12 月 31 日, 03 年 7 月 5 日, 01/01/05, 07/ 03 / 05, 07/01/06,而 06 年 7 月 4 日影响如烟花的影响,对 PMF 和多变量模型是一个挑战,因为他们是罕见持续时间短的高浓度事件由 GUI 引起的输入数据的变化在数据异常画面有详细描述这些变化包括指定一个物种“弱”或“坏”, 排除一个样本通过浓度时间序列图,或者排除一个样本使用“缺失值指标”在数据文件屏幕的“输入文件”对话框点击鼠标右键,保存数据异常信息5.65.6 基本模型运行基本模型运行基本模型运行产生主要的 PMF 因子和贡献输出基本模型运行采用一个新的随机种子或出发点用于迭代如果选择了“随机启动”选项 用户可以测试该解决方案是否是局部或全局最小通过使用许多随机种子并检查 Q (稳健) 值是否稳定。
恒定的种子可以通过取消选择“随机启动”对话框进行设置因子数相同,运行相同的恒定的种子将产生同样的 PMF 结果,种子也被保存在配置文件中该配置文件可以被重新加载为 PMF 解决方案额外的评价,也可以发送给合作者进行PMF 解决方案的评价25word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持基本模型运行在基本模型标签下的基本模型屏幕启动下面的参数需要指定:“运行次数”-要执行的模型的运行次数,;这个数字必须是介于 1 和 999 之间的整数运行的推荐数量是 20,这将允许评估 Q 的变化因子数”-模型应该选择的适合的因子数目;这个数目必须介于 1 和 999 之间的整数因子数的选择将取决于用户对影响样品的源因素,样品的数目,采样时间分辨率,物种特性的理解种子”- ME-2 每次迭代的起点,默认是随机启动,这告诉 GUI 每次运行随机选择一个起点随机种子数会显示在“种子数”对话框(图 12,1) 为了再现结果,取消选择“随机开始”选项,以使所用的种子数目将被保存为.cfg 文件的一部分,并因此相同的解决方案创建利用相同的.cfg 文件(图 12,2) 。
指定上述参数后,用户应该按基本模型上的“运行”按钮启动基本运行一旦运行被启动,在屏幕的右下角的“运行进度”框激活基本模型运行可以随时终止通过按下“运行进度”对话框下的“停止”按钮在这个对话框中的进度条充满当该运行完成当运行停止,有关运行的信息将不会被保存或者显示在基本模型运行屏幕的状态栏与数据文件屏幕一样显示相同的信息26word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持当基本运行完成后, 每次运行的总结出现在基本模型运行画面中的右侧部分在基本模型运行总结表中(图 13 中的红色框) Q值是用公式1-2计算的拟合优度参数, 是对模型拟合输入数据进行的很好评估用最低的 Q(鲁棒)的运行被高亮显示,并且只有融合解决方案应进行审查 不收敛表明该模型没有找到任何极小 有几种情况可能导致不收敛,包括不确定度过低或指定不正确或不恰当的输入参数Q(稳健)和 Q(真)值提供了运行的拟合的比较,通过比较残差提供更详细的比较 内运行残差计算与基本模型间的残差相比通过增加每一对基本运行缩27word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持放残差的不确定度之间的平方(公式 5-5) :其中,r 是经缩放的残差,i 为样品,j 是变量,而 k 和 l 是两个不同的运行这些结果显示在一个矩阵中, 并且可以用于识别具有显著不同拟合度的运行 此外,对于每个运行一对物种值可以通过增加 d 值(公式 5-6)进行比较D 值在一个基础运行对矩阵里被报告用户应该检查这个矩阵大的变化,这表明两个运行分导致真正的不同的解决方案,而不仅仅是彼此旋转如果不同的解决方案被看到,用户应检查 d 值,这将表明,个别物种在整个运行中具有不同的拟合度这些因子中的每个因子的物质的浓度分布和种类总和百分比结果也被评估: 最低的 Q 值,最小值(MIN) ,第 25 百分位,第 50 百分位数,第 75 百分位数,最大值(MAX) ,平均值,标准差(SD) ,相对标准偏差(SD* 100 /平均值) ,和 RSD%最低 Q物种分布的大的变化可表示因子信息正在改变,由于处理变化,反应性,或测量的问题28word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。
这些内部运行变化的结果都记录在*诊断文件,并可以查看通过 GUI 通过选择诊断选项卡并滚动查看“规模化残差分析此外,该相对于最低 Q(强大的)运行的物种分布的因子的总结记录在*_run 比较文件, 并可以通过 GUI 选择诊断选项卡和窗口下的“运行比较统计查看基本模型运行结果的详细信息在基本模型结果选项卡下的屏幕中提供 以最低Q(稳健)值运行的结果会自动显示用户可以改变运行次数,通过高亮显示在基础模型运行屏幕的基础模型运行总结表, 或在基本模型结果屏幕底部选择运行数目残差分析残差分析残差分析画面(图14)对于选定的运行以多种格式显示缩放残差的不确定度在屏幕的左侧(图14 中的 1) ,用户可以选择一个物种,这将被显示在屏幕中央的直方图中(图14 中的 2) 直方图显示了在一个给定的箱图中所有缩放的残差(每个箱等于 0.5)的百分数这些图是有用的,对确定模型是否很好的拟合每个物种 如果一个物种有许多规模较大的残差或显示不正常的曲线,它可能是一个很差的不合适的指示在图 14 中的物种(硫酸盐)是模拟较好;所有的残差在 3 和-3 之间,且他们是正态分布的在 3 和-3 之间提供灰线供参考选择“自动调整直方图”对话框设置y 轴最大范围为每个物种最大箱图值的+10%。
如果选中该复选框, y 轴最大值固定为 100%残差超过+3 和-3 的物种需要在 OBS/预测散点图和时间序列的屏幕中进行评估大的正缩放残差可能表明 PMF 未嵌合该物种或物种的存在于一个罕见源该屏幕还显示缩放残差大于用户指定值的样品(图14 中的 3) 默认值是3.0残差可通过选择上表中相应的选项显示为“日期物种”或“物种日期”当在左边的列表中选择了一个物种(图 14,1) ,右边的表(图 14,3)自动滚动到该物种29word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持观察观察/ /预测散点图预测散点图观察(输入数据)值和预测(模拟)值之间的比较是非常有用的,以确定该模型能很好地适合每个品种 观察值和预测值之间没有强相关性的物种应该由用户进行评估,以确定它们是否应当向下降低权重或排除出模型在观测/预测松散点图屏幕的表显示每个物种相应的基础运行统计 (图 15, 1) 这些数字是用观察和预测的浓度进行计算来表示每个物种与模型适合度 统计数据显示相关系数(R2) ,截距,截距 SE(标准误差) ,斜率,斜率 SE,SE 和普通残差(正常残差)的系数。
该表还显示残差是否是正态分布的,如通过柯尔莫哥洛夫 - 斯米尔诺夫检验如果测试结果表明残差不是正态分布的,用户应目视检查直方图外围残差如果不是所有的统计数据都是可见的,用户可以在表的底部和侧面使用滚动条以显示更多的数据这些统计数据中还提供在*诊断输出文件观测/预测散点图(图 15 中 2)示出了对于选定的物种的观察到的(x 轴)和预测的(y 轴)的浓度提供一个蓝色的一对一的线以供参考(一个完美的结合会完全一致的在这条线上) ,和回归线显示为红色虚线该屏幕(图15)状态栏上显示日期,x 值,y 值和预测和观察数据之间的回归方程,当滑动鼠标在数据点(图 15,3) 30word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持观察/预测时间序列该观测/预测散点图屏幕上显示的数据与 OB/预测时间序列界面(图 16)的数据是相同的当一个物种由用户选择,种类所观察到的(用户输入)的数据显示为蓝色和预测的(模型)的数据被显示为红色用户可以查看此屏幕来确定何时模型很好拟合观测数据如果一个物种的峰值不是由模型产生的, 他可能建议排除该物种或改变物种类别至薄弱。
该屏幕上状态栏显示时间,样品观察和预测的31word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持浓度最接近的黑色垂直点的参考线配置文件/贡献通过 PMF 解决的因子都显示在配置文件/贡献屏幕每个因子显示两个图,一个显示因子文件和另一个显示每个因子对每个样本的贡献(图 17) 32word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持该因子图,在上面显示出来(图 17,1) ,显示分配到因子的各物质的浓度,为淡蓝色的条纹和红色框中的分摊到每个因子的每个物种的百分比 浓度栏对应左边的 y 轴,这是一个对数标度物种的百分比对应于右边的 y 轴底部图显示了各因素对总质量的贡献(图 17 中的 2) 此图是正态化的,使得所有贡献对每个因子的贡献平均值为 1在此屏幕上的状态栏(图 17 中的红色框)显示数据点的日期和贡献,当滑动鼠标在因子贡献图上配置文件/贡献屏幕的底部的下拉菜单使用户可以轻松地比较运行和因子在左下角开始, 每次运行时可通过切换并点击相应的运行数量来选择。
用户可以快速比较运行以评估该解决方案的稳定性或确定什么, 如果有的话,单个物种或因子在不同的运行之间是变化的用户可以在 PMF 产生的因子中间切换,通过使用从左侧的下拉菜单中的左数第二个因子 1 是当前选定的 用户可以创建一个因子或时间序列的叠放图通过首先选择因子分布图或因子浓度图解, 右键单击查看菜单,选择“叠放图33word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持如果一个总变量被选择,用户可以选择配置文件 /贡献屏幕左下角的 “浓度单位”, 以同一个单位显示浓度对总质量的贡献(图 18) 如果此选项选择,GUI乘以在那个因子中的总变量质量的贡献状态栏显示日期,因子贡献,入选总变量,该物种的因子,当滑动鼠标在要素贡献图上(图18 中的红色框) 如果没有总变质量被分摊到该因子中,图形不显示,GUI 显示“总变量质量为 0 对此运行/因子34word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持用户可以在配置文件贡献/屏幕上给一个因子命名,右键点击鼠标查看菜单,选择“因子的名称”键入一个唯一的名称,然后按“Apply(应用)因子名称。
新的因子名称将出现在指纹因子,G-空间叠加,要素贡献,诊断画面 因子 1 具有高浓度的硫酸盐和铵离子,它代表煤电厂的燃烧二次硫酸盐的形成从 PMF 因素识别,需要检讨衡量物种的关系一些源也很容易识别 ;工业源,例如,可以通过在锌浓度的峰占主导地位其它来源可能更加难以识别该物种 Q /预期(Q / Qexp)可以通过配置文件/贡献选项卡(图19)上选择“Q/ Qexp”切换显示Q 预期等于(X 中非弱数据值的数目) - (数字中,G 和 F的元素数目加在一起) 例如,五个因子,642 的样品,和 19 个强的物种,这等于(642* 19) - ( (5 *642)+(5 *19) ) ,或 8893对于每个物种,一个物种的 Q/ Qexp 是物种经缩放的残差的平方和除以所有 Qexp 除以强物种数对于每个样品,Q / Qexp 是所有物种经缩放的残差的平方和,除以物种的数量检查Q/ Qexp 图是了解 PMF 解决方案的残差的有效途径,特别是,什么样本和/或物种并没有得到很好建模(即,具有大于 2 的值) 种类的结果的比较表明,EC 和OC 具有高的 Q / Qexp 值, 这可能表示机动车贡献可以通过加入其它来源得到更好的解释(图19 中的 1) 。
此外, Q/ Qexp 值的时间序列示出了两天的物种的浓度与其他天相比适合的不怎么好, (图 19,2) 这几天可能有特别的来源影响,35word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持应进一步调查因子指纹因子指纹每一个物种对每个因子的贡献 (百分比) 在因子指纹屏幕显示为堆积条形图 (图20) 此图可用于确认因子名称和确定个体物种的因素分布该图仅显示当前选定的运行要改变运行时,用户可以选择不同的运行次数在残差分析,观测 /预测散点图,观测/预测时间序列,或配置文件/屏幕底部左侧角落36word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持G -G - 空间图空间图G-空间图画面(图 21)显示一个因子与另一个因子的散点图,它可以用来评估旋转歧义以及源的贡献之间的关系一个更稳定的解决方案,将有许多样品在两个轴上的贡献为零,它提供了以更少的旋转歧义更大的稳定性的 PMF 的解决方案 一个解决方案或源组合也可能没有点在轴上或附近,这导致较大的旋转歧义。
用户在屏幕的左边菜单里选择一个因素为 y 轴一个因素为 x 轴 这些因子的散点图将在右边屏幕显示图 21 中的图是一个因子非最优旋转的一个例子,它具有一个上部边缘, 不与 G-空间图中的轴对齐 (加入红色线供参考) 在 EPA PMF中,用户可以探索不同的旋转通过选项(Paatero 等人,2005) ,其详细解释在第 6.1 节G 空间图,也有用对因子源贡献之间关系的理解,图 21 显示区域的二次硫酸盐和当地钢铁生产之间没有关系37word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持因子贡献因子贡献因子贡献屏幕(图 22)示出了两个图上面图是饼状图,显示各物种在通过PMF 解决的因子之间的分布(图 22,1) 感兴趣的物种在屏幕左边的表中被选择,该物种的分类也显示以供参考如果用户选择浓缩 /不确定度屏幕下方的一个总变量,该变量在表中粗体显示所选物种的饼状图在画面的右侧如果用户已经指定了一个总的变量,该变量在整个因子的分布将是特别重要的用户也可能希望检查关键的源示踪剂物种的跨因素的分布 底部图显示所有的因子对样品的总质量的贡献(图 22 中的 2) 。
带点橙色线表示每年的 1 月 1 日该图是正态化的,使得各个因子的加起来的所有贡献的平均值为1,以允许源贡献的时间模式的比较诊断诊断诊断屏幕上显示两个输出,也保存在输出目录:*诊断和*_run 比较文件38word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持输出文件输出文件基本运行完成后,在 GUI 创建包含所有用于在屏幕上显示结果的数据的输出文件创建的输出文件的数量取决于所选的输出文件的类型:制表符分隔(*TXT) , 并用逗号分隔 (* CSV) 创建五个输出文件 - * _诊断, *_contrib, *_profile,*_resid 和*_runcomparisonExcel 工作簿(* .xls)创建两个输出文件 - *_diag 和*_base输出文件被保存到数据文件中屏幕 “输出文件夹”对话框中指定的目录中,使用“输出文件前缀”框中指定的前缀诊断包含了用户输入和模型诊断信息(等同于诊断画面)的记录贡献率-包含用于生成配置文件/贡献选项卡上贡献图的各基础运行的贡献贡献是由运行次数排序. 首先显示正态化的贡献,接着是以质量单位表示的贡献如果指定了总变量的话。
文件,包含了每次用于在因子/贡献表中产生因子图的基础运行的文件配置文件由运行次数进行排序,以质量单位的配置文件将首先写入,随后物种的百分比和物种的浓度百分数的配置文件,如果指定了总质量的变量残差-包含每个基础运行的残差(常规和不确定度缩放) ,用于产生残差分析屏39word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持幕上的图表运行比较--包含了所有的 PMF 运行的各因素的物种贡献的总结和比较最低的Q(稳健)运行*_base--包含*_contrib,*_profile,*_resid 和**_run_comparison 在同一个 Excel工作簿单独的工作表该输出文件只有当用户选择“Excel 工作簿”作为输出文件类型出现因子名称,可以在配置文件/贡献屏幕或基本运行画面上输入或修改基本运行完成后,位于基本模型的左下部运行画面的“因子名称”框将被填充(图 23,红色方框) 矩阵中的每一行都将用运行数来标记,以升序排列,每列由因子数来标记,以升序排列然后填入该表与每个列标题相关的因素名字因子名称用于指示具体解决方案在用于评估模型结果的工具中。
用户可以输入自己的因素名称,这将取代默认的在因子名称表中,并保存在配置文件中用户可以为所有的基本运行设置一个唯一的名字通过在一个单元格输入名称, 然后按“应用到所有运行”按钮,更新配置和贡献文件名里的因子名称按“更新 Diag(诊断)文件”的按钮;或按重新加载预设系数的名字进入因子名称表“重置为默认值”应当指出的是, 如果用户加载现有配置文件用用户定义的因子的名称,并用随机种子启动基本模型运行,运行解决方案中因子顺序可能改变在这种情况下,GUI 将生成一个弹出警告,提醒用户以确认先前的因子名称是合适的在 PMF 中可用的误差估计方法简短的描述连同例子因子浓度(蓝色)和三种方法误差上限如图 24 所示对于 BS 上的错误估计上限锌来源是最低的和 DISP和 BS-DISP 的估计增加随机误差估计用BS 法在本节中描述此外,在因子解析解决方案文献中估计不确定度的方法(Paatero 等,2014 年)提供了 PMF 误差估计方法的一个详细说明40word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持5.75.7 基本模型替代误差估计基本模型替代误差估计该 DISP 明确探讨了 PMF 的解决方案的旋转歧义,通过评估源配置文件值的最大范围,而不明显增加 Q 值。
DISP 误差估计可以在不运行 BS 下运行,也可以 BS 与 BS-DISP 之后运行(分别在第 5.8 和 5.9,讨论) 对于由用户选择的解决方案, 在该因子信息的每个值是第一个上下调节,然后所有其它值被计算以实现相关联的 PMF(收敛于一个 Q 最小值) 很重要的要注意新计算的最小 Q 值41word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持修改)可能与未调整的解决方案(碱)相关联的 Q 值不同在因子信息的值的调整(向上和向下)总是允许的最大,随着该差的约束(DQ=基 - 修饰的) ,因为这种调整是不超过最大 dQmax (DQD Q 最大) 该模型产生的结果为下面为dQMax 值:4,8,15,和 25对于每个 Q 最大值,总结了在各因子中每个元素的 DISP 执行和间隔(最小和最大的源信息的值)信息例如,如果有 20 种是在一个数据集和一个 7 因子模型已被嵌合,则 DISP 方法将估计 20×7 =140 的间隔为每个 dQMax 最大值模拟表明 dQ 的值 4 和 8 提供了最小的误差范围,以及范围外最少数目的基底因子值。
EPA PMF 为所有的 dQmax 提供结果,但图仅显示了 4 dQmax,因为这应该为几乎所有的数据集提供强大的间隔DISP 间隔时间可以计算为基础的模型解决方案和添加了约束的基本模型解决方案按“运行”按钮,在基本模型替代方法框中开始 DISP该 DISP 输出示于图 25 中,随着指导有关解释输出当DISP 方法完成,两个输出文件(*_DISPest.dat 和* _ DISP.text)都保存在数据文件屏幕中的输出文件夹中指定的目录中该.DAT 文件是在一个简洁的格式对软件最有用,但不打算供用户查看;在这个文件中没有标签,只有数字该 txt 文件是关于模型嵌合和DISP 间隔结果的非常大的文本文件四个文件是从 DISP 输出,一个用于每个 dQmax,用户提供的输出文件前缀被放置在文件名的开始和显示在用户指南中以星号(*) (dQmax=4,8,16,32;*_DISPres1,*_DISPres2,*_DISPres3,*_DISPres4) 在每个文件中,存在着一个两个数的行,接着四行数据在第一行中,第一个值是错误代码:0 表示没有错误; 6 或 9 表示运行被中止如果该第一值是非零,则 DISP 分析结果被认为是无效的。
第二个值是观察到的 Q DISP 过程中最大的下降第一行下面是包含为每个 dQmax 水平(行)交换计数因子(列)的四线表第一行是 dQmax=4, 第二行 dQmax= 8, 第三行 dQmax= 15 和第四行 dQmax= 25交换计数是 PMF 解决方案稳定性的重要指标,在 dQmax= 4 的交换,或表中第一行显示该解决方案不应该被解释42word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持如果最小的 dQmax 发生了因子互换,则表明有显著旋转歧义和该解决方案不足够坚固以被使用如果 Q 值的减小大于 1%,则可能的是,没有 DISP 的结果应该发表除非 DISP 分析是找到 Q 的真实全局最小后重做,为了提高解决方案,该的因素数量可以减少,边缘物种可以被排除在外,或在时间序列图中的异常事件可以被排除在外在*_DISPresX 数据文件的这些诊断下面是四个数据块,其中每列是一个因子,每行是一个物种: (1)在信息矩阵的上界,在浓度单位; (2)信息矩阵的下限,在浓度单位;(3)在信息矩阵的上界,以%物质单位; (4)该信息矩阵的下界,在%物种。
该 DISPPres 文件直接从 ME 输出, 给想要处理输出的用户 该 dQmax为 4 的 DISP 结果归纳在一个易于使用的文件:*_ErrorEstimationSummary5.85.8 基本模型基本模型 BSBS 误差估计误差估计BS 被用来检测和估计对解决方案一小部分观测不成比例的影响,以及在较小程度上,旋转变模糊的影响BS 数据集是通过从原始数据集进行随机采样的观测块构成该块的长度取决于数据集和被选择为使得每个BS 的数据集将保留潜在的的序列相关性, 这个相关性可能存在于基础的数据集中 观测块被随机选择,直到 BS 数据集与原始输入数据是相同的尺寸若干 BS 的数据集(例如,100) ,然后用 PMF 处理,并且对于每个 BS 运行,BS 因子与基础运行的因子进行比较使用下列方法: BS 因子被映射到与该 BS 因子贡献具有最高相关性(高于用户指定的一个阈值)的基本因子如果对于一个43word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持给定的 BS 因子,没有基础的因子关联值高于这个阈值,该因子被认为是“未映射”。
重复这一过程,像用户指定的 BS 运行那样多次可能存在当从同一运行多个 BS 的因素可以被映射到相同的基本因子的实例EPA PMF然后总结所有的引导运行(bootstrapping runs).用户应当检查 BS的结果以决定假如基本运行(BS run) (蓝色方块)在四分位数间距(盒)周围的轮廓之内 元素的基本运行值在四分位间距之外的结果应当被小心的解释,因为观察的一个小的组观察可能影响基本运行结果或者因子中的物种浓度可能是无关紧要BS 因子对基础因子的映射理想的是一对一那就是说,来自于 BS因子的每一个因子应该和一个唯一正确的一个基础因子对应然而,很可能是几个重要观察的存在(或不存在)能极大地影响 BS 因子轮廓在这种情况下,受影响的BS 因子可能接近与一个特定基础因子符合在大多数情况下,其他情况下,会和其他因子符合另外,在基础模型中(BASE model)太多因子的规范也可能创造出一个虚拟因素 任何因子接近 80%或者来自 BS run的映射更少应当有主要贡献物种在调查轮廓当中, 以及对基础模型结果更进一步的评估应该被做用 BS-DISP and DISP 错误估计的方法启动启动 BS runBS runBS 捕获与随机误差相关的错误,它在 BS 模型标签框里触发,在 Base ModelRuns 屏幕上(Figure 26, red box)(Figure 26, red box)。
对于 base runs,用户必须作出多项选择在触发它之前Base Run – the base run 用来映射每一次 BS 运行base 运行在最低的Q(robust)条件下自动提供,用户可选择另一个运行数Block Size – 块大小,样品数将在每一步重采样的过程中被选择44word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持例如, 一个3的块大小意味着每一个BS块将包括来自输入数据集的三个样(例如,样 8-10 可以是一个块). 他默认的块大小的计算根据 Politis and White (2003)写到的,但可以被用户重新选择如果这个默认值被重新选择,用户可以按“Suggest”按钮保存这个默认值Number of Bootstraps – BS 的运行被进行的次数 他要求 100 次 BS 运行以确保统计信息的正确性、稳健性对于初步分析,50 次 BS 运行被进行以快速计算解决方案的稳定性最少也要求20 次 BS 运行最低相关性 R 值 - 最小 Pearson相关系数将被使用在一个 BS运行因子对一个基础运行因子的分配中,默认值是 0.6。
如果大量的因子未映射,用户可能想要调查降低 R 值的影响这种变化应在最终解决方案中报告所有的输 入参 数设 定后 , BS 运 行就 可以通过 按 “Run” 按 钮 在 BaseModelBootstrap 框里对于 base runs,用户可以中断运行通过按“Stop”按钮假如运行中断的话,没有输出将被保存或者覆盖5.8.15.8.1Summary of BS RunsSummary of BS Runs((BSBS 运行总结)运行总结)一一 个个 BSBS 运运 行行 总总 结结 呈呈 现现 在在 (Figure(Figure 27)27) ,, 它它 仅仅 当当 BSBS 运运 行行 完完 出出 现现 45word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持前8行包含了用于bootstrapping的所有的输入参数与用户在输入屏幕上设定的一样总结屏幕也包含了几个表总结BS 运行结果第一张表是一个矩阵包含多少BS 因子与每个基础因子挈合下一张表显示了这些值 minimum, maximum,median, and 25th and 75 th percentiles of the Q(robust)。
总结的其他部分是每一个因子轮廓的变化性,也给出了 the mean, standard deviation, 5thpercentile,25thpercentile, median, 75thpercentile, and 95thpercentile,这些值使用公式(5-2) 每一个轮廓的基础运行包括在第一列作参考,作为一列显示如果运行轮廓在 BSrun profiles 四分位间距内EPA PMF也计算与 BS 运行有关的离散差异百分比(DDP),并在 Base BootstrapSummary screen 屏幕上报道这些值这种方法估计围绕基地运行配置文件的第90 和 95 个百分点的置信区间(CI) ,报道为百分比DDP 的计算通过在每个轮46word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持廓的每个物种的 BS 运行与基础运行之间的绝对差值的第 90 和 95 百分位,作为基础运行值的百分比表达它如果 DDP 百分数大于 999, “+” 显示在屏幕上初始值保存在输出文件(*_diag and *_boot).如果一个物种的基础运行 base run 值是0, 就不能计算 DDP;在这些情况下,(*)显示。
DDP 值被用来报道 BS 错误估计对于这个例子,基础和引导因子是符合的, 除了三次运行的三个因子被映射到因子 7尘土(因子 4)和机动车(因子 7)包含地壳元素和钢铁源也被映射到 3 个其他源,这可能是因为BS 没有创造一个数据集包含所有的样受到高的钢铁产量影响 总的映射因子的数目可能没有加到 BS 运行的数目, 如果 boot factor运行没有收敛,因子的映射超过80%表明 BS 不确定度可以被解释,因子数目也是合适的5.8.25.8.2Base BootstrapBase Bootstrap 箱图箱图BS 运行的变化性显示在 Base Bootstrap Box Plots screen (Figure 28).两张图存在:每个物种的百分比变化(Figure 28, 1)和每个物种的浓度变化(Figure28, 2),与在 Base Bootstrap Summary screen 中因子轮廓表中的变化相对应47word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持48word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持在两张箱图中,box (Figure 29)显示了 BS 运行的四分位间距(25th–75thpercentile)水平绿线代表了 BS 运行的中位值,红线代表了四分位间距外的值基础运行显示为一个绿色箱子图作为参考四分位间距之外的值用红线表示在屏幕的底部,基础运行数目显示出来,不能选择;然而,对于 bootstrapping的基础运行用黄线表示用户可以选择他们想看的因子,通过单击因子数目在屏幕底部物种浓度的变化显示在底部箱图中四分位间距外的 the base run profilevalue (blue box)的物种应被解释仅当评估了两个额外的错误估计结果在 PMF这些物种影响了 BS 观察值基于 base or BS runs,the DISP and BS-DISP 将提供更可靠的错误估计5.95.9基础模型的基础模型的 BS-DISPBS-DISP 错误估计错误估计BS-DISP 估计了与随机和旋转歧义有关的错误,它运行从 the Base Model49word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持Runs screenRuns screen 的错误估计部分的错误估计部分BS-DISPBS-DISP 可能花费好多个小时去运行,由于被评可能花费好多个小时去运行,由于被评估的组合的数量估的组合的数量 因此他要求用户第一次评估因此他要求用户第一次评估 BS-DISPBS-DISP 结果少于结果少于 100100 次运行次运行 (建(建议议 5050 次)次) ;对于最终的;对于最终的 BS-DISPBS-DISP 结果,使用结果,使用 100100 次次 BSBS 运行BS-DISP 是 BS 和 DISP 方法的组合 BS 错误估计必须先于 BS-DISP 运行, 因为每次 BS 重新取样经历一个 DISP 分析因此误差限对所有的 F (profile)因子元素factor elements 这个过程可能如下: 每一次 DISP 定义了旋转无障碍空间的跨度每一次 BS 重取样移动这个空间,随及在不同方向两者合计,旋转空间的所有复制,在随机的位置,代表了随即不确定性和旋转不确定性通过代替一个因子元素得到的限制包括旋转歧义和由于输入数据的不确定性引起的变化。
为了加快 BS-DISP 的运算,建议所有 F 因子的元素只有一小部分被调整向下加权变量创建了 DISP 计算的一个特殊的问题如果这个变化被调整,错误间距将会非常大(基于模拟数据评估) 向下加权物种的错误估计从调整 non-downweighted species 的结果中得到最好评估BS-DISP 提供了与替代有关的 Q 值的变化偶尔,也可看到替代引起 Q 值的显著降低,通常是 10 到数百个单位如果这个降低出现在 DISP or BS-DISP中,他就意味着 the base case 解决方案实际上不是最低,尽管他被假设成那样与Q显著改变有关的值也被评估, 但初始指导是Q改变大于1%被认为是显著的,如果 Q 改变大于 0.5%,建议增加 Base Model runs 的数目到 40 以发现一个全局最小来自 DISP 和 BS-DISP 分析的一个重要输出是要素交换的程度,通常从“未明确定义”的解决方案产生的 (例如: 一个解决方案, 其中的因子身份为流动的) BS-DISPBS-DISP 输出的一个样本显示在输出的一个样本显示在 Figure 30Figure 30,,50word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持伴随着解释从最合理的解决方案开始,因此能够逐步改变该解决方案,在不显著增加 Q 值得情况下,因此因子身份在改变在极端的情况下,因子可能改变很多以至于他们交换身份这称作因子交换从物理角度来看,有因子交换的解决方案代表了相同的物理模型相对于原解决方案然而,因子交换的存在,意味着所有的中间解决方案也存在并且必须被视为替代解决方案对于一个高的 dQmax,通常可以得到很大的不确定性区间或 CI该区间越大,它包含的不确定真值的机会越大CI 伴随着配置文件值显示在 the BS-DISP箱图选项卡.dQmax 值也被评估,DISP 的 dQmax 为 4,BS-DISP 的值为 0.5,为真正的不确定性估算提供下界.如果输入数据的不确定性是合理的小的 dQmax值使用在 BS-DISP 对 DISP 比较中, 因为 bootstrapping and DISP 的组合应捕获解决方案的几乎所有的不确定性所有的 dQmax 值应该被评估以确定这个解决方案是否能很好地被定义来自 BS-DISP 总结表的样本结果如图 30 所示在使用了来自各源的关键物种 (硫酸盐,钾离子,总的硝酸盐,硅,锌,铁,和 EC) 。
在图 30 的 BS-DISP 结果显示这个解决方案没有明显的旋转歧义, 基础模型和错误估计可以被解释没有交换,dQmax 提供信息:解决方案被很好的约束和BBS-DISP 结果可报告51word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持如果因子互换在 dQmax = 0.5 产生,解决方案中的因子数目和 BS and DISP结果应该被评估在报道 BS-DISP 结果之前因为 BS-DISP 是 BS and DISP 的组合, 建议各成分的结果应该被评估以理解什么可能引起交换降低交换数目的步骤包括降低因子数和增加限制4 个文件被输出来自 BS-DISP,一个用于 dQmax;用户提供的输出文件前缀放置在文件名的开始,并作为(*)标示在用户指导里,(dQmax=0.5, 1, 2, 4; *_BSDISPres1, *_BSDISPres2, * _BSDISPres3,*_BSDISPres4)这些包含相同的诊断总结提供在 BS-DISP 总结表里在诊断第一行的第 5 个值,显示1.k. 该文件中的个案数目。
这包括全数据的个案情况下和接受的(不拒绝)重新采样如果所有的 bootstrap 个案被接受,这个值将等于 1 加 bootstraps 的数目(额外的一次运行是初始化运行) 如果没有个案被排除,k 应该等于bootstraps 的数目乘以因子数目乘以 BS-DISP 选定的物种数2. Q 的最大减小值一个大的值不用着急,但它表明至少有一个重新采样,其中有一个更深的最小值出现Q 的减小的一个大的值接近 Q(robust)的 1%或更多需要更多的测试提供更好的指导对此值3.Q 下跌的案例数4.最适合的带有交换的个案数52word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持5. DISP 中带有交换的个案数BS-DISP 诊断总结的第一行下面是一个四线表,包括每个 dQmax 水平的因子(列)交换计数,以升序排列(dQmax=0.5, 1, 2, 4)在最好的情况下,所有的交换为 0,然而,创建一个 BS 数据集导致一个交换的可能性是基于数据的特点,BS 运行的数目,因子数目配置文件和 DISP 结果应被评估以决定是否有原因引起交换。
在两个因子间带有交换的一个结果比多个因子间有交换的一个结果更可靠例如,交换出现在土壤(因子4)和钢铁源(因子6) ,两者具有许多共同的元素而且,交换的数目是一对两个因子来说,这表明有一些旋转歧义存在于因子间来自 BS-DISP 的文件包含许多数据块在图 30 包含的诊断后面前两个数据块是初始运行数据,每行代表一个物种和每列代表一个因子每个块的最后一行始终是一系列“1”作为占位符每一次 BS 重取样包含四个数据块 (1)BS 重取样#1 的简介矩阵在置换下来后,以浓度单位 (2)BS 重新取样#1 简介矩阵在取代了后,以浓度单位(3)BS 重新取样#1 的简介矩阵在置换下来后,以%物种(4)BS 重采样#1 的轮廓矩阵在取代了之后,以%物种这四个数据块在每个BS 重采样之后重复 BS-DISP 文件直接从 ME 输出, 给想要处理输出的用户 dQmax 为 0.5 的 BS-DISP结果总结在一个易于使用的的文件中:*_Base Error Estimation Summary5.105.10解释误差估计结果解释误差估计结果一套全面的错误估计可用, 结果被加到总结文件中以便于使用在运行了每次错误估计方法以后(*_BaseErrorEstimationSummary,*_FpeakErrorEstimationSummary,*_ConstrainedErrorEstimationSummary)总结文件包含了物种和诊断也包括了通过因子浓度进行的错误估计, 物种和的百分数, 总变量的百分数加假如一个变量被选择。
错误估计信息总结在*_BaseErrorEstimationSummary文件中和接下来的图中在每个错误估计方法运行之后 *_BaseErrorEstimationSummary文件有一个关于因子错误估计的有用的总结:Base Value, BS 5th, BS Median, BS 95th, BS-DISP 5th, BS-DISP Average, BS-DISP 95th, DISP Min, DISP Average, and DISP Max 图31 显示了这 3 种错误估计的错误估计总结图53word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持6 6 旋转工具旋转工具一般来说, 非负限制不足以产生一个唯一的结果一个不限数量的合理的解决方案可能产生并且不能使用数学算法简单地取消资格 旋转一个给定的解决方案并且评估旋转结果填充解决空间填充的怎样是一个减少解决方案的方法 额外的信息如知道源的贡献和/或源的组成对于减少解决方案的数目也是有用的,并且可以决定一个解决方案是否比其他解决方案更有现实的物理意义在数学上,一对因子矩阵(G and F)能被转换成为另外一对因子矩阵(G* andF*),在相同的 Q 值的情况下,被说成是旋转。
这个转换发生像公式 6-1 描述的那样:T 矩阵是一个 p x p,非奇异矩阵P 代表因子数在 PMF 中,这不是一个直接的旋转,而是 G 和 F 矩阵的一个线性变换由于 PMF 中这个非负的限制,一个纯粹的旋转(i.e., a specific T-matrix) 是唯一可能的, 如果新矩阵中没有元素是小于零的如果没有旋转是可能的,这个解决方案就是唯一的因此,近似的旋转,允许增加一些Q 值,并防止解决方案中的任何元素成为负值,在PMF 中是有用的对于一些解方案,非负的限制足以确保一个解决方案有一个很小的旋转歧义54word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持如果存在足够数量的零值在一个解决方案的因子 (F-matrix)和贡献(G-matrix)中,该解决方案将不会从“真正的”解决方案转动离开然而,在许多情况下,一个非负的限制不足以防止旋转远离“真正”的解决方案为了帮助确定一个最优的解决方案是否被建立,用户应当检查 G-space 图对选定的因子对在原始解决方案中当前的指导是选择一个区域源类型例如燃煤电厂(硫)并绘制它针对当地的工业源,如钢铁生产(铁) 。
6.1 Fpeak6.1 Fpeak 模型运行规范模型运行规范评估了基本运行 BS 的错误估计之后,旋转应该被利用Fpeak 运行被启动通过选择“Rotational Tools,” “Fpeak Rotation & Notes,” and “Fpeak Model Runs.”以最低的 Q(robust)的基础运行被程序自动选择,作为 FPEAK 运行的运行;这可以被用户覆盖在“Selected Base Run”对话框中用户可以执行多达五个FPEAK 运行通过检查框的适当数量并且进入每个峰值运行所需的强度尽管对能够进入作为峰值强度的值没有限制(under “Selected Fpeak Runs"),在-5 和 5之间的一般值应当首先被利用正峰值削减了 F-矩阵,并涂抹了 G-矩阵; 负峰值涂抹 F-矩阵, 增强了 G-矩阵 更多关于正和负峰值的详细信息可以在 Paatero(2000)中找到在 ME-2 的峰强度不同于那些在 PMF2 中的;大约五倍 PMF2值的值需要产生类似的结果在 ME-2 中另外,峰值为 0 是不允许的;EPA PMF将给用户一个错误信息,如果输入 0,在任何 FPEAK 强度框。
Fpeak 运行开始当用户按下“Run”按钮在 Fpeak Model Runs screenBaserun and BS run results将不会丢失当 Fpeak 运行时 Fpeak runs 完成后, Fpeakresults的总结, 与Base Model Run Summary表中包含相同的信息显示在FpeakModel Run Summary 表中(Figure 32, red box).55word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持额外的结果显示:Fpeak Profiles/Contributions, Fpeak FactorFingerprints, Fpeak G-Space Plot, Fpeak Factor Contributions, and FpeakDiagnostics; 这些结果应当被用作一个参考当评估 Fpeak 运行时 FPEAK 对于检查可能的旋转跨度非常有用, 得到一个最终结果在贡献或者因子文件中更多的值处于或接近 0 根据一个正或负的 FPEAK 是否在使用。
从而 DISP 和 BS-DISP带有 FPEAK 迫使将缩短 EE 间隔,可能导解决方案的不正确的解释Fpeak 因子/贡献屏幕显示了 Fpeak 运行的因子和贡献图(by Fpeak strengthvalue and factor)以及为选定的基础运行在因子图中中,物种的浓度(左边的y 轴)是一个绿色的条框,物种的百分数(右边的百分数)是一个橙色的条框为了比较,原始基础运行结果也显示在轮廓图中物种的质量(左边的 Y 轴)是一个浅灰色的条,物种的百分数(右边的 Y 轴)是一个暗灰色的框贡献图代表了因子贡献的时间序列基本模型结果的因子贡献也显示(灰线) Fpeak值以同样的顺序像进入 FPEAK 模型运行屏幕的顺序那样;在这些图中,用户应该寻找偏差(i.e., increases or decreases in a particular species in a factor)在FPEAK 值中,以及带有相应的基本运行结果用户可以选择一个FPEAK 值和因子数目通过点击想要的数目在屏幕的底部 在 FPEAK 文件/贡献屏幕的状态栏(Figure 33,56word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持red box)显示数据点的日期和贡献在贡献图最接近鼠标的位置上状态栏显示日期、浓度、选择的总变量和物种因子,当他们的鼠标停留在因子贡献图上时如果没有总变量的质量被分配到该因子,该图不显示,指导相应的显示为“总变量质量为 0 对于这次运行/因子FpeakFpeak 因子指纹因子指纹Fpeak 因子指纹屏幕每个物种对每个因子贡献的浓度 (以百分数表示) 作为一个堆积柱形图(Figure 34).此图可用于验证唯一的因子的名称和确定因子的分布为单个物种用户应当找到偏差(i.e., increases or decreases in a particular species in a factor)在Fpeak 值和相应的基本运行结果中间用户可以选择Fpeak 值通过在屏幕底部点击想要的数目57word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持Fpeak G-Fpeak G-空间图空间图像在像在 BaseBase 模型结果屏幕中的那样,模型结果屏幕中的那样, Fpeak G-Fpeak G-空间图屏幕空间图屏幕显示了多种因子的散点图。
用户指定一个因子到y轴和x轴通过选择想要的因子从屏幕左侧的列表中(Figure 35, 1)峰值显示,the base run G-space plot (“Show Base”), and the delta in G-space plotsbetween the base run and an Fpeak run (“Show Delta”)在屏幕的底部被选择(Figure 35,2).当一个 Fpeak 值被选择在 Fpeak 文件/贡献屏幕或者 Fpeak G-空间图屏幕,它自动选择在其他屏幕用户也可以选择一个点在任何Fpeak G 空间图屏幕通过点击那个点被选择的点将会变成橙色,日期和x-y 值将会被储存在*_Fpeak_diag 文件中这个特点帮助用户识别和跟踪旋转例如,假如一个G-空间图出现了旋转,用户可以标记这个边缘点使用信息例如气象条件或排放信息,用户可以决定这些边缘点是否预期将有低的贡献来自源的58word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持FpeakFpeak 因子贡献因子贡献Fpeak 因子贡献屏幕(Figure 36)显示了两张图。
顶部图是一张饼状图,显示了每个物种的分布在由 PMF 解决的因子中(Figure 36, 1)感兴趣的物种被选择从屏幕左侧的表中;那个物种的种类也显示作为参考如果一个总变量被用户选择在浓度/不确定度屏幕,该变量将用粗体显示在表中被选中的物种的饼状图将出现在屏幕的右侧如果用户已经指定了一个总变量,这个变量在整个因子中的分布将会相当重要用户可能会想要检查一个特定关键物种的分布,例如有毒物质在整个因子中底部图显示了所有因子的贡献对样品总质量(Figure 36, 2)黄色的虚线参考线表示每年的 1 月 1 日该图是标准化的,使得每个因子所有的贡献的平均值为 159word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持FpeakFpeak 诊断诊断Fpeak 诊断屏幕总结了 Fpeak 输入参数和输出作为参考e.g., Fpeak runsummary, factor profiles and contributions, and samples that are marked onthe Fpeak G-space plot)。
屏幕上的所有信息保存在*_FpeakFpeak 运行应被用户视为探索所选择的解决方案全部空间的一种方法 解决方案的几个空间应该被评估以理解 Fpeak 怎样改变 PMF 解决方案 用户应该首先检查 Fpeak 运行(available in the Fpeak Model Run Summary on the FpeakRotation & Notes Fpeak Model Runs screen)的 Q 值, 评估他们的增加从基本运行 Q 值来讲在一个纯粹的旋转中,Q 值将不会改变因为旋转仅仅是原始解决方案的线性变换然而,因为PMF 的非负限制,纯粹的旋转通常不可能,由Fpeak 引发的旋转是近似的旋转, 这将会改变 Q 值 一般来说, 由于 Fpeak 旋转引起的 Q 值的增加在 dQ 小于 5%基本运行 Q 值的情况下是可以接受的 相应的 Fpeak 解决方案因子的 G 空间图应该被检查以查看该点是否移向了轴线或者降低/零贡献(Figure 37)此外,轮廓和贡献应当被检查以决定旋转的影响60word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。
6.26.2 约束模型运行约束模型运行源组成和贡献知识可被用于限制模型运行 例如如果一个源已知在一段时间不活动, 应该没有贡献来自代表那个源的那个因子在不活动时期贡献可以设定为0 或者下拉到 0,Q 的惩处被提供从最优解移动到一个依据外部知识得到的解另外一个例子是从附近工厂的一个来源文件已被量化, 用户可以限制轮廓文件在一个代表这个工厂类型的因子中来匹配所测量的轮廓 Q 允许的约束的量取决于所述数据集;然而,5%Q(稳健)值是当前要求的最大值PMF 自动计算 Q 的量与百分数相关的通过输入一个% dQ 限制的使用在其他地方详细讨论(Norris etal.,2009;Paateroet al., 2002; Paatero and Hopke, 2008; Rizzo and Scheff, 2007).约束模型运行屏幕用于规范约束与多种类型先前的信息有关的包括: a.使用表达式生成器生成限制 b.从基本模型结果和约束表中指定约束点.开始一个选定的基础运行,两种类型的限制可以被运行: (1) “硬拉着”这是施加不考虑 Q 值的变化(例如一个特定的因子元素在轮廓或贡献矩阵中设置为0,给定一个下限和上限,或固定到它原始的值)或( 2)“软拉动”,Q 值有一个允许的改变限制(例61word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持如一个元素或元素的表达被最大限度拉起,最大限度拉下,或者拉至目标值) 表达式生成器有三个单选按钮用户可以选择来定义限制例如恒定比例(Figure 38), 质量平衡(Figure 39),或个性化表达(Figure 40)比率比率(Figure 38)-选择一个因子和两个不同的物种从列表中, 输入比率在 “值” 文本框中质量平衡质量平衡(Figure 39)-(Figure 39)-选择和增加一个或多个因子物种到文本框中在等号两边在“质量平衡”设置一个平衡等式如果需要的话,一个数字可以被输入“系数”文本框,将被作为选定物种的一个系数,点击“清除”按钮消除当前平衡等式的设定自定义自定义(Figure 40)-(Figure 40)- 通过创建一个自定义的公式指定约束 自定义公式可以基于文件(物种为元素)或贡献(样品为元素) 自定义方程必须遵循相同的结构像由表达式生成器生成的方程的那样对于表达式生成器的三个功能的每个功能,在用户定义了一个限制,按下“应用到表达” 按钮, 以一个标准形式相应的的公式将出现在表达表里(Figure 41, redbox)。
由于使用表达式生成器中定义的约束是“软拉动”, Q 值变化的一个限制必须指定一个默认值(% dQ = 0.5)提供在表达表里,如果需要的话,可以由用户更新允许用户删除选定的限制或所有的限制通过按“移除选定表达”或“移除所有表达”按钮在表达表的底部源贡献可以被限制;用户可以识别点在三个图中:62word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持63word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持64word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持像在,像在,PMFPMF 解决方案中的解决方案中的 G-G-空间图被评估以寻找表明旋转歧义的边缘,并决空间图被评估以寻找表明旋转歧义的边缘,并决定在解决方案中是否有旋转定在解决方案中是否有旋转如果用户在如果用户在 G-G-空间图中确定了一个边缘,空间图中确定了一个边缘,约束可被指定沿边缘拉数据点朝向轴线(即,朝向零) 。
用户应该沿着边缘检查点;如果有任何先验信息,表明一个值应该为 0(例如,一个因子代表的源在特定时间内不活动) ,则点应被拉出使用相关的约束各拉力的力度被控制通过指定一个Q 值变化限制如果用户希望执行一个弱上拉, Q 值变化的一个小的限制应该被允许相反,如果用户希望执行一个强拉,一个大的对 Q 值的变化的限制应该被允许拉强度应根据一关于污染源的先验信息表明对于给定的样品的贡献应该为零 用户可以选择尽可能多的点拉, 在尽可能多的因素中, 像他们希望的那样65word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持约束点在前面的三个图形中定义了之后, 约束表会出现在旋转工具里, 约束屏幕,显示出每一行中的约束(图44,黄色的框) 然后,用户需要选择包含在下拉列表中的六个约束类型之一(列“类型”) :66word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持下拉最大下拉最大- -一个因子元素最大限度地拉低给予Q值变化的一个限制;用户可以更新默认的dQ 值。
上拉最大上拉最大- -一个因子元素最大限度地拉高给予Q值变化的一个限制;用户可以更新默认的dQ 值拉到一个指定值拉到一个指定值-一个因素元素被拉到目标值以给定Q 值(默认%dQ 的=0.5)变化的一个限制;用户需要输入目标值到“值”列设置为设置为 0-0-一个因子元素被迫等于零,对Q 值的变化没有限制设置为原始值设置为原始值- -一个因子元素被固定到它的原始值,对Q 值的变化没有限制定义限制定义限制- -一个因子元素被赋予一个下限和上限;用户需要输入的“低/高”限在列的“值”里面应当指出,通过表达式生成器或“约束点”所限定的约束条件特异于一个选择的基站运行如果用户输入另一个运行数目, 像在模型运行限制里“选定的基础运行” ,与以前的基础运行有关的所有约束运行将从表达式和约束表中删除所有的约束模型参数规范后,用户应该按下 “运行”按钮在约束模型运行框来启动一个约束模型运行一旦运行开始,在屏幕的右下角的 “运行进展”框被激活和约束模型运行可以在任何时候通过按“停止”按钮终止没有有关约束模式运行的信息将被保存或者显示当运行停67word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。
止当约束模型运行完成后, 汇总表显示 dQ,Q(稳健) ,%dQ(稳健) ,Q(AUX) ,Q(真)以及运行是否收敛(图44,红色框) 五个新选项卡与约束模型运行结果将显示,包括约束文件/贡献,约束因子指纹,约束G-空间图,约束因子贡献,约束诊断%dQ(可靠)的值需要评估根据在约束中使用的dQ 的量所述%dQ(鲁棒)显示了 Q的增加由于约束(多个) 一个 dQ 的增加高达 1%对所有的限制是可以接受的;然而,因子文件解释,贡献的时间序列和误差估计结果也是关键的文件/贡献表提供了基础和限制因子文件以及基础和限制因子时间序列 评估所有因子的图以理解限制的影响并决定限制是否提供了一个更可解释的方案限制文件/贡献屏幕(图 45)显示因子文件和贡献图以相同的格式与上述FPEAK 文件/贡献屏幕 质量和物种百分数和因子贡献的时间序列都呈现, 在约束模式运行和选定的基础运行中用户应该查看在这两个模型运行结果中的偏差并检查约束的影响通常情况下,物种对因子的贡献分为两类:在(1)硬,他们不会显著改变或者如果它们被约束,不合理的文件将会创建; (2)弱,它们很容易地移动,并且通常不被PMF 很好的建模 理解硬和弱的源的关键示踪物种允许优化解决方案使用测的信息或其他信息。
弱品种应该很容易理解为移动源之间,而硬物种与因子强烈相关联,并应在它的源解释中使用68word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持限制因子指纹限制因子指纹约束因素指纹屏幕显示每个物种对每个因子的贡献浓度 (百分比) 以堆积条形图 (图 46) 此图可用于验证独特的因子名称和单个物种在因子中的分布 用户应该寻找偏差 (即增加或减少在一个因子中的特定物种)与指定的约束(S)和相应的基础运行结果约束约束 G-G-空间图空间图约束 G-空间图(图47)给出了约束模式运行的因子贡献的散点图类似于FPEAK G-空间图屏幕,用户可以选择“显示基础”,以显示基础运行G-空间图,并选择“显示三角”以显示约束模型运行和基础运行之间的G-空间图的区别限制因子贡献限制因子贡献限制因子贡献屏幕(图 48)显示了两个图顶图是一个饼状图,显示了各个物种在因子间的贡献由 PMF 解决的感兴趣的物种被从屏幕左侧选择;那个物种的种类也显示作为参考,如果总变量被选择在浓度/不确定度屏幕,那个变量将被粗体显示在表中选择的那个物种的饼状图将会出现在屏幕的右边, 如果用户定义了一个总变量, 这个变量在各个因子中的分布将会相当重要。
底部图显示了所有因子对总质量的贡献通过样品(图48,2黄色的虚参考线表示每年的 1 月 1 号图是正态化的,每个因子的平均贡献是169word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持限制限制 BSBS 运行和结果运行和结果一个限制模型运行可被影射像基础模型运行一样, 在一个限制模型运行完成后, 用户能启动一个 BS 运行对限制模型,在限制模型映射屏幕限制映射结果显示在限制映射箱图和限制映射总结中以同样的形式像在基础映射运行输出屏幕中那样以便于比较BS 文件保存在*_Gcon_profile_boot限制可被用于减少旋转歧义, 提炼一个解决方案, 理解强和弱的因子物种 所有因子和源贡献时间序列必须被评估以理解限制的影响 此外,错误估计结果需要被评估, 以决定限制是否显著的改变了物种因子贡献 限制的指导将会继续发展像PMF 一样应用到更多的数据集第 8 部分的悬链联系训练联系提供了更多的例子关于结果如何解释70word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。
7 7 检修检修EPA PMF 5.0的常见问题包括有指导产生的错误信息以及以及用户应该采取的措施在表3中,详细描述71word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持8 训练演习以下各节提供了三种数据类型的 PMF 分析的例子: (1)在降雨期间的多个位置收集水样;(2)密苏里州圣路易斯市的每小时气雾剂金属数据;(3)从光化测站(保诚)网站在巴吞鲁日,路易斯安那州挥发性有机化合物的数据该数据集被安装在 EPA PMF/数据文件夹和被作为例子提供进行分析用户可以按照每个例子中的概述步骤,以便更好地了解 PMF 的过程和本用户指南中所述的各组件之间的交互作用所有实施例跟随在图 50 所示的流程中,建议所有的 PMF 分析使用对于某些用户来说,基本模型可能就足够了然而,FPEAK 可以用来优化方案和约束可用于掺入的源信息,如混合物或排放物上评估误差估计是 PMF 分析的重要组成部分72word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持8.1 密尔沃基水资料这项工作的重点在用水 Samples.xls 提供的数据集。
这次演习的目的是展示思维过程以及参与评估来自多个站点的小数据集情况下的步骤 ;它并不打算成为一个完整的源解析分析PMF 的输入参数总结在表 4 和所有位点,在分析中使用73word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持Soonthornnonda和Christensen (2008年) 进行了污染物的源解析, 19.5英里 (31.4公里)内联存储系统在密尔沃基合流下水道(污水+雨水) 深层隧道系统的示意图示于图 51 和更多的信息可以在找到来自同一天从多个站点收集样本,在用水 Samples.xls 文件有三个标签:浓度(浓度) ,UNC(不确定度)和站点信息本文引用还包括该网站选项卡上无论是 CMB,还是 PMF 版本都是由 Bzdusek 等人开发的(2006) 被用于数据分析和用于 PMF 建模的数据被张贴在环境科学和技术网站 1 上,作为补充信息此外,作者假定的数据矩阵中的元素的 20%的相对误差所有的物种,最初用在基本模型运行,3 个因素,和 20 次运行一个随机种子最初用于评估运行的可变性和下面的结果是基于 12 的种子数目。
74word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持使用浓度散点图对物种间的关系进行了评估生物需氧量(BOD 5)与总悬浮固体(TSS) (图 52)是不相关的,这表明它们具有不同的来源此外,镉浓度仅在两个浓度层次上(图 53) ,从而可能指示使用的物种的一个问题75word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持使用 OBS/ PRED 散点图评估基本模型的结果,因为数据是在同一天从多个站点收集的除镉外,所有物种都具有线性关系,如图 53,基于这些结果,镉被设定为“坏”,基本模型重新运行在图 54 所示的叠积图形,这表明结果类似于Bzdusek 等人的(2006 年 a) ,通76word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持过在文件/贡献屏幕选择顶部图,单击鼠标右键,并选择堆栈中图表选择新窗口,用鼠标右键单击文件存储选项,或者使用“复制到剪贴板”粘贴图到文档中创建。
此数据集对于绘制带来了一些挑战,由于样品是下雨的同一天从多个站点收集而不是在一个固定的时间表,抽样是基于事件的时间序列曲线在位点之间具有水平线(图55) 图上的一个点选择之后,站点名称和采样时间的信息显示在底部的状态栏用户需要评估在 PMF 分析中,数据相结合是否是有道理的关键的受体建模假设是影响采样点的源的组合物在站点之间并没有变化77word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持来源贡献和观察与预测浓度的时间序列提供了有用的信息 源的贡献的时间序列在不同地点之间应显示变化,一个位点被影响,其他位点之间的影响可忽略可以指示该源的组合物是不均匀不统一的观察与预测的图提供了最重要的信息,观察预测(剩余)之间的差异大的站点 最有可能是由更独特的源影响,并能从分析中删除 在这两种情况下, 一个站点或贡献率或残差有显著差异的站点之间在保留它们在多个站点的 PMF 分析之前需要更详细地评估,密尔沃基水的数据的时间序列图,是用于证明合并的 PMF 多个站点(图 55,图 56) ,并鼓励用户使用数据文件画面中的复选框和综合分析,单独运行每个站点。
源影响的相对幅度在采样点间是变化的,但是,影响是可变的,多个站点都有高和低的源贡献 位点的结合看来是有道理的在站点之间的变化的基础上观察与预测浓度的时间序列也有线在不同站点之间(图 56) 时间序列显示,几个采样点的观测和预测的浓度较大,其他采样点的低不同站点之间的数据具有大的差异应该更详细地进行评价以确定这个样本是否应当结合到 PMF 分析中在 Q / Qexp 图也应接受评估,因为它提供了一个附加的时间序列图在 OBS/PRED 种类图旋转工具中的时间序列图中的也显示了不同采样点之间的线78word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持该 BS,DISP 和 BS-DISP 结果表明解决方案的一些不稳定性,这是由于数据集小,和要素数目的限制错误的估计结果显示在图 57 中79word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持DISP 结果(图 57,1)显示,该解决方案是稳定的,因为没有交换存在BS 结果(图 57 中,2)为金属源显示源被映射到生活污水和雨水源 6 和 8 次。
这可能是由于 PMF 不适合这高度变化源和所述 BS 的数据集也可能没有捕获金属的可变性BBS-DISP 结果(图 57,3)突出该解决方案可能是不可靠的,由于在两个因素互换 互换的数目是低的,其结果可能反映了由许多采样点引入的变异性相对小的数据集要求所有的结果被报告和解释,并且该*_ErrorEstimationSummary 文件应作为出版物的补充信息错误的估计汇总图提供了错误估计的总结为了便于分析,BS-DISP 错误同时捕获随机误差和旋转歧义具有最大范围(图 58) 80word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持8.2 圣路易斯 Supersite PM2.5 的数据集这项工作的重点是在圣路易斯 - con.csv 和数据集 - 圣路易斯 unc.csv 提供的数据集这次演习的目的是展示基本模型结果的评估和使用 EPA PMF 限制许多论文已发表在圣路易斯颗粒物(PM)的分摊研究和阿马托和 Hopke(2012)最近公布了圣路易斯的数据分析这里所举的例子不是一个完整的分析 ;它说明如何用 PMF 分析数据和评估模型结果的重要性。
PMF 的输入参数列于表 5 中81word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持圣路易斯点数据集包括 13 种和 420 小时的样品,2001 年 6 月,2001 年 11 月和 2002 年 3 月期间,在东圣路易斯 Supersite 拍摄(图 59) 该数据被格式化在csv 文件中,每一行代表一个取样和每列一个物种物种不确定度估计和样本由分析实验室提供低于检测限的样品被给予 5/6 检出限的不确定度, ,缺失样品被定为 4 倍的中位数浓度的不确定度和超出检测限的样品获得三分之一的检测限不确定度加上特异样本实验室的不确定度特别地, 该数据集被选择来说明添加约束到基于已知源配置 PMF 模型82word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持物种特征(浓度/不确定度和浓度时间序列)该种类别在,以确定是否与预期的源的物种浓度在时间上的相关例如,铁和锌的含量一起变化,表明钢铁生产存在或其他来源?铁和锌的时间序列示于图60放大的时间序列的图形是由同时 “Alt”键和鼠标左键的同时绕所感兴趣的时期绘制框围产生。
选择“Alt”键和 单击鼠标左键,返回到原来的数字83word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持在图 60 中的曲线显示了一个复杂的图象,因为高锌浓度不对应于铁浓度这种差异可能表明一个不包含铁的本地锌源在圣路易斯的这个例子中,锌冶炼厂位于该监测点附近物种之间的关系(浓度散点图)物种之间的散点图应检查关系,表明了一个共同的源发出两个物种(例如 OC和 EC 都是由移动污染源排放) 在圣路易斯数据集,铅和锌是不相关的,这表明两种可能的来源(图 61) 84word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持排除样品(浓度时间序列)用户应检查浓度时间序列图,以验证 PMF 选择的品种预料的季节性模式(在暑假期间如高硫酸盐) ,以及找出不寻常的事件(例如,在七月四日,其中高量的钾,锶,和其他微量金属的贡献烟花) 通常,这些事件被容易地识别在这些确定的事件而采取的样品应当被排除, 因为整体的配置文件可能不捕捉源的独特的组合物,或无事件源的配置文件可能失真。
通过突出显示,然后点击“排除样本”在屏幕的右下方排除样本所有的数据排除必须充分论证并形成文件初始模型参数(基本模型运行)该模型是运行 20 次,8 个因子和 30 种子恒定种子被用于复制结果为练习目的和运行融合和 Q 值是非常稳定的在 Q(鲁棒)比 Q(真)低约 10%,表明对 Q 值的一些,但不重的异常值的影响根据观察与预测的散点图和时间序列,有些品种,如铅,进行建模很好,和其他,如镉,并没有很好的建模(图62) 这可能是不正确的不确定度,不正确的分类(例如,作为强势品种) ,过少的因素被用于模型,从源头上没有足够的影响,或 PMF 不正确的模拟品种差异的结果这种嵌合微量物种缺乏已经被高时85word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持间分辨率的采样(一小时的频率或更低)注意到了镉源,如焚化炉的监测点附近极有可能存在然而,数据不具有足够的信息用于 PMF 来解决它模拟的不良物质(镉)应该被归类为“不良”此外,NO 3(在图 63 中的曲线图所示)2001 年的夏天具有许多固定值用于第一密集可设定在 MDL(方法检出限) (方法检出限)中。
此问题是不存在下两个时间段如图 63 和 NO 3 如果整个数据集使用应设置为“不良”, 和如果只有最后两个密集 intensives 使用则为“强”86word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持旋转(G-空间图解)G - 空间曲线的解决方案应进行检查,以确定是否贡献充满空间以及有边或点有低或零贡献为这些点选择物种是重要的,品种应针对区域性源指标,如燃煤电厂图 64 示出了两个例子,一个是点靠近两个轴,另一个点只在一个轴上FPEAK 进行评估,以确定更优的解决方案是否可以找到如果在一个图中一个点被选择,同一个点在其他附图也会被加以强调因素识别(文件/贡献,总贡献)87word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持因素可能会利用优势种和时间模式被识别 硝酸盐是从分析中除去与要素的数目被减少到 7(因为硝酸盐是一个因素) 在圣路易斯的数据集确定的七个因素表示基于该地区已知的来源的一个现实的解决方案, ,这是晶体(锰) ,铜冶炼厂(铜) ,煤炭燃烧(SO4,硒) ,锌冶炼厂(Zn)煤铁(Fe 和 EC) ,铅冶炼厂(以Pb 计) ,和机动车(OC,EC) 。
铁和煤因子似乎是物种的混合和因子稍后在本实施例中使用约束条件进行评价该因子剖面示于图 65质量分布(因子贡献)图 66 所示为总质量变量(PM2.5)的饼图的因素的贡献评估贡献的分配以确定它们是否在预期的样本范围之内这个例子的主要来源是机动车和煤燃烧,有轻微的贡献来自地壳,锌冶炼,铅冶炼,铜冶炼来源88word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持ErrorEstimationSummary 文件的误差估计结果的总结示于表 6 连同评论结果是稳定的,没有交换出现ErrorEstimationSummary 文件在任何出版物和报告中应当报告这个例子说明了进行 PMF 的解决方案评估的迭代的方法:评估输入数据,计算和评估基础结果,并评估误差估计误差估计浓度汇总如图 6789word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持定义约束表达式(表达式生成器)圣路易斯数据集, 本地钢铁设备源配置用于测定钢中铁和锰的适当比率样品被分析如圣潘克拉斯等人所述的那样(2005) 。
此方法提供了总的无机的浓度,这是可比的总无机浓度由能量色散 X 射线荧光 (EDXRF) 花岗岩市炼钢转炉的资料被用来作为代表性的样品,因为它被认为是影响的地点;EDXRF 铁和锰的比例在源配置文件为 60铁和锰的平均比例在圣路易斯周围的空气数据为 10.8然而,从 PMF 基础模型运行结果表明,51 的铁对锰的比例根据钢铁系数曲线有点低比例约束被定义使用表达式生成器,它被解释为autopull 式:铁减去60 倍的锰在钢铁因子里,在给定的 dQ 限制下拉至零(比约束的定义[钢|铁] - 60* [钢|锰〕= 0) 此外,EC90word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持在铁和煤因子里被选择和鼠标右键来切换 EC 作为一个约束这可能允许 EC 是从钢源更好分离%dQ 的设定在每一个约束为 5%和融合的结果用 2.1%dQ模型运行结果约束(约束概况/贡献和诊断)在随后出现的限制运行结果来看, 比例移到 60 和 EC 也显著降低到 40%左右,如图 68 所示,EC 转移到另外一个因素是很重要的最大的变化是机动车。
这表明,约束提供一种改进的结果相比该基础运行这些变化对总的因素贡献的质量并没有很大的影响 (铁和煤因子减少了 2.3%,并在机动车因子增加 1.1%) ,但是,它展示了带来的外部信息的好处添加约束后,运行所有三个错误估计和比较它们的基本模型的结果误差估计摘要(图69)不显示显著变化在其它的数据集,该另外的约束可以通过减小旋转歧义来降低误差估计值的大小8.3 巴吞鲁日保诚的 VOC 数据集以下各节是巴吞鲁日,路易斯安那州(保诚)的光化学空气监测站的 VOC 数据集的详细 PMF 分析用户应该运行的 EPA PMF5.0 所提供巴吞鲁日,con.csv数据集和 - 巴吞鲁日,unc.csv 的数据集,遵循下面描述的分析这次练习的目的是展示思维过程和采用 EPA PMF5.0 找到解决方案的步骤;它并不打算成为一个完整的源解析分析 PMF 的输入参数总结于图 6991word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持此分析的浓度数据从环保署空气质量系统下载 从 2005 年六月至八月, ,2006年六月-9 月(307 个样本)期间在巴吞鲁日监测站点收集 3 小时的 Speciated 挥发性有机化合物(VOC)样品的数据被下载列入 PMF。
PAM 的 VOC 数据不经常报道不确定度对于这种分析,每个种类和样品设置初始不确定度为浓度的15%,除非该值低于检测,其中浓度为 MDL(方法检出限) (方法检出限)/ 2和不确定度(5/6)* MDL(方法检出限) (方法检出限) (表 7) 92word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持物种特征(浓度/不确定度和浓度时间序列)S / N 比在这个分析不是有益的,因为所有的物种都给出一个设定的不确定度;因此,物种分类会根据残差和基础运行后观察 /预计初始的统计数据进行评估品种有较大的相对不确定度被归类为“不良”,并从分析中排除对于初次运行,包括所有物种被归类为“强”和所有 21 种,包括总非甲烷有机物(TNMOC) ,被使用物种之间的关系(浓度散点图)物种之间的散点图应进行检查以评估该物种之间的关系可能表明一个共同的来源在巴吞鲁日数据集,汽油移动源物种之间预期的关系,如甲苯,邻 - 二甲苯, (图 70,1)和重型车辆移动源物种,如正癸烷,正十一烷(图70,2)表93word 格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持乙烷和丙烷(图 70,3)显示两个源影响的一些证据即两个源有不同的乙烷和丙烷的比例,可能表明混合新源来自其他地区的石化加工 /天然气利用和其他地区转输苯和苯乙烯(图 70,4) ,经常移动源占主导地位的物种,并没有很好的相关性与其他移动源种;这种缺乏相关性可能是由于这些物种从该区域的几大石化来源的排放样品和种类排除(浓度时间序列)每一种污染物的时间序列被检测为极端的事件和 /或明显的阶跃变化在浓度上应该从分析中删除步的变化(例如,差异由于改变了实验室分析技术)可能被错误地识别为单独的物种来源如果样品被除去由于各种物种的异常事件,EPAPMF 以外进一步的数据分析可以被用来确定该数据是否是真实的,信息量大的94word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持初始模型参数(执行模型)最初,20 个基础运行有 4 个因素与 25 种子进行了探讨在此迭代中,由几百个单位而变化的 Q 值, 这表明该解决方案可能并不稳定 种类和类别被示于表 8。
残差和图如下所述进行评价后,若干种类别分别变更为“弱”的强/弱见表 8 的物种类别栏已更改95word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持96word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持模型重构(OBS/预测散点图,观测/预测时间序列)种类的残差被分析,规模残差的直方图(选择自动缩放后)苯被显示,它有一个很好的符合,以及乙烯不适合如图 71此外,观察与预测散点图和时间序列在图 72 和图 73 中,示出分别由于 PAM的数据只在暑假期间收取,时间序列图有秋季至春季期间失踪的时间段 散点图和时间序列也显示所观察到的和预测的浓度之间的差异不符合物种残差大于 3.0,峰值观察不适合在分散或时间序列图缩放的残差大于4 的物种具有峰值浓度未适合在 PMF:2 - 甲基丁烷,乙烯,异丁烷,异戊烷,正癸烷,正 - 己烷,正壬烷,正辛烷,正戊烷,邻乙基甲苯和丙烯类别为这些物种被设定为“弱”97word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持。
因素识别(文件/贡献,总贡献)98word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持该基本的运行重新运行, 文件和贡献进行了检查以确定因素测得的文件被用于支持各因素的识别和因子名称已被添加到图 74 通过右键单击配置文件/贡献,并通过“要素名称”选项命名这个因素PMF 结果被进行比较以测试文件使用所述第一和第二列的,藤田(2001) ,在图 75 中示出柴油机排气信息(要MCH)的正辛烷水平高,相对于车辆的排放(EXH J)和图 76 中的表示因子指纹情节的量正癸烷的主要是与柴油的因素有关 消息人士透露乙炔对源的贡献将在本例中后面讨论乙炔主要与汽车尾气排放相关,并对汽油蒸气有小的贡献它也存在于工业源和柴油99word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持旋转(G-空间图解)机动车辆及柴油废气排放源贡献的G空间的图也有一个很虚弱的线性关系 (图77) 这可能表明该柴油机动车源可与机动车源混合,或可能存在柴油燃烧的另一个来源其它 G-空间曲线的配对显示点被分布在解空间的轴线之间。
FPEAK应进行调查,以确定是否旋转移动指向轴100word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持物种分布(因子饼图)总的变量(TNMOC)主要由机动车尾气和汽油蒸气贡献工业部件也是一个主要因素,如图 78101word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持8.3.5 FPEAK检查机动车尾气对汽油蒸气 FPEAK G-空间图表明,使用的-1.0 的 FPEAK 一些优化可能会获得本实施例的焦点是为了演示的源信息的限制,所以 FPEAK结果将不作进一步讨论基础,FPEAK 和约束模型的结果,应进行比较以确定旋转工具和约束是否提供了一个不同因素和贡献的解释误差估计摘要如表 9 所示, 并非所有的主成分因素被映射到引导因素与那些没有正确映射的因子的数量约 80%,这是比较稳定的未映射的因素是由于数据的高变异性和PMF 未嵌合所有数据的峰值 (图 79) 的组合 所有的“强”品种入选对于 BS-DISP误差估计 DISP 互换的数目是零,并且 BS-DISP 互换分布在三个因素。
在BS-DISP 互换的数量是相对高的,并且BS 的结果和模型拟合统计报告结果之前需要要评价102word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持约束被用来确定乙炔是否与工业来源密切相关, 因为乙炔是为机动车排气的一103word 格式支持编辑,如有帮助欢迎下载支持文档从互联网中收集,已重新修正排版,word 格式支持编辑,如有帮助欢迎下载支持种关键的示踪剂在基础运行而言,乙炔的 84%和 14%分别和汽油尾气和炼油厂的因素相关联 乙炔在炼油厂因素中选择, 用切换限制, 并在 “下拉期最大” 使用 1%的 dQ 约束和乙炔在汽油的尾气因素也用“上拉期最大”用 1%的 dQ 制约基地运行和约束运行结果示于图 80约束中使用0.84%dQ 和乙炔在炼油厂因子被拉到为零(图 80 中,1) ,并用汽油尾气因数提高到接近 100%(图 80 中,2) 乙炔移动所需的低量dQ 表示它不是炼油厂因子的坚定特征,乙炔可以用作汽油机动车排气的示踪剂104word 格式支持编辑,如有帮助欢迎下载支持。
