好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基于BP神经网络的网络舆情预警研究.docx

12页
  • 卖家[上传人]:ji****81
  • 文档编号:210396561
  • 上传时间:2021-11-14
  • 文档格式:DOCX
  • 文档大小:20.17KB
  • / 12 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 基于BP神经网络的网络舆情预警研究 侯萍 崔孟杰摘要:企业网络舆情传播对企业和社会产生不可忽视的影响,对企业网络舆情监测和预警的研究能够为管理部门提供理论和实践指导从舆情热度,舆情状况和舆情趋势三个方面,综合现有指标体系的优缺点,构建一个具有三个一级指标、十个二级具体指标的企业网络舆情危机预警指标体系将获取到的指标数据运用定性与定量相结合的方法进行无量纲化处理,并利用Matlab进行BP神经网络模型创建,建立企业网络舆情危机预警模型选取2017年以及2018年舆论相对集中的“携程亲子园”事件以及“滴滴空姐遇害”事件进行模型的训练以及模型验证实验结果表明,基于BP神经网络的企业网络舆情危机预警模型是有效和可行的关键词:网络舆情;指标体系;BP神经网络;舆情预警:G350;TP393★基金项目:国家重点研发计划课题(2017YFD0401005);江苏省高校自然科学研究面上项目(18KJB520038)引言随着互联网科技的迅速发展,网络深入到人们的日常生活中,网络舆情逐步转化为社情民意的主体部分,网络舆情技术随着互联网的发展,涉足面越来越广,负面网络舆情对于企业造成的影响越发凸显,企业对于自身的舆论也越来越重视,能夠提前预知大规模负面舆论的爆发,可以使企业及时采取有效的措施进行防范,尽可能的降低舆论带来的负面效应,及时止损。

      一个完善的企业网络舆情预警系统有着十分重要的现实意义在负面舆论大规模爆发的前夕及时告知企业管理者,采取相应的应对措施减少负面舆论带来的不利影响,及时规避舆论恶化国内外学者纷纷展开了网络舆情指标体系和预警模型构建的研究在网络舆情危机预警方法方面,文献[1]利用动态层次文本聚类法挖掘网络舆情预警过程中的热点话题文献[2,3]构建了微博舆论场超网络模型,提出了微博舆论场场强计算公式判别微博舆论场中舆情的演化设计了基于微博舆论场的舆情演化规则文献[4]首先根据Lyapunov指数证明网络舆情具备混沌的特征,然后对网络舆情时间序列数据进行相空间重构,最后进行网络舆情预测文献[5]提出一种基于模糊推理理论的网络舆情观点聚合的CA(Cellular Automaton)模型,在元胞自动机模型Moore邻域结构下演化并分析个体属性以及邻域环境对网络舆情观点聚合现象的影响文献[6]针对热点传播的问题提出改进的SIRS传播模型,该模型结合博弈论对SIRS模型中的传染体和免疫体进行演化博弈建模,对SIRS模型进行改进,得到热点话题传播的平衡点和规律文献[7]也构建了谣言事件传播模型,研究热点事件传播规律文献[8]为了解决网络舆情预警评价问题中样本数据的非线性和髙维性等实际难题,提出以投影寻踪理论为基础,利用文化基因算法确定最佳投影方向,建立了基于文化基因算法的网络舆情评价的投影寻踪模型。

      文献[9]将模糊神经网络模型用于公司产品市场销售状态的预警问题,为销售人员处理市场危机问题提供参考意见综上所述,国内外学者针对舆情监测预警模型主要集中在模型构建及态势评估等方面,从应用角度对企业网络舆情构建模型并量化算法的实例研究的成果较少本文构造企业网络舆情危机预警指标体系并运用BP神经网络模型建立企业网络舆情预警模型选取2017年以及2018年舆论相对集中的“携程亲子园”事件以及“滴滴空姐遇害”事件进行模型的训练以及模型验证1、企业舆情危机预警指标体系1.1 企业舆情危机预警指标体系构建依据2006年国务院发布的《国家突发公共事件总体应急预案》,将预警等级按照各类突发公共事件的严重程度、可控性和影响范围等因素分为Ⅰ级(特别重大)、Ⅱ级(重大)、Ⅲ级(较大)和一般[10]本文将舆情危机预警划分为五个级别,分别是安全、一般、警告、严重,用1000、0100、0010、0001来表示建立一个科学、严谨、高效、可行的完善的企业网络舆情预警指标体系最关键的在于指标体系中各项指标的选取,合理正确的指标有助于提升指标体系的合理性我国的舆情预警研究的学者已经在该方面取得了显著的成果,文献[11]从传播媒体、传播范围、传播速度、情绪倾向程度及相关度等方面对舆情潜在影响力进行探索,构建了网络舆情潜在影响力指标体系并设计潜在影响力计算模型,对探讨网络舆论的潜在影响有一定的现实意义。

      文献[12]基于网络舆情中的舆情等级分类,划分移动社交网络中的舆情等级,同时结合生命周期理论,分析移动社交网络舆情生命周期并通过实证研究验证指标体系是否合理本文依据前人的研究,网络舆情预警指标的选取本着定量为主,定性为辅、科学性、可操作性等原则,最终构建3个一级指标,10个二级指标的网络舆情预警指标体系在选取指标的同时,尽可能的以最少指标达最优预警目标的准则来选取,同时为了使模型容易构建,进行量化处理,尽可能的选择定量指标1.2 企业舆情危机预警指标说明舆情热度是研究舆情的重要指标,通过搜索量、转发数、评论数、点赞数来衡量舆情热度,末端数据的获取主要来自于百度指数以及新浪微博搜索量是指在一定的时间条件下,通过百度指数高级检索,检索指定企业名称为关键字的网络曝光率以及网民关注度搜索量的多少反映了网民对于该话题的关注程度,通过搜索量的排序可以明确当前的热点话题评论数是指在新浪微博中,网民对于某一舆情热点话题的评论,通过评论的内容以及评论数量的多少可以反映出该舆情事件在网民心中的关注程度转发数转发数是指在新浪微博中,某条关于某热点事件的评论被转发的次数,如果网民转发该微博, 即表示他对于这一评论表示认同。

      转发数反映了该条微博在网民中的认可度点赞数是指在新浪微博中,某网络舆情事件获得的点赞数量,该数值越大,则表明网络舆情发生的概率越大舆情状况主要通过网络舆情的真实性、舆情话题的敏感性、网民观点的倾向度来表示网络舆情的真实性,话题的敏感程度以及观点的倾向度较为全面地展示了舆情的状况真实性主要是因为网络空间的虚拟性与真实性相互融合,再加上互联网的虚拟性,许多言论难以辨分,舆情的真实性是反映舆情状况的最关键的指标真实性采取定量分析的方法来确定,参考新浪微博的认证用户关于某网络舆情事件的微博数占全部的百分比来确定,认证用户是实名认证的,需要对自己发言的真实性负责,认证用户的言论的真实性较高舆情的敏感性是用来衡量舆情未来发展的主要指标敏感性越高,则该网络舆情热点话题的关注度越高,敏感性指标通过定性分析获取倾向度是指网民对于某网络舆情热点话题所持的赞同、中立或是反对的态度按照人们对于某事件的看法,倾向度可以分为赞同,中立,反对该指标通过新浪微博中负面微博的占比来表示舆情趋势指的是舆情在接下来的一段时间内的发展趋势,主要是通过观察网络舆情的热度变化得出,而网络舆情热度变化主要通过搜索量变化、转发数变化、评论数变化得以体现,最终得出网络舆情的趋势变化。

      搜索量变化通过百度指数中在一段时间内对于某网络舆情事件相应关键词检索的数量变化来衡量转发数变化通过新浪微博中关于某网络舆情事件的微博的轉发数量的变化来计算评论数变化指的是新浪微博中关于某网络舆情事件的微博的评论数数量的变化2、企业网络舆情预警模型构建2.1 BP神经网络的设置本文采用BP神经网络进行企业网络舆情预警模型的构建,由于BP神经网络结构中包含隐含层,通常情况下,隐含层越多,网络的复杂性越高,计算难度越高本文采用只包含一个隐含层的BP神经网络结构2.1.1 输入层、输出层、隐含层节点确定依据构建的企业网络舆情预警指标体系,在该体系中选取了10个指标作为企业网络舆情预警模型的预警指标,则输入节点数为10,确定了预警等级为安全(1000)、一般(0100)、警告(0010)、严重(0001)四个等级,则输出节点为4隐含节点的确定采用公式(1)进行隐含节点的计算其中m为输入层节点数,n为输出层节点数,a为1-10之间的常数2.1.2 输入数据的归一化处理由于指标选取的时候对相应的各项预警指标进行了一定的量化处理,在进行模型构建时,为了便于计算,减小误差,再一次的进行归一化处理,即通过公式将所有收集到的原始数据进行整理,同意转化为(0,1)区间内的无量纲指标值。

      指标有正负方向之分,所以在进行数据归一化的无量纲指标处理时,也有着不同的方法正向指标指标值越大越安全,所以以最小值为基准进行归一化处理,即在进行无量纲化处理时采用公式(2)进行处理;而负项指标与正向指标恰好相反,指标值越小越安全,在无量纲化处理时以最小值为基准,进行归一化处理即采用公式(3)2.1.3 训练参数的设置在对数据进行归一化处理之后,设置训练参数,训练参数的设置不同也会对网络性能有一定的影响设置隐含层、输出层传递函数为logsig(对数S型传递函数),具有非线性的特点,设置训练函数为traingdx(学习率可变的BP算法),学习函数为learngdm(梯度下降动量学习函数),在相对应的训练参数设置中,设置显示间隔show = 25,设置网络学习效率lr = 0.05,设置动量参数mc = 0.9,设置最大训练次数epochs =1000,设置目标误差goal =1e-5,而其余的相关参数保持默认值不变2.2 预警模型建立依据公式(1)进行隐含节点的确认,可计算出神经元的个数为4-13之间,通过测试发现当a=10时,神经网络的性能达到最佳,即确定隐含层节点数为10选取2017年11月“携程亲子园虐童”事件作为本文的研究对象,以10个具体指标建立企业网络舆情危机预警指标体系。

      首先分析企业网络舆情指标体系中的各项指标的性质,得到分析结果如表1所示按照携程亲子园事件的进展设定了8个时间点,方便数据采集以及观测,如表2所示利用烽火舆情软件进行相应的关键词检索,得出“携程亲子园”事件的舆情走势,分析相应的负面舆情占比,通过当日的负面舆情占全部舆情数的占比得出观点倾向度,舆情走势如图2所示利用百度指数工具高级检索对“携程亲子园”限定关键词进行检索,得出搜索量以及搜索量变化指标原始数据如图3所示在每个时间节点以“天”为单位做平均值处理,使数据具备可比性评论数、点赞数、真实性、敏感度、倾向度、转发数、评论数变化、转发数变化等指标数据通过新浪微博获取,在8个时间点获取的原始数据,为了使数据之间的关联性更高,各个指标之间的数据的可比性更强,在依据指标的性质的基础上进行数据的归一化处理,归一化后的数据如表3所示利用Matlab 2017a软件进行模型的建立,以时间1-时间7的指标数据作为模型的训练样本,选取时间8的指标数据作为检验样本来进行模型检验工作的实施期望输出如表4、表5所示通过调用Matlab 2017a软件中的神经网络工具箱,参照上述的传递以及训练参数设置,进行BP神经网络的创建,对训练样本进行167次训练后,误差值为9.945e-6,達到训练目的,如图4所示。

      3、模型可靠性验证通过案例“滴滴空姐遇害事件” 进行模型可靠性验证,数据如表6所示:利用烽火舆情软件进行相应的关键词检索,得出“滴滴出空姐遇害”事件的舆情走势,分析相应的负面舆情占比,通过当日的负面舆情占全部舆情数的占比得出观点倾向度利用百度指数工具高级检索对“滴滴”限定关键词进行检索,得出搜索量以及搜索量变化指标原始数据在每个时间节点以“天”为单位做平均值处理,使数据具备可比性评论数、点赞数、真实性、敏感度、倾向度、转发数、评论数变化、转发数变化等指标数据通过新浪微博获取,对9个时间点获取的原始数据进行归一化处理,归一化后的数据如表7所示通过以上建立的模型将原始数据进行代入检验,与期望输出结果表8进行比较与期望输出结果进行比较后,发现时间6的输出出现差错,其余结果一致,准确率达到87.5%4、结束语根据上述构建的BP神经网络模型,通过对于时间1-时间7的获取的企业网络舆情预警指标中的10个二级具体指标数据。

      点击阅读更多内容
      相关文档
      《公共文化体育设施条例》深度解读课件.pptx 《法律援助条例》深度解读课件.pptx 《广播电视设施保护条例》深度解读课件.pptx 社区关于2025年夏季基孔肯雅热疫情防控工作的经验总结报告材料.docx 2025关于转型实践中汲取发展思考的学习心得体会.docx 2025关于“学论述、谈体会、抓落实”活动的学习心得体会.docx 2025教育系统党徽党旗及其制品使用管理情况自查自纠报告.docx 熔铸忠诚之魂夯实平安之基 锻造政法铁军在县委政法委员会2025年第三次全体(扩大)会议上的讲话发言.docx 县委2025年新兴领域“两个覆盖”集中攻坚工作进展情况汇报材料.docx 在2025年市关于建强基层组织体系专题会议上的讲话发言.docx 在共青团县委2025年全体团员干部会议上的党课讲稿:用团结奋斗开辟美好未来.docx 在2025年片区农业产业发展专题工作会议上的讲话发言材料.docx 在市保险领域民事检察协同监督工作推进会上的讲话发言材料.docx 县自然资源局人才工作情况汇报材料.docx 在2025年县委办公室“病灶”清除行动警示教育暨作风建设深化推进会上的讲话发言.docx 在市防汛工作会议上的讲话发言材料2篇.docx 在区村(社区)“两委”换届工作调度会上的讲话发言.docx 在2025年全区年轻干部座谈会上的发言材料.docx 在全区茶产业高质量发展推进会议上的讲话发言材料.docx 在烟草专卖局(公司)系统2025年半年工作会议上的讲话发言.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.