电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

面向产品评论的属性类别分类方法研究与实现

27页
  • 卖家[上传人]:人***
  • 文档编号:479683563
  • 上传时间:2022-08-13
  • 文档格式:DOCX
  • 文档大小:290.67KB
  • / 27 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、目 录中文摘要3Abstract3第一章 绪论11.1研究背景11.2研究现状21.3经济意义21.4 本文工作3(1) 训练阶段3(2) 测试阶段4第二章 相关知识介绍42.1分词技术42.1.1关键问题52.1.2中文分词算法52.1.3结巴分词62.2 特征提取62.2.1 特征选择方法72.2.2 文本向量化9I.向量空间模型(VSM)。9II.词嵌入(word embedding)。92.3分类模型102.3.1 CNN(卷积神经网络)模型102.3.2 LSTM模型112.3.3支持向量机(SVM)13第三章 语料143.1 语料收集143.2 语料处理工作153.3评价指标16第四章 实现产品评论属性分类174.1 产品评论分类研究意义184.2属性类别分类方法184.2.1 Word2Vec训练词向量204.2.2 基于LSTM的类别分类方法204.3 实验参数设置及结果分析224.3.1 实验参数设置224.3.2 实验结果分析22第五章 总结与改进235.1 本文工作总结245.2 改进工作24致谢25中文摘要情感分析和意见挖掘是分析人们的观点、情感、评价、态度的重

      2、要研究领域。它是自然语言处理领域中最活跃的研究领域之一,在数据挖掘、Web挖掘和文本挖掘中也得到了广泛的研究。事实上,由于它对商业和社会的重要性,这项研究已经在计算机科学之外扩展到管理科学和社会科学。情感分析的重要性与日俱增,与社交媒体如评论、论坛讨论、博客、微博、推特和社交网络的发展相一致。在人类历史上的第一次,我们现在有大量的以数字形式记录的有观点的数据进行分析。情感分析和特征抽取的系统在几乎所有的商业和社会领域都被应用,因为意见是几乎所有人类活动的中心,是我们行为的主要影响者。我们的信念和对现实的看法,以及我们做出的选择,很大程度上取决于别人如何看待和评价这个世界。因此,当我们需要作出决定时,我们往往会征求别人的意见。这不仅适用于个人,也适用于组织。所以说,挖掘研究产品评论的信息,对于整个社会来说,隐含着许多重要的经济价值。本文针对主要针对互联网上的的中文产品评论文本,对其进行属性类别进行分析,并根据已标注的样本,对产品评论属性与方向进行预测。主要是通过LSTM算法来实现。关键词:产品评论;LSTM;语料;属性分类1AbstractEmotional analysis and o

      3、pinion mining is an important research field to analyze peoples opinions, emotions, opinions and attitudes. It is one of the most active research fields in the field of natural language processing and has been widely studied in data mining, Web mining and text mining. In fact, because of its importance to business and society, the study has expanded beyond computer science to management science and social science. The growing importance of emotional analysis is consistent with the development of

      4、 social media such as comments, BBS discussions, blogs, tweets, tweets, and social networks. For the first time in the history of mankind, we now have a large number of data in the form of a digital form of data analysis.The emotional analysis system is used in almost all commercial and social fields, because opinion is the center of almost all human activities and is the main influence of our actions. Our beliefs and perceptions of reality, and the choices we make, depend in large part on how o

      5、thers perceive and evaluate the world. Therefore, when we need to make a decision, we tend to seek advice from others. This applies not only to individuals but also to organizations. So, digging up information about product reviews has many important economic implications for society as a whole.This paper mainly aims at the comment text of Chinese products on the Internet, to analyze its property categories, and according to the sample, and labeled with forecast product reviews properties and di

      6、rection. Mainly through LSTM algorithm.Keywords:product comments; LSTM; corpus;attributes classification第一章 绪论1.1研究背景随着互联网在中国的逐渐普及,网民的生活也变得和互联网密切相关。电商则是信息化科技融入生活发展最明显的一个例子。电子商务通过现代通信技术,使得消费者可以在互联网上或者是其他计算机网络上进行与商家的各种交易。截至2010年12月,通过网络购物用户的比例达到1.61亿,提高了35.1%的使用率,增长了7%,用户在2010年增长了48.6%,在各种应用中增长最快,是用户增长最快的应用。2008年以来,外国的经济受到全球金融危机蔓延的深度影响,在各行各业都受到了不同程度的冲击,但电子商务行业却一直保持着向上发展的趋势,成为新型经济的不可忽视的一部分。特别是青年人,工作比较忙碌,导致了没有充足的时间可以来在实体店购物,那么就会选择网络购物平台。如今,越来越多的用户选择从网络来购买自己所需的产品,就淘宝而言,数据显示,截止2014年,淘宝拥有超过5亿注册会员,每天活跃用

      7、户超过1.2亿,在线产品10亿,淘宝和天猫的交易额超过了1.5亿。而在2017年的双十一期间,天猫最终以总共1682亿成交额定格,创下了历史新高,同比增长了39%,这是非常可观的一笔数,意味着我们电商行业每年以十分迅猛的速度在发展,因而消费者的参与度也是越来越高。此外,京东近几年来也呈现出了飞一般的发展趋势,作为中国最大的综合网络零售商之一,主要在线销售家电、数字通信、电脑、家居百货、服装、母婴、书籍、食品、网上旅游等12类商品。2012年,中国独有的B2C市场占据了49%的市场份额,整个供应链继续扩大其在中国电子商务市场的优势。2014年5月,京东集团正式在美国纳斯达克上市,成为中国第一个成功的美国公司。-上市大型综合电商平台,是中国最大互联网公司的收入,2016年京东集团市场交易额达到9392亿元,净利润261亿元,较上年同期增长43%。越来越多的用户选择在网络上购买产品,并且已经从小的生活用品,衣着等向着更加大型,昂贵的物品发展,京东的销售额就是一个很好的例证。在这些数以亿计的电商的浏览量中,网友无时不刻在进行着信息的交互,产品评价意见的共享,在这些评论中有包含着两方面的情感,积

      8、极的方面,也有消极的方面,同时更加注重的也是评论的分类,即这些评论都是对哪方面的情感在进行评价,比如质量,产品的重量、外观、性价比之类的类别。情感分析的一个重要领域即是对出现在互联网上各式各样的评论挖掘和分析,本文着重于对评论的文本进行分析研究,构建基于机器学习的分类模型对电子产品的评论进行分类。1.2研究现状近年来,自然语言处理领域逐渐开始采用深度学习算法,因而获得了比传统的模型,例如基于词典的分类方法更加有效,更加优秀的成果,像Bengio等学者基于深度学习的思想构建的神级概率语言模型,利用各种深层神经网络通过大规模英文语料进行语言模型训练从而得到更好的语义表征,完成句法分析和情感分类等内容,这些都为大数据时代的自然语言处理提供了新的思路。之前大多数国外的研究都是针对英文的情感分析,对于中文的情感分析研究较少,如今通过基于机器学习的情感分析方法,在中文研究上获得了较大进展,首先是要对训练样本进行分词,预处理,进行一些标注等工作,一般通过大量的手工标注来获取训练分类模型的训练样本,然后再去使用训练好的分类模型来分类测试样本,通常是分为褒贬两种情感极性。情感极性的问题最早是由Hatzi

      9、vassiloglou等人率先提出,通过人工从大量的文本集中提取形容词并判定形容词的情感倾向性来分析文本的情感倾向性,经过多年长期的发展,现在有积极(Positive)和消极(Negative)类方法,正负向种子词集合的方法,同义词关系法,和无监督的情感分类算法。由于中文的语言复杂性,如果使用基于语义的分类方法要求计算机完全理解分析词语的语义倾向,会是很困难的。如今网络上铺天盖地的评论量之巨大,使得现在情感分析将研究的对象瞄准产品评论,通过网络,我们可以获取大量的评论信息,但是中文方面的产品评论研究还是有些欠缺,尤其是针对口语化的评论。1.3经济意义 通过情感分析技术对网络上出现的格式评论做挖掘与分析,产生的重大意义是之前人工分析所不能比的。一个产品的褒贬评价能够影响大部分消费者消费的意愿,对于整个产品的销量有着不可估量的影响,进一步是对企业今后的发展有着重要的战略意义。通过对产品评论的挖掘分析,我们可以对用户评价,用户的情感倾向和产品销量之间的关系进行研究,对评论是如何影响产品销量情况来建立理论关系模型,不止局限于大型的电商网站,互联网上任意关于该产品的评论信息都可以成为分析的输入数据源。 电影电影的票房往往会与网络上评价成正相关,如果好评数比较多,则票房一般来说会比较高。利用情感分析技术,建立基本的预测模型,再讲从评论中挖掘的情感和观点引入预测模型,那么就可以通过前期的票房数和网络上的评价进行票房预测。一些研究学者发现评论的数量和评论的评分均值均会对销量产生一定的影响,但是评分的均值影响作用力在上线的前期会更加明显,评论的数量则可能会影响后期的票房。电子产品 关于电子产品的评论,会对产品的销量产生一些影响,获取会有一些干扰因素,因为一些电子商务的商家

      《面向产品评论的属性类别分类方法研究与实现》由会员人***分享,可在线阅读,更多相关《面向产品评论的属性类别分类方法研究与实现》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.