好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基于微博学科热点发坝追踪及研究.doc

7页
  • 卖家[上传人]:gg****m
  • 文档编号:225311565
  • 上传时间:2021-12-17
  • 文档格式:DOC
  • 文档大小:63.11KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 基于微博学科热点发坝\追踪及研究编者按:微博的互动性、便捷性、草根性、个性化等特点 使其成为发展最快的互联网应用,截至2011年12月底,我 国微博用户数达到2.5亿,较上一年底增长了 296%,微博 的影响力极速扩大许多学者也开始关注和研究微博用户、 微博的信息挖掘、微博信息传播、微博信息管理等领域,产 生了不少研究成果继本刊2012年第3期组织刊发专题“中 国政府机构微博现状实证研究”之后,又围绕主题"基于微 博的信息组织与传播”,从来稿中选取3篇文章以专题形式 发表,以期引起读者关注,促进相关研究的深入和广泛参与[摘要]指出依据传统信息源对学科热点进行分析研究 存在时间上严重滞后的缺点,提出基于微博的学科热点发 现、跟踪和分析机制,论证其可行性并给出实现方法和步骤 以基于新浪微博的“数据挖掘”领域学科热点的研究作为 实例,将微博结果同传统研究结果进行对比,表明该方法同 传统热点分析结论有重合部分,但又可以反映出传统方法所 无法反映出的最新热点[关键词]微博学科热点热点发现数据挖掘[分类号1C3501、问题的提出对学科热点及其变化轨迹进行分析,可以了解该学科过 去和现在的热点及未来发展趋势,因此热点研究一直受到人 们的关注。

      传统研究方法主要通过电子期刊、硕博论文、立 项基金或引文信息源,采用词频分析、共词分析、聚类分析 等方法,利用已有的或自行开发的软件进行分析挖掘传统 信息源具有高质量和权威性的特点,在此基础上进行热点研 究也具有相当的可信度和说服力,但传统信息源最大的缺点 之一就是更新滞后,目前一篇文章从完成到正式发表大约历 时一年左右信息时代技术瞬息万变,根据传统数据源得来 的学科热点有时只能代表过去,大大降低了学科热点研究的 质量,偏离了研究的原始目标微博(Microblog)是一个基于用户关系的信息分享、传 播及获取平台,用户可以通过Web、Wap及各种客户端组建 个人社区,以140字左右的文字或者图片、视频、网页链接 等方式更新信息,并实现即时分享微博的最大特点就是快 速更新、群策群力,是否可以根据微博的特点来获得学科前 沿资料并对学科热点进行发现、追踪与分析,弥补传统学科 热点分析的不足之处,将是本文的研究目标2、基于微博预测学科热点的可行性随着Web2. 0的出现,互联网用户行为已发生了很大变 化,从微博上获得信息较以往变得容易许多,基于微博的各 种应用不断涌现,并逐渐为企业、政府、出版社等部门所认 可。

      目前微博应用领域主要有:企业应用、新闻媒体、政府 舆情、学术出版等,但将微博用于学术领域的目前尚未可见, 其他领域应用中所涉及的技术方法和思路对微博在学术领 域的应用研究将有很大的参考借鉴作用本文认为通过微博 平台了解他人研究进展,获取学科前沿信息,预测学科热点 具有可行性,理由如下:2.1微博上包含了大量专家学者、研究人员以新浪微博为例,新浪微博的名人认证是其特色之一, 其中除了明星和知名企业家外还有众多高校学者、科技精 英,这些人通过身份认证,可以代表学科领域的权威力量 除了名人学者外,更多的学者选择以个人身份在微博上耕耘 自己的学术天地,他们有的在微博上发表自己的研究成果、 研究进展、研究思路,有的用微博现场发布参加学术会议的 情况,有的博士导师甚至把自己的学术研讨会也搬上了微 博还有各行各业的专业技术人员,他们把学科知识应用到 工作当中,是知识转化为生产力的第一线骨干,他们的见解 更侧重于技术与实践的结合,与商业价值的结合正是这只 庞大的专业技术队伍使微博展现学科前沿变为可能2.2微博学术信息更新快,信息可公开获取微博用户通过电脑、等多种途径实现随时、随地、 随身发布和接收信息,大大提高了微博的易用性、高效性, 这直接导致了微博内容更新速度极快一一比论坛信息快,比 网页数据快,更比期刊杂志快,这是其他任何数据来源都无 法比拟的,同时也成为了获取学科前沿资料的最大优势。

      除 了更新速度快,微博的另一个优势是信息容易公开获取,以 往研究的难点往往不是技术而是数据难以获取,无论是企业 的内部数据、不公开的政府信息还是收费的期刊数据库等都 给学术研究设置了障碍,而在微博平台上学者们不仅可以自 己畅所欲言,更可以容易地获取他人发布的信息,这种信息 的公开性也为获取学科前沿资料扫清了障碍2.3微博的分众聚类可形成学术圈了解学术前沿的重要途径之一就是形成学术圈,同圈内 人士交流,这也是学术会议产生的原因,这样的理念同微博 的分众聚类不谋而合在微博中,人们可以根据自己的喜好 关注他人,这一思想运用到学术领域可以变为根据自己的研 究领域添加关注同行人士,从而形成自己特有的学术圈,添 加关注等于订阅了他人的发言,微博学术圈可以帮助你随时 随地了解同行研究进展或是其他地方正在发生的最新学术 事件2.4第三方应用让学术信息容易被计算机自动获取和 分析微博学术信息更新的速度也带来了信息采集方面的困 难,如果按照传统的人工采集方式则付出的成本极高,目前 大量由第三方开发的微博应用解决了这一难题以新浪微博 为例,目前其官方网站上的各种应用已达600余种,并在不 断增加中,其中许多应用都可在学术研究领域发挥作用,本 文后半部分将给出这些应用的使用案例。

      微博应用让学术信 息的搜集和分析变得简单,也让通过微博研究学科领域之热 点变得可行3、基于微博预测学科热点的步骤3. 1热点发现虽然微博中存在大量学术前沿信息,但这些信息分散在 微博的各个角落,如何把他们汇聚起来从中发现学科热点是 该步骤要完成的任务3.1.1信息采集和预处理 信息的采集是热点发现的 第一步,微博信息的采集主要分两个方面:①微博内容;② 作者ID微博内容的采集可用作热点挖掘的语料,而微博作 者ID的采集也同样重要,由于微博存在关注和转发功能, 通过分析作者ID,可以找出其中的学术权威,对于了解学术 最新进展有重要意义釆集后的数据还存在大量信息冗余, 因此要进行信息的预处理,主要包括合并数据、文本清洗、 添加自定义词等步骤3. 1.2发现学科热门词汇 将采集到的数据进行特征 提取,分类聚类以及共词分析等方法处理可以找出某一领域 相关的热门词汇3.1.3发现学术意见领袖意见领袖是最为活跃的话 语群体,他们的意见和观点对事件的发展方向产生了深远影 响在微博的学术领域,意见领袖可以分成两种:一种是以 知名学者为代表的学术权威,另一种则是从学术研究或工作 实践出发,不断提供最新学科前沿信息的知识工作者。

      发现 学术意见领袖可采用社会网络分析 (socialnetworkanalysis)、聚类等方法3.2热点追踪步骤一获得的学术热点和学术领袖只能代表过去,如何 沿着这些热点继续追踪,不断了解学术发展的现状,并对未 来发展做出预测是该步骤真正要完成的。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.