电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

网站流量统计系统的设计

28页
  • 卖家[上传人]:cl****1
  • 文档编号:432024878
  • 上传时间:2023-12-09
  • 文档格式:DOCX
  • 文档大小:300.32KB
  • / 28 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、网站流量统计系统摘要网站流量统计是改进网站服务的重要手段之一,通过获取用户在网站的行为,可 以分析出哪些内容受到欢迎,哪些页面存在问题,从而使网站改进活动更具有有针对 性。常用的网站流量统计指标包括三类:(1)网站流量指标,如在一定统计周期那网 站的独立用户数量、总用户数量、网页浏览数量、每个用户的页面浏览数量等;(2) 用户行为指标,如用户来源网站、用户所使用的搜索引擎及其关键词、在不同时段的 访问量情况等;(3)用户浏览网站的方式,如用户上网设备类型、用户浏览器的名称 和版本、访问者电脑分辨率显示模式等。获取网站访问统计资料通常有两种方法:(1)在自己的网站服务器端安装统计分 析软件进行监测;(2)采用第三方提供的网站流量分析服务。两种方法各有利弊,采用第一种方法可以方便地获得详细的网站统计信息,并且 除了访问统计软件的费用之外无需其他直接的费用,但由于这些资料在自己的服务器 上,因此在向第三方提供有关数据时缺乏说服力;第二种方法则正好具有这种优势, 但通常要为这种服务付费,虽然也有一些免费网站流量统计服务,但由于在功能方面 会有一定的限制,或者通常需要在网站上出现服务商的标识甚至

      2、广告。因此本人以第三方统计网站流量为设计基础,运用 Python 编程语言及其 web 开 发框架Django,结合SQLite3数据库,完成对访客的IP地址,浏览器,操作系统, 浏览页面的记录,并按时间单位进行统计统计。关键词 网站流量统计;Python; Django; SQLite;第1 章 绪论1.1 网站流量统计的动机在用户访问模式、Web软件组件的性能和基本网络基础设施的特征参数提取中, Web流量测量起着关键的作用。内容创建者可以从用户浏览模式测量那里收集有价值的数据。考虑销售图书的电 子商务站点,站点访问者数量的统计数字将影响Web页面里嵌广告带来的广告收入。 另外,分析用户访问模式可以指导Web站点重新设计的过程。设想有许多用户访问 主页,并点击特定次序的超文本链接以查找到平装书籍。这将激发改变主页的想法, 以提供给含有大量普通图书列表的直接链接。知道用户停留在网站有多长时间和下载 了多少网页将是很有用的。如果许多用户在查看了一两页后就离开的话,那么网站就 需要更好地组织或增加更令人感兴趣的资料。在连续网页间迅速切换的用户可能不会 发现他们想要的信息。于是内容创建者可

      3、通过允许用户根据主题搜索站点来解决这个 问题。内容的创建者也可能对知道用户怎么到达Web站点感兴趣。例如,设想对图书 网站的访问请求的25%是用户从某个新闻网站点击超文本链接而来,那么图书销售商 可能会在这个新闻网站继续做广告。测量也可以用来刻画Web站点的性能特征。1.2 网站流量统计指标网站流量统计的基础是获取网站流量的基本数据,网站流量统计指标大致可以分 为三类,每类包含若干数量的统计指标。具体的网站流量统计是通过不同的 IP 登陆 网站来计算的。也就是说,一天内同一台机器登陆网站的次数不论是多少,在流量统 计中只记为一次有效登陆,这种计算方法可以较为科学的计算出有多少人登陆过该网 站,有效的防止了有意的对网站进行刷新从而增加自己网站的点击率。网站流量指标:1、独立的访问者数量(unique visitors );2、重复的访问者数量(repeat visitors);3、页面浏览数( page views);4、每个访问者的页面浏览数(page views per user);5、某些具体文件/页面的统计指标,如页面显示次数、文件下载次数等。 用户行为指标:1、用户在网站的停留

      4、时间;2、用户来源网站(也叫“引导网站” );3、用户所使用的搜索引擎及其关键词;4、在不同时段的用户访问量情况等。用户浏览网站的方式:1、用户上网设备类型;2、用户浏览器的名称和版本;3、访问者电脑分辨率显示模式;4、用户所使用的操作系统名称和版本;5、用户所在地理区域分布状况等。1.3 网站流量统计原理当浏览者访问网站时,会向网站所在服务器发送HTTP请求,由于网页是富媒体 聚合形式,当引用第三方的图片、音频、视频时,也会向媒体所在服务器发送请求。通过向所要统计网站页面中插入一段HTML代码来实行转向访问oHTTP请求标 头(Request-Header)中包含了用户代理(User-Agent),引用地址(Referer),以及通 过WEB服务器获得客户端的IP地址。绝大多数HTTP通讯由用户代理进行初始化,并通过它来组装请求以获取存储在 一些原始服务器上的资源。在最简单的情况下,通过用户代理与原始服务器之间一个 简单的连接就可以完成。图 1.1 HTTP 通讯过程HTTP/1.0 的请求标头允许客户端向服务器端传递该请求的附加信息及客户端信息。该域做为请求的修饰部分,遵照编程语言

      5、程序调用参数的语法形式。12Request-Header = Authorization| From| If-Modified-Since| Referer| User-Agent; 用户代理的身份凭证; 用户的电子邮件地址; 同最后一次修改时间的比较; 引用页面的 URI; 用户代理软件的信息HTTP/1.1 请求标头已经增加到了 19 个,不过增加的部分并不包含所要收集的数 据,所以本文不进行列举。第2章Python语言及Django框架简介2.1 Python 语言简介Python是一门跨平台的脚本语言,Python规定了一个Python语法规则,实现了 Python 语法的解释程序就成为了 Python 的解释器,我们用的比较多的是 C 版本的 Python,也就是使用C语言实现的Python解释器,除此之外还有使用Java实现的 Jython和使用.NET实现的IronPython,这些实现可以使Python用户充分利用己有的 Java及.NET资源。同时,Python支持几乎所有常用的操作系统,包括:Windows/DOS、Macintosh、 Linux及FreeBSD。

      6、及很多不常用的操作系统,包括AIX、AS/400 (OS/400)、BeOS、 OS/2、OS/390 与 z/OS、Palm OS、PlayStation 与 PSP、Psion、QNX、RISC OS、Series 60、 Sparc Solaris、 VMS、 VxWorks、 Windows CE 或 Pocket PC、 Sharp Zaurus、 MorphOS 等。可扩充性可说是Python作为一种编程语言的特色。新的内置模块(module)可 以用C或C+写成。而我们也可为现成的模块加上Python的界面。Python可以使 用户避免过分的语法的羁绊而将精力主要集中到所要实现的程序任务上。因此 Python 具有非常庞大的程序库,通过它们可以快速完成绝大部分常用的任 务,如:从某个URL中获取信息、正则表达式、获得某个文件或字符串的MD5特征 字符串、多线程、XML及HTML的分析等。Python也被称为是一门清晰的语言。因为它的作者在设计它的时候,总的指导思 想是,对于一个特定的问题,只要有一种最好的方法来解决就好了2.2 Django 框架简介Django是一个开放

      7、源代码的Web应用框架,由Python写成。采用了 MVC的设 计模式,即模型M,模版T和视图控制器V。它最初是被开发来用于管理劳伦斯出 版集团旗下的一些以新闻内容为主的网站的。并于2005年7月在BSD许可证下发布。这套框架是以比利时的吉普赛爵士吉他手 Django Reinhardt 来命名的。Django的主要目标是使得开发复杂的、数据库驱动的网站变得简单。Django注 重组件的重用性和“可插拔性”敏捷开发和DRY法则(Dont Repeat Yourself )。在 Django 中 Python 被普遍使用,甚至包括配置文件和数据模型。Django 框架的核心包括:一个 对象-关系 的映射器,用作数据模型(以 Python 类的形式定义)和关系数据库间的媒介;一个基于正则表达式的 URL 分发器;一个 视图系统,用于处理请求;以及一个模板系统。核心框架中还包括:1、一个轻量级的、独立的 Web 服务器,用于开发和测试。2、一个表单序列化及验证系统,用于HTML表单和适于数据库存储的数据之间 的转换。3、一个缓存框架,并有几种缓存方式可供选择。4、中间件支持,允许对请求处理的

      8、各个阶段进行干涉。5、内置的分发系统允许应用程序中的组件采用预定义的信号进行相互间的通信。6、一个序列化系统,能够生成或读取采用XML或JSON表示的Django模型实 例。7、一个用于扩展模板引擎的能力的系统。Django包含了很多应用在它的“contrib包中,这些包括:1、一个可扩展的认证系统2、动态站点管理页面3、一组产生 RSS 和 Atom 的工具4、一个灵活的评论系统5、产生Google站点地图(Google Sitemaps)的工具6、防止跨站请求伪造(cross-site request forgery)的工具7、一套支持轻量级标记语言(Textile和Markdown)的模板库8、一套协助创建地理信息系统(GIS)的基础框架2.3 SQLite 数据库简介SQLite是遵守ACID的关联式数据库管理系统,它包含在一个相对小的C库中。它是 D.RichardHipp 建立的公有领域项目。不像常见的客户-服务器范例,SQLite引擎不是个程序与之通信的独立进程,而 是连接到程序中成为它的一个主要部分。所以主要的通信协议是在编程语言内的直接 API 调用。这在消耗总量、延

      9、迟时间和整体简单性上有积极的作用。整个数据库(定 义、表、索引和数据本身)都在宿主主机上存储在一个单一的文件中。它的简单的设 计是通过在开始一个事务的时候锁定整个数据文件而完成的。库实现了多数的 SQL-92 标准,包括事务,就是代表原子性、一致性、隔离性和 持久性的(ACID),触发器和多数的复杂查询。不进行类型检查。你可以把字符串 插入到整数列中。例如,某些用户发现这是使数据库更加有用的创新,特别是与无类 型的脚本语言一起使用的时候。其他用户认为这是主要的缺点。多个进程或线程可以访问同一个数据而没有问题。可以并行的满足多个读访问。 只有在其他访问当前不被服务的时候才能满足写访问;否则写访问失败并带有一个错 误代码(也可以在可配置的超时过期之后自动的重试)。提供了叫做sqlite的一个独立程序用来查询和管理SQLite数据库文件。它也充 当写使用 SQLite 库的应用的一个例子第 3 章 需求分析3.1 系统描述网站流量统计系统包括三个基本部分,一个是记录访客部分,包括记录访客的 IP 地址,浏览器信息,操作系统信息,浏览时间,离开时间,浏览页面,会话记录。一 个是系统管理部分,包括用户管理,用户组管理,权限管理,站点管理,访客管理。 还有一个是统计部分,包括在线人数统计,综合数据统计,单日流量统计等。3.2 统计网站识别本系统由于要对多个网站进行统计,所以必须区分访问不同站点的访客。每个网 站都由系统生成唯一的编号,通过让不同的网站引用名为该网站编号的图片,就能区 分出是来自哪个网站的访客。3.3 页面识别一个网站包含多个页面。区分访客对不同页面的访问对统计来说意义重大。在图 片请求 Request 中的 Referer 包含引用图片的网页的网址。通过它不仅能区分访客访 问什么页面,还能判断是否是属于某网站域名下的URL,以过滤第三方引

      《网站流量统计系统的设计》由会员cl****1分享,可在线阅读,更多相关《网站流量统计系统的设计》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.