好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

pdf文档格式入门教程.docx

9页
  • 卖家[上传人]:宝路
  • 文档编号:5644042
  • 上传时间:2017-09-07
  • 文档格式:DOCX
  • 文档大小:677.04KB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 一.前言PDF 是基于 PostScript 文本描述语言,PDF 特点有1. 跨平台2. 包含多种类型的内容3. 实时的合作编辑4. 数字签名保证安全性5. 安全和许可保证相关权限6. 方便残疾人的阅读7. 对其它文件格式和应用程序的重用二.语法应该从 4 个方面来理解语法1. 对象2. 文件结构3. 文档结构 4. 内容流PDF 并不局限于 ASII 字符,包括任意的 8 位字符,但是字符串和流建议用 ASCII 表示PDF 字符集分成 3 种 regular,delimiter,white-space.PDF 8 种基本数据类型 1. Boolean values2. Integer and real numbers,默认为实数3. Strings,可以写成两种方式 (文本),,可以使用\ 表示跨行,转义字符的 16进制可以表示非 ASCII 字符4. Names,名字对象总是以 /开始5. Arrays,可以由不同的对象构成,6. Dicitionaries,键必须是一个名字, 是单重集7. Streams,PDF 可以读取流对象以增量的方式,且大小没有限制,而字符串对象必须一次性完全读入,8. The null object2.1 文档页面注:如果一个 PDF 文件包含二进制数据,那么建议报头那行之后应紧紧跟着一行至少包含四个二进制字符的评论,也就是,字符的代码是 128 或更大。

      这样确保文件传输应用程序在检测文件开头部分数据时能够采取恰当的操作来确定是把文件内容当作纯文本文件还是二进制数据文档页面通过页面树结构来访问, 该结构定义了文档中页面的顺序该树结构允许PDF 应用程序,使用很小的内存,就能快速打开一个上千页的文档树型结构包含 2 种节点--中间节点称为页树型结构节点,和叶节点称为页面对象应用程序应准备处理构成节点的树型结构的任何格式最简单的结构是仅包含一个页面树节点,直接指向所有的文档页对象2.2 内容流和资源内容流是描述页面外观和其它图形数据元素的主要手段内容流取决于所载信息相关的资源词典,这两个对象相结合形成一个自我包含的实体一个内容流是一个 PDF 流对象,它的数据由一系列描述在页面上绘图的图形数据元素的指令构成这些指令以 PDF 对象形式呈现,使用同样的对象语法然而尽管文档整体上是一个静态的,随机访问的数据结构,但是内容流中的对象将会按照顺序被解析1.一个页面可以由一个或多个内容流表示.2.内容流可以独立表示对象(Form Xobject, Patterns, Type3 字体, 外观流)3.内容流可以被编码 FlateDecode, 在解析 PDF 文件中的 FlateDecode 过滤器时存在整数溢出。

      FlateDecode 过滤器中可指定多个参数,之后在算术运算中使用了这些参数值计 算所要分配的堆缓冲区的字节数这个计算可能溢出,导致分配了不充分的堆缓冲区处理 PDF 文档中的 TrueType 字体和 JBIG2 数据时存在内存破坏 4.内容流中的操作数在操作符之前(后缀表示法),为了便于程序实现 .5.内容流中操作符的操作数只能是直接对象,间接对象和对象的引用都是不允许的在某些情况下,操作符必须指向一个定义在内容流外的 PDF 对象,例如字体字典或图像数据流6.一个内容流中的命名资源是由资源字典来定义,资源字典列举了内容流中操作符需要的指定资源和指向所需要的名称比如,如果一个文本操作符在内容流中出现需要某一个字体,内容流资源字典可以将名称 Font1 与相应的字体字典结合起来文本操作符可以使用这个名称指向相应的字体资源字典可以通过以下方法中的一种与内容流结合:1.作为页面 Contents 选项的值的内容流,(由于页面 Resource 属性是可继承性, 它可能就位于某个页面对象的父节点中).2.对于其他内容流,流字典的 Resources 选项指定资源字典这个适合于指定 Form XObjects 的内容流,pattern , Tpye3 字体,和标注外观流。

      3.Form XObject 或 Type3 字体字形描述可能缺省 Resources 选项在这种情况下,可以在使用表单或字体的页面的 Resources 选项中查询资源但不建议用这种方法4.过滤器 过滤器可以串联,基本上可以分成两类ASCII 过滤器,可以将任意的 8 位数据编码成 ASCII 文本形式.对于加密过的 PDF 文件没有作用解压过滤器对于压缩过的数据,• 交叉引用表(Cross-reference Table) 中包含允许随机访问文件应有的间接对象的信息,从而在定位某一特定对象时不必去读整个 PDF 文件每一个 PDF 文件均应该包含一张交叉引用表,由一个或多个部分( sections)组成如果没有更新信息扩充到 PDF 文件,则交叉引用表表仅包含一个部分( section)以对象编号 0 开始,每更新一次文件就在该文件的交叉引用表表中增加一个部分三.图形1.Pdf 将符号当做一般的图形来对待。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.