
区块链基本知识.docx
6页新区块SHA2562区块链基础知识区块链(BlockChain),是区块(Block)和链(Chain)的直译,其数据结构如图1所示,即每个区块保存规定时间段内的数据记录,并通过密码学的方式,构建一条安全可信的链条,形成一个不可篡改、全员共有的分布式账本比特币的区块分为区块头和区块体两部分区块头的大小为80字节,包括4字节的版本号、32字节(256位)的上一区块哈希值、32字节的Merkle根节点、4字节的时间戳、4字节的难度值和4字节的随机数区块体包含10分钟内选定的交易记录,第一笔交易(coinbase交易)是用于奖励矿工比特币的特殊交易,由矿工自己添加进区块区块N+1图1区块链的数据结构示意图基本概念区块链是很多现有技术交叉融合在一起的集成创新因此,要了解区块链,首先要了解区块链到底集成了哪些技术P2P网络如图2所示,P2P(Peer-to-Peer)网络是一种端到端的网络P2P网络分为结构化(例如基于Chord的P2P网络)和非结构化的P2P网络(例如Gnutella)比特币的区块链采用的是非结构化P2P网络,整个网络没有中心化的硬件或管理机构,任一节点既是服务端,也是客户端任何节点只要安装相应的客户端软件,就能接入P2P网络(例如BT软件),参与区块链的记录和验证,不超过1/3节点的损坏、退出甚至被植入恶意代码,都不会影响整个系统的运作。
金融系统在机构之间使用一个中心化的账本来追踪资产的流动通过去中心化账本来替代中心机构认证资产所有权,多个机构共同运行和检没,来防止欺诈和人为操控图2传统中心化系统和P2P网络的拓扑对比图加密算法和数字签名加密技术分为对称、非对称和哈希(Hash)加密对称加密是指用同样的密钥来进行加密和解密,非对称加密是指用一个密钥对来进行加密和解密,希运算,用固定的哈希结果值验证信息是否被篡改非对称加密在非对称加密技术中,对外公开、分发出去的密钥叫做公钥,哈希加密主要是通过对数据进行哈不能公开、自己留存的密钥叫3所示明文加密密文解盛明文88>887^nod187=11ll23mod187=88*88做私钥公钥加密的,对应的私钥才能解密反之亦然如图私钥三(23f187)图3非对称加密RSA算法的简化示例图非对称加密算法有RSADSA和ECC等种类,区块链使用的是基于椭圆曲线加密技术的数字签名(ECDSA,具体实现是secp256k1ECDSA相当于是DSA和非对称加密ECC的结合相比RSA算法,ECDSAM有计算量小、存储空间小、带宽要求低等特点数字签名基于数字签名的通信机制工作原理,如图4所示,发送报文时,发送方用一个哈希函数从报文文本中生成文件摘要,然后用自己的私钥对摘要进行加密,加密后的摘要将作为报文的数字签名和报文一起发送给接收方。
接收方首先用与发送方一样的哈希函数从接收到的原始报文中计算出报文摘要,接着再用发送方的公钥来对报文附加的数字签名进行解密,如果得到的明文相同,那么接收方就能确认传输的文件并未受到篡改,是安全可信的文件摘要1接受文件时比分析如果相同,代表可也如果不同,代表蔑改,哈希运算提取公铝解磨艾件摘要2图4数字签名的流程示意图哈希加密安全哈希算法(SecureHashAlgorithm,SHA)是由美国国家安全局研发,由美国国家标准与技术研究院(NISD发布的一系列密码哈希函数,包括SHA-CkSHA-1、SHA-2和SHA-3等系列比特币的区块链使用的是SHA-256哈希加密算法,于2CC1年发布,属于SHA-2分支由于SHA256伪随机性的特点,只要是相同的数据输入,一定会得到相同的结果,如果输入数据稍有变化,将得到一个千差万别的结果,如图5所示SHA256还是一个单向不可逆的算法,即根据一个输入数算SHA256的结果很容易,但根据SHA256的结果反算输入数几乎是不可能除此之外,比特币还使用ripemd16C算法来生成比特币钱包的地址图5哈希加密的示意图梅克尔树梅克尔(Merkle)树是区块链的基本组成部分。
如果没有梅克尔树,区块链也是可以运转,但是要在区块头里包含所有交易记录,扩展性方面存在很大挑战如图6所示,区块链中的每个区块,由区块头和区块体构成,区块头中含有一个Merkle根节点的字段,通过对区块体中所有交易记录,以二叉树的形式迭代地两两拼接、进行哈希操作,可以得到一个最终的哈希值,我们称之为Merkle根哈希Merkle根哈希相当于是对区块中所有交易记录进行了一个快照,区块中交易记录的任意改动都可以通过比较Merkle根哈希而很容易地察觉Merkle根哈希主要用于简单支付验证(SPV,在验证某个交易是否在区块中时,也能极大区块N地减少网络传输成本新区块SHA2562版本号版本号版本号上一区块哈希值上一区块哈希值上一区块哈希值SHA256?SHA256?Merkle根节点Merkle根节点Merkle根节点时间戳时间戳;时间戳难度值璀度值随机数:交易数据区块体交易数据:区块体交易数据Merkleftl的根节点哈希值交易的哈希值/串联后哈交易01的二哈希值\串联后哈希/交易1的哈希值交易22的哈希与值交易2的哈希值交易2的哈希信图6Merkle树示意图工作量证明机制工作量证明机制,简单地说,就是一种共识机制,用来确认你是否做过一定量工作的证明。
比特币的区块链主要是依托计算数学难题来衡量工作量每个区块,当选定一定数量的交易记录之后,填充版本号、时间戳、难度值,生成相应的Merkle希哈希很容易看到,这些数值在选定交易记录以后,都是确定的,唯一能够改变的就只有随机数(Nonce)这个值如图7所示,系统根据难度值,要求计算整个区块头的两次SHA256算法,得到的哈希结果要小于一个阈值根据前面描述的SHA256算法的伪随机性,只有通过不断地尝试和枚举,才能找到相应的随机数,证明自己的工作量新区块上一个区块的哈希值#78Aadqddq..…梅克尔根节点61dldflahjm..…随机数(不断睛测)30282937302829383028293930282940两次SHA256哈希、f(block)〈目标阈值J302829413028294230282943图7工作量证明机制示意图除了工作量证明机制(PoW)这类共识机制之外,还有股权证明机制(PoS)、授权股权证明机制(DPo0、拜占庭容错机制(BFD、实用拜占庭容错机制(PBFT)这些在不可信环境下的共识机制以及要求在可信环境下的共识机制,例如PaxOS^Raft表1是做了简单的对比。
共识机制PaxosRaftPoWBFTPBFT一致性强一致性一性强致弱一致性弱一致性弱一致性网络组织主从主从对等对等对等数据库适配自身IcxclDBIcvclDBrocksDB允许失败的节点数<1/2<1/2<1/3<1/3<1/3恶意节点不允许允不许允许允许允许虚拟机无无无有需要代币无无有有无表1共识机制的简单对比表运行机制接入网络和验证节点通过安装相应的软件(例如比特币核心),接入区块链节点启动以后,主要是在P2P网络上发现邻居节点、链接邻居节点、传递P2P消息和下载区块链验证节点可以选择下载全量的区块链进行验证,或者是只下载区块头,通过Merkle树节点来进行简单支付验证(SPV)钱包软件可以分为移动钱包、桌面钱包、互联网钱包和纸钱包,都支持保存用户的私钥,钱包也可以根据私钥是否是种子产生的,而分为决定性钱包和非决定性钱包,关键区别在于私钥的备份和易恢复性区块链的存储和接受比特币的区块链使用BerkeleyDB(文件数据库)作为钱包数据库,使用LevelDB(键值数据库)存储区块的索引和UTXO(UnspentTransactionOutput,未开销的比特币交易输出)节点在启动的时候,将整个区块链的索引从LevelDB加载入内存。
当收到一个新区块时,节点对新区块中的所有交易进行检测,验证交易格式、交易大小、交易签名、UTX是否匹配、交易签名、脚本合规等方面如果验证成功,检查上一区块头与链头区块哈希值是否一致,如果是一致,则更新UTXO数据库和回滚交易数据库,如果不是,贝U将该区块放在孤儿区块池中当节点发现网络中存在另一条更长的区块链时,就需要断开现有的区块并对区块链进行重组如果验证不成功,会抛弃该区块,继续等待新区块的到来(矿工会继续计算新区块的数学难题)区块链的工作量证明计算机制“矿工”角色的节点一直收集网络中广播的交易记录,并致力于计算新区块的数学难题,即工作量证明如果其他节点发来的新区块验证成功,节点除了更新UTXO数据库和回滚交易数据库,节点会立即开始下一个新区块的计算新区块的构建优先选取交易内存池中优先级高的交易记录优先级的计算方式为:如果自己的工作量证明计算成功,节点会第一时间将这个区块广播至整个网络中,其他节点收到该新区块,如上所述,会进行相应的验证和存储整个区块链的运转机制如图8所示用户A1用户B1其他用户F矿工A■其他矿工1'生成公私钥.形成新地址;<\数字釜名,发起交易!:;►E消息A广播消息►E消息—itSMerkle根节点一,计舞Merkle根节点哈希值「填充区块口哈希值「填充区块个头相关字段+头相关字段I!|IIIIH计算数学谁题」—I计算数学谁题,*1工作量证明I」工作量证明广播消息pE消息<获碍授权,广播消息一|rw消息■;验证♦:——.□蛔R倒曰蛔曰领取阶奖励1IIfifii■4I1iL|形成新区块.链入L|形成新区块,槌入一|形成新区块,链入L|形成新区块,槌入L|形成新区块,惚入7原区块镀末尾<」原区块链末尾原区块谜末尾4」原区块磁末尾♦」原区块链末尾图8区块链运转机制示意图其他相关脚本语言区块链采用的脚本语言并不是图灵完备的语言,不支持循环,只能进行堆栈式操作。
这种脚本语言的好处是,不允许矿工提交一个死循环的脚本,更注重的是安全方面的考量,但其扩展能力有限从以太坊为首的区块链编程平台支持图灵完备的编程语言,引领区块链跨入2.0时代由于支持循环等复杂操作,以太坊用Gas(燃料)机制来防止死循环的出现,确保系统的安全消息队列比特币区块链采用ZeroMQ(ZMQ)作为消息分发和消息队列管理工具与很多人熟悉的RabbitMQ相比,ZMQ不像传统意义的消息服务器,更像一个底层的网络通信库,在多个线程、内核和主机盒之间弹性伸缩,在SocketAPI之上将网络通信、进程通信和线程通信抽象为统一的API接口挖矿设备和算法演进挖矿设备从支持复杂指令(CISC、适合串行计算的CPU矿机时代,经由基于众核体系、适合并行简单计算的GPU挖矿和低功耗却价格昂贵的FPGA挖矿,逐渐向集约高速的ASIC矿机和规模效应的矿池演进基于工作量证明机制的算法,容易导致矿工算力集中的问题有人将这种“中心化”的责任归咎于SHA256算法此时,基于SCRYP琳法的莱特币(Litecoin)进入了人们视线,其占用内存多、计算时间长、并行计算困难的特点,限制了矿工的“军备竞赛”莱特币的成功催生了更多算法的交叉融合,衍生出串联算法(夸克币)、并联算法(HeavyC。
