基于LZW算法的数据无损压缩硬件实现

摘要： 基于LZW算法的数据无损压缩硬件实现,当前数据压缩技术分为有损压缩和无损压缩，算术编码、游程编码、霍夫曼和LZW压缩是传统的数据压缩方法，属于无损数据压缩;而基于小波变换的数据压缩和基于神经网络的编码方式是近年来新发展起来的现代数据压缩方法，

关键词： 压缩无损数据 LZW

Abstract：

Key words :

</a>数据" title="数据">数据" title="数据">数据压缩技术分为有损压缩和无损压缩，算术编码、游程编码、霍夫曼和LZW压缩是传统的数据压缩方法，属于无损数据压缩;而基于小波变换的数据压缩和基于神经网络的编码方式是近年来新发展起来的现代数据压缩方法，属于有损数据压缩。本研究主要探讨一种基于LZW算法的数据无损压缩硬件实现。

　　1 LZW算法及其改进算法

　　LZW压缩算法在压缩的过程中自适应建立一个字典，以后的数据同字典中的数据相匹配，匹配上则输出字典的索引。由于表示字典的索引所用的比特数远小于字符的比特数，从而达到压缩的效果。这个生成的字典不需要随着压缩的数据一同传输，而是能够根据压缩的数据在解压时重新动态生成一模一样的字典。

　　LZW编码原理如图1所示，在进行压缩时首先把字典中的前256(0～255)项初始为全部的256个8位字符，分别为十进制数0～255。当输入第一个字符时，总是在字典中可以找到，直到新的字符X不在字典词条中时，便将字符串IX加入到字典的第256项，以此类推。以字符串流5，6，7，8，9，5，5，6，6，7，8，9，5，…为例，表1给出了字典存储的物理结构和压缩过程中字典项的读写示意。压缩后编码输出为5，6，7，8，9，5，256，257，259，…。

　　传统的LZW压缩算法采用8位数据输入，固定长度编码输出，随着字典内容的不断增多，输出编码的位数不断增加势必造成资源的浪费，也会损失压缩率。另外，由于字典的容量有限，随着压缩过程的进行，字典会被填满，若是简单的不再向字典中增加内容，那么后面的压缩率就会降低，而如果将字典全部清除重新建立字典，在字典建立初期压缩率也是很低的。针对以上不足，文献对LZW算法做以下改进：采用12位数据作为压缩输入，变长度的码字输出。

　　压缩字典最多可容纳16 384个码，共分为三部分，其中0～4 095为12位输出，4 096～8 191为13位，8 192～16 383为14位。每当输出长度变化时，同时输出一个变长标识，便于解码器解码。

　　2 LZW算法FPGA实现

　　2.1 算法实现硬件结构

　　LZW数据压缩算法的FPGA硬件实现，其内部功能模块划分如图2所示。

　2.3 仿真结果

清空字典存储器模块，初始化信号，将可能出现的单字符存入字典，压缩时新传续存地址为4096，新字符串输入时产生相应的哈希表地址与偏移量;然后读字典存储器相应地址的内容，如内容为空则输出输入的数据，并把相应内容存入字典，如内容匹配，则继续输入下一数据，否则(即发生冲突)产生新的哈希表地址，重新读取字典，进行判断、比较。仿真时序如图3所示.

　　仿真结果：输入数据为5，6，7，8，9，5，6，7，8，9，5，6，7，…;输出数据为5，6，7，8，9，4 098，4 100，4 102，…。仿真结果与理论计算值一致。

　　3 结论

　　LZW算法逻辑简单，实现速度快，擅长于压缩重复出现的字符串;无需事先统计各字符的出现概率，一次扫描即可;相对于其他算法，更有利于硬件实现。本文利用FPGA实现了改进的LZW压缩算法，仿真证明其算法具有很高压缩率，适合工程的实际应用。

通知公告

编辑观点

理事会

参考资料

凡《网络安全与数据治理》（原《信息技术与网络安全》）录用的文章，如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明，即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊，本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时，本刊支付的稿酬已包含上述使用的费用，特此声明。

作者投稿

在线期刊

下载中心

信网杯

《网络安全与数据治理》（原《信息技术与网络安全》）编辑部