几种常用无损数据压缩算法研究

(中国工程物理研究院计算机应用研究所,四川绵阳621900)摘要:随着网络承载的信息量的飞速增长,数据压缩必然会备受人们重视。数据压缩可分成两种类型,一种叫做无损压缩,另一种叫做有损压缩。文中主要介绍目前用得最多和技术最成熟的无损数据压缩技术,按照无损压缩方法采用的压缩技术的不同,从基于统计的压缩思想和基于字典的压缩思想两个方面对其中最具有代表性的无损数据压缩方法进行了详细的分类讨论和优缺点比较,并对基于字典压缩算法的一些成熟的改进算法进行了汇总介绍,便于对无损数据压缩技术感兴趣的同志学习参考。关键词:数据压缩;无损数据压缩;统计压缩算法;字典压缩算中图分类号:TP311.5文献标识码:A文章编号:1673-629X(2011)09-0073-04ResearchofSeveralCommonLosslessDataCompressionAlgorithmsZHENGCui-fang(InstituteofComputerApplication,ChinaAcademyofEngineeringPhysics,MAbstract:Withthequickincreaseofnetwork’sinformation,datacompressionispaidmoreandmoreattentionbypeople.Datacompres-sioncanbedividedintotwotypes,oneiscalledlosslesscompression,andtheotheriscalledlosscompression.Ittakeslosslessdatacom-pressionasmainline.Accordingtodifferentcompressiontechnologyoflosslessdatacompression,fromtwoaspectsofstatisticanddic-tionaryideas,itintroducessomerepresentativelosslessdatacompressionapproachesandanalyzesthesekindsofdatacompressionalgo-rithms’advantagesanddisadvantages.Gathersomematurebettermentalgorithmbasedondictionarycompressionalgorithmtogetherandintroducethem;Itisfacilitatereferenceforpeoplewhoisinterestinlosslessdatacompressiontechnology.分类介绍,并对它们各自的优缺点进行归纳总结。由0引言于篇幅的原因,文中并没有对每个算法的具体实现步随着信息化技术的飞速发展,各行各业都用计算机来处理信息,各种系统数据量越来越大,数据在时间和空间上日益增长,给信息存储特别是网络传输带来诸多的困难。为了节省信息的存储空间和提高信息的传输效率,必须对大量的实际数据进行有效的压缩。数据压缩作为解决海量信息存储和传输的支持技术受到人们的极大重视。压缩算法分为无损压缩和有损压缩。相对于有损压缩来说,无损压缩的占用空间大,压缩比不高,但是它100%地保存了原始信息,没有任何信号丢失并且音质高,不受信号源的影响。而且随着限制无损格式的种种因素逐渐被消除(例如:硬盘容量的急剧增长而且价格越来越低廉),使得无损压缩格式具有广阔的应用前景。文中在查阅大量文献的前提下,对目前国内外的一些具有代表性的无损压缩算法进行详细的骤进行描述,而只是引入了对每个算法介绍比较详细的中文文献信息。希望能为对无损压缩算法有兴趣的同志学习、查询提供方便。1无损数据压缩的分类无损压缩技术即通常所说的通用压缩技术也称为信息保持编码、熵编码、无失真编码等,也就是根据一定方法对大量数据进行编码处理以达到信息压缩存储过程,在数据的压缩过程中不允许精度的损失,被压缩的数据应该能够通过解码恢复到压缩以前的原状态主要用于文本文件、数据库、程序数据和特殊应用场合的图像数据(如指纹图像、医学图像等)的压缩。这类算法压缩率较低,一般为1/2~1/5。通常压缩对象是文字或数字等要求精确的数据时,无损压缩是必然的选择。无损压缩从压缩模型上收稿日期:2011-01-27;修回日期:2011-05-09基金项目:中国工程物理研究院预先研究基金(09-0642)大体可以分为基于统计的压缩算法和基于字典的压缩算法具体的分类图如图所示图1常用无损数据压缩分类图Huffman的运行时间与输入串长度成线性比,而存储基于统计压缩算法1.1基于统计式压缩算法的起源较早,实质是统计字符的出现频率来对字符本身重新编码,属于熵编码类,与原始数据的排列次序无关而与其出现频率有关,主要的压缩算法有Shanno-Fano编码、游程长度编码(RLC)、哈夫曼编码和算术编码。空间的需求量不依赖输入串长度,是一个常数。5)算术编码[6]也是一种根据字符出现几率的统计结果重新编码的...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?