数据压缩

如题所述

推荐答案 2020-01-18

数据压缩技术主要研究数据的表示、传输和转换方法，目的是减少数据所占据的存储空间和缩短数据传输时所需要的时间。

衡量数据压缩的3个主要指标：一是压缩前后所需的信息存储量之比要大；二是实现压缩的算法要简单，压缩、解压缩速度快，要尽可能做到实时压缩和解压缩；三是恢复效果要好，要尽可能完全恢复原始数据。

数据压缩主要应用于两个方面。一是传输：通过压缩发送端的原始数据，并在接收端进行解压恢复，可以有效地减少传输时间和增加信道带宽。二是存储：在存储时压缩原始数据，在使用时进行解压，可大大提高存储介质的存储量。

数据压缩按照压缩的失真度分成两种类型：一种叫作无损压缩，另一种叫作有损压缩。

无损压缩是指使用压缩后的数据进行重构（或者叫作还原、解压缩），重构后的数据与原来的数据完全相同；无损压缩用于要求重构的信号与原始信号完全一致的场合。一个很常见的例子是磁盘文件的压缩。根据目前的技术水平，无损压缩算法一般可以把普通文件的数据压缩到原来的1/4～1/2。一些常用的无损压缩算法有霍夫曼（Huffman）算法、算术算法、游程算法和LZW（Lenpel-Ziv ＆ Welch）压缩算法。

1）霍夫曼算法属于统计式压缩方法，其原理是根据原始数据符号发生的概率进行编码。在原始数据中出现概率越高的符合，相应的码长越短，出现概率越少的符合，其码长越长。从而达到用尽可能少的符号来表示原始数据，实现对数据的压缩。

2）算术算法是基于统计原理，无损压缩效率最高的算法。即将整段要压缩的数据映射到一段实数半封闭的范围［0，1）内的某一区段。该区段的范围或宽度等于该段信息概率。即是所有使用在该信息内的符号出现概率全部相乘后的概率值。当要被编码的信息越来越长时，用来代表该信息的区段就会越来越窄，用来表示这个区段的位就会增加。

3）游程算法是针对一些文本数据特点所设计的压缩方法。主要是去除文本中的冗余字符或字节中的冗余位，从而达到减少数据文件所占的存储空间。压缩处理流程类似于空白压缩，区别是在压缩指示字符之后加上一个字符，用于表明压缩对象，随后是该字符的重复次数。本算法具有局限性，很少单独使用，多与其他算法配合使用。

4）LZW算法的原理是用字典词条的编码代替在压缩数据中的字符串。因此字典中的词条越多，压缩率越高，加大字典的容量可以提高压缩率。字典的容量受计算机的内存限制。

有损压缩是指使用压缩后的数据进行重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。例如，图像和声音的压缩就可以采用有损压缩，因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息，丢掉一些数据而不至于对声音或者图像所表达的意思产生误解，但可大大提高压缩比。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://77.wendadaohang.com/zd/G3q3NI8qpYWvWIGNIvp.html

相似回答

数据压缩名词解释答：数据压缩名词解释是指在不丢失有用信息的前提下，缩减数据量以减少存储空间，提高其传输、存储和处理效率，减少数据的冗余和存储的空间的一种技术方法。数据压缩可以根据不同的特性和应用需求进行分类。常见的数据压缩分类方式：1、无损压缩（Lossless Compression）：无损压缩技术可以将数据以较高的精确度压缩...

大数据中常见数据存储格式与压缩格式答：Parquet，列式存储的明星，专为数据分析设计，通过压缩列数据，支持复杂类型，是Impala和Hive的首选。ORC，Hive的专属列存格式，支持ZLIB和SNAPPY压缩，对数据仓库的读取优化表现出色。TextFile，虽然以行存形式存在，但无压缩且解析成本高，主要应用于数据的初始层（ODS）。SequenceFile，Hadoop的基石，采用二...

数据压缩的可以分为哪几类?各举例说明其中的经典算法。答：【答案】：数据压缩有两类基本方法：一种是将相同的或相似的数据或数据特征归类，使用较少的数据量描述原始数据，达到减少数据量的目的，称为无损压缩。第二类方法是有利用人眼的视觉特性有针对性地简化不重要的数据，以减少总的数据量，这种压缩一般为有损压缩。无损压缩编码算法主要包括Huffman编码、算术...

数据压缩有哪些方法答：矢量数据的常用压缩方法：间隔取点法、垂距法、光栏法。间隔取点法：每隔k个点取一点，或每隔一规定的距离取一点，但首末点一定要保留。这种方法可大量压缩数字化使用连续方法获取的点和栅格数据矢量化而得到的点，但不一定能恰当地保留方向上曲率显著变化的点。垂距法：这个方法是沿着边界线，逐点计算...

数据压缩分为哪三类??答：数据压缩分为两类，有三种分法：1、即时压缩和非即时压缩即时压缩是将语音信号转化为数字信号，同时进行压缩，然后即时通过Internet传送出去。即时压缩一般应用在影像、声音数据的传送中。非即时压缩是在需要的情况下才进行，没有即时性。非即时压缩一般不需要专门的设备，直接在计算机中安装并使用相应的压缩...

什么是压缩比,压缩比越大,压缩后的文件越大吗?答：压缩比是指压缩算法对数据进行压缩后的大小与原始数据大小之间的比例关系。它是衡量压缩效果的一种度量方式。压缩比可以用公式表示为：压缩比 = 原始数据大小 / 压缩后的数据大小。压缩比通常以比例或百分比表示，并且值越大，表示压缩效果越好。例如，一个压缩比为2:1的意味着经过压缩后的数据大小只有...

数据压缩答：数据压缩按照压缩的失真度分成两种类型：一种叫作无损压缩，另一种叫作有损压缩。无损压缩是指使用压缩后的数据进行重构（或者叫作还原、解压缩），重构后的数据与原来的数据完全相同；无损压缩用于要求重构的信号与原始信号完全一致的场合。一个很常见的例子是磁盘文件的压缩。根据目前的技术水平，无损压缩...