最新 | 最热门 | 最高评价

+0  slimarray: gzip的压缩率, 即时访问

Tag: algo | array | 数组 | compress | succinct
张炎泼(xp) 发于 2020年11月15日 08:00 | 点击: 457 | 展开摘要
slimarray

场景和问题

在时序数据库, 或列存储为基础的系统中, 很常见的形式就是存储一个整数数组,
例如 slim 这个项目按天统计的 star 数:

这类数据有有很明显的统一的变化趋势, 对这类数据的存储,
我们可以利用数据分布的特点, 将整体数据的大小压缩到几分之一.
这就是 slimarray 要做的事情.

使用 slimarray, 可以将数据容量减小到gzip差不多的大小,
同时还能允许直接访问这些数据!
测试中我们选择了2组随机数, 以及现实中的

查看全文: http://www.udpwork.com/item/17477.html

+0  Huffman 编码压缩算法

Tag: 杂项资源 | 程序设计 | Algorithm | Compress | Huffman Code
陈皓 发于 2012年05月22日 13:32 | 点击: 2550 | 展开摘要
前两天发布那个rsync算法后,想看看数据压缩的算法,知道一个经典的压缩算法Huffman算法。相信大家应该听说过 David Huffman 和他的压缩算法—— Huffman Code,一种通过字符出现频率,Priority Queue,和二叉树来进行的一种压缩算法,这种二叉树又叫Huffman二叉树 —— 一种带权重的树。从学校毕业很长时间的我忘了这个算法,但是网上查了一下,中文社区内好像没有把这个算法说得很清楚的文章,尤其是树的构造,而正好看到一篇国外的文章《A Si

查看全文: http://www.udpwork.com/item/7339.html

+0  JavaScript 压缩中的常量内联

Tag: 工具 | closure | compress | google | JavaScript | Yahoo
lifesinger 发于 2010年11月30日 23:24 | 点击: 2432 | 展开摘要
两年前,NCZ 在 Extreme JavaScript Compression With YUI Compressor 里提到:

Best Optimization = Identifier Replacement

标志符替换(Identifier Replacement)在 YUI Compressor 里非常重要。

下面用 CC 表示 Closure Compiler, YC 表示 YUI Compressor.

本地文件大小

为了帮助 YC 有效进行标志符替

查看全文: http://www.udpwork.com/item/3631.html

+0  ETS新的压缩特性

Tag: Erlang探索 | compress | ets
Yu Feng 发于 2010年11月28日 14:44 | 点击: 2137 | 展开摘要
原创文章,转载请注明: 转载自Erlang非业余研究

本文链接地址: ETS新的压缩特性

即将发布的R14B01要支持ets的压缩,更大程度的提高内存的利用率。

在github上可以看到这个分支,有兴趣的同学可以下载下来看看。

压缩的时候只压缩value, key是不压缩的。 value特别简单类型的eterm也是不压缩的,因为zip压缩需要一定长度的内容,而且压缩本身也要加入一点的overload.

以下是sverker (author)的提交log.

ETS

查看全文: http://www.udpwork.com/item/3605.html

+0  关于 gzip, deflate, zlib, LZ77

Tag: Misc | deflate | gzcompress | gzdeflate | gzencode | gzip | lz77 | zlib
liwei 发于 2010年06月25日 20:40 | 点击: 3990 | 展开摘要
LZ77: 是一种基于字典的无损数据压缩算法(还有 LZ78, LZW 等)

deflate: 也是一种数据压缩算法,实际上就是先用 LZ77 压缩,然后用霍夫曼编码压缩

gzip: 是一种文件结构,也可以算一种压缩格式,通过 defalte 算法压缩数据,然后加上文件头和CRC校验

zlib: 是一个提供了 deflate, zlib, gzip 压缩方法的函数库;也是一种压缩格式(用 deflate 压缩数据,然后加上 zlib 头和 CRC 校验)

PHP 中的

查看全文: http://www.udpwork.com/item/6246.html

+0  为什么不压缩 HTML

Tag: 开发 | compress | HTML
lifesinger 发于 2010年05月02日 21:29 | 点击: 1963 | 展开摘要
CSS 和 JavaScript 的压缩已经很成熟,各大网站都在使用。HTML 的压缩(特指去除空白字符和注释),除了 Google 等搜索页面,在其它网页上基本见不到踪迹。

原因很简单:

HTML 文档中,多个空白字符等价为一个空白字符。也就是说换行等空白字符的删除是不安全的,有可能导致部分元素的样式产生差异。

HTML 元素中,有一个pre, 表示 preformatted text. 里面的任何空白,都不能被删除。

HTML 中有可能有 IE 条件注释。这些条件

查看全文: http://www.udpwork.com/item/1253.html
|<<<1>>>| 一共1页, 6条记录