最新 | 最热门 | 最高评价

+0  一些有意思的文章和资源

Tag: Web开发 | 技术读物 | 杂项资源 | 64bits | Algorithm | Android | C++ | ebook | Java | Python | UI
陈皓 发于 2011年04月06日 08:47 | 点击: 6215 | 展开摘要
又到了向大家介绍一些最近我在网上发现的有价值的东西的时候了。(下面的链接中很多都被墙)

以前向大家介绍过《一些重要的算法》和《算法和数据结构词典》,不过,你知道有些什么样比较奇怪的数据结构吗?wikipedia上的这个词条可以让你看看各种不同的数据结构。比如:Skip lists, Bloom filters,或是什么Dancing links。你也许会像一个以“如何学好C++”中的朋友们所说的,不削于这种所谓的“奇技淫巧”,甚至觉得这太根本不实用。其实,这些东西还是有用的

查看全文: http://www.udpwork.com/item/4739.html

+0  类型的本质和函数式实现

Tag: 编程语言 | C++ | Design | Javascript | Python
Todd 发于 2013年07月22日 19:46 | 点击: 6067 | 展开摘要
(感谢 @文艺复兴记(todd) 投递此文)

在上一篇文章《二叉树迭代器算法》中,我介绍了一种基于栈的二叉树迭代器实现。程序设计语言和Haskell大牛@九瓜 在看过之后评论到:

这里用了 stack 来做,有点偷懒,所以错失了一个抽象思考机会。如果我们能够理解二叉树到线性表的转换过程,完全可以把 Iterator 当作抽象的线性表来看,只要定义了关于 Iterator 的 empty, singleton, 还有 append 操作,实现二叉树的 Iterator 就变

查看全文: http://www.udpwork.com/item/10258.html

+0  Python里使用zbar识别二维码

Tag: 我的代码 | 我的分享 | python | qrcode
Xiaoxia 发于 2015年11月05日 04:55 | 点击: 5628 | 展开摘要
今天研究数据库里的微信群二维码图片,很多人上传的图片并不是正确的群二维码,而是个人微信、公众号或者是一个手机充值流量的入口。为了把这些不合格的二维码挑选出来,只能一个个识别了。找了网上一些接口的,测试了一下不但限制频率为一秒2个,还很多识别不出来,看报错用的是zxing这个库,最后只能想其他方法。

在CentOS7上安装了zbar,没有找到el7的rpm,只好自己编译。研究出编译时使用一些参数可以避免安装一些不必要的包。为了virtualenv里的python能用,编译时候

查看全文: http://www.udpwork.com/item/14742.html

+0  pip install lxml编译失败问题解决

Tag: Python
youngsterxyf 发于 2013年03月17日 00:00 | 点击: 4760 | 展开摘要
以前在遇到这个问题时,都是偷懒使用sudo apt-get install python-lxml(Debian系的Linux发行版)直接安装已打包好的deb包。但一方面这样安装的不是最新的库,另一方面我希望把所有的Python第三方库都限制在virtualenv中使用,所以希望使用pip install lxml,那么这个问题就必须解决了。

Google了一把,在这里找到了解答。

其实在编译失败的log里,已经有提示:

make sure the developmen

查看全文: http://www.udpwork.com/item/11846.html

+0  python中文分词

Tag: algorithm | program | math | probability | python
isnowfy 发于 2012年03月17日 22:15 | 点击: 4301 | 展开摘要
相对于英文而言,中文在计算机处理方面有个必须要面对的问题就是中文分词,英文的单词都是空格间隔的,而中文的词语则不同,所以用程序解决中文分词,在很多自然语言处理方面都是首要进行的步骤。

其中最简单的就是最大匹配的中文分词了,比如“今天天气不错”可以分词为“今天/天气/不错”,但是面对一些有歧义的句子时却显得捉襟见肘,于是“南京市长江大桥”就会被分成“南京市长/江/大桥”而不是“南京市/长江/大桥”,于是更好的是基于统计学原理的分词,也就是说看哪种出现的频率更高。
对于一个中

查看全文: http://www.udpwork.com/item/7003.html

+0  dstat:一款简单直观的os实时监控工具

Tag: 工具 | 监控 | dstat | python
NinGoo 发于 2010年02月05日 11:43 | 点击: 4263 | 展开摘要
Author:NinGoo posted on NinGoo.net
在oschina上闲逛,发现一款不错的os实时监控工具dstat,整合了vmstat, iostat, ifstat, netstat等常见os监控工具的优点,输出的结果简单直观,并且结果可以保存到csv文件,这样再写一个简单的perl脚本,就能将os的主要监控信息一次性全部抓取出来,保存到监控数据库中用于分析展示。试用了一下觉得非常不错,因此在这里分享一下这个用python写的工具。

$dstat
-

查看全文: http://www.udpwork.com/item/1690.html

-1  用Python做科学计算

Tag: Science | Python | Ruby
何 李石 发于 2011年01月20日 22:41 | 点击: 4252 | 展开摘要
计算机方面的科研,很大一部分是用模拟或者仿真完成的。所谓的理论研究大概就是这样吧,可惜我之前不知道。我还以为很高深,因此当时就义不容辞的选择了做工程。为了混毕业,我也得发文章啊。

做仿真或者模拟,有人用别人写好的比较成熟的仿真器。网络方面有NS-2(现在应该NS-3了吧?),模拟TinyOS平台上程序的运行的话可以用TOSSIM或者Avrora。不过,对于小型的模拟还要了解这些在时间成本上就比较麻烦了。因此,对于WSN(WIreless Sensor Networks)我们

查看全文: http://www.udpwork.com/item/4173.html

+0  使用MoinMoin作为个人KMS

Tag: Linuxer | Python编程 | 工欲善其事必先利其器 | image2attach | KMS | Linux | MoinMoin | nginx | Python | uwsgi | wiz
alswl 发于 2011年12月26日 20:54 | 点击: 4227 | 展开摘要
去年9月份时候,我写过一篇《我所使用的知识管理系统》 来介绍我使用的KMS系统。当时经过我层层筛选之后,我选用了Wiz作为我的KMS。

一年多过去了,Wiz在Windows下面工作的非常不错,Wiz团队里陆续推出了iOS / Android / Web版本。我的Wiz收藏的内容也增加到近1000篇。

此时我遇到了KMS再选型的问题,原因很简单:我全线转换到Linux平台, Wiz不符合我的要求了。

我重新整理一下我要求KMS的特性:

跨平台:Linux / Web /

查看全文: http://www.udpwork.com/item/6587.html

+0  给MoinMoin写插件

Tag: Python编程 | image2attach | MoinMoin
alswl 发于 2012年02月10日 17:27 | 点击: 4087 | 展开摘要
1. 使用 MoinMoin

前些日子,我写了一篇使用MoinMoin作为个人KMS 大赞MoinMoin的各种好处。MoinMoin的其中一个好处是基于GPL的开源, 我们可以方便的给MoinMoin撰写自己的插件(当然也可以去官方的wiki上获取大量现成插件)。

MoinMoin开发者wiki地址

MoinMoin开发API文档(这个官方wiki居然很少提及)

MoinMoin的多国语翻译组wiki地址

我在使用MoinMoin过程中,有一个急迫需要的功能:

查看全文: http://www.udpwork.com/item/6824.html

+0  如何抓取汽车之家的车型库

Tag: Technical | Python
老王 发于 2017年02月01日 19:44 | 点击: 4009 | 展开摘要
实际上,关于「如何抓取汽车之家的车型库」,我已经在「使用 Mitmproxy 分析接口」一文中给出了方法,不过那篇文章里讲的是利用 API 接口来抓取数据,一般来说,因为接口不会频繁改动,相对 WEB 页面而言更稳定,所以通常这是数据抓取的最佳选择,不过利用 API 接口来抓取数据有一些缺点,比如有的数据没有 API 接口,亦可能虽然有 API 接口,但是数据使用了加密格式,此时只能通过 WEB 页面来抓取数据。

既然要通过 WEB 页面来抓取数据,那么就不得不提到 Scr

查看全文: http://www.udpwork.com/item/16084.html

-3  计算组合数:Java和Python

Tag: Programming | 技术文章 | Java | Python | 组合数
何 李石 发于 2011年03月12日 22:34 | 点击: 3960 | 展开摘要
排列和组合,高中就学过了,计算公式不复杂。但是,要将其计算出来是有点复杂的,特别是大数,即使是C语言也拿它没办法(如果没有第三方库的话)。

Java有BigInteger,Python原生支持大数,因此能够很方便的解决这个问题。贴两段代码,比较一下他们的代码量和难易程度:

Java:

Python:

关于作者

ikbear, PE.VC, Intern

为用户提供以下咨询服务: 1. 海外VPS/共享主机购买。 2. LNMP(Linux, Nginx, Mysq

查看全文: http://www.udpwork.com/item/4506.html

+1  基于coroutine的gevent

Tag: Python
Stephen 发于 2011年10月22日 21:13 | 点击: 3938 | 展开摘要
coroutine也是一种并发模型,但不同于thread和callback,它的所有task都是可以在一个线程里面执行,然后可以通过在一个task里面主动放弃执行来切换到另一个task执行,它的调度是程序级的,不像thread是系统级的调度。gevent就是一个基于coroutine的python网络开发框架,不像twisted那样集成了很多库和协议,gevent非常精简,当然文档也很少,在性能上的话,看了PyCon上的视频,对比了twisted和其他的几个库,在内存的性能上

查看全文: http://www.udpwork.com/item/6100.html
|<<<1234567>>>| 一共16页, 188条记录