最新 | 最热门 | 最高评价

+0  yum库批量下载功能

Tag: python | linux | yum
longhao 发于 2010年10月13日 19:35 | 点击: 2582 | 展开摘要
    觉得国外的yum库下载太慢,就搞一个mirror玩玩。需求较为简单:给定一个url,把url显示出来的rpm为后缀的文件全部下载到本地。写脚本解决问题当日最简单了,所以我就出了个菜鸟的思路:

下载页面文件到本地

分析文件中<a></a>的href中带有rpm后缀的字符串A

拼上url和A,然后wget

    实现到代码如下:

#!/usr/bin/env python

查看全文: http://www.udpwork.com/item/3033.html

+0  自动摘要算法

Tag: algorithm | program | ir | nlp | python
isnowfy 发于 2013年11月30日 18:05 | 点击: 2578 | 展开摘要
当时yahoo以3000万美元的价格收购了summly的消息传出来之后,貌似大家都比变的对自动摘要产生了极大的兴趣,关于自导摘要wiki这里有很详细的介绍,一般自动摘要比较常用的一个是摘取文章中的关键词,另一个则是摘取文章中的关键的句子,在这里我主要是介绍用textrank算法来搞句子的摘取。

相对于textrank,摘取关键句子还有一些比较简单的算法,比如这篇,我们可以把句子分别和整篇文章做比较,相似性最大的就是关键的句子。而textrank其实就是pagerank算法扩

查看全文: http://www.udpwork.com/item/11267.html

-11  Cpy是如何打败Python的

Tag: Python | Cpy
ideawu 发于 2012年07月24日 12:17 | 点击: 2551 | 展开摘要
Python 语言的初学者, 特别是”惊奇者”(也就是那种第一眼就被毫无意义的某些特性吸引, 之后持续说服自己的人)认为 Python 不需要 C 语言的 for 语句, 因为他们能用优雅的 Python for 来代替类 C 的 for.

Cpy 的循环方式:

for(i=s; i<num; i+=step){
}

Python 的循环方式:

for i in range(num)[s:e:step]:

最近, 我写了一个循环 100

查看全文: http://www.udpwork.com/item/7761.html

-2  使用nose做测试

Tag: Python编程 | nose | Pylons
alswl 发于 2011年09月22日 11:08 | 点击: 2515 | 展开摘要
不做单元测试的程序员不是好程序员。最近我在Pylons下面做开发, 使用 nose 做单元测试,颇有心得, 在这里分享一下。

1. Pylons中依赖包

先简单介绍一下Pylons, Pylons与其说是一个框架,不如说是一堆框架的组合, Pylons在其中做到一个胶水的作用。Pylons依赖的包如下。

breaker,缓存和Session

FormEncode,用户输入检查

Mako,模板渲染

nose,自动化测试

Paste,服务器

Routes, 路由

查看全文: http://www.udpwork.com/item/6240.html

+0  Memcached Java && Python Client API 共享

Tag: Java | Memcached | Python
smallfish 发于 2009年12月15日 09:24 | 点击: 2497 | 展开摘要
用Python写了一个计划任务,定时更新Memcached中一个key值,写的很happy,几分钟搞定。

然后在Java Servlet测试,代码写的也很happy,编译 – 刷新,一气呵成。

然后发现值一直是null,再tail日志看看,异常不断:

com.danga.MemCached.MemCachedClient Mon Jul 20 09:37:04 CST 2009 - ++++ exception thrown while trying to

查看全文: http://www.udpwork.com/item/1122.html

+0  函数式编程

Tag: Python | 程序设计 | 编程语言 | functional | Javascript | 函数式
陈皓 发于 2013年12月27日 08:11 | 点击: 2494 | 展开摘要
当我们说起函数式编程来说,我们会看到如下函数式编程的长相:

函数式编程的三大特性:

immutable data 不可变数据:像Clojure一样,默认上变量是不可变的,如果你要改变变量,你需要把变量copy出去修改。这样一来,可以让你的程序少很多Bug。因为,程序中的状态不好维护,在并发的时候更不好维护。(你可以试想一下如果你的程序有个复杂的状态,当以后别人改你代码的时候,是很容易出bug的,在并行中这样的问题就更多了)

first class functions:这

查看全文: http://www.udpwork.com/item/11411.html

-2  Pysvn 程序员指南

Tag: Python | Pysvn
smallfish 发于 2009年11月20日 17:31 | 点击: 2491 | 展开摘要
这是一篇关于pysvn模块的指南.

完整和详细的API请参考 pysvn Programmer’s Reference.

pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个.

该API不能创建新的仓库; 只能作用在现有仓库上. 如果你需要创建一个仓库, 请使用Subversion的svnadmin命令.

使用这个API, 你可以check out一份工作拷贝, 添加, 编辑,

查看全文: http://www.udpwork.com/item/1130.html

+0  baidu ting下载音乐脚本

Tag: Python编程 | tingdownload
alswl 发于 2012年01月03日 12:44 | 点击: 2461 | 展开摘要
度娘终于干了一件好事,Baidu Ting上线了, 正版音乐免费下载,类似于谷歌音乐。 关于音乐版权和免费的问题, 有很多问题需要取讨论, 比如说这种商业模式是否对传统唱片业产生冲击又或是有积极影响? 作为普通消费者,暂时不用考虑这些问题,先享受这些服务好了。

Baidu Ting的音乐质量是128KBps,音质算好,里面的idv3信息也勉强可以,有:

歌名

歌手

部分专辑名(偶尔也出现“201-8月新歌快递”这种比较山寨的字)

部分唱片封面

查看全文: http://www.udpwork.com/item/6640.html

+0  Python配置文件部署自动更新脚本教程

Tag: python | linux | 脚本 | 自动部署
longhao 发于 2010年03月31日 19:20 | 点击: 2453 | 展开摘要
    系统中存在配置文件几乎是没有悬念的事情,每次系统升级,手动修改配置文件是一件让人非常头痛的事情,既然计算机能够自动搞定这些事情,为什么人工还要干预呢?所以写个脚本来批量处理这个事情。

    需求分析

新添加的配置能够自动添加到生成环境中去,删除的配置能够自动从生成环境删除;

对新添加的配置能够展示给用户,当用户输入某行行号后,能够修改配置到生产环境。

    用shel

查看全文: http://www.udpwork.com/item/1101.html

-1  简易的python web服务器用途

Tag: Linux | 工具介绍 | python | SimpleHTTPServer
Yu Feng 发于 2011年07月22日 10:50 | 点击: 2434 | 展开摘要
原创文章,转载请注明: 转载自Erlang非业余研究

本文链接地址: 简易的python web服务器用途

我们在工作中经常会需要看下报表,如tsung的统计报表或者lcov的覆盖情况,这些报表通常为了方便都会作成html格式的。我们可以把这些html网页打包拉回去用浏览器慢慢看,但是每次都要打包,拉数据非常麻烦。我们可以架设个web服务器来做这个事情。

apache或者nginx都太庞大,设置起来太麻烦。简易Python服务器来帮忙了。

只要在你的html的目录下运

查看全文: http://www.udpwork.com/item/5515.html

+0  拉手网ipad抽奖活动算法

Tag: Python | 语言 | ipad | 抽奖 | 拉手网 | 概率
雨水无香 发于 2010年06月11日 23:46 | 点击: 2409 | 展开摘要
话说拉手网很有钱啊,10天送出55台ipad,具体抽奖规则请见http://img.lashou.com/tuangou/china/a_ipad.html,这个算法可以计算自己中奖机会有多少的。具体如下:

#!/usr/bin/env python
#-*-coding: UTF-8-*-
 
import copy
 
pool = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,

查看全文: http://www.udpwork.com/item/1742.html

+0  Python ConfigParser 与 ConfigObj INI 配置读写顺序

Tag: Python
smallfish 发于 2010年04月19日 20:27 | 点击: 2406 | 展开摘要
默认的ConfigParser对于选项是按照字母顺序排列的。如下代码:

>>> from ConfigParser import ConfigParser
>>> cf = ConfigParser()
>>> cf.add_section('d')
>>> cf.set('d', 'name', 'smallfish')
>>> cf.add_section('a')
>>

查看全文: http://www.udpwork.com/item/1061.html
|<<<3456789>>>| 一共16页, 188条记录