最新 | 最热门 | 最高评价

+0  Python里使用zbar识别二维码

Tag: 我的代码 | 我的分享 | python | qrcode
Xiaoxia 发于 2015年11月05日 04:55 | 点击: 4893 | 展开摘要
今天研究数据库里的微信群二维码图片,很多人上传的图片并不是正确的群二维码,而是个人微信、公众号或者是一个手机充值流量的入口。为了把这些不合格的二维码挑选出来,只能一个个识别了。找了网上一些接口的,测试了一下不但限制频率为一秒2个,还很多识别不出来,看报错用的是zxing这个库,最后只能想其他方法。

在CentOS7上安装了zbar,没有找到el7的rpm,只好自己编译。研究出编译时使用一些参数可以避免安装一些不必要的包。为了virtualenv里的python能用,编译时候

查看全文: http://www.udpwork.com/item/14742.html

+0  CentOS7上MySQL返回Too many connections

Tag: Linux | 我的分享 | django | mysql
Xiaoxia 发于 2015年11月03日 04:58 | 点击: 2147 | 展开摘要
被这个问题困扰了一天,今天做微信开发,流量一大,django占用CPU很大,这个比较好解决,加进程加硬件即可。然而数据库连接开始报Too many connections,查了网上一些文章,直接改/etc/my.cnf加入max-connections=3000,无果。又查,在mysql里输入set GLOBAL max-connections=3000,数值是变了,然并卵。

刚才找到一个文章,才想起原来是CentOS7的systemd限制了服务进程的NOFILE,导致每次

查看全文: http://www.udpwork.com/item/14733.html

+0  手撕包菜磁力搜索引擎的开源说明

Tag: Internet | 我的代码 | 我的分享
Xiaoxia 发于 2015年05月15日 00:44 | 点击: 7092 | 展开摘要
已经一年半载没有写博客了,搞得上来不知道写些什么。博客上的内容还时不时有人评论,大部分我还是会一一回复的。有些人会关注我的博客用什么主机,我的博客现在是用Linode的主机,因为现在很便宜,而且配置不差。另外比较多的是问手撕包菜的源代码能否提供,能否出售。今天我写这个文章就是把手撕包菜的网站开源了,包括网站页面,DHT爬虫和搜索引擎相关部分。

2年前的那篇跟磁力搜索相关的文章在这里:

写了个磁力搜索的网页 - 收录最近热门分享的资源

作为最早在国内研究和实践DHT爬虫的

查看全文: http://www.udpwork.com/item/14210.html

+0  Windows上最小的Python运行环境,700KB

Tag: Linux | 我的分享 | mingw | python | sogou proxy
Xiaoxia 发于 2013年09月25日 15:24 | 点击: 2748 | 展开摘要
之前还没有编译过Windows上的Python,打包发布一般使用py2exe和pyinstaller,生成的文件至少有3MB。而且Python只有VS的Project文件,也就是说,如果自己要用GCC来编译,就需要自己编写或者修改Makefile了。我是在Debian上安装了Mingw32之后,修改默认的Makefile来让它支持编译成Windows版本,而且源代码有大幅度改动,所以这里就不把过程写出来了,我也忘了做了多少修改。编译方法可以参考我的上一篇博文。建议有VS的同学

查看全文: http://www.udpwork.com/item/10746.html

+7  写了个磁力搜索的网页 - 收录最近热门分享的资源

Tag: Internet | 我的分享
Xiaoxia 发于 2013年05月11日 05:16 | 点击: 3515 | 展开摘要
好吧,又很疯狂地做了一个东西:http://bt.shousibaocai.com/

平常我们高端用户都会用到BT工具来分享一些好玩的资源,例如ubuntu 13.04的ISO安装盘,一些好听的音乐等。这个时候我们会进入一个叫做P2P的网络,大家都在这个网络里互相传递数据,这种分布式的数据传输解决了HTTP、FTP等单一服务器的带宽压力。以往的BT工具(包括现在也有)在加入这个P2P网络的时候都需要借助一个叫Tracker的中心服务器,这个服务器是用来登记有哪些用户在请求哪

查看全文: http://www.udpwork.com/item/9818.html

+0  HTTPS与SNI扩展,一个IP多个证书

Tag: Internet | 我的分享
Xiaoxia 发于 2012年12月18日 14:23 | 点击: 9182 | 展开摘要
在搭建支持HTTPS的前端代理服务器时候,通常会遇到让人头痛的证书问题。根据HTTPS的工作原理,浏览器在访问一个HTTPS站点时,先与服务器建立SSL连接,建立连接的第一步就是请求服务器的证书。而服务器在发送证书的时候,是不知道浏览器访问的是哪个域名的,所以不能根据不同域名发送不同的证书。用过GoAgent的人都知道需要给浏览器导入证书才能使用HTTPS正常登录Twitter等网站。

SNI(Server Name Indication)是为了解决一个服务器使用多个域名和

查看全文: http://www.udpwork.com/item/8875.html

+10  Python与简单网络爬虫的编写

Tag: Internet | 我的代码 | 我的分享
Xiaoxia 发于 2012年11月02日 05:43 | 点击: 5365 | 展开摘要
电影来了这个电影资源搜索网站火起来了,曾有一段时间因为太多人访问我的博客,访问量高于平常十多倍,Apache、PHP和MySQL这三个庞大的东西搭建的庞大的wordpress博客就直接挂掉了,直接挂掉了,挂掉了,了。。。

从上一篇博文的评论中看出似乎很多同学都比较关注爬虫的源代码。我也给大家回复,当时写的文件比较乱,爬虫文件也很多,没时间整理,所以就直接发技术博文来说一下我个人对爬虫的研究收获。所以嘛,也就注定了我这篇文章只能跟爬虫相关了。

我第一次接触爬虫这东西是在今年

查看全文: http://www.udpwork.com/item/8551.html

+45  写了个电影搜索引擎 – 十万电影资源分享哦

Tag: 我的分享
Xiaoxia 发于 2012年10月12日 02:44 | 点击: 7352 | 展开摘要
好吧,做了一个很疯狂的东西! http://movie.readself.com/

平常我想要看电影的时候,总是需要在Google或者Baidu里搜索很长时间才能找到一个下载链接。

比如说,我想看《黑天鹅》,我就去Google里搜索:

ext:mkv Black Swan

然后就搜出种子或者下载链接了。那么这一个过程,是否可以简化呢?是否可以预先搜集好每个影片的下载链接,然后存到数据库里,方便我想看电影的时候直接调出来下载呢?所以就这样萌生了写个爬虫的想法!最初还是听

查看全文: http://www.udpwork.com/item/8231.html

+2  喜欢上Facebook和YouTube的同学,来看看如何用它穿墙

Tag: Internet | 我的分享
Xiaoxia 发于 2012年08月26日 00:00 | 点击: 3527 | 展开摘要
最近做这个东西,纯属练习一下Qt4写界面。

YouProxy可以帮助你获取YTB和Vimeo全球著名视频网站的真实IP地址来连接,免除你使用hosts文件的繁琐。毕竟不经过任何外部的中间代理服务器,所以一般情况下速度读会很给力的,能满足看视频的需求了。Vimeo上有很多很棒的微电影,有些印度人拍的片子也挺好的,虽然听他们说英文怪怪的样子~!

猛击这里,下载Windows可执行文件

(9月6日已经上传源代码)

注意,这次使用的不是icefox那个原理,也跟以前的fox有

查看全文: http://www.udpwork.com/item/8003.html

+0  我常用的Vim和Bash的配置

Tag: 我的分享
Xiaoxia 发于 2012年07月19日 22:37 | 点击: 3262 | 展开摘要
经常切换到新环境下工作,例如VPS变更了,电脑换了,OS换了等。无论是哪个发行版的Linux,还是哪个版本的OSX或BSD,只需要配置一下Bash和Vim这两个使用最频繁的工具就OK。听说“天然呆小萌兔”去了Google,难怪最近一直那么萌的了,她说她的部门只有一个人用Emacs,Vim还是目前主流。公司给她配了一个Macbook和一个Linux PC,这么爽我也不想在学校里呆了……

Vim配置

Vim作为最主要的编辑器,无论是代码、脚本、文本还是二进制文件,都会用到它。

查看全文: http://www.udpwork.com/item/7739.html

+1  在iOS上启动root特权的后台进程

Tag: Android | 我的分享
Xiaoxia 发于 2012年07月19日 21:50 | 点击: 2543 | 展开摘要
接触iOS开发还不到一个星期,看了O'Reilly出版的一本《Cocoa and Objective-C: Up and Running》作为入门书,描述的比较简单,很适合初学者入门。我看书基本上就是找重点看,找疑惑的地方着重理解,边理解也边开着XCode实践一下。所以,还是一天把它吸收了,第一次看至少能消化一半,回头看应该还能再理解透一点。我相信每个人一开始都会觉得objc的扩展语法很奇怪,不过习惯了之后,这种感觉就会消失了。一个拥有C语言的效率,又拥有动态的运行环境以及垃

查看全文: http://www.udpwork.com/item/7738.html

+1  Python与OpenCV人脸检测

Tag: 我的分享
Xiaoxia 发于 2012年06月14日 20:31 | 点击: 2918 | 展开摘要
因为这个学期学习的Pattern Recognition需要做一个Lab实验,而我所在的小组的题目是人脸识别。我想参与做的工作是人脸检测定位,然后提取特征。

为了减少工作量,尽量采用现成的技术和现有的库,例如OpenCV。最容易实现而且已经被广泛实践的就是人脸的定位了,使用过google plus或者facebook的人都知道,在浏览相片的时候,能够自动识别人脸并且提示圈人。目前发现新浪微博的相册还无此自动识别功能,只有手动寻找位置……

人脸检测效果如下:

在Pytho

查看全文: http://www.udpwork.com/item/7482.html
|<<<12>>>| 一共2页, 22条记录