最新 | 最热门 | 最高评价

+0  为什么我不在微信公众号上写文章

Tag: 杂项资源 | Blog | search | 传播 | 影响 | 微信
陈皓 发于 2016年07月11日 09:08 | 点击: 2314 | 展开摘要
很多朋友问我为什么不在微信公众号上写文章。我都没有直接回答,老实说,我也是扭扭捏捏的,才去开了个个人的微信的公众号,而且还只能搜索我博客这边的文章,我承认现在的阅读都在移动端,而且微信的公众号是国内移动端的文章流量及分享的入口,但是我还是更愿意使用blog这样的方式分享文章,最多也是在blog这边写好文章后,再去微信公众号那边贴一下。这个原因,不是因为我是一个老顽固,有习惯思维,而是,我不觉得微信公众号是一个好的信息传播和交流的平台。

我下面的言论仅仅代表我的个人观点,我不

查看全文: http://www.udpwork.com/item/15665.html

+0  基于Golang将MongoDB的数据同步到Elasticsearch

Tag: go | mongo | elasticsearch | 工具
鸟窝 发于 2015年12月11日 10:38 | 点击: 3516 | 展开摘要
Elasticsearch是一个分布式可扩展的实时搜索和分析引擎。它能帮助你搜索、分析和浏览数据。Elasticsearch 是一个基于Lucene实现的搜索服务器,用Java开发实现。它提供了RESTful web接口,并作为Apache许可条款下的开放源码发布,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

Elasticsearch关键概念

Cluster集群

有相同集群名称的节点Node的集合。集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产

查看全文: http://www.udpwork.com/item/14717.html

+0  uriDB网站的可扩展的技术栈

Tag: go | bootstrap | nginx | nsq | android | mongo | elasticsearch | 架构
鸟窝 发于 2015年11月10日 15:11 | 点击: 2599 | 展开摘要
背景

uriDB本身不生产干货,uriDB技术流网站只是大自然的搬运工。
自Hacker News诞生依赖,已经有多个中文技术头条的网站了,比如开发者头条和极客头条,为什么还要做这样一个雷同的头条网站呢?

有两个原因:
一是我想做一个分类头条的网站,按照技术领域对文章进行分类,这样只对前端感兴趣的同学可以只跟踪最新的前端文章。 同时uriDB只会筛选最新的技术干货,不会将问答,闲聊等技术层次低的文章收录。
二是这么多年来,我涉及的领域包括后台,大数据,前端和移动端的技术也

查看全文: http://www.udpwork.com/item/14757.html

+0  TF-IDF模型的概率解释

Tag: 杂项资源 | 程序设计 | Algorithm | search | TF-IDF
Todd 发于 2012年10月24日 09:05 | 点击: 4853 | 展开摘要
(感谢 @猫叔shiro(以前的todd) 投递此文)

信息检索概述

信息检索是当前应用十分广泛的一种技术,论文检索、搜索引擎都属于信息检索的范畴。通常,人们把信息检索问题抽象为:在文档集合D上,对于由关键词w[1] … w[k]组成的查询串q,返回一个按查询q和文档d匹配度relevance(q, d)排序的相关文档列表D’。

对于这一问题,先后出现了布尔模型、向量模型等各种经典的信息检索模型,它们从不同的角度提出了自己的一套解决方案。布尔模型

查看全文: http://www.udpwork.com/item/8446.html

+0  Understanding System and Architecture for Big Data

Tag: 业界评论 | 系统架构 | Big Data | hadoop | ibm | IBM Research | 分布式系统
Guancheng (G.C.) 发于 2012年05月09日 21:18 | 点击: 2268 | 展开摘要
简介:IBM Research最近在Big Data领域有很多工作,例如我们组在4月份在10台采用POWER7处理器的P730服务器上成功地用14分钟跑完了1TB数据的排序(7月份又在10台Power7R2上用8分44秒跑完了1TB排序),这项工作已经发表为一篇IBM Research Report,欢迎大家围观,并提出宝贵意见,谢谢。

The use of Big Data underpins critical activities in all sectors of o

查看全文: http://www.udpwork.com/item/7259.html

+1  Google Search Plus 把用户选择放到了内容质量的前面

Tag: search | google
Guangchen Chen 发于 2012年01月31日 22:30 | 点击: 2086 | 展开摘要
Google 发布了 Search, plus Your World,简称 Google Search+,带来最大的改变包括 3 点:

跟个人相关的搜索结果:你跟 Google+ 上好友发表过的链接和照片都会出现在搜索结果内,包括通过 Circle 限制为非公开的。

Google+ Profile:如果搜索人名,自动完成和搜索结果都会出现对应的 Google+ Profile。

相关 Google+ Profile:如果 Google+ 上有 Profile 跟你搜索的

查看全文: http://www.udpwork.com/item/6767.html

+0  关于相似图片搜索

Tag: program | algorithm | python | search
isnowfy 发于 2011年09月04日 15:50 | 点击: 2099 | 展开摘要
先说一下搜索的原理,其实就是不管你搜索什么,都是将你要搜的东西提取出特征值,然后按照特征值比较相似度,按照相似度排序呈献给用户就可以了,所以总共来说需要解决两个问题,一个是如何取得特征值,一个是如何计算相似度。

首先说特征值,特征值可以用图片的颜色比例来,比如python用PIL中的histogram函数就可以得到颜色分布

这幅图的颜色分布直方图是这样的

通过这样我们就得到了一个图像的特征值,这种方法是得到的颜色的分配,还有另一种方式得到的则是图像的内容特征。


查看全文: http://www.udpwork.com/item/6399.html

+0  Geek漫画:微软帝国停止进化?

Tag: Startups | 业界动态 | 业界评论 | 资源分享 | App Store | Facebook LIke | Google +1 | iPad | iPhone | Music Store | Search
何 李石 发于 2011年04月10日 11:00 | 点击: 3081 | 展开摘要
我们曾发布过一张图,显示微软帝国正四面临敌。
不仅如此,微软帝国似乎也在停止进化。请看下图。

同时,这张图也传达了一些当前各大公司追逐的热点或者核心业务:Google +1或Facebook Like,iPhone和iPad,Search或Social,Music Store或者App Store.
大公司都如此copy,小公司自然“不甘示弱”。只是,有些copy是大公司能做而小公司无法做到的。(创业,在哪都不简单。同志们加油!)
 
关于作者
何李石, PE.V

查看全文: http://www.udpwork.com/item/4768.html

+0  度娘,你真的不行

Tag: Search | 业界评论 | Google搜索 | 百度搜索 | 百度文库
何 李石 发于 2011年04月04日 10:04 | 点击: 2466 | 展开摘要
看到这样一句话,想查查其出处:
Everybody is a genius. But if you judge a fish by its ability to climb a tree, it will live its whole life believing that it is stupid.
用Google一搜索,得到这个链接。其中有个出处是百度百科的这篇文章,截图如下:
用百度一搜,发现在百度上也根本没有文库的份儿:

用文库一搜,更是没有结果:

百度,你流量还

查看全文: http://www.udpwork.com/item/4726.html

+0  fastsearch快速字符串查找算法

Tag: Linux | 源码分析 | BM | fastsearch | fsm | horspool | kmp | python | 匹配 | 字符串
Yu Feng 发于 2011年03月15日 23:05 | 点击: 3148 | 展开摘要
原创文章,转载请注明: 转载自Erlang非业余研究

本文链接地址: fastsearch快速字符串查找算法

最近在做一个项目需要涉及到快速的字符串匹配,每秒几十万次的那种。之前我用过linux内核的的textsearch库的KMP,BM,FSM的算法觉得还不错,这几个算法用于Linux网络模块的关键词过滤系统,支持非线性的字符查找,但是对性能还是不够印象深刻。于是我想起了python的fastsearch. Python这样的脚本语言字符查找用的非常的密集,所以这个算法

查看全文: http://www.udpwork.com/item/4521.html

+0  google宣布搜索方面算法的重大改进

Tag: Search | Google | 搜索算法
何 李石 发于 2011年02月25日 21:03 | 点击: 2155 | 展开摘要
文章来自ReadWriteWeb。大致内容如下:

改变非常细微,以至于大多数人并不能感觉到变化。改变了算法,会影响11.8%的查询结果,同时也想让网民明白算法的改进。惩罚低质量网站:对用户没多少价值的,或者拷贝无用信息的网站。提升高质量网站的排名:有原创内容和信息的网站,如研究、深度报告和有思考的分析等。

这一举措对于互联网的发展非常有意义。特别是在互联网行使其作为一种查找和传播信息的工具的功能时。

在大家满嘴挂着团购、SNS和电子商务等时尚词汇的时代,Google能够

查看全文: http://www.udpwork.com/item/4371.html

+0  searchblox–一个基于lucene的搜索产品

Tag: search | lucene | searchblox | 搜索
kafka0102 发于 2010年12月08日 23:04 | 点击: 2996 | 展开摘要
前两天在solr邮件组看到一封广告帖,一个叫searchblox的搜索产品可免费使用,好奇心驱使我简单了解并使用了一下。searchblox是基于lucene的搜索解决方案,现在的版本已经是6.1,看来也有些年头了。searchblox不是个开源产品,有免费的版本,也有收费的版本,看文档介绍,收费版本除了提供服务支持还多了复制功能。

功能上看,searchblox集成了爬虫和搜索功能,也提供Http API接口供索引和查询,可以在http://www.searchblox.

查看全文: http://www.udpwork.com/item/3706.html
|<<<12>>>| 一共2页, 21条记录