0
微博Karma和其算法的一些简单介绍
太久不做coding需要放松一下。于是就做了个有趣的东西:微博Karma (如果进入的是WebStore首页,请在左上方搜索“weibo karma”)。其实一直就想做一个类似Page Rank的东西来鉴别一个微博博主的真实“能量”。经常看到有些微博博主有50-100万左右的粉丝,发出来的微博却几乎无人问津(零转发、零评论),于是就动手做了这个插件。
首先,明确一点,这个玩意只是一个玩具,需要不断改进 。优点和缺点都是很明显的。人人都能方便的用,就必须用前端插件的形式来实现,但使用前端插件的话,就别指望JavaScript能获取和判断太多信息。其实,仅作为一个有趣的玩具来看,也能发现一些有趣的现象。相反,若是想获得专业和客观的“微博粉丝互动频度”、“微博僵尸粉丝数量”数据,请不要盲目参考。举个简单例子,”@方舟子”(只是我做数据分析的客观结果,舟子老师的粉丝不要怪我)的微博后面很多人是在骂他,而这一部分数据JavaScript是无法辨别的,因此都计算到”@方舟子”这个微博的Karma里了。
同样,由于采用了一个简单的算法,因此突然爆红的微博也会导致Karma过高。比如某人说“梁博赢了我就切jj”,转发了30000多条,而他的粉丝只有几百人。这种情况在最新版中已经修复了:我去掉了最大的评论和转发数字来避免出现“Karma暴发户”。这样当然会导致所有人的Karma下降,但是不会出现一个普通博友超过韩寒的不正常现象了。
目前最新的计算方法是:
- 取得用户第一页所有微博的评论数和转发数
- 按照原创微博和二次转发(即转发别人的)分组
- 转发组中的评论数和转发数超过15、50条的,分别予以3倍或5倍的加权
- 将评论数和转发数求平均值,然后加上这个博主的粉丝数做一个运算得到Karma最终值,公式为:
Karma = (转发*10 + 评论*5) / sqrt(max(粉丝数, 2000))
至于为什么选择10、5还有sqrt这些参数,纯粹是个人灵感。没有任何逻辑,毕竟不像计量经济学那样可以找到大量数据来做参考。如果能提供更好的算法,欢迎留言!
- 为什么我的偶像Karma只有0?
因为你用的Karma插件版本太老啦,去下个最新的吧:
https://chrome.google.com/webstore/detail/weibo-karma/bgdpegifffbkpfinfkikcioljnjajoih/ - 为什么我的偶像Karma太低了?
因为你的偶像有太多粉丝不说话不互动了。我只能帮你帮到这了。
- 为什么我讨厌的人Karma还那么高?
你应该这么思考:因为去他微博骂他的人太多了。恭喜你! - 是不是只支持Google Chrome?
是的,因为Firefox和IE插件太难写。另外,因为我是Chrome的粉丝。对了,360极速浏览器也是可以支持的。
- 是不是只支持新版微博?
是的,因为老微博的DOM结构太复杂了,分析起来有点头大。 - 如何升级到新版微博呢?
猛击:新版微博升级入口。(这本来应该是新浪的工作啊) - 你是来骗粉的、你低估了我的偶像,我很讨厌这个,如何卸载?
chrome://chrome/extensions/ 只能帮你帮到这了:) - 名字Karma怎么来的?
的确是借鉴了Plurk的“Karma”概念。我在Plurk刚出的时候曾经很痴迷这个概念,当时在Plurk上认识了很多台湾网友,可惜,后来Plurk上不去了,原因你们都懂的。 - 插件是否安全?
安装好插件之后,可以查看插件源代码,一切背后的奥秘和逻辑都在那里。另外注意看看安装地址是否与本Blog提供的地址一致。
16
条评论,立即发言
|
本文关键词:微博,微博Karma,新浪微博
©aw's blog 姿态永恒1984-2012 |链接地址- http://www.awflasher.com/blog/archives/1849
@awguo (新浪微博)|@awguo (腾讯微博)|Twitter: @awguo
