最新 | 最热门 | 最高评价

+0  The cost of knowledge: JMLR 的 8g

Tag: Life | Fun | Thought
pluskid 发于 2012年02月20日 09:21 | 点击: 1997 | 展开摘要
这一阵子数学家们发起了一场抵制 Elsevier 的运动,建立了一个网站叫做 the cost of knowledge。简而言之,Elsevier 是一个出版商,它旗下有很多期刊,但是在众多恶劣的出版商之中,Elsevier 似乎尤其恶劣,价格高昂,并且搞捆绑销售捆绑一些非常低质量的期刊,而且还被爆参与一些非正当的学术行为,另外还和前一阵子引起很大风波的让 Wikipedia 下线一天的 SOPA 有关。期刊本来的主要作用是传播学术成果,学术论文发表是没有稿费的,并且论文评

查看全文: http://www.udpwork.com/item/6865.html

+0  时间估计的难题

Tag: Life | Drawing | Thought
pluskid 发于 2012年01月23日 18:37 | 点击: 1824 | 展开摘要
喜欢看书的同学,放假回家的时候都会带几本书呢?然后开学回学校的时候发现真正打开看了的又有多少本呢?反正我从前回家带的书总是看不完的,不止回家,甚至是去自习室或者图书馆,带的书也总是会超过我的处理能力——而且我还没次都是仔细计划过的。当然造成这样的原因有多方面的,比如多带几本书的话,在一本书看不下去的时候可以换一本;又比如也许是因为执行力不够没有能把计划实施(比如中途开小差去了什么的)。但是似乎有一个重要的原因在生活中其他地方也非常常见——就是我们对于时间或精力的估计上,似乎经

查看全文: http://www.udpwork.com/item/6739.html

+0  机器学习物语(4):PAC Learnability

Tag: Machine Learning | Learning Theory | Supervised Learning
pluskid 发于 2011年12月31日 22:26 | 点击: 2477 | 展开摘要
这次我们要介绍的话题是 PAC Learnability ,直译过来就是 PAC 可学习性。可学习性听起来和计算理论里的可计算性是很类似的,当然其实也确实是类似的,而且这里也包含一些计算理论里的内容。对比来看,这里研究的主要是三个问题:

计算理论研究什么时候一个问题是可被计算的,而 PAC 学习理论,或者说计算学习理论 (Computational Learning Theory) 主要研究的是什么时候一个问题是可被学习的。可计算性在计算理论中已经有定义,而可学习性正是我们

查看全文: http://www.udpwork.com/item/6629.html

+0  机器学习物语(3):回归问题

Tag: Machine Learning | Learning Theory | Supervised Learning
pluskid 发于 2011年12月16日 18:41 | 点击: 1786 | 展开摘要
上一次讲到 Empirical Risk Minimization (ERM) 算法在有限个函数的空间里学习是可行的,然而这样的结果似乎用处不大,因为许多机器学习中用到的函数空间都是无限的。我们还提到,为了解决这个问题,需要一个“将无限化为有限”的工具。如果是对统计学习理论有一定了解的同学,可能会觉得我应该马上要讲 VC Dimension 了:如果 $\mathcal{F}$ 的 VC 维是有限的,那么即使它本身的元素个数是无限的,我们仍然可以得到合理的 bound 。任何

查看全文: http://www.udpwork.com/item/6538.html

+0  机器学习物语(2):大数定理军团

Tag: Machine Learning | Learning Theory | Probability | Supervised Learning
pluskid 发于 2011年12月11日 22:29 | 点击: 2808 | 展开摘要
机器学习理论帝国崛起,大数定理军团功不可没,称之为军团毫不夸张,在前军先锋强大数定理和副将弱大数定理后面,是铠甲上刻着“Concentration of Measure”的古老印记的战士们,不妨暂且忽略他们之间乱七八糟的“血缘”关系,而罗列一些名字:Chebyshev 不等式、 Markov 不等式、 Bernstein 不等式、 Hoeffding 不等式、 McDiarmid 不等式、 Chernoff 不等式……虽然他们之间互相关系微妙,但是在战斗中却是各有千秋,特别是

查看全文: http://www.udpwork.com/item/6507.html

+0  机器学习物语(1):世界观设定

Tag: Machine Learning | Learning Theory | Supervised Learning
pluskid 发于 2011年12月09日 22:25 | 点击: 3056 | 展开摘要
我想如今机器学习 (Machine Learning) 的重要性(不论是在学术界还是在工业界)已经不用再多强调了,比如说 2010 年的图灵奖得主 Leslie Valiant 就是学习理论 (Learning Theory) 的一位先驱大牛,正是他提出了“可能近似正确” (Probably Approximately Correct, PAC) 模型——每次念一念 PAC 的中文翻译就觉得好玩,不过 PAC 模型及其变种确实是如今学习理论里最为广泛使用的框架之一,而且正是

查看全文: http://www.udpwork.com/item/6500.html

+0  概率与测度 (4):闲扯大数定理与学习理论

Tag: Mathematics | Learning Theory | Math | Probability
pluskid 发于 2011年10月24日 22:33 | 点击: 2236 | 展开摘要
本文属于概率与测度系列。

在本系列的上一篇文章中,我偷偷留了一个问题:为什么具体试验所得到的频率是趋向于该事件的概率的。这个问题似乎是显而易见的,但是仔细想想似乎也并不显然,并不能一下子得出这个结论来。事实上,历史上有以这个性质作为基础来构建概率论的理论体系的尝试,不过在现在的概率论公理化体系下面,这个可以作为一个结论推导出来,具体来说,它是大数定理的一个特殊情况。不过如本文标题所说,这次只是闲扯,因为我们目前的进度还没有到大数定理那里,所以就不仔细介绍众多形式的大数定理了

查看全文: http://www.udpwork.com/item/6111.html

+0  概率与测度 (3):概率模型

Tag: Mathematics | Math | Probability
pluskid 发于 2011年09月14日 23:10 | 点击: 2356 | 展开摘要
本文属于概率与测度系列。

系列的前面两篇大致陈述了一下测度论方面的基础,由于这个学期有去旁听《概率论》这门课,所以主要还是按照课程进度来吧,不定期地把课程里一些有意思的内容抽取出来整理在这里。这次就说概率模型。

先从一个例子开始,比如一个盒子里放了 8 个黑球和 2 个白球,从盒子里随机拿一个球,问它是白球的概率是多少,大家都会不假思索地说,1/5 。的确,这似乎是很显然的,不过,实际上我们是用了一个模型来进行概率分析,但是由于这个情况实在太简单了,我们根本就没有注意到模

查看全文: http://www.udpwork.com/item/5901.html

+0  同义反复

Tag: Life | Bug | Fun | Math
pluskid 发于 2011年09月11日 15:08 | 点击: 2146 | 展开摘要
忘记了之前在哪里看到说数学其实就是同义反复而已。从某种程度上来说,这样的言论也不能说完全是乱说,比如一系列的等价的推导,其实可以说就是在说同一件事情。但是“同义反复”多少有些贬义的意思,具体来说应该是指“不必要的反复”吧,但是数学应该不是这样吧。实际上,来考虑一下什么样的“反复”是“不必要的反复”就可以了,我觉得,那些只要是“不太明显” (non-obvious) 的关系,把这样的关系建立起来,应该也都是有其意义的,而尤其重要的是其中那些“深刻”的关联。

不过“深刻”这样的

查看全文: http://www.udpwork.com/item/5781.html

+0  久别重逢的 std::bad_alloc

Tag: Bugs | Bug | C++ | STL
pluskid 发于 2011年08月23日 20:41 | 点击: 6414 | 展开摘要
久别重逢是说,自从在教科书上见过它一面之后,这才是第二次碰面。也就是说,在这些年的编程经历中,从来没有遇到过吧——至少在我印象中是这样的。以至于我都开始怀疑在“平常的”程序中,它是否真正存在了。内存分配,C 里的 malloc (或者配套的函数) ,如果分配失败了会返回地址 0 ,所以,“作为良好的编程习惯,每次申请内存之后,应该检查一下返回值是不是 NULL ”,这样的“良好习惯”也许刚开始写几个程序的时候还能坚持,到后来就完全不管了——因为从来没有遇到过 malloc 返

查看全文: http://www.udpwork.com/item/5683.html

+1  拓扑空间的紧性

Tag: Mathematics | Topology
pluskid 发于 2011年07月26日 19:05 | 点击: 1926 | 展开摘要
Klein Bottle

参加暑期讨论班其中有一场是我讲,第一次这样子讲数学的东西,有点紧张,于是先在这里整理一下。内容大致是拓扑空间的紧性。

关于空间的紧性,我们在之前的分析中已经见过了:例如在实数轴上的有界闭区间就是典型的紧集,紧集具有很多优良的性质,比如我们知道在有界闭区间上的连续函数一定是一致连续的,并且能取到最大值和最小值。所以,在将空间的概念推广到一般的拓扑空间之后,我们也希望将紧性这一优良性质也带到拓扑空间中来。为此,我们需要找到什么是紧集最本质的东西。在实

查看全文: http://www.udpwork.com/item/5531.html

+0  MSTC 月刊第三期(十周年特辑)

Tag: Life | Fun | MSTC
pluskid 发于 2011年07月13日 23:26 | 点击: 1897 | 展开摘要
MSTC 月刊第三期,距离第一期创刊号发布已经快要有两年了,所以说叫“月”刊当然不太合适,当然现在就不去纠结这些细节问题了。这次是第三期,也是特别的一期,因为今年是俱乐部成立十周年,所以是十周年特辑。比较遗憾的是没有能在十周年 party 之前弄完,不过现在既然终于要正式出炉了,那么这些话也不多说了吧,制作过程当然是很辛苦和漫长,当然最需要感谢的是各位供稿人,没有你们提供的内容,月刊是绝对做不出来的啦。

先提供下载吧,顺便附上前两期下载以供怀旧之用(校内下载是 FTP 地址

查看全文: http://www.udpwork.com/item/5466.html
|<<<123456>>>| 一共6页, 67条记录