最新 | 最热门 | 最高评价

+0  netoops启动时报 "XX is a slave device, aborting"

Tag: 操作系统 | kernel | netoops | netpoll | redhat
DongHao 发于 2012年06月07日 11:34 | 点击: 2323 | 展开摘要
为了监控上线的新内核,我们把google的netoops backport到了自己的内核,生产上如有kernel panic,会将panic的栈信息发送到日志服务器,方便调试和修复。

前天,洪川同学报告说以前线上的netoops都是把bond的slave网口作为发消息的dev,新上线2.6.32-220内核后,启动netoops失败,系统报:

”eth0 is a slave device, aborting."

找了一下从 2.6.32-131 到 2.6.32-22

查看全文: http://www.udpwork.com/item/7431.html

+0  Oops debug小经验

Tag: Programming | debug | kernel | oops
liuw 发于 2012年01月06日 23:37 | 点击: 2381 | 展开摘要
常在河边走哪能不湿脚,写程序没有遇到bug那是不可能的。内核菜鸟写代码,出个kernel oops那更是家常便饭。

从我目前遇到的各种oops来看,debug首先要检验能否稳定重现bug。

若不能稳定重现(触发条件不一,Oops信息不一),那么恭喜了,基本是出现竞态了。这种问题可大可小,当然最后的问题肯定是在自己的代码里面的(前提是其他模块都是稳定的)。这个时候当然是得先把code path都走一遍,检查是不是逻辑有问题;之后就是检查各种锁了。

若能稳定重现,那么相对好

查看全文: http://www.udpwork.com/item/6662.html
|<<<1>>>| 一共1页, 2条记录