最新 | 最热门 | 最高评价

+0  [转]Xtrabackup全量备份/增量备份脚本

Tag: 运维
鸟窝 发于 2018年01月09日 17:36 | 点击: 629 | 展开摘要
本文收集了几篇关于使用 Xtrabackup/innobackupex进行mysql数据库全量和增量备份的脚本,学习之用。搜集的几篇都是转载,非本文原创。

Xtrabackup全量备份/增量备份脚本

这篇转载的文章源于 http://powermichael.blog.51cto.com/12450987/1954307,但目前这篇原始文章已经无法访问了。

全量备份脚本

全量备份脚本

1
2
3
4
5
6
7
8
9
10
11
12
13

#!/bin/bas

查看全文: http://www.udpwork.com/item/16603.html

+0  [转]系统之锹sysdig:Linux服务器监控和排障利器

Tag: 运维
鸟窝 发于 2016年07月09日 16:20 | 点击: 646 | 展开摘要
中文编译地址:https://linux.cn/article-4341-1.html by GOLinux
英文原文地址:http://xmodulo.com/monitor-troubleshoot-linux-server-sysdig.html 作者: Gabriel Cánepa

当你需要追踪某个进程产生和接收的系统调用时,首先浮现在你脑海中的是什么?你可能会想到strace,那么你是对的。你会使用什么样的命令行工具来监控原始网络通信呢?如果你想到了tcpdum

查看全文: http://www.udpwork.com/item/15659.html

+0  zabbix容器化部署实践

Tag: Docker | 公有云 | 监控 | 运维 | zabbix
xianchaobo 发于 2016年03月06日 11:18 | 点击: 1439 | 展开摘要
声明:

本博客欢迎转发,但请保留原作者信息!

博客地址:http://t.51gocloud.com

新浪微博:@线超博

内容系本人学习、研究和总结,如有雷同,实属荣幸!

zabbix是一个开源分布式监控解决方案,数据采集监控通过agent、ipmi、snmp等方式,最终采集结果通过WEB页面呈现。本文主要介绍通过容器方式安装部署zabbix(3.0版本)。

环境:两台ubuntu14.04,一台用于zabbix server;一台用于安装zabbix agent

查看全文: http://www.udpwork.com/item/15303.html

+0  从未降级的搜索技术-Hippo在线服务调度系统

Tag: 分布式技术 | 自动化运维 | 调度系统
路仁 发于 2014年11月29日 18:10 | 点击: 1987 | 展开摘要
          很久很久以前,有一个PE叫川小生,有一个开发叫子小嘉。双11前,他们按照业务的要求给天猫准备了14倍余量,给主 搜准备了1倍余量。结果11号上午流量涨势喜人啊,嗖嗖往上涨。川小生和子小嘉说不对啊,怎么主搜涨这么厉害天猫只涨4倍呢,川小生掐指一 算,干,到 晚上主搜就挂了啊。俩人怂了,把天猫机器迁一点给主搜吧。于是改clustermap下机器,发binary,发依赖数据,发全量,追增量,起进程,改 clustermap加机器,一通折腾一个半小时过去,总算有惊

查看全文: http://www.udpwork.com/item/13574.html

+0  OpenTSDB监控系统的研究和介绍

Tag: 其他 | hbase | 一淘 | 监控 | 运维
韩堂 发于 2012年07月06日 12:30 | 点击: 14069 | 展开摘要
一、背景介绍

此次航天局为了让天宫一号与神舟九号载人交会顺利对接成功,采用了新一代数值天气预报系统为神九保驾护航。新一代数值天气预报系统是中国国内技术最先进、分辨率最高、预报时效最长的数值天气预报系统。新系统在火箭燃料加注、飞船发射和返回、载人交会对接等关键节点发挥重要作用。 同样,作为后台系统或网站的运维,我们同样需要类似的监控或预报系统快速发现各种不稳定现象和解决性能问题以达到SLA(服务等级协议)的标准。

你有没有厌倦那个拥有10年以上寿命的监控系统?它常常会出现这

查看全文: http://www.udpwork.com/item/7868.html

+0  陌陌架构分享之移动运维篇(2) – 工作原理

Tag: 陌陌架构 | 架构分享 | 运维 | 陌陌
latermoon 发于 2012年06月19日 23:22 | 点击: 1421 | 展开摘要
为了实现后台API方便地控制iOS前端显示,必须定义一个足够简单和具有扩展性的结构。

这个结构参考了iOS SDK里UITableView,对一个占满屏幕的UITableViewController定义为TreeDocument,对里面的分组定义为TreeSection,对分组里的UITableViewCell定义为TreeItem,并且TreeItem可以绑定一个新的的TreeDocument来实现二级页面,继而实现任意层级。

TreeDocument包含TreeSec

查看全文: http://www.udpwork.com/item/12583.html

+0  Java应用运维

Tag: 故障处理 | 发布 | Java | java系统运维
bluedavy 发于 2012年01月29日 11:34 | 点击: 1559 | 展开摘要
对于互联网产品或长期运行的产品而言,运维工作非常重要,尤其是在产品复杂了以后,在这篇blog中就来说下Java应用的运维工作(ps:虽然看起来各种语言做的系统的运维工作都差不多,但细节上还是会有很多不同,so本文还是只讲Java的)。

苦逼的码农按照需求开发好了一个全新的Java Web应用,该发布上线给用户用了,要把一个Java Web应用发布上线,首先需要搭建运行的环境,运行的环境需要有JDK、APPServer,在已经装好了os的机器上装上JDK和APPServer,

查看全文: http://www.udpwork.com/item/6764.html

+0  环境为王-论贴吧环境解决方案

Tag: 未分类 | 运维技术 | 基准环境 | 更新 | 监控 | 稳定性 | 自动化
editor 发于 2011年11月24日 14:20 | 点击: 1434 | 展开摘要
摘要

本文列举了当前贴吧线下环境在使用过程中遇到的几个典型问题场景,针对这些问题,从如何维护环境稳定性以及如何提供更好的环境更新体验两个维度,给出了对应的解决方案。

通过环境稳定性解决方案,降低了人力的投入,保证了环境的最新,减少了人为因素引入问题,通过技术的手段,保证整个过程自动化、可视化。

通过更新方案,给予用户更好地更新体验,提升更新效率和速度,降低了执行机与基准环境之间的耦合性。

关键字

基准环境  自动化  监控  稳定性  更新

名词解释

基准环境:

查看全文: http://www.udpwork.com/item/6374.html

+0  产品做大之后的运维观

Tag: 产品 | QQ邮箱 | 优酷 | 运维
XJP 发于 2011年09月19日 22:26 | 点击: 1267 | 展开摘要
最近半年,会发现优酷经常会在视频播放过程中出现报错,信息通常是:抱歉,数据异常,你可以尝试刷新操作。当然,刷新之后能不能恢复那就得看人品了,根据个人经验这是需要拼人品的,这半年时间我有搬过一次家所以尝试至少两家运营商。优酷是我现在使用最多的视频网站,PPS客户端其次,在优酷不能正常工作的情况下我会尝试土豆,所以在发生这种情况我通常很沮丧,然后点击反馈问题想要协助他们解决问题。

当我想要反馈信息的时候,我发现优酷的联系表单居然需要强制填写固定电话,我总在想在这个固话越来越少手

查看全文: http://www.udpwork.com/item/5937.html

+0  HBase运维碎碎念

Tag: 技术 | 运维 | hadoop | hbase
NinGoo 发于 2011年06月27日 15:19 | 点击: 1710 | 展开摘要
最近开始看HBase,幸运的是,现在HBase社区已经非常的活跃,网络上可以找到大量的参考资料。但对于大集群的运维经验,还有待积累。上周在团队内部简单分享了一下这段时间的读书总结,现在把PPT放出来。

这个PPT只是个读书笔记,可能有些理解有误的地方,如果发现了,请一定要留下评论。

Hbase运维碎碎念
View more presentations from seaman ning

查看全文: http://www.udpwork.com/item/5359.html

+1  hbase运维

Tag: HBase | NoSQL | hbase运维
bluedavy 发于 2011年06月23日 13:52 | 点击: 2095 | 展开摘要
NoSQL现在风生水起,hbase的使用也越来越广,但目前几乎所有的NoSQL产品在运维上都没法和DB相提并论,在这篇blog中来总结下我们在运维hbase时的一些问题以及解决的方法,也希望得到更多hbase同行们的建议,:)

在运维hbase时,目前我们最为关注的主要是三大方面的状况:

1. Cluster load;

2. 读写;

3. 磁盘空间。

1. Cluster load

集群的load状况直接反映了集群的健康程度,load状况的获取非常容易,直接部署

查看全文: http://www.udpwork.com/item/5342.html

+0  Google的系统工程师(SA)如何工作

Tag: Linux | Google | operation | 运维
Tim 发于 2010年09月13日 00:32 | 点击: 1762 | 展开摘要
本文根据系统管理领域知名博客 Thomas A. Limoncelli 的 What is system administration like at Google 整理而成,添加了部分笔者观点。

Google的系统工程师(System Administrator)如何工作

由于Google的服务已经集群化,系统工程师并不大量接触硬件比如做安装服务器等事情。另外大部分工作也已经自动化了,比如架设LDAP, 负载均衡等。对照而言,国内目前大部分互联网公司SA仍然要做大量重复

查看全文: http://www.udpwork.com/item/2686.html
|<<<1>>>| 一共1页, 12条记录