立即注册
 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
广州大学城网业务调整

[其他主题] 首届GITC互联网技术大会新炬专家亮相 [复制链接] qrcode

查看: 5312 | 回复: 0

aatengkeker
发表于: 2013-12-23 15:47:34 | 显示全部楼层

新炬袁伟翔:从数据库故障诊断到故障管理

2013125-6日,首届GITC全球互联网技术大会在北京国家会议中心成功召开,本届GITC的主题是“技术造梦新世界”,历时两天,来自互联网行业的三千余位从业者出席本次大会。
作为首届GITC的主办方麒麟会和协办方iTech Club中国互联网技术精英俱乐部对本次大会十分重视,希望藉此机会推进我国互联网从业企业与国际知名企业的交流,了解互联网行业最新技术走势,促进行业及其技术的交流与发展,成为一个资源共享、多方共赢的大会,从而促进我国互联网领域的繁荣发展。
据悉,本次GITC全球互联网技术大会邀请到数十位VIP及海内外近百家企业的互联网技术领域精英们作为演讲嘉宾,他们来自互联网行业最顶尖企业,代表着中国乃至全球互联网的最前端技术。通过围绕云计算、大数据挖掘、SDN、开放源代码、移动APP、运维与安全等13个技术方向进行专题演讲。
2013GITC全球互联网技术大会第二天数据库专场中,上海新炬的技术专家袁伟翔带来了他的主题分享。袁伟翔从事数据库运维服务已经8年的时间,是Oracle数据库的故障处理方面的专家。在本次大会中他的话题是《数据库故障诊断到故障管理》。
数据库故障处理的目标是消除引起故障的深层次根源以防止故障再次发生。其实包括主动性故障处理和被动型的故障处理。平时我们所说的故障都是被动型的故障处理。如何进行主动的故障处理呢?通过我们的巡检、监控等手段找到系统薄弱的环节,并进行增强。主动性故障做的好,才能让一个系统更加稳定的运行。
         

2013年仍然是一个故障频发年,大大小小的故障弱干起,    大型故障的恢复及处理,光靠一两个人的技术能力是不足以胜任的。我们需要建立快速响应和调度机制,通过实现制度化的流程来实现故障的迅速恢复。当故障出现的时候,我们首先想到的是如何尽快的恢复业务,让业务能够持续性的运行。然后我们才会分析故障产生的原因。并形成报告进行归档。将故障分类归纳到知识库里面。


上面说过,大型故障的恢复及处理,光靠一两个人的技术能力是不足以胜任的。所以如何合理的安排人员,一起协调工作。能够最大提升故障处理及分析的效率,帮助客户快速解决故障


出故障其实并不可怕,只要故障可控和可治。我们通过制订这些流程、合理安排人员,通过假象分析,进行贴实的模拟测试,实现有人调度,一线人员快速的上传日志,二线的人员快速响应恢复与升级,三线同步故障分析,最终达到信息快速真实上报,决策准确实施执行反馈,做到故障处理业务影响最小化。
跳转到指定楼层
快速回复 返回顶部 返回列表