毕竟用户和流量来了服务器没撑住,首要责任就是自己,一个没处理好,造成了线上事故和公司利益的损失,那自己就可以卷铺盖滚蛋了。
幸好幸好,运维主管实时观察着各服务器的各项指标虽然猛蹿了一大截,但还在安全线以内。
随后他老神在在地喝着雀巢咖啡.
心里暗自感谢伟大的陈总,否则现在最忙的应该就是他了
即便微信这段时间经过了技术人员反复的测试和验证,尽可能考虑到所有可能发生的意外和结果。
随着时间的推移,当数据量达到一定的层级,还是有各种大大小小突发情况的发生。
一般的问题,经过反馈基本到李建超这里就消灭殆尽了。
可有极特殊的情况还是在前面三个小时内爆发出来,比如360那边数据传输格式在极端情况下会偶现脏(错误)数据等等
一开始所有人都认为是自身代码出现问题,在10分钟内李建超没发现任何端倪和报错后,立马上报给了陈默。
这时就轮到陈默出马了,仅仅想了不到10秒,陈默立马联系360技术协调解决,这边修复数据,先解决用户问题及时止损,再来查找原因。
但还是有新的脏数据产生,虽然几率比较低,经过孙子维扫描统计,只占整体千分之几,可放大到百万级的数据面前,那就是几百上千个用户出现问题。
陈默淡定下令,让许良手动持续修复错误数据,然后他带领技术排查根本原因。
随后在他牵头排查下,3分钟排除代码层面问题,5分钟排除中间件问题。
这时360那边反馈他们那边发现问题正在解决。
30分钟后,360那边反馈问题修复已上线。
但脏数据虽然产生的几率降低了可还是存在,看来这是一个混合问题,不能单一而论。
陈默想了想跟运维主管一起排查服务器,从表面上看确实一切正常,但随着陈默了10分钟写了一个脚本扫描,随后发现某台服务器的一个节点跑不通,应该是其中某个硬件发生了故障。
这一下把运维主管吓够呛,早就听闻陈默技术惊人,没想到连运维的活干的都这么溜,刚才配合他工作,感觉回到了当时他刚入行跟老师时候的那种感觉
当运维把那台问题服务器摘掉后,数据终于恢复了正常。
问题解决,众人又恢复常态,他们一边监察着自己负责业务的运行情况,同时在等待着不知什么时候会到来的新问题。
到了10点多,总经理办公室的房门打开,雷军从里面走了出来。
林斌和周光平被他打发到英华达工厂那边跟进小米手机的制造组装过程,最近一段时间那边也是状况频出,听说这两个家伙都住到工厂现场办公解决问题。所以换自己坐镇总部,由于3q大战牵一发动全身,现在到了他们这个层级也乱成一锅粥,跟金山和其他有关联的企业各种沟通,就在刚才撂下一个投资机构的好友劝他去给双方调停的电话。
雷军表面说着好好好,行行行,尽量尽量。
心里暗道,妈的老子就是主谋之一,巴不得脑袋打开,还调停。
这不他刚喘了口气,出来看下外面陈默这边的情况。
他来到陈默跟前,“微信这边怎么样?”
“还行刚解决完一个问题,目前挺平稳,你看下数据。”陈默看到略显疲惫的雷军后,把他拉统计数据的屏幕前面。
“431万?卧槽!怎么这么快?”即便见过无数大场面的雷军也被这数据吓了一跳,不自觉爆粗,显然这数据的走势超出了自己以往对于一个软件上线后客观发展规律的认知。
“是吧,我当时也吓一跳,只能说小马哥太不得人心,或者热度太高。”
“今晚准备整到多久?”
“先通宵吧!”
雷军闻言瞪大了眼睛,“通宵怎么能从你的嘴巴说出。”
“毕竟关键一战不容有失,我只是讨厌加班,又不是不能加班!”陈默一副伱瞧不起谁呢的表情。
“那行这边有你在我也放心,我还得去找趟求伯君”
雷军拍了拍陈默的肩膀,然后又跟还在战斗的同学勉励一番,说了下辛苦,随后闪人。
其实陈默整体计划没问题,但许多细节还是需要自己去完善弥补。