“蝴蝶效应”的老故事19日晚出现在中国加密行业。由于AWS东京节点冷却系统断电,火币年发生了第一次严重的网络故障,随后币安、Matcha、coinex和Kubi出现了小规模故障。可以说,几乎所有的中国交流都受到了影响。
北京时间19日晚10时,一台6011突然出现故障,用户被踢出登录状态,说明网络不好。火币表示,由于亚马逊云服务C区出现大概率网络故障,登录受到影响,目前已联系对方,正在修复中,因此客户资产的安全不会受到影响。
11:00,币安、库比、Matcha app、coinex等也出现卡滞,但影响相对较小。该图是AWS节点的故障图和原因,该节点处于修复状态。AWS在日本时间19日晚11点发现问题。核心原因是冷却系统断电导致的温度升高。日本时间20日下午3时30分,大部分问题已恢复,下午5时30分,基本全部恢复。
币安宣布,随着AWS的中断影响了我们的平台和许多其他交易所,币安的整个网络暂停了从第二十九点到香港时间凌晨1点13分到4点52分的充值、撤回和资金转移。
虽然几乎所有的中国交流都遇到过失败,但一位微博网友对火币如此严肃的原因解释如下,这也得到了相关人士的认可。
“为了追求速度和牺牲高可用性,所有服务都必须迁移到单个可用性区域,即此故障的区域C。同时,没有快速有效的应急预案。单区故障时,所有的服务都需要迁移,数据也需要重建,所以时间成本非常高。”(**参考:阿里巴巴前高管朱烨是火币的新任CTO,火币的所有高管都是第一次曝光)
业内人士指出,AWS日本是亚太地区成本相对较高的地区,也是地震带。选择AWS日本作为单一可用区域并不合适。客观地说,系统可用性、极端的事务性能和成本投资是“不可能的三角形”。以牺牲可用性为代价追求速度可能会导致这样的结果。
由于比特币和部分主流货币19日晚间继续飙升,空头合约的投资者可能因无法撤单而蒙受损失。目前除火币外,其他交换机故障范围较小,不存在补偿问题。火币表示,肯定会推出相应的补偿方案。更为特殊的是,OKEX在这一事件中可能没有失败,因为它主要在香港使用阿里巴巴云服务器。
在失败之前,币安突然宣布暂停以太坊及相关代币的退市,这引起了很多猜测和阴谋论,但它很快恢复了退市。然而,币安相对较高的停机和故障频率也引起了关注。原因是什么?币安本身就是由于交通量过大。CZ说每天有30000个新用户。然而,有人怀疑币安上一季度的利润接近10亿美元,因此它不应该不愿意投资于技术。
专业人士指出,原因可能如下:
一是投入不够。币安虽然利润不小,但在系统、软硬件上都是巨大的投资成本。总公司每年的维护费用可能达到数亿美元。二是币圈具有较强的特殊性,如7次24小时交易、全球用户、各种不可预知的突发事件和黑客攻击,使得维护非常困难;三是内部应急能力不足,没有完善的测试团队。传统的互联网公司会有大量关于失败的先期演练,以及完善的机制和制度。由于币安的快速发展,很多相关的制度和机制没有跟上。
文章标题:为什么故障这么严重?为什么在交通拥挤的情况下货币安全会下降
文章链接:https://www.btchangqing.cn/196341.html
更新时间:2021年02月20日
本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。
把我机会~危机=机会