저자: 첸 Whilin, 중국 클라우드 네트워크 기술 고문 절곡 검토 설립자 북쪽 오로라 벤처 자본 투자 고문
4 사례 연구-아마존 AWS
4.2 아마존 AWS 서비스 중단 설문 조사 (2006-2009)
아마존 AWS의 2006 년 3 월 14 오픈 S3 파일 스토리지 서비스와 2006 년 8 월 25 일 이후 많은 서비스 충돌을 경험 했다 EC2 서비스, 그리고 2008 년 8 월 EBS 서비스. EC2, S3 및 EBS 포함 됩니다. 그것의 충격은 많은 중요 한 인터넷 회사의 서비스를 고용 하는 관련이 있습니다.
2008 년 2 월 16 일에 AWS, AWS의 S3 심각한 서비스를 중단 했 고 많은 AWS 사용자에 대 한 서비스의 중단을 발생. 아마존의 AWS 팀 깊은 다 듬 었 고, 4 월 8 일, AWS 서비스 다양 한 서비스의 신뢰성 매일 추적 건강 대시보드를 제공 하 고 시작 했다.
이 섹션은 AWS 라인에 주요 가동 중지 이벤트의 목록을 정리 하 고 그에 따라 그들을 논의 하려고 합니다.
1 Apri 1, 2006
아마존의 S3 스토리지 서비스 1 개월 여 되었습니다 그리고 2006 년 4 월 1 일에 S3 추락.
사고 원인: S3
사고 복구: 6 시간
문제 설명: AWS 팀 할 S3 저장 부하 분산 관리. 결과 S3 하위 시스템 서비스 중단 하 게 하는 내부 네트워크 부하 충돌.
관련된 url: https://forums.aws.amazon.com/thread.jspa?threadid=10185
2. 9 월 29 일입니다. 2007
아마존의 e c 2는 추락 하 고 일부 고객 데이터가 손실. EC2 API 관리 기능 잠시 중단 됩니다.
사고 원인: EC2
사고 복구: 4 시간
사고 설명:
관련 url: https://forums.aws.amazon.com/thread.jspa?threadid=17211 & 시작 = 0 및 tstart = 0
아마존의 AWS 팀 일부 고객의 가상 기계의 실수로 전체 AWS 서비스의 보안을 보장 하기 위해 당시 AWS의 관리 소프트웨어 오류. 일부에 의해 사망 했다, AWS 팀 신속 하 게 중단 EC2 관리 API 기능을 설명 했다.
3. 2 월 15, 2008
2 월 15 일, 08 아마존에서 공식적으로 인정 하 고 지식과 일반적인 구름의 신뢰성에 업계의 경계 또한 영향 중에 설명 하는 첫 번째 주요 사건입니다. 그리고 아마존의 규정 강화 결정 및 서비스 가용성의 투명도를 직접 지도.
사고 원인: S3
사고 복구: 3 시간
사고 설명:
S3 서비스 서브 시스템의 인증 (인증) 서비스는 서비스 요청, 마비 되 고 S3 시스템의 갑작스런 큰 영역을 견딜 수 없습니다. AWS의 공식적인 해석에서 찾을 수 있습니다.
이 주요 중단 후 AWS 팀 약속 "서비스 상태 대시보드", 있도록 산업 투명 AWS에 다양 한 서비스 조건을 이해 하는 사용자 수 있습니다.
4. 6 월 5 일, 2008
6 월 5 일, 08, 동부 버지니아 데이터 센터에서 아마존은 찾을 번개 충격. EC2 서비스의 일부 지역에서 다운 됩니다.
사고 원인: 천둥과 번개
사고 복구: 없음
사고 설명:
천둥과 번개 동부 쪽 버지니아의 데이터 센터. 일으키는 EC2 중단에 힘의 손실에 지도 했다.
관련된 url: http://www.datacenterknowledge.com/archives/2008/06/05/brief-outage-for-amazon-web-services/
5. 2008 년 6 월 6 일
6 월 6 일 08, 아마존의 자신의 온라인 소매 비즈니스 갑자기 추락 했다. 미국과 영국에서 주로 사업. 하지만 AWS 자체가 나타나지 않았다 비정상적 이기를.
사고 원인: 아마존 사고에 대 한 어떤 공식적인 설명 하 게 하지 않았다. 그것은 단지 약식 설명 "아마존의 네트워크 시스템은 매우 복잡 하다." 약간 뭔가가 매우 사고 하 고 정상...
사고 복구: 3 시간
사고 설명:
아마존은 사건에 대 한 공식적인 설명을 만들지 않았다, 아마존의 부하 분산 비즈니스, DNS 서비스 등은 문제가 업계의 추측이 했다. 다른 인수가 아마존에서 트로이 목마는 악의적인 DDoS 공격에 의해 공격 되었다입니다. 증거는 아마존의 IMDB 사이트 (http://www.imdb.com) 되 고 교통 및 레이어 7 DDoS 증폭 아마존의 주요 사이트는 아래로 하는 동안 이다. 공격 흐름은 아마 3mbits/초. 다음 그림은 아마존의 가동 미국 및 영국 사이트 그 날에.
6. 7 월 20, 2008
08 7 월 20 일, S3 다른 주요 가동 중단 사고. 모든 이미지는 기본적으로 아마존의 S3 시스템에 저장 된 twitter.twitter 같은 많은 중요 한 고객 영향을 받습니다.
사고 원인: S3
사고 복구: 8 시간
문제 설명: S3 서버 S3 서버를 모든 사용자의 서비스 요청을 처리할 수 없습니다 일으키는 서버 간의 정보 흐름을 제어 합니다. 아마존 e c 2의 서비스 영향을 받은 것을 또한 인정. 일부 고객 가상 컴퓨터 실행. 또한, 간단한 큐 서비스 (SQS) 서비스는 또한 영향을 중단.
AWS의 공식 설명은: http://status.aws.amazon.com/s3-20080720.html
7. 6 월 10 일
에 6 월 10 일 09, EC2, AWS에에서 주요 가동이 했다. 이유는 데이터 센터 번개 충격 및 손실된 힘을 복종 되었다.
사고 원인: EC2
사고 복구: 8 시간
사고 설명:
자연의 기후, 번개 하면 힘을 잃는 데이터 센터.
관련된 url: http://www.datacenterknowledge.com/archives/2009/06/11/lightning-strike-triggers-amazon-ec2-outage/
8 2009 년 7 월 19 일
7 월 19 일 09의, AWS EC2 성능 및 가동 중단 했다.
사고 원인: EC2
사고 복구: 2 시간
사고 설명: 없음
관련된 url: http://www.datacenterknowledge.com/archives/2009/07/19/outage-for-amazon-web-services/
9. 10 월 5 일
에 10 월 5 09, BitBucket, 온라인 오픈 소스 프로젝트 서비스 회사, AWS 사업에 19 시간을 추락의.
사고 원인: EC2, EBS
사고 복구: 19 시간
사고 설명:
AWS에서 BitBucket 서비스 트래픽 공격 방법을 사용 하 여 해커에 의해 해킹 했다. 사용 하는 첫 번째 것은 UDP 홍수. 다음 TCP 홍수를 변환. 서비스는 19 시간 동안 일시 중지 되었습니다. AWS의 운영 팀 과정에서 경험의 부족을 설명 했다.
관련된 url: http://www.networkworld.com/community/node/45891
2009 년 12 월 10 일
에 12 월 10 일 09, AWS EC2 가동 사고에서 발생 했습니다. 이유는 데이터 센터 번개 충격 및 손실된 힘을 복종 되었다. 위치는 동부 쪽 북쪽 버지니아의 데이터 센터에서 일어난
사고 원인: EC2
사고 복구: 45 분
사고 설명:
자연의 기후, 번개 하면 힘을 잃는 데이터 센터.
관련된 url: http://www.datacenterknowledge.com/archives/2009/12/10/power-outage-for-amazon-data-center/
이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이
페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.
커뮤니티에서 표절 사례를 발견한 경우
info-contact@alibabacloud.com
으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.