새 제출자의 djeps 내가 Nagios 이벤트 처리기 스크립트와 RabbitMQ과 자동 문제 해결의 어느 정도를 달성하는 데 사용하지만, 페이스 북이 sysadmin 나의 옛날보다 훨씬 큰 규모에 일을 가지고 '쓰기 인용 :. 인프라가 크기 때 페이스 북의 항상 추락거나 일반적으로 오작동있는 소프트웨어의 고장 서버와 조각이 있습니다. 대부분의 경우, 우리의 시스템은 이러한 문제를이 사이트를 사용하는 사람이 거의 또는 전혀 영향을 일으킬 이러한 설계되었습니다.하지만 가끔은 작은 정전이 더 될 수 있습니다 부러진 소프트웨어나 하드웨어의 한 부분이 영향이 사이트를 않는 경우에는 중단, 발생 오류 또는 사이트에서 성능 저하가. 그때는 우리가 문제를 해결하거나 최대한 빨리 그것을 대체하는 것이 중요합니다. ... 우리는 자동화된 방법을 찾아야만 인간의 엔지니어가 더 크고 복잡한 중단을 해결하고 예방에 초점을 수 있도록 문제의이 종류를 취급하고 있습니다. 그래서, 내가 고장난 서버 및 소프트웨어 조각의 다양한 유형에 대한 수정을 자동화하는 시간이 있었을 때 스크립트를 쓰기 시작했다. ' "
이 이야기의 자세한 내용을 Slashdot에에 있습니다.
댓글 없음:
댓글 쓰기