Go Daddy explica ce s-a intamplat pe 10 septembrie

Auguste Goldman, CIO al companiei de hosting Go Daddy, a explicat joi intr-un post pe blog care a fost cauza care a dus la intreruperea semnificativa la scara larga a serviciilor companiei, din data de 10 septembrie 2012. Conform lui Goldman, cauza ca a fost identificata ca fiind o “combinatie perfecta” de esecuri de retea, acesta desfiintand din nou ideea ca sistemele companiei ar fi fost sparte de hackeri.

Goldman scrie pe blog ca infrastructura DNS a companiei Go Daddy raspunde in medie la aproximativ 10 miliarde de interogari DNS pe zi, repartizate pe 41 de milioane de zone DNS. Sistemul foloseste anycast BGP routing pentru a distribui interogarile DNS catre cea mai apropiata zona DNS, un sistem care este destinat sa ofere atat latenta redusa, cat si redundanta in caz de defectiuni hardware.

Incidentul din data de 10 septembrie, spune Goldman, “a fortat multe dintre routerele noastre dincolo de capacitatile lor.”

Furnizorul de hosting spune ca a restaurat serviciul prin filtrarea informatiilor rutate in retea, restaurarea configurarilor de rutare si resetarea routerelor care nu mai faceau fata suprasarcinilor. Cu toate acestea, imediat ce compania a readus online sistemele de rutare, aceasta s-au confruntat cu un flood de trafic DNS de la cache-urile care au expirat si care ameninta sa intrerupa din nou functionarea sistemelor.

Goldman spune ca Go Daddy a atenuat pericolul ca acest lucru sa se intample, reducand traficul DNS la toate punctele sale de conectare la Internet, pe masura ce isi aducea sistemele online. Astfel, a prelungit durata de intrerupere a serviciului, dar a oferit posibilitatea ca sistemele sa revina inapoi online, in conditii de siguranta. Traficul a fost marit pe masura ce sistemele de rutare DNS reveneau online.