Nuove tecnologie e non solo...

Il problema di Amazon Web Service è stato causato da un errore umano

Qualche giorno fa, durante una normale attività di debug sui server di Amazon, un tecnico ha creato non pochi problemi a parecchi siti.

Infatti un errore di battitura di un comando ha compromesso l’agibilità di vari siti web. Non si è quindi trattato ne di un attacco ne di problemi legati al hardware dei server, ma un banalissimo errore di scrittura.

La società tramite un comunicato stampa ha fatto sapere che:”Siamo orgogliosi del nostro lungo record di disponibilità di Amazon S3 e sappiamo quanto critico sia questo servizio per i nostri clienti, le loro applicazioni e gli utenti finali, e il loro business. Faremo tutto quello che possiamo per imparare da quanto accaduto, usando questo evento per migliorare ancor di più la nostra disponibilità. La rimozione di capacità è una pratica operativa chiave, ma in questo caso lo strumento utilizzato ci ha permesso di rimuovere troppa capacità in maniera troppo rapida. Abbiamo modificato lo strumento così da rimuovere capacità più lentamente e abbiamo aggiunto alcune misure di sicurezza per evitare di rimuovere capacità quando porterebbe qualsiasi sistema al di sotto dei requisiti minimi essenziali per il corretto funzionamento”.

Quello che dovevano fare, era la semplice rimozione dalla rete di alcuni server, i quali non dovevano in nessun modo andare ad intaccare le prestazioni dei servizi garantiti, ma l’inserimento di un comando errato ha invece intaccato un numero di server considerevoli, numero talmente elevato da creare un disservizio considerevole.

La stessa società assieme ai propri ingegneri ha anche detto di voler valutare un metodo alternativo per il prossimo futuro, così da non creare più simili problemi. Ovviamente Amazon si è anche scusata pubblicamente con tutti i suoi clienti per il disservizio creato.

Next Post

Previous Post

Leave a Reply

© 2022 NonSoloMobile

Theme by Anders Norén

Follow by Email
YouTube