एज़्योर आउटेजः माइक्रोसॉफ्ट का कहना है कि समस्या की पहचान की गई है; इंजीनियर परिवर्तनों को वापस ले रहे हैं और ट्रैफ़िक को बदल रहे हैं
माइक्रोसॉफ्ट का एज़्योर क्लाउड प्लेटफॉर्म 29 अक्टूबर 2025 को एक बड़े पैमाने पर आउटेज का शिकार हुआ, जिसने वैश्विक स्तर पर कई महत्वपूर्ण वेबसाइट्स, सेवाओं और ऐप्स को प्रभावित किया। यह समस्या दोपहर करीब 12 बजे ईटी (भारतीय समयानुसार रात 9:15 बजे) शुरू हुई, जब डाउंडिटेक्टर पर यूजर रिपोर्ट्स में अचानक तेज उछाल देखा गया। आउटेज ने माइक्रोसॉफ्ट 365, एक्सबॉक्स लाइव, आउटलुक, टीमेंज और नेटवेस्ट बैंकिंग जैसी सेवाओं को बाधित किया, जिससे लाखों यूजर्स का कामकाज रुक गया। यहां तक कि स्कॉटिश संसद में वोटिंग प्रक्रिया भी इसकी वजह से ठप हो गई, जो इसकी गंभीरता को दर्शाता है। माइक्रोसॉफ्ट की एज़्योर स्टेटस पेज पर एज़्योर पोर्टल एक्सेस में समस्या की पुष्टि हुई, और दुनिया के हर रीजन में नेटवर्क इंफ्रास्ट्रक्चर को “क्रिटिकल” स्थिति घोषित कर दिया गया। यह आउटेज कंपनी के तिमाही आय घोषणा से ठीक कुछ घंटे पहले हुआ, जो एज़्योर की वैश्विक निर्भरता को और उजागर करता है। डाउंडिटेक्टर पर पीक टाइम पर 16,000 से अधिक रिपोर्ट्स दर्ज हुईं, मुख्य रूप से सर्वर कनेक्शन और डोमेन संबंधी शिकायतें। इस घटना ने क्लाउड कंप्यूटिंग की कमजोरियों पर फिर से बहस छेड़ दी, खासकर पिछले हफ्ते अमेज़न वेब सर्विसेज (एडब्ल्यूएस) के आउटेज के बाद।
समस्या का कारण: डीएनएस कॉन्फ़िगरेशन चेंज और एज़्योर फ्रंट डोर की भूमिका
माइक्रोसॉफ्ट ने आउटेज के पीछे एज़्योर इंफ्रास्ट्रक्चर के एक हिस्से में हालिया डीएनएस कॉन्फ़िगरेशन चेंज को जिम्मेदार ठहराया, जो एक गलती से हुआ अनजाने में बदलाव था। डोमेन नेम सिस्टम (डीएनएस) इंटरनेट का आधारभूत हिस्सा है, जो यूजर-फ्रेंडली डोमेन नेम्स जैसे www.microsoft.com को मशीन-रीडेबल आईपी एड्रेस (जैसे 192.0.2.1) में बदलता है, ताकि ब्राउज़र्स और ऐप्स वेबसाइट्स से जुड़ सकें। इस मामले में, समस्या एज़्योर फ्रंट डोर (एएफडी) सर्विस में उत्पन्न हुई, जो एक ग्लोबल कंटेंट डिलीवरी नेटवर्क (सीडीएन) है और ट्रैफिक डिस्ट्रीब्यूशन, लोड बैलेंसिंग तथा एप्लीकेशन डिलीवरी का काम करती है। सिस्को थाउजैंडआईज की रिपोर्ट के अनुसार, 29 अक्टूबर को दोपहर 3:45 बजे यूटीसी से शुरू होकर, एएफडी में एचटीटीपी टाइमआउट्स, सर्वर एरर कोड्स और पैकेट लॉस की समस्या देखी गई, जिसने माइक्रोसॉफ्ट 365 और एज़्योर क्लाउड मैनेजमेंट पोर्टल्स को प्रभावित किया। यह चेंज एक टेनेंट कॉन्फ़िगरेशन डिप्लॉयमेंट प्रोसेस में सॉफ्टवेयर डिफ़ेक्ट के कारण हुआ, जिसने सेफ्टी वैलिडेशन को बायपास कर दिया और अमान्य कॉन्फ़िगरेशन स्टेट पैदा कर दिया। परिणामस्वरूप, कई एएफडी नोड्स ठीक से लोड नहीं हो सके, जिससे ट्रैफिक असंतुलित हो गया और लेटेंसी, टाइमआउट तथा कनेक्शन एरर्स की श्रृंखला शुरू हो गई। माइक्रोसॉफ्ट ने स्पष्ट किया कि उनकी प्रोटेक्शन मैकेनिज्म्स, जो गलत डिप्लॉयमेंट्स को रोकने के लिए हैं, एक सॉफ्टवेयर बग के कारण फेल हो गईं। यह आउटेज 15:45 यूटीसी से 30 अक्टूबर को 00:05 यूटीसी तक चला, जो लगभग 8 घंटे की अवधि थी। विशेषज्ञों का मानना है कि ऐसी कॉन्फ़िगरेशन चेंजेस हमेशा टेस्टिंग के बाद ही लागू होनी चाहिए, लेकिन यहां डिप्लॉयमेंट प्रक्रिया में खामी ने वैश्विक प्रभाव पैदा कर दिया।
प्रभावित सेवाएं और वैश्विक असर: उद्योगों पर गहरा प्रभाव
यह आउटेज पूरी तरह वैश्विक था, जिसमें एज़्योर के सभी रीजन प्रभावित हुए, जिससे बिजनेस, गेमिंग और सरकारी सेवाओं पर व्यापक असर पड़ा। माइक्रोसॉफ्ट 365 यूजर्स को ईमेल, कैलेंडर, कोलैबोरेशन टूल्स जैसे आउटलुक, टीमेंज और वनड्राइव में गंभीर दिक्कतें आईं, जहां कई यूजर्स को “कुछ गलत हो गया” जैसी एरर मैसेज मिले। एक्सबॉक्स लाइव प्लेयर्स को लॉगिन, मल्टीप्लेयर गेमिंग और प्रोफाइल एक्सेस में समस्या हुई, जबकि माइनक्राफ्ट सर्वर्स पर ग्लोबल मल्टीप्लेयर कनेक्शंस पूरी तरह रुक गए। कॉपिलॉट फॉर सिक्योरिटी और अन्य एआई-आधारित टूल्स भी बाधित हुए, जो बिजनेस एनालिटिक्स पर निर्भर यूजर्स के लिए बड़ा झटका था। एयरलाइंस सेक्टर पर विशेष असर पड़ा; अलास्का एयरलाइंस ने अपनी वेबसाइट, चेक-इन सिस्टम्स और क्रिटिकल ऑपरेशंस में रुकावट की शिकायत की। यूके में वोडाफोन के नेटवर्क और हीथ्रो एयरपोर्ट के सिस्टम्स प्रभावित हुए, जबकि ऑस्ट्रेलिया और यूरोप में बैंकिंग ऐप्स जैसे नेटवेस्ट ठप हो गए। स्कॉटिश संसद में वोटिंग प्रक्रिया रुकने से राजनीतिक कार्य प्रभावित हुआ, जो दिखाता है कि क्लाउड फेलियर कैसे लोकतांत्रिक प्रक्रियाओं को भी बाधित कर सकता है। अन्य प्रभावित एज़्योर सर्विसेज में ऐप सर्विस, एक्टिव डायरेक्टरी बी2सी, कम्युनिकेशन सर्विसेज, डेटाब्रिक्स, हेल्थकेयर एपीआईज, मैप्स, एसक्यूएल डेटाबेस, वर्चुअल डेस्कटॉप, कंटेनर रजिस्ट्री, मीडिया सर्विसेज, माइक्रोसॉफ्ट डिफ़ेंडर, एंट्रा आईडी (मोबिलिटी मैनेजमेंट, आईडेंटिटी एंड एक्सेस मैनेजमेंट), माइक्रोसॉफ्ट पर्व्यू, सेंटिनल (थ्रेट इंटेलिजेंस) और वीडियो इंडेक्सर शामिल हैं। डाउंडिटेक्टर डेटा के अनुसार, माइक्रोसॉफ्ट 365 पर 11,700 से अधिक रिपोर्ट्स पीक पर पहुंचीं, जबकि एज़्योर पर 16,000। यह घटना पिछले साल क्राउडस्ट्राइक आउटेज की याद दिलाती है, जहां हॉस्पिटल्स, बैंक और एयरपोर्ट्स ठप हो गए थे, जो वैश्विक इंटरकनेक्टेड टेक्नोलॉजी की नाजुकता को रेखांकित करती है। बिजनेस के लिहाज से, यह आउटेज उत्पादकता में घंटों की हानि का कारण बना, खासकर उन कंपनियों के लिए जो एज़्योर पर पूरी तरह निर्भर हैं।
माइक्रोसॉफ्ट का समाधान: समस्या की पहचान, रोल बैक और रिकवरी प्रक्रिया
माइक्रोसॉफ्ट ने आउटेज की पहचान करते ही कई रिमेडिएशन स्ट्रैटेजी अपनाईं, जो उनकी इमरजेंसी रिस्पॉन्स सिस्टम की मजबूती दिखाती है। सबसे पहले, कंपनी ने प्रभावित कॉन्फ़िगरेशन चेंज को तुरंत रोका और आगे के बदलावों को ब्लॉक कर दिया, ताकि समस्या और न फैले। फिर, ट्रैफिक को प्रभावित इंफ्रास्ट्रक्चर से हटाकर हेल्दी नोड्स की ओर रूट करना शुरू किया गया, जो तत्काल राहत प्रदान करता था। उन्होंने “लास्ट नोन गुड” कॉन्फ़िगरेशन को डिप्लॉय किया, जो एक हालिया बैकअप था जहां सब कुछ ठीक काम कर रहा था, और इसे ग्लोबल फ्लीट पर लागू किया। यह डिप्लॉयमेंट 30 मिनट के अंदर पूरा होने की उम्मीद थी, जिसके बाद नोड्स को रिकवर कर ट्रैफिक बैलेंस किया गया। एज़्योर पोर्टल को एएफडी से फेलओवर किया गया, जिससे यूजर्स सीधे एक्सेस कर सके; हालांकि, मार्केटप्लेस जैसे कुछ एंडपॉइंट्स में इंटरमिटेंट लोडिंग इश्यूज बने रहे। कस्टमर कॉन्फ़िगरेशन चेंजेस को अस्थायी रूप से ब्लॉक रखा गया है, और मिटिगेशन पूरा होने पर नोटिफिकेशन भेजा जाएगा। इंजीनियर्स ने इंटरनल इंफ्रास्ट्रक्चर के कनेक्टिविटी इश्यूज को अनब्लॉक किया, कई सर्वर्स पर कॉन्फ़िगरेशंस रीलोड कीं और ट्रैफिक को धीरे-धीरे रीडिस्ट्रिब्यूट किया, ताकि ओवरलोड न हो। माइक्रोसॉफ्ट ने यूजर्स को एज़्योर ट्रैफिक मैनेजर का सुझाव दिया, जो फेलओवर स्ट्रैटेजी के जरिए ट्रैफिक को ओरिजिन सर्वर्स पर रीडायरेक्ट कर सकता है। रिकवरी के शुरुआती संकेत 30 अक्टूबर को सुबह दिखने लगे, और 98% सेवाएं बहाल हो गईं। कंपनी ने सॉफ्टवेयर डिफ़ेक्ट को ठीक करने के लिए अतिरिक्त वैलिडेशन और रोल बैक कंट्रोल्स लागू किए हैं। एक पोस्ट-इंसिडेंट रिव्यू (पीआईआर) 14 दिनों के अंदर पूरा होगा, जिसमें रूट कॉज एनालिसिस और कस्टमर्स को अपडेट्स शेयर किए जाएंगे। यह प्रक्रिया दिखाती है कि माइक्रोसॉफ्ट कैसे फेलियर से सीखकर सिस्टम को मजबूत बनाती है।
एज़्योर स्टेटस पेज पर अपडेट्स: समयबद्ध प्रगति और यूजर गाइडेंस
माइक्रोसॉफ्ट के एज़्योर स्टेटस पेज ने आउटेज के दौरान पारदर्शी अपडेट्स प्रदान किए, जो यूजर्स को स्थिति की वास्तविक तस्वीर देते रहे। 29 अक्टूबर को दोपहर 12 बजे ईटी के आसपास, पेज पर डीएनएस कॉम्प्लिकेशंस की पुष्टि हुई, जिसने कई सेवाओं की उपलब्धता को प्रभावित किया। कंपनी ने रूट कॉज की जांच शुरू की और 60 मिनट के अंदर डिटेल्ड अपडेट का वादा किया। एक अपडेट में कहा गया कि वे मल्टीपल स्ट्रैटेजी पर काम कर रहे हैं, जैसे प्रभावित इंफ्रास्ट्रक्चर से ट्रैफिक हटाना, ऑफेंडिंग चेंज को ब्लॉक करना और रोल बैक डिप्लॉय करना। रिकवरी प्रोग्रेस में, पेज ने बताया कि लास्ट नोन गुड कॉन्फ़िगरेशन डिप्लॉय हो रहा है, और कस्टमर्स को शुरुआती सुधार के संकेत दिखने लगेंगे। 30 अक्टूबर को सुबह 12:40 यूटीसी तक फुल मिटिगेशन ट्रैक किया गया, हालांकि कुछ लॉन्ग टेल इश्यूज बाकी थे। अपडेट्स में एज़्योर सर्विस हेल्थ के जरिए डायरेक्ट नोटिफिकेशंस का जिक्र था। माइक्रोसॉफ्ट ने एक्स (पूर्व ट्विटर) पर भी सपोर्ट अकाउंट्स से अपडेट्स शेयर किए, जैसे “हम एज़्योर फ्रंट डोर सर्विसेज में इश्यू की जांच कर रहे हैं, जहां स्पोरैडिक रिक्वेस्ट फेलियर्स या डिले हो सकते हैं।” स्टेटस पेज ने कस्टमर्स को फेलओवर स्ट्रैटेजी अपनाने की सलाह दी, जैसे एज़्योर ट्रैफिक मैनेजर यूज करना। यह टाइमिंग कंपनी की क्वार्टरली अर्निंग्स से पहले की थी, जहां सीईओ सत्य नडेला ने रेजिलिएंस और इनोवेशन पर जोर दिया, नोट करते हुए कि कोपिलॉट एडॉप्शन तेजी से बढ़ रहा है। अपडेट्स ने यूजर्स को सूचित रखा कि एरर रेट्स और लेटेंसी प्री-इंसिडेंट लेवल पर लौट आई है, लेकिन कुछ कस्टमर्स को माइनर इश्यूज का सामना करना पड़ सकता है।
डीएनएस समस्याएं क्या हैं और उनका असर: गहन व्याख्या और भविष्य की सलाह
डीएनएस, या डोमेन नेम सिस्टम, इंटरनेट का “फोनबुक” है, जो जटिल आईपी एड्रेस को सरल डोमेन नेम्स में ट्रांसलेट करता है, जिससे यूजर्स आसानी से वेबसाइट्स एक्सेस कर सकें। जब डीएनएस में समस्या आती है, तो यह ट्रांसलेशन प्रक्रिया बाधित हो जाती है, जिससे कनेक्शन टूट जाते हैं और ऐप्स या ब्राउज़र्स सर्वर्स तक पहुंच नहीं पाते। एज़्योर जैसे क्लाउड प्लेटफॉर्म पर लाखों साइट्स और सर्विसेज निर्भर हैं, इसलिए एक डीएनएस फेलियर चेन रिएक्शन पैदा कर सकता है, जो वैश्विक स्तर पर असर डालता है। इस आउटेज में, एएफडी के डीएनएस फेलियर ने ट्रैफिक को असंतुलित कर दिया, जिससे हेल्दी नोड्स पर लोड बढ़ गया और इंटरमिटेंट अवेलेबिलिटी की समस्या हुई। माइक्रोसॉफ्ट ने बताया कि यह चेंज गलती से हुआ, और सॉफ्टवेयर डिफ़ेक्ट ने सेफगार्ड्स को नाकाम कर दिया। विशेषज्ञों के अनुसार, डीएनएस इश्यूज अक्सर कॉन्फ़िगरेशन एरर्स या डिप्लॉयमेंट बग्स से होते हैं, जो टेस्टिंग की कमी से बढ़ जाते हैं। यूजर्स और बिजनेस को सलाह दी जाती है कि वे फेलओवर प्लान्स रखें, जैसे बैकअप डीएनएस सर्वर्स, रिडंडेंट क्लाउड प्रोवाइडर्स या ट्रैफिक मैनेजमेंट टूल्स का इस्तेमाल। यह घटना क्लाउड की कमजोरियों को उजागर करती है, जहां एक छोटी गलती पूरे इकोसिस्टम को प्रभावित कर सकती है। भविष्य में, माइक्रोसॉफ्ट जैसी कंपनियों को और मजबूत वैलिडेशन प्रोटोकॉल अपनाने होंगे, ताकि ऐसी घटनाएं दुर्लभ रहें। कुल मिलाकर, यह आउटेज डिजिटल इकोनॉमी की निर्भरता को याद दिलाता है, जहां रेजिलिएंस एक प्राथमिकता है।
