នៅក្នុងនាមជាអ្នកជំនាញ IT ដែលគ្រប់គ្រងបន្ទប់ Server ដែលមាន Dell Server ដំណើរការដោយ VMWare ESXi (មានម៉ាស៊ីននិម្មិតដូចជា AD, DNS, និង File Server) ការរៀបចំ Disaster Recovery (DR) គឺជាដំណើរការចាំបាច់បំផុតដើម្បីធានាថាប្រព័ន្ធហេដ្ឋារចនាសម្ព័ន្ធ IT របស់អ្នកអាចដំណើរការឡើងវិញបានយ៉ាងរហ័ស ក្រោយពេលមានគ្រោះមហន្តរាយ (ដូចជាគ្រោះធម្មជាតិ ឬការវាយប្រហារតាមសាយប័រ)។
ខាងក្រោមនេះគឺជាអ្វីដែលអ្នកត្រូវធ្វើលម្អិតទាក់ទងនឹង Disaster Recovery សម្រាប់ប្រព័ន្ធរបស់អ្នក៖
១. ការកំណត់គោលដៅនៃការសង្គ្រោះទិន្នន័យ (RPO និង RTO) អ្នកត្រូវកំណត់ឲ្យបានច្បាស់លាស់ជាមួយថ្នាក់គ្រប់គ្រងនូវសូចនាករទាំងពីរនេះ៖
RPO (Recovery Point Objective): តើទិន្នន័យប៉ុន្មានដែលស្ថាប័នអាចទទួលយកបានក្នុងការបាត់បង់? ឧទាហរណ៍ សម្រាប់ File Server ប្រសិនបើ RPO គឺ ១ម៉ោង អ្នកត្រូវធ្វើការ Backup ទិន្នន័យរៀងរាល់ ១ម៉ោងម្តង ដើម្បីធានាថាទិន្នន័យមិនបាត់បង់ហួសពីកម្រិតកំណត់។
RTO (Recovery Time Objective): តើប្រព័ន្ធ (AD, DNS, File Server) អាចគាំងដំណើរការ (Downtime) បានយូរបំផុតប៉ុន្មានដោយមិនធ្វើឲ្យប៉ះពាល់ធ្ងន់ធ្ងរដល់ប្រតិបត្តិការក្រុមហ៊ុន? នេះជួយកំណត់ថាតើអ្នកត្រូវចំណាយពេលលឿនប៉ុណ្ណាដើម្បី Restore ម៉ាស៊ីននិម្មិត (VMs) ទាំងអស់នោះឱ្យដំណើរការវិញ។
២. ការរៀបចំទីតាំងបម្រុង និងប្រព័ន្ធ High Availability (HA) ដើម្បីកាត់បន្ថយពេលវេលាគាំងប្រព័ន្ធ អ្នកគួររៀបចំយុទ្ធសាស្ត្រផ្តល់សេវាកម្មជាប់លាប់ (High Availability) និងទីតាំងបម្រុង៖
Active-Active ឬ Active-Passive: សម្រាប់ AD និង DNS អ្នកគួរមាន Server យ៉ាងហោចណាស់ពីរ ដើម្បីធ្វើការចែករំលែកបន្ទុក (Active-Active) ឬមួយធ្វើការនិងមួយទៀតរង់ចាំជំនួសពេលមានបញ្ហា (Active-Passive)។ ការធ្វើ Active-Active គឺល្អបំផុតព្រោះវាជួយរក្សាប្រព័ន្ធឱ្យដំណើរការជានិច្ច និងបង្កើនល្បឿនថែមទៀត។
Alternative Sites (ទីតាំងទី២): ក្នុងករណីបន្ទប់ Server ទី១ ឆេះឬខូចទាំងស្រុង អ្នកត្រូវពិចារណារៀបចំ Hot site (ទីតាំងមានម៉ាស៊ីន Server ដើរស្រាប់ និងទិន្នន័យដូចគ្នា), Warm site (ទីតាំងដែលមានឧបករណ៍តិចតួចគ្រាន់តែអាចឱ្យប្រព័ន្ធដំណើរការបាន), ឬ Cold site (ទីតាំងដែលមានត្រឹមតែបន្ទប់ទទេរងចាំយកឧបករណ៍ទៅដាក់) ដោយផ្អែកលើទំហំថវិកាស្ថាប័នរបស់អ្នក។
៣. ការការពារបរិស្ថានក្នុងបន្ទប់ Server (Physical Protection) Disaster មិនមែនមានត្រឹមតែការវាយប្រហារតាមសាយប័រទេ តែរួមបញ្ចូលទាំងបញ្ហាអគ្គិសនី និងបរិស្ថានក្នុងបន្ទប់ផងដែរ៖
ថាមពលអគ្គិសនីបម្រុង (UPS & PDU): អ្នកត្រូវបំពាក់ UPS នៅក្នុងទូ Rack ដើម្បីទប់ភ្លើងនៅពេលដាច់អគ្គិសនី និងការពារបញ្ហាភ្លើងលោតខ្លាំង (Surges) ដែលអាចបំផ្លាញ Dell Server។ អ្នកក៏ត្រូវប្រើប្រាស់ PDU ដើម្បីបែងចែកចរន្តអគ្គិសនីទៅកាន់ឧបករណ៍នីមួយៗក្នុង Rack ឱ្យមានសណ្តាប់ធ្នាប់ផងដែរ។
ការគ្រប់គ្រងសីតុណ្ហភាព និងសំណើម: បន្ទប់ Server ត្រូវរក្សាសំណើម (Relative Humidity) ចន្លោះពី 45% ទៅ 55% (ការពារកុំឲ្យមានកម្តៅអគ្គិសនីស្ទាក់ ឬច្រែះ) និងរក្សាសីតុណ្ហភាពចន្លោះពី 64 ទៅ 81 ដឺក្រេហ្វារិនហៃ (17-27°C) ដើម្បីការពារកុំឲ្យម៉ាស៊ីនឡើងកម្តៅខ្លាំង (Overheating)។
ប្រព័ន្ធពន្លត់អគ្គិភ័យ: ត្រូវដំឡើងប្រព័ន្ធពន្លត់អគ្គិភ័យប្រភេទឧស្ម័ន (Gas-based) ដូចជា FM200 ជាដើម ព្រោះវាមិនចម្លងចរន្តអគ្គិសនី និងមិនបន្សល់ស្នាមប្រឡាក់ដែលអាចខូចខាតដល់ Dell Server នៅពេលវាបាញ់ពន្លត់។
៤. ការ Backup ការកំណត់រចនាសម្ព័ន្ធ (Configuration Backups) ក្រៅពីការ Backup ទិន្នន័យ File Server អ្នកក៏ត្រូវតែ Backup Configuration របស់ឧបករណ៍បណ្តាញ (Switches/Routers) និងម៉ាស៊ីន VMWare ESXi ព្រមទាំង VMs ទាំងអស់ (AD, DNS) ផងដែរ ដើម្បីធានាថានៅពេលមានបញ្ហាខូចខាត អ្នកអាចទាញយកការកំណត់ទាំងនោះមកប្រើវិញបានភ្លាមៗដោយមិនចាំបាច់ចំណាយពេល Setup ពីសូន្យឡើងវិញ។
៥. ការធ្វើតេស្តផែនការសង្គ្រោះ (Tabletop Exercises & Testing) ការមានត្រឹមតែឯកសារផែនការ Disaster Recovery គឺមិនគ្រប់គ្រាន់ទេ។ ក្នុងនាមជា IT អ្នកត្រូវធ្វើការសាកល្បងអនុវត្តន៍ជាក់ស្តែង៖
រៀបចំការសាកល្បង Tabletop Exercises ដោយប្រមូលផ្តុំក្រុមការងារមកពិភាក្សាអំពីសេណារីយ៉ូគ្រោះអាសន្នផ្សេងៗ (ឧទាហរណ៍៖ ចុះបើ Dell Server រលត់ឈឹង? ចុះបើមាន Ransomware វាយប្រហារ File Server?) ដើម្បីស្វែងរកចំណុចខ្វះខាតនៅក្នុងផែនការ និងកែលម្អវាឱ្យកាន់តែប្រសើរ។
ត្រូវតែធ្វើការសាកល្បង Restore ទិន្នន័យ និងបើកដំណើរការ VMs ចេញពី Backup ឱ្យបានជាប្រចាំ ដើម្បីប្រាកដថាប្រព័ន្ធ Backup ពិតជាដំណើរការបានជោគជ័យ និងអាចសង្គ្រោះបានទាន់ពេល។

0 comments:
Post a Comment