تعریف آرشیو داده ها یا Data Archiving Definition

تعریف آرشیو داده ها یا Data Archiving Definition

هر سازمانی نیاز به یکسری فرم جهت استراتژی بایگانی خود دارد .

در این مقاله یکسری راهنمایی ها و  شیوه هایی که میتواند به شما کمک کند تا

بتوانید روشی برای ایجاد آرشیو خود در نظر بگیرید گفته شده است .

 

بهترین روشهای بایگانی اطلاعات :

تفاوت بین بایگانی یا آرشیو اطلاعات با پشتیبان گیری از اطلاعات یا backup

یکی  از شایع ترین سوالاتی که بهتر است به آن توجه کنیم این است

“تفاوت بین پشتیبان گیری یا backup با بایگانی یا Archive چیست ؟

بایگانی داده یا archive  اغلب با backup اشتباه گرفته میشود. Backup  یا پشتیبان گیری داده ها

به جهت بازیابی اطلاعات در موقع لزوم می باشد .مثلا موقعی که داده ها ی ما گم شده اند یا

خراب شده اند یا نابود شده اند  . در مقابل بایگانی داده ها یا Archive یعنی محافظت از داده های قدیمی تر .

 داده های آرشیو ، در زمان عملیات کسب و کار روزمره مورد نیاز نیست .

اما ممکن است گاهی نیاز به دسترسی به آنها داشته باشیم.

بعنوان یک مهم در هر سازمانی بهتر است که بهترین شیوه های بایگانی داده ها را بیاموزیم .

همچنین یادگیری استراتژی های موثر آرشیو داده ها بعنوان بخش ضروری؛ در هر سازمان

فناوری اطلاعات محسوب میشود .

آرشیو یا بایگانی داده ها یعنی عمل انتقال داده ها به جایی  یا به یک دستگاه ذخیره سازی

دیگر که فعلا مورد استفاده ما نمی باشد .

معمولا در سازمانها بهتر است یک کارشناس مسئول عملیات backup  و یک مشاور ارشد

وجود داشته باشند تا بصورت یک پردازش  بلند مدت مسئله backup  و archive را مورد

بررسی قرار دهند.

بایگانی اطلاعات یعنی

” یک مجموع یا مجموعه ای از سوابق تاریخی ” که به طور خاص برای نگهداری در دراز مدت

در نظر گرفته میشود و بعنوان مرجعی در آینده برگزیده میشود .

بعلاوه آرشیو داده ها شامل داده های قدیمی تر می باشد که برای مرجع آینده هنوز

مهم و ضروری می باشد و یا داده هایی که باید برای انطباق قانونی حفظ شوند .

مثلا داده های مربوط به حساب بانکی و پردازشهای بانکی و صورتحسابهای کارتهای

شتاب از جمله داده هایی هستند که در زمان وقوع خطا نیاز به بررسی آنها داریم .

مکانیزم آرشیو داده ها بصورت ایندکس بوده بنابراین دارای قابلیت جستجو بوده

تا فایل ها و قطعات فایل ها بتوانند به آسانی مورد بازیابی قرارگیرند .

در این مقاله چند تکته برتر در مورد پشتیبان گیری یا Backup

 در مقابل Archive یا آرشیو داده را جمع آوری کرده ام .

در این مقاله می آموزیم چرا نباید فایل backup  خود را بعنوان Archive یا

فایل بایگانی استفاده کنیم .

همچنین اینکه از Tape یا disk یا چه فضای ذخیره سازی بهتر است استفاده کنیم سخن گفته ام .

اینکه برای آرشیو کردن از تکنولوژی Cloud یا ابر استفاده کنید بهتر است یا خیر و چگونه

ابری را انتخاب کنید نیز صحبتهایی کرده ام .

بعلاوه می آموزیم که چگونه داده های خود را قبل از تهیه نسخه پشتیبان بایگانی نماییم

تا حجم backup  داده ها را  کاهش دهیم .

۱- بهتری روش آرشیو  داده ها  یا Data Archiving

 

پشتیبان گیری داده ها در مقابل آرشیو داده ها یا همان Backup data .vs. Archive data

بحث تفاوت backup  و Archive سالیان سال است که ادامه دارد و همیشه متخصصان

این فن میگویند که “backup  به معنی Archive نیست “.

فروشندگان نرم افزارهای پشتیبان گیری و آرشیو داده ها  شروع به ادغام عملکرد های

مختلف در نرم افزار خود کرده اند ،

بنابراین آیا هنوز طرح این سوال درست است که backup  همان Archive نیست

بعضی از این ویژگی هایی که این کمپانی ها به نرم افزارهای خود اضافه کرده اند

سهولت ذخیره سازی و مدیریت   داده کاوی یا  deduplication data   و چرخه حیات داده

یا data lifecycle می باشد .

آیا با توجه به اضافه شدن این ویژگی ها backup  میتواند کلیه وظایف مورد نظر در Archive

را تحت پوشش قراردهد

 

 ۲- بهترین شیوه آرشیو داده ها یا Data Archiving

هیچگاه از فضای ذخیره سازی بایگانی یا Archive storage خود برای ذخیره سازی backup  استفاده نکنید .

یکی دیگر از تمایزهای مهم بین backup  و Archive در نحوه استفاده از فضای ذخیره سازی آنها می باشد .

یادتان باشد که هدف از تهیه فایل پشتیبان یا backup  برای بازیابی داده ها در زمان رخداد فاجعه می باشد .

یعنی عملیات backup  صرفا برای بازیابی داده در زمان مورد نیاز می باشند . اما Archive ها یا آرشیو داده ها

برای کشف داده ها یا discovery داده می باشد .

backup  بمنظور بازیابی فایل های خراب بکار میرود . پس اگر شما بصورت تصادفی برخی از

فایل های خود را حذف کرده باشید و نیاز به بازگردانی به صورتی که قبلا از آن استفاده میگردید

داشتید،اگر backup  داشته باشید جای هیچ نگرانی نیست .

علاوه بر این، نرم افزارهایی که بصورت سنتی عملیات backup  را انجام میدهند

در آرشیو داده ها نمی توانند کمکی به ما بکنند؛بنابراین مهم است که همیشه

برای آرشیو داده ها از نرم افزارهای جداگانه ای استفاده نماییم .

در ضمن یادمان باشد که فضای ذخیره سازی backup  از Archive جدا باشد .

۳- آرشیو داده ها با نوار  Tape ، دیسک Disk یا ابر Cloud

انجمن صنعت شبکه سازی Storage Networking Industry Associations  که بصورت مخفف با SNIA نمایش داده میشود

آرشیو یا Archive را به این صورت معنی کرده است :

مجموعه ای از اشیاء داده یا data objetives  که ممکن است فرا داده های مرتبط (metadata) با خود داشته باشند

و در یک سیستم ذخیره سازی نگهداری میشوند و

هدف اولیه آن حفظ و نگهداری طولانی مدت این داده می باشد .

علاوه بر این انتظار نمی رود , اطلاعاتی که آرشیو شده است به راحتی قابل جستجو باشد.

این تعریف به نظر ساده است ؛

 اما مشکلات زیادی برای مدیران سیستم عامل یا sysadmin ها فراهم می کند .

به عنوان مثال، نوع رسانه اطلاعات ذخیره شده یا فضایی که برای ذخیره داده ها بکار میبرید ؛

 بر روی سرعت و سهولت بازیابی آن ، تاثیر می گذارد.

سه مورد از انتخاب های اساسی برای آرشیو دادها عبارتند از  نوار یا Tape ، دیسک disk

 و ابر Cloud است.

اما از بین این فضاهای ذخیره سازی  کدام را انتخاب کنیم ؟برای سازمان ما

 کدام بهترین است ؟  کدام گران ترین است؟

۴- بهترین شیوه آرشیو  Data Archiving

 

استفاده از خدمات آرشیو ابر یا Cloud Archive

میدانیم که این روزها با توجه به گستردگی مفهوم ابر یا cloud ,

سازمانهای بیشتری  برای استفاده از خدمات ذخیره سازی ابر استفاده می کنند.

با اینکه ممکن است این سرویس دهندگان ابر زیاد باشند اما تنها دو سرویس دهنده

ذخیره سازی آنلاین بصورت ابر برای ذخیره داده ها وجود دارند

که عبارتند از

 Autonomy Zantaz و Iron Mountain Inc.

در مورد خدمات و چگونگی انتخاب بهترین ارائه دهنده سرویس ابری برای بایگانی

بین این دو شرکت بعدا صحبت خواهیم کرد

 

۵- بهترین شیوه آرشیو داده یا Data Archiving

چگونه میتوانیم با آرشیو داده ها حجم داده های ذخیره شده را کاهش دهیم .

در بسیاری از سازمانها این جمله را  میشنویم

“انجام آرشیو بیشتر با حجم کمتر”

یعنی در زمانی که در حال کنترل کردن رشد داده های سازمان خود می باشیم ,

داده های غیر فعال یا داده هایی که دیگر استفاده نمیکنیم را از چرخه  backup گیری

خارج کنیم .

یعنی کاربران یا افرادی که مسئول عملیات آرشیو و backup گیری هستند چنانچه در این فرآیند

داده های غیر فعال را از چرخه خارج کنند حجم اطلاعات backup  را تا حد زیادی کاهش خواهند داد .

 

آرشیو Archiveدر مقابل پشتیبان گیری backup  و چرا شما نیاز به دانستن تفاوت ها آنها دارید

عملیات backup عمدتا برای بازیابی داده مورد استفاده قرار میگیرند تا سریعا بتوان فایل

یا پایگاه داده ای خراب شده را به حالت اول برگرداند .

در backup  تمرکز روی سرعت هم در زمان پشتیبان گیری است و هم در زمان بازیابی

داده می باشد . بنابراین مسئله یکپارچکی داده ها بسیار در این امر مهم می باشد .

در آرشیو سرعت اهمیت کمتری دارد . آنچه در آرشیو مهم است جستجو در داده های

بایگانی شده می باشد .

در آرشیو آنچه اهمیت دارد توانایی در اندازه گیری یکپارچگی داده ها و حفظ داده ها

در مدت زمان طولانی می باشد .

گاهی نیاز داریم که آرشیو داده هایمان را برای ده ها سال نگهداری نماییم مثل تصاویر

ما از آرشیو اطلاعات برای کارهای تحقیقاتی میتوانیم استفاده نماییم .

برنامه های آرشیو ایمیل ها اغلب دارای برنامه ای برای ایجاد آرشیو جداگانه هستند .

چنانچه ایمیل های شما در داخل یک دیتا بیس ذخیره گردند میتوان از مفهوم backup گیری

در دیتا بیس برای پشتیبان گیری ایمیل ها استفاده نمود .

این در حالیست که مفهوم آرشیو داده های اصلی ایمیل ها روی دیسک هم بحث دیگری

است که باید بصورت جداگانه نیز انجام گیرد تا خللی در صحت ایمیل کاربران رخ ندهد .

چنانچه مجبور به استفاده از ترکیب آرشیو و پشتیبان بر روی یک platform بودید

باید ببینید که اهداف مورد انتظار شما از فرآیند پشتیبان گیری و آرشیو در سازمان

شما چیست و بر اساس آن platform خود را انتخاب نمایید .

 

 

آیا نوارها  یا Tape میتوانند برای بایگانی استفاده شوند؟

 

در حالی که اکثریت قریب به اتفاق سازمانها نوار را برای آرشیوهای طولانی مدت خود در نظر می گیرند،

و شرکت هایی مانند Index Engines Inc. توانایی به طور موثر جستجوی داده ها را روی نوار  فراهم می کنند

, اما بهتر است متوجه تعداد بارهایی که روی نوار مینویسیم هم باشیم .

درست همانطور که دیسک بعنوان یک محل ذخیره سازی محبوب در امر backup  گیری تبدیل شده است

نگرانی هایی نیز در مورد بازیابی داده های ذخیره شده روی نوار نیز وجود دارند

میدانیم که داده های ذخیره شده روی نوار ها قرار است برای مدت طولانی در قفسه ها نگهداری شوند

بنابراین بحث آسیب پذیر بودن این فضای ذخیره سازی و نحوه نگهداری آن , نوع تکنولوژی بکار رفته در آن

همه باید مورد توجه قرار گیرد .

فرض کنید داده ای دارید که

۷ سال پیش آنرا با استفاده از تکنولوژی LTO-1 یا LTO-2 ذخیره کرده اید و حالا میخواهید آنرا با تکنولوژی

DLT بازیابی کنید , چقدر احتمال دارد که این داده ها بدرستی خوانده و بازیابی گردند .

آیا تمام سخت افزارهای مرکز داده شما برای خواندن این tape بدرستی کار میکنند .

حتی اگر سخت افزار کار میکند چگونه میخواهید یک قطه داده را که هفت سال

ذخیره کرده اید از میان صدها و شاید هزاران نوار پیدا کرده و بازیابی نمایید .

بسیاری از برنامه های backupگیری متادیتا را به مدت طولانی در خود ذخیره نمیکنند .

ماکزیمم بین ۹۰ تا ۱۲۰ روز متادیتا نگهداری میشود و بعد از آن بستگی به مهارت بازیابی

اطلاعات بر اساس حدس و گمان و اسکن دستی و صرف زمان طولانی در این راستا می باشد .

آیا باید از دیسک برای بایگانی استفاده کنید؟

فکر کردن به نگه داشتن همه بایگانی ها در دیسک ممکن است غیرممکن و پرهزینه باشد، اما

شرکت هایی مانند EMC Corp.، شرکت Hewlett-Packard و Permabit Technology Corp.

تکنولوژی ای را ارائه داده اند که میتوان برای آرشیو از دیسک استفاده نمود که شاید ۲۵ یا ۵۰ یا حتی ۱۰۰ سال

قبل رویایی بیش نبود .

اما امروزه وقتی صحبت از disk drive میکنیم منظور ما همان disk drive صد سال قبل نیست .

با اینکه دیسک باعث میشود روند پشتیبان گیری خیلی واقع بینانه تر از tape انجام گیرد

اما بهترین روش در بایگانی و آرشیو داده ها این است که یک سیستم خاص و مشخص برای بایگانی

داده های خود در نظر بگیریم . بازیابی داده های آرشیو و زمان بازیابی و علت بازیابی این داده ها

با داده هایی که بصورت backup  ذخیره کرده ایم متفاوت میباشد . پس بهتر است سیستم های ذخیره سازی

آنها نیز مستقل باشند و هر کدام رادر زمان خود مورد استفاده قرار دهیم .

در روش های آرشیو که مبتنی بر ذخیره روی دیسک می باشد اکثر این فضاهای بصورت یک نقطه اتصال

به شبکه معرفی میشوند مانند NFS   یا  CIFS

این روشها از هفت سال پیش تا بحال تفاوتی در mount شدن نکرده اند .

یکی از نکات مهم در بحث backup  و Archive , این است که حتما هر چند وقت یکبار اقدام به بازیابی اطلاعات

از روی فضاهای ذخیره سازی نماییم تا از صحت این اطلاعات مطمئن شویم .

داستانی را تعریف میکنم مربوط به بیست سال قبل که در یک مرکز داده از اطلاعات مهمی

همیشه backup  دیتابیس روی دیسک بصورت ارتباط شبکه ای گرفته میشد و نه تنها یک نسخه بلکه سه یا چهار نسخه

روی دیسکهای ۳۶۰ که حجم بیشتری از فلاپی های قدیمی داشتند اما چون حتی یک بار هم صحت آنها بررسی نشده بود

در یک روز که برق رفت و دیتابیس بالا نیامد و نیاز به بازیابی داده ها از دیسک backup بود متوجه شدند که کلیه دیسک ها خراب

شده است و داده های روی آنها صدمه دیده است .

البته دراین پروسه با همکاری یکی از همکاران مجرب خود توانستیم با ترفندهای غیرمعمول اکثر داده ها را بازیابی نماییم که

پروسه ای طولانی و سخت بود .

برای همین همیشه علاوه بر backup  از دیتا بیس یا دیسک حتما آرشیوهای لازم را نیز تهیه نمایید .

امیدوارم این مقاله مفید واقع شده باشد .

لطفا نظرات , سوالات و پیشنهادات خودتان را برای ما به اشتراک بگذارید .

 

 

 

 

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *