آموزش رایگان Data Storage Networking؛ آرایههای ذخیرهساز چه مزایایی دارند؟
آرایههای ذخیرهساز مزایای بالقوهای در اختیار سازمانها قرار میدهند، با اینحال، مشکلات خاص خود را دارند که زمان تأخیر یکی از آنها است. البته این زمان تأخیر تنها برای کاربردهای کاملاً حساس به زمان محسوس است، در ارتباط با چنین محیطهایی پیشنهاد میشود از رسانههای ذخیرهسازی محلی استفاده کنید. در این مقاله فالنیک با مزایا و معایب آرایهها و مؤلفههای داخلی آنها بیشتر آشنا میشویم.
برای خرید استوریج با مشاوره رایگان و گارانتی معتبر و همچنین دریافت قیمت استوریج hp میتوانید روی لینک بزنید.
- ویژگی تکثیر هوشمندانه و کاربرد آن در حافظههای فلش
- فلش برای محیطهای مبتنی بر سرور مجازی
- عملکرد لایه 0 در مقابله لایه 1
- مزایای آرایه ذخیرهسازی
- معایب آرایه ذخیرهسازی
- کالبدشکافی یک آرایه ذخیرهسازی
ویژگی تکثیر هوشمندانه (Deduplication) و کاربرد آن در حافظههای فلش
شرکتها برای آنکه هزینه تمام شده هر ترابایت آرایه تمام فلش را کاهش دهند، نیازمند بهکارگیری فنآوریهای کاهندهای مثل تکثیر هوشمندانه (deduplication) و فشردهسازی (compression) هستند. تکثیر هوشمندانه به این صورت عمل میکند که رکوردهای تکراری و دادههایی که باعث بروز مشکل افزونگی دادهها میشوند را حذف میکند. این تکنیک نه تنها تاثیر قابل توجهی بر استفاده درست از فضای ذخیرهسازی دارد، بلکه در محیطهای مبتنی بر SAN کمک میکند تا بستههای دادهای کمتری ارسال شود.
در دنیای رسانههای فلش، تکنیک فوق به این صورت عمل میکند که تنها یک نمونه از داده روی حافظه فلش ذخیره و برای دادههای تکراری از اشارهگری برای ارجاع به نسخه اصلی دادهها استفاده میشود. در شرایطی که تکنیک تکثیر هوشمندانه و ذخیرهسازی هوشمندانه (Intelligent and Deduplication Compression) اساسا برای هارد دیسکها طراحی شده است، اما شرکتها از این تکنیک در ارتباط با حافظههای فلش و به صورت کپیبردارهای درون خطی استفاده میکنند تا عملکرد را به بالاترین حد ممکن برسانند. در اینجا پردازندههای مرکزی از ویژگی offload، الگوریتم هش و تطابق بیتی برای تکثیر هوشمندانه استفاده میکنند تا فضای ذخیرهسازی به شکل بهینهای استفاده شود.
اگر دادههایی از قبل وجود داشتهاند، یک مقایسه سریع بیت به بیت میان دادههای هش شده و دادههای واقعی انجام میشود. این مقایسه بیتی در رسانههای فلش سریع است، زیرا آنها در عملیات خواندن بهترین هستند، در حالی که فرآیند فوق روی هارد دیسکها آهسته است. برای پیادهسازی موثر deduplication درون خطی در ارتباط با هارد دیسکها به الگوریتمهای هش قدرتمندی نیاز است تا مقایسه بیت به بیت با زمان تاخیر کمتری انجام شود، زیرا این فرآیند سیکلهای کاری زیادی از پردازنده مرکزی را به خود اختصاص میدهد.
شرکتها برای حل این مشکل از یک کش متوسط در رسانههای حالت جامد استفاده میکنند تا فرآیند هش به شکل غیر همزمان و پس از اینکه پیام ACK توسط میزبان صادر شد، انجام شود.
در حالت کلی، Deduplication مشکل دادههای غیر پیوسته (noncontiguous) را بهوجود میآورد که تأثیر زیادی بر عملکرد هارد دیسکها میگذارد، بهطوری تاخیر زیاد در جستوجو و چرخش بیشتر صفحات را به همراه دارد. هیچ یک از این دو مشکل در ارتباط با معماریهای مبتنی بر فلش وجود ندارد.
البته Deduplication برای همه آرایههای تمام فلش و بهویژه آنهایی که عملکرد فوقالعاده بالایی دارند مناسب نیست. اما برای سایر رسانههای ذخیرهساز (tier 1)، بهکارگیری deduplication ضروری است.
نکته: در ارتباط با مبحث ذخیرهسازی لازم است اطلاعات اولیهای در ارتباط با دو اصطلاح لایه (tier) و لایهبندی (tiering) داشته باشید. در دنیای فناوری اطلاعات، برداشتهای مختلفی در ارتباط با این دو اصطلاح وجود دارد. یک برنامه تجاری مهم در یک سازمان ممکن است یک برنامه کاربردی لایه یک توصیف شود، در حالی که برخی منابع به آرایههای ذخیرهساز پیشرفته در قالب مفهومی بهنام آرایههای ذخیرهساز لایه یک اشاره میکنند. از اصطلاح لایه برای اشاره به درایوها نیز استفاده میشود. درایوهای لایه یک سرعت بسیار زیادی دارند و بالاترین عملکرد را ارائه میکنند، در حالی که درایوهای لایه سه کندترین هستند که عملکرد پایینی دارند. دقت کنید صنعت ذخیرهسازی از اصطلاح لایه 0 برای اشاره به درایوها و آرایههای ذخیرهسازی با کارایی استفاده میکند.
فلش برای محیطهای مبتنی بر سرور مجازی (Flash for Virtual Server Environments)
فناوریهای هایپروایزر بر مبنای الگویی رفتار میکنند که صنعت ذخیرهسازی از اصطلاح اثر مخلوط ورودی/خروجی (I/O blender effect) برای توصیف آنها استفاده میکند. بهطوری که دهها ماشین مجازی روی یک سرور فیزیکی اجرا میشوند. اجرای این حجم کاری روی یک سرور فیزیکی باعث میشود تمام عملیات ورودی/خروجی روی سرور شکل تصادفی پیدا کنند، درست مثل اینکه مواد غذایی مختلفی را در یک مخلوطکن بریزید و با هم ترکیب کنید. هارد دیسکها در عملیات ورودی و خروجی تصادفی عملکرد جالبی ندارند. رسانههای ذخیرهساز حالت جامد، عملکرد بهتری در زمینه دارند و در نتیجه آرایههای تمام فلش بهترین گزینه برای مبحث مجازیسازی هستند.
برای خواندن مقاله آموزش رایگان Data Storage؛ LUN چیست و کش چه نقشی در آرایههای ذخیرهساز دارد؟ کلیک کنید.
عملکرد لایه 0 (Tier 0) در مقابله لایه 1 (Tier 1)
در ارتباط با آرایههای فلش دو انشعاب بزرگ وجود دارد که باید در مورد آنها اطلاع داشته باشید. برخی فروشندگان آرایههای فلش مبتنی بر لایه 0 را به بازار ارائه میکنند که عملکرد فوقالعاده عالی دارند و معیار ارزیابی آنها دلار بر حساب عملکرد ورودی و خروجی ($/IOP) است. این آرایهها بهترین عملکرد را در دنیای ذخیرهسازی هستند و قادر به مدیریت میلیونها IOPS هستند. آرایههای تمام فلشی نیز وجود دارند که بازار ذخیرهسازی لایه 1 را هدف قرار میدهند. این آرایهها عملکرد بالاتر و قابل پیشبینیتری نسبت به آرایههای مبتنی بر هارد دیسکهای لایه 1 دارند، اما عملکرد محدودهتری در ارتباط با عملیات ورودی/خروجی نسبت به آرایههای لایه صفر نشان میدهند. این آرایهها بیشتر بر ویژگیها، قابلیتها و پیادهسازی مقرون به صرفه رسانههای ذخیرهساز و تمرکز بر مباحثی مثل deduplication متمرکز هستند، بهطوری که اختلاف قیمتی که نسبت به هارد دیسکها دارند خرید آنها را توجیهپذیر میکند.
مزایای آرایه ذخیرهسازی (Storage Array Pros)
آرایههای ذخیرهسازی به شما این امکان را میدهند که منابع ذخیرهسازی را یکپارچه کنید و از ظرفیت و عملکرد به شکل بهینهتری استفاده کنید. از منظر عملکرد، با موازی کردن دسترسی به منابع بالاترین سطح از عملکرد و ظرفیت را ارائه میکنند.
ظرفیت (Capacity)
از منظر ظرفیت، آرایههای ذخیرهسازی مانع بروز مشکل جزایر ظرفیت (capacity islands) میشوند. جزایر ظرفیت به حالتی اشاره دارند که شما رسانههای ذخیرهسازی در اختیار دارید که به شکل گسسته و بدون یک مدیریت جامع در دسترس کاربران قرار دارند. فرض کنید 10 سرور با 1 ترابایت حافظه محلی دارید. در پنج مورد از سرورها فضایی بیش از 900 گیگابایت مصرف شده است، اما باز هم به فضای ذخیرهسازی بیشتری نیاز است، در حالی که در پنج سرور دیگر تنها از 200 گیگابایت فضای خالی آنها استفاده شده است. از آنجایی که این فضای ذخیرهسازی به صورت محلی به یکدیگر متصل شدهاند، هیچ راهی وجود ندارد که به پنج سروری که ظرفیت آنها رو به اتمام است اجازه دهیم از ظرفیت اضافی پنج سروری که هر کدام فقط 200 گیگابایت ظرفیت آنها مصرف شده دسترسی پیدا کنیم. این مسئله باعث بروز مشکل کاهش ظرفیت میشود.
فرض کنید 10 ترابایت ظرفیت روی یک آرایه ذخیرهسازی داریم که در دسترس هر 10 سرور است. کل ظرفیت موجود را میتوان به صورت پویا بین 10 سرور متصل به اشتراک گذاشت. در این حالت هیچ ظرفیت بلااستفاده و رها شدهای (جزیره) وجود ندارد.
مدیریت (Management)
اگر فضای ذخیرهسازی به شکل محلی به 10 سرور متصل شود، 10 نقطه مدیریت وجود دارد. اما اگر از یک آرایه ذخیرهسازی استفاده کنید، فضای ذخیرهسازی این سرورها را میتوان از یک نقطه مرکزی مدیریت کرد. تصور کنید، محیطی متشکل از صدها یا حتی هزاران سرور دارید که آرایه ذخیرهسازی در آنها وجود ندارد و باید فضای ذخیرهسازی هر یک از سرورها را به شکل جداگانه مدیریت کنید!
عملکرد پیشرفته (Advanced Functionality)
آرایههای ذخیرهسازی معمولاً ویژگیهای پیشرفتهای از جمله تکثیر، اسنپشاتها، فشردهسازی دسترسپذیری بالا، provisioning، deduplication و پشتیبانی بهتر از فناوریهای مجازیسازی به ویژه در ارتباط با بارگذاری سیستمعامل/هیپروایزر را ارائه میدهند. درست است که ابر برتری آرایههای ذخیرهساز را به چالش کشیده و فروشندگان آرایههای ذخیرهساز را مجبور کرده تا قابلیتهای کارآمدتری برای مقابله با مکانیزمهای ابری ارائه کنند، اما بازهم آرایههای ذخیرهسازی مخاطبان خاص خود را دارند.
افزایش قابلیت اطمینان (Increased Reliability)
تا زمانیکه یک آرایه ذخیرهسازی حداقل دو کنترلکننده داشته باشد، مانند یک سیستم کنترلکننده دوگانه، بازهم میتوان از آرایه بدون آنکه نگران از دست رفتن دادهها باشیم استفاده کنیم و مولفه خراب را جایگزین کنیم. تا زمانی که مولفه خراب جایگزین شود، عملکرد کاهش پیدا میکند، اما این اطمینان خاطر وجود دارد که اطلاعات خود را از دست نخواهید داد. این موضوع در ارتباط با رویکردهای ذخیرهسازی اتصال مستقیم (DAS) و زمانی که رسانه ذخیرهساز مستقیماً در یک سرور نصب میشود، صادق نیست. در رویکرد DAS، خرابی مادربرد سرور یا کنترلر حافظه داخلی ممکن است باعث از دست رفتن اطلاعات سیستم شود.
معایب آرایه ذخیرهسازی (Storage Array Cons)
اگرچه آرایههای ذخیرهساز نقاط مثبت زیادی دارند، اما اشکالاتی نیز دارند. در این بخش نگاهی به برخی از مشکلات رایج خواهیم داشت.
تاخیر (Latency)
تأخیر یکی از بزرگترین مشکلاتی است که پیرامون آرایههای ذخیرهساز قرار دارد. حتی با داشتن سریعترین و با کمترین تأخیر شبکه ذخیرهسازی، همیشه زمان تأخیر خواندن و نوشتن در یک آرایه ذخیرهسازی بیشتر از خواندن و نوشتن روی یک دیسک محلی از طریق یک گذرگاه PCIe داخلی است. در مواردی که نیازمند تأخیر بسیار کم هستیم، ممکن است یک مکانیزم ذخیرهسازی محلی عملکرد بهتری ارائه دهد. اگر به IOPS تصادفی بالا همراه با تأخیر کم نیاز دارید، فلش مبتنی بر PCIe که به صورت محلی به سیستم متصل است، ممکن است بهترین گزینه باشد. امروزه آرایههای ذخیرهسازی به طیف گستردهای از نیازهای تجاری سازمانها بدون مشکل پاسخ میدهند. تنها در کاربردهایی که نیازمند کمترین زمان تاخیر هستید باید به سراغ مکانیزمهای ذخیرهسازی اتصال محلی بروید.
قفل کردن (Lock-in)
یکی از بزرگترین مشکلات شرکتها این است که تنها به فکر خرید آرایههای ذخیرهساز هستند و نگاه خاصی به مقوله نگهداری مداوم ندارند و حتی بودجهای برای این منظور اختصاص نمیدهند. آمارها نشان میدهند آرایههای ذخیرهساز در بازههای زمانی چهار تا پنج سال باید جایگزین شوند.
چرخه انتقال خدمات به یک آرایه ذخیرهساز جدید به عنوان بخشی از فرآیند به روزرسانی فناوری باید در چک لیست فرآیندهای تجاری سازمان درج شود. در حالی که فناوریها برای آسانتر کردن روند مهاجرتها پدید آمدهاند، اما هنوز هم چالشهای خاص خود را دارند. هنگام خرید فضای ذخیرهسازی، مطمئن شوید که الزامات فناوری جدید را در نظر گرفتهاید. هنگامی که قصد بهروزرسانی دارید و مجبور هستید به یک پلتفرم ذخیرهسازی جدید عزیمت کنید، باید به هزینههای جانبی دقت خاصی داشته باشید.
هزینه (Cost)
آرایههای ذخیرهساز گران هستند. البته بخش عمدهای از هزینهها به فروشندهای که قصد معامله با آن را دارید بستگی دارد. اگر از یک فروشنده قیمت بالایی را دریافت کردید، عجله نکنید و قیمتهای ارائه شده توسط فروشندگان دیگر را نیز بررسی کنید. دقت کنید قبل از هرگونه خریدی ابتدا تحقیق کنید و یک فروشنده قابل اعتماد را پیدا کنید.
کالبدشکافی یک آرایه ذخیرهسازی (The Anatomy of a Storage Array)
در شکل زیر مولفههای اصلی یک آرایه ذخیرهسازی را مشاهده میکنید. ما از قسمت جلویی شروع میکنیم و راه خود را از طریق آرایه، تا پشت (از چپ به راست) آرایه ادامه میدهیم.
قسمت جلویی
قسمت جلویی آرایه ذخیرهساز مکانی است که آرایه با شبکه ذخیرهسازی و میزبانها ارتباط برقرار میکند، در اینجا دروازههای ورودی و خروجی آرایه را مشاهده میکنید. این دو بخش، مکانهایی هستند که بخش عمدهای از اتفاقات در آنجا رخ میدهد.
اگر اطلاعاتی در ارتباط با SCSI داشته باشید به خوبی میدانید که پورتهای جلویی در یک آرایه ذخیرهساز SAN نقطه شروع انجام ورودی/خروجی با میزبانها هستند، در حالی که HBA در میزبان به عنوان آغازگر SCSI عمل میکند. اگر آرایه شما یک آرایه NAS است، درگاههای جلویی، نقاط پایانی شبکه با آدرسهای آیپی و نامهای میزبان سیستم نام دامنه (DNS) هستند.
پورتها و اتصالات (Ports and Connectivity)
سرورها با یک آرایه ذخیرهسازی از طریق پورتهای جلویی ارتباط برقرار میکنند که اغلب به آنها پورتهای فرانت اند گفته میشود. تعداد و نوع پورتهای فرانت اند به نوع و اندازه آرایه ذخیرهساز بستگی دارد. آرایههای سازمانی بزرگ میتوانند صدها پورت جلویی داشته باشند و بسته به نوع آرایه ذخیرهسازی، این پورتها از فناوریهای FC، SAS، و اترنت (پروتکل های FCoE و iSCSI) پشتیبانی میکنند.
اکثر آرایههای ذخیرهساز رده بالا دارای پورتهای جلویی قابل تعویض هستند، وقتی یک پورت از کار میافتد، حتی در شرایطی که آرایه آنلاین است، امکان جایگزین کردن وجود دارد تا عملیات I/O بدون مشکل انجام شود.
میزبانها (Hosts) میتوانند به روشهای مختلف به آرایههای ذخیرهساز متصل شوند، مثل اتصال کابل به طور مستقیم از سرور به آرایه ذخیرهسازی در یک رویکرد اتصال مستقیم یا اتصال از طریق شبکه. میتوان چندین اتصال یا مسیر بین یک میزبان و یک آرایه ذخیرهسازی به وجود آورد که البته همه آنها نیازمند مدیریت هستند.
اتصال مستقیم (Direct Attached)
میزبانها میتوانند مستقیماً و بدون آنکه نیازی به سوئیچ SAN باشد یک اتصال مستقیم را از طریق پورتهای جلویی برقرار کنند. اتصال مستقیم در استقرارهای کوچک مورد توجه کارشناسان قرار دارد، اما مقیاسپذیری خوبی ارائه نمیکند. در یک پیکربندی اتصال مستقیم، فقط میتوان یک نگاشت یک به یک (one-to-one) از میزبانها به پورتهای ذخیرهسازی برقرار کرد.
اگر آرایه ذخیرهسازی شما دارای هشت پورت جلویی است، میتوانید حداکثر هشت سرور به آن متصل کنید. داشتن چند مسیر برای دسترسی به ذخیرهسازی (هر میزبان حداقل به دو پورت آرایه ذخیرهسازی متصل باشد)، مورد توجه همگان قرار دارد. در این حالت، دیگر محدود به یک ارتباط یک به یک نیستید. یک آرایه ذخیرهساز هشت پورت میتواند به چهار میزبان پاسخ دهد، بهطوری که هر کدام دارای دو مسیر به آرایه ذخیرهسازی باشند که بازهم مقیاسپذیری خوبی ارائه نمیکند.
SAN Attached
گزینهای محبوبتر و گسترشپذیرتر نسبت به مکانیزم اتصال مستقیم، فناوری SAN است. SAN یک سوئیچ بین سرور و آرایه ذخیرهسازی قرار میدهد و به چندین سرور اجازه میدهد از طریق یک پورت ذخیرهسازی اشتراکی با محیط SAN در ارتباط باشند. در روش مذکور، چند سرور از طریق پورت اشتراکی که اغلب fan-in نامیده میشود، به منابع ذخیرهساز دسترسی دارند. شکل زیر عملکرد فناوری فوق را نشان میدهد.
در شماره آینده مبحث فوق را ادامه میدهیم.