به "وبلاگ فالنیک ( ایران اچ پی)" خوش آمدید    |   وبسایت فالنیک (ایران اچ پی)
امروز جمعه ۲۳ آذر ۱۳۹۷ - تماس با فالنیک : 8363-021

آشنایی با Data Deduplication یا حذف رکوردهای تکراری داده

وبلاگ فالنیک ( ایران اچ پی)

آشنایی با Data Deduplication

در مبحث ذخیره‌سازی ممکن است با مبحث Data Deduplication یا حذف رکوردهای تکراری داده رو به رو شوید که اهمیت بسیار زیادری در سرعت ذخیره‌سازی و واکشی داده دارد. در این مقاله با تکنولوژی Data Deduplication آشنا می‌شویم و برخی مزایای آن را نام می‌بریم.

Data Deduplication یا حذف رکوردهای تکراری داده که به صورت Dedupe هم شناخته می‌شود، روشی است که با حذف داده افزونه، نیازهای ذخیره‌سازی کاهش می‌یابد. علاوه بر کاهش مصرف فضای ذخیره‌سازی، هنگام انتقال داده تحت شبکه، تعداد بایت‌های ارسالی نیز کاهش می‌یابد.  این روش با نام‌های دیگری مانند فشرده‌سازی هوشمند (Intelligent Compression) و Single-Instance Storage یا SIS نیز شناخته می‌شود. در این تکنیک طی یک پروسه تحلیلی، تنها یک نمونه از داده در رسانه ذخیره‌سازی مانند Tape یا دیسک ذخیره می‌شود و داده افزونه یا تکراری با اشاره‌گری جایگزین می‌شود که به این نسخه از داده که یکتاست ارجاع می‌دهد. در نتیجه میزان داده‌ای که باید منتقل یا ارسال شود، به صورت چشمگیری کاهش پیدا می‌کند. مثلا یک ایمیلِ سیستمیِ معمولی ممکن است صد نمونه از یک فایل پیوست یک مگابایتی داشته باشد. برای بکاپگیری و آرشیو آن باید تمامی صد نمونه ذخیره شوند که به فضای ذخیره‌سازی 100 مگابایتی نیاز دارد. اما با استفاده از Dedupe تنها یک نمونه از این فایل ذخیره می‌شود و نمونه‌های بعدی به همان یک نسخه ذخیره شده، ارجاع داده می‌شوند. در این مثال، هر صد مگابایت مورد نیاز می‌تواند به تنها یک مگابایت کاهش یابد.

آشنایی با Data Deduplication

Data Deduplication مزایای دیگری هم دارد. اگر به فضای ذخیره‌سازی کمتری نیاز باشد، هزینه مالی مورد نیاز برای تامین دیسک‌ها هم کاهش می‌یابد. استفاده بهینه‌تر از فضای دیسک، باعث افزایش زمان نگهداری دیسک می‌شود در نتیجه RTO بهتری نیز فراهم شده و نیاز به بکاپگیری نیز کمتر می‌شود.

با Data Deduplication، داده‌هایی که باید در WAN به منظور بکاپگیری از راه دور، Replication و Disaster Recovery فرستاده شود نیز کاهش می‌یابد در نتیجه به پهنای باند کمتری نیز نیاز دارید و باعت بهینگی در WAN می‌شود. این تکنولوژی اغلب به صورت ترکیبی با دو تکنولوژی دیگر یعنی فشرده‌سازی و Delta Differencing استفاده می‌شود که در این صورت در بهینه‌سازی مصرف فضای ذخیره‌سازی نیز موثرتر خواهد بود.

آشنایی با Data Deduplication

Data Deduplication عموما در سطح بلاک یا فایل عمل می‌کند. File Deduplication در واقع فایل‌های Deduplicate را حذف می‌کند اما روشی با کارایی بالا نیست. Block Deduplication روشی کاراتر است اما به قدرت پردازشی بیشتری نیاز دارد.

منابع:

techtarget.com
Wikipedia.com


نویسنده :

آشنایی با Data Deduplication یا حذف رکوردهای تکراری داده
5 رای، میانگین 5 از 5

4
دیدگاه بگذارید

avatar
4 نظرات
0 تعداد پاسخها
0 دنبال کنندگان
 
پربازدیدترین کامنت
پرامتیاز ترین کامنت
4 نویسندگان نظرات
اکبریرحمتیحسن روشندلیوسفی نظرات اخیر
  اشتراک  
اطلاع رسانی
یوسفی
مهمان
یوسفی

با این تفاسیر فکر میکنم فضای هدر رفت دیگر بوجود ندارد.

حسن روشندل
مهمان
حسن روشندل

در واقع Data Deduplication به مدیران Storage کمک می‌کند تا هزینه‌های مرتبط با داده‌های تکراری را کاهش دهند.

رحمتی
مهمان
رحمتی

قابلیت بسیار مفید و پرکاربردی است

اکبری
مهمان
اکبری

در بسیاری از موارد فایل های تکراری خیلی زیادی در فضای ذخیره سازی وجود دارند که با کاهش اونها و حذف رکوردهای تکراری میشه هزینه های فضا رو به شدت کاهش داد.

پادکست 10
تعمیر پرینتر تخصصی
ایبوک فالنیک
تک تاک
پادکست
نویسنده مهمان فالنیک
پربازدید ترین مطالب
  • ماه
  • فصل
  • کل
پر بحث ترین ها
استفاده از مطالب سایت فالنیک (ایران اچ پی) فقط برای مقاصد غیر تجاری و با ذکر منبع بلامانع است. کلیه حقوق سایت متعلق به فالنیک (ایران اچ پی) است.
عضویت در خبرنامه سرور فالنیک (ایران اچ پی)

عضویت در خبرنامه سرور فالنیک (ایران اچ پی)

با عضویت در خبرنامه سرور فالنیک (ایران اچ پی) اولین نفری باشید که مقالات و محتواهای ناب و تخصصی را دریافت می کنید.

تبریک، شما با موفقیت در خبرنامه عضو شدید.