تاثیر هوش مصنوعی بر صنعت ذخیرهسازی و فناوری اطلاعات
گِلین بُودِن، معمار ارشد، بخش هوش مصنوعی و علوم داده شرکت اچپی میگوید: «امروزه، بیش از هر زمان دیگری، سازمانها به دنبال استفاده از هوش مصنوعی (AI) و به ویژه یادگیری ماشین (ML) برای حل چالشهای پیچیده دادهای و استخراج بینشها و ارزشهای جدید از حجم فزاینده اطلاعات ذخیره شده در کسبوکار خود هستند».
چهار سال قبل، ظهور عنوان شغلی دانشمند داده به عنوان یک مهارت اصلی و کلیدی در سازمانهای با ابعاد مختلف و تمرکز سازمانها بر این عنوان شغلی نشان داد که شرکتها به جای تمرکز بر امور سنتی، تمایل به پذیرش فناوریها و مشاغل دادهمحور دارند. با این حال، با توجه به سرعت بالای تغییرات، ارزیابی دقیق تاثیر این موج جدید تحلیل داده بر زیرساختها و به طور خاص محیطهای ذخیرهسازی که اکثر این دادهها در آن قرار دارند، دشوار است.
فهرست محتوا
لزوم توجه به رویکردهای نوین در نحوه طبقهبندی دادهها
آیا هوش مصنوعی و یادگیری ماشین گام بعدی در مسیر تکاملی پس از انبارهای داده و کلان دادهها هستند؟ تفاوت در چیست، فقط مقیاس؟ پاسخ منفی است. امروزه، با یک چالش بزرگ در زمینه ذخیرهسازی دادهها روبرو هستیم که متفاوت از آن چیزی بود که در گذشته نظارهگر بودیم. این چالش مربوط به نحوه استفاده از دادهها است.
به طور سنتی، ذخیرهسازی دارای یک کاربرد یا حداقل یک مشخصه عملکردی در یک مرحله خاص از چرخه عمر خود است. برای مثال، میدانیم دادههایی که تازه تولید شدهاند به شکل مکرر مورد استفاده قرار میگیرند و به همین دلیل به آنها دادههای گرم میگوییم. سپس، این دادهها در گذر زمان کمتر حائز اهمیت میشود و به اصطلاح سرد میشوند تا اینکه بایگانی شوند یا به طور کامل منقضی شوند. این بدان معنی است که تمرکز بر مدیریت چرخه عمر داده و معماریهای ذخیرهسازی سلسله مراتبی بود.
در این معماری سنتی، دادهها بین لایهها جابهجا میشوند، بنابراین، تا زمانی که تازه و فعال است روی رسانههای با کارایی بالا و زمانی که سرد میشوند روی رسانههای حجیمتر قرار میگیرند. با این حال، با تکنیکهای جدید هوش مصنوعی و یادگیری ماشین، دادهها میتوانند در هر زمان کاربردهای متعددی داشته باشند. این حرف بدان معناست که امکان مدیریت و ذخیرهسازی دادهها بر مبنای یک سلسله مراتبی سنتی دشوار است.
لزوم بازبینی نحوه ذخیرهسازی اطلاعات
همچنین، اگر به نحوه ذخیرهسازی برخی دادهها نگاه کنید، متوجه میشوید در قالبهای مختلفی ذخیرهسازی میشوند. برای مثال، میتوانند فایلهای بدون ساختار، بلوکهای داده در یک مخزن مبتنی بر معماری شیمحور، یا دادههایی در یک پایگاه داده SQL روی یک LUN داشته باشید.
اگر ناگهان تصمیم بگیرید یکی از این منابع دادهای را برای ساخت یک مدل مورد استفاده قرار دهید، به یکباره وضعیت دادههای درون این مخازن تغییر پیدا کرده و از حالت سرد به گرم تغییر حالت میدهند.
برای آموزش مدلهای هوشمند، این موضوع فشار زیادی به زیرساخت ذخیرهسازی وارد میکند که باید اطلاعات موردنیاز را به شکل مستمر در اختیار مدل قرار دهد. برای مثال، در مورد یادگیری نظارت شده، دادهها چندین بار در طول مراحل اعتبارسنجی و آزمایش تجزیه میشوند. این در حالیست که تخمین الگوی ورودی/خروجی خواندن اطلاعات تا حدودی دشوار است؛ زیرا ممکن است دادهها به روشهایی مرتب شوند که متناقض با الگوهای سنتی هستند. به این معنی که ایندکسها روی پایگاههای داده وجود دارند. حتی دسترسی تصادفی به بلوک میتواند تاخیر را افزایش داده و بر عملکرد تاثیر بگذارد.
فراموش نکنید که همه این اتفاقات در شرایطی رخ میدهند که ممکن است رسانه ذخیرهسازی هنوز برای کارهای روزانه مرتبط با فعالیتهای تجاری استفاده میشود، بنابراین بر عملکرد سایر سیستمهای حیاتی کسبوکار تاثیر میگذارد.
ذخیرهسازی اطلاعات به شکل پالایش شده و دقیق
ما نه تنها باید به مقوله آرشیوها و مخازن داده درون سازمانی توجه کنیم، بلکه باید به دادههایی که روزانه تولید شده و به سمت زیرساختهای ذخیرهسازی ارسال میشوند و فرآیندهای جدید که ممکن است معنادار باشند، نگاه کنیم. قبل از آنکه از مجموعه دادههای خود در ارتباط با آموزش مدلهای یادگیری ماشین استفاده کنیم، اغلب لازم است، دادهها به نحوی تغییر شکل داده شوند تا امکان استفاده بهینه از آنها وجود داشته باشد.
از اینرو، نیازمند فیلتری هستیم که بتواند بر مبنای فید داده ورودی، به طبقهبندی اطلاعات بپردازد و ویژگیها یا رکوردهایی که ممکن است برای مدل مهم نباشند را حذف کند.
اگر ویژگیها و رکوردهای غیرضروری مورد استفاده قرار گیرند، بر روند استنتاج مدل تاثیر منفی میگذارند. به طوریکه میتوانند باعث تاخیر اضافی، کیفیت پایین عملکرد مدل یا ارائه نتایج اشتباه شوند.
این اغلب به عنوان پیش پردازش یا پیش مهندسی شناخته میشود. آنچه از طرف دیگر مورد توجه قرار میگیرد، مجموعه دادههای تمیز و تبدیلشدهای است که برای استنتاج مناسب هستند. این فرآیند متفاوت از دادههای ورودی اصلی است و نیازمند انشعاب خط لوله داده، به نحوی است که بتواند به نیازهای مدلهای هوشمند پاسخ دهد.
به عبارت سادهتر، وقتی میخواهیم از هوش مصنوعی برای تحلیل دادهها استفاده کنیم، باید دادهها را آماده کنیم. این فرآیند به معنای تمیز کردن دادهها، مرتب کردن آنها و تبدیل آنها به شکلی است که هوش مصنوعی بتواند درک کند. گاهی اوقات، باید برخی از دادهها را حذف کنیم تا هوش مصنوعی بهتر کار کند. بعد از آماده کردن دادهها، باید تصمیم بگیریم که آیا دادههای اصلی را هم نگه داریم یا نه.
همانطور که مشاهده میکنید، نحوه استفاده از دادهها دستخوش تغییرات اساسی شده است. ما باید به سرعت و فضای ذخیرهسازی دادهها توجه کنیم، زیرا دادهها دائم در حال تغییر هستند. با حجم زیاد دادهها، نمیتوانیم همه چیز را کنترل کنیم. باید روش جدیدی برای ذخیرهسازی و استفاده از دادهها پیدا کنیم. باید قبول کنیم که از هر دادهای ممکن است در آینده استفاده شود، بنابراین باید دادهها مدت زمان بیشتری نگهداری شوند.
این در حالیست که هوش مصنوعی بر نحوه استفاده و پردازش دادهها تاثیر میگذارد. از اینرو، باید مطمئن شویم که همه چیز درست کار میکند و اگر تغییری در هوش مصنوعی ایجاد شد، تغییرات لازم در دادهها نیز اعمال شود. در غیر این صورت، هوش مصنوعی نمیتواند به درستی به درخواستهای کسب و کارها پاسخ دهد.
نکته آخر اینکه دادهها برای کارهای مختلف استفاده میشوند. ما باید بتوانیم دادهها را از سیستمهای مختلف جمعآوری کنیم و به هوش مصنوعی برسانیم، بدون اینکه کارهای دیگر را مختل کنیم. با این توصیف باید بگوییم هوش مصنوعی فرصتهای خوبی ایجاد میکند، اما اگر درست استفاده نشود، مشکلساز خواهد بود.
تاثیر هوش مصنوعی در استوریجهای اچ پی
اچ پی از شرکتهای پیشگام در زمینه عرضه استوریجهای ذخیرهسازی تمام فلش، هیبریدی و مبتنی بر هارد دیسک است که بر مبنای به کارگیری جدیدترین فناوریها و راهحلهای نوآورانه توانسته است به این نیاز شرکتها پاسخ دهد. به بیان دقیقتر استوریجهایی مثل استوریج HP MSA 2062 SAN Storage، استوریج HP MSA 2060 SAN Storage، استوریج HP MSA 2050 SAN Storage، استوریج اچ پی MSA 2060 SAS 12G 2U 12-disk LFF Drive Enclosure، استوریج HP 3PAR StoreServ 8200 2-node Storage Base و غیره به این نیازها شرکتها پاسخ میدهند.
برای مثال استوریج HP MSA 2062 SAN Dual Controller Storage به واسطه مشخصات سطح بالایی مثل افزایش حافظه کش، قابلیت توسعهپذیری و مقیاسپذیری، مدیریت ساده، IOPS بسیار بالا، پشتیبانی از پاورهای با بهرهوری 94 درصد، افزایش ظرفیت آرایهها و انکلوژرها از طریق پشتیبانی از هاردهای SSD و HDD، پهنای باند و اتصالات برای افزایش 45 درصدی IOPS قادر است به نیاز شرکتهای فعال در زمینه راهحلهای ذخیرهسازی به بهترین شکل پاسخ دهد.