بایگانی برچسب برای: Hardware

۵ کاری که نمی‌توان در مرکز داده به صورت خودکار انجام داد

عنوان اصلی مقاله: Five Things You Can’t Automate In Your Data Center
تاریخ انتشار و نویسنده: By Christopher Tozzi, Jan 17, 2024
Data Center Knowledgeوب‌سایت منتشر کننده: Data Center Knowledge
 لینک اصلی مقاله

اتوماسیون مراکز داده یک موضوع داغ است، اما هنوز برخی از حوزه‌های کلیدی نیازمند دخالت انسان‌ها هستند. در این مقاله خواهید دید که در حال حاضر کدام عملیات در مراکز داده در برابر اتوماسیون مقاومت دارند.

آلامی (Alami)

این راحت است که فرض نماییم اتوماسیون یا خودکارسازی در مراکز داده و فراتر از آن، دیگر هیچ مرزی ندارد. در دنیایی که به نظر می‌رسد هوش مصنوعی طیف بی‌حد و حصری از فرصت‌ها را برای بهبود عملیات مراکز داده و شبکه‌ها در اختیار ما گذاشته است و صنعت فناوری اطلاعات نیز این مفهوم را به طور کلی پذیرفته است که گردش‌های کاری به قدری می‌توانند خودکار شوند که ما به وضعیت نوآپس (NoOps) برسیم، شاید این‌گونه وانمود شود که دیگر چیزی در مراکز داده وجود ندارد که نتوانیم آن را خودکار کنیم.

با این حال، واقعیت بسیار جدی‌تر است. در حالی که فناوری‌های جدید پتانسیل زیادی برای خودکارسازی مراکز داده در بسیاری از زمینه‌ها ایجاد کرده‌اند، جنبه‌های کلیدی عملیات در مراکز داده تا آینده‌ی نزدیک غیرقابل خودکارسازی خواهند بود.

در واقع، ماهیت فیزیکی مراکز داده ایجاب می‌کند که از برخی جهات، خودکارسازی تأسیسات و تجهیزات مرکز داده حتّی بیشتر از سایر انواع زیرساخت‌ها و محیط‌های فناوری اطلاعات چالش‌برانگیز است، از جمله سکوهای ابری عمومی، که در آن همه‌ی آن چیزی که کاربران با آن در تعامل هستند، در نرم‌افزار تعریف می‌شود و بنابراین به راحتی با استفاده از راه‌حل‌های مبتنی بر نرم‌افزار، خودکار می‌شوند.

برای اثبات این موضوع، در اینجا نگاهی به پنج جنبه از مراکز داده یا عملیات مرکز داده می‌اندازیم که هیچ‌کس نباید این انتظار را داشته باشد که به این زودی‌ها به طور کامل خودکار شوند.

  1. استقرار سرورها

استقرار سرور در ابرهای عمومی، به سادگی و با استفاده از برخی از الگوهای «زیرساخت به شکل کد» برای تأمین منابع ابری به صورت خودکار انجام می‌شود.

با این حال، در یک مرکز داده امکان پیاده‌سازی این نوع خودکارسازی وجود ندارد، زیرا سرورهایی که شما مستقر می‌کنید سخت‌افزار فیزیکی هستند. شخصی باید سرورها را نصب کند، آنها را به کابل‌های برق و شبکه متصل نماید، از سرمایش مناسب آنها اطمینان حاصل کند و غیره.

به شکل نظری، ربات‌ها قادر هستند بسیاری از کارهای استقرار سرورها در مراکز داده را به صورت خودکار انجام دهند. با این حال، برای انجام این کار به یک شکل مقرون به صرفه با استفاده از ربات‌ها، باید در مقیاس وسیع عمل کرد. ضمن آنکه شما برای خودکارسازی چنین عملیاتی بدون کمک دست انسان، به استقرار سرورهایی نیاز دارید که به اندازه‌ی کافی با یکدیگر همگون شده و کار با آنها قابل پیش‌بینی باشد. امروزه، بیشتر موارد استقرار سرورها چنین معیاری را برآورده نمی‌کنند.

حتماً دلیلی وجود دارد که ما هنوز تعداد کمی رُبات در مراکز داده می‌بینیم، در حالی که حداقل یک دهه است که در خصوص پتانسیل اتوماسیون رباتیک مراکز داده صحبت در میان است: در بیشتر موارد چنین کاری ممکن نیست. انتظار می‌رود استقرار سرورها حداقل برای یک آینده‌ی قابل پیش‌بینی دستی باقی بماند.

  1. تعمیر و نگهداری سخت‌افزار

به طریقی مشابه، نگهداری سخت‌افزار سرورها پس از استقرار در داخل یک مرکز داده، وظیفه‌ای نیست که در اکثر موارد قابلیت خودکارسازی داشته باشد. تعویض دیسک‌های خراب، جایگزینی منابع تغذیه و کابل‌های فرسوده و به‌روزرسانی کارت‌های شبکه، رویه‌هایی معمول در اکثر مراکز داده هستند و تنها راه انجام آن‌ها استفاده از نیروهای فنی انسانی است.

  1. نصب و نگهداری تهویه

سامانه‌های سرمایش و چرخش هوا که از تجهیزات فناوری اطلاعات در برابر گرمای بیش از حد محافظت می‌کنند، جزء ضروری هر مرکز داده هستند؛ و همانند سرورها، سامانه‌های خنک‌کننده نیز شامل اجزای فیزیکی‌ای هستند که نیاز به نگهداری توسط انسان زنده دارند.

حسگرها و سامانه‌های پایش تهویه می‌توانند از راه دور به خودکارسازی برخی از فرایندهای مرتبط با مدیریت تهویه کمک کنند؛ اما در نهایت، تعمیر و نگهداری تهویه کاری نیست که بتوان به راحتی آن را در مراکز داده خودکار نمود.

  1. امنیت فیزیکی

امنیت فیزیکی مراکز داده حوزه‌ی دیگری است که در آن سامانه‌های پایش قادر هستند به خودکارسازی برخی از وظایف مربوط به آن کمک کنند، در عین حالی که همچنان مداخله‌ی دستی انسانی برای پاسخ به مشکلات عمده ضروری است.

شما می‌توانید از حسگرها برای ردیابی حرکت افراد در مرکز داده استفاده کنید و یا دستگاه‌های احراز هویت زیست‌سنجی یا بیومتریک (Biometric) را برای کنترل خودکار دسترسی فیزیکی به مرکز داده به کار بگیرید. با این حال، اگر یک مزاحم شناسایی شود، یا اگر سامانه‌های کنترل دسترسی خودکار به درستی کار نکردند، آنگاه به تعدادی نیروی امنیتی برای پاسخ به آن رویداد نیاز خواهید داشت.

  1. بازیابی از فاجعه

در برخی موارد، روال‌های بازیابی از فاجعه (Disaster recovery) را می‌توان خودکار کرد. در واقع، خودکارسازی بازیابی از فاجعه برای صرفه‌جویی در زمان هنگام بازیابی داده‌ها یا برنامه‌های کاربردی پس از وقوع خرابی، یک امر حیاتی است.

با این حال، تنها در صورتی می‌توانید بازیابی از فاجعه را به صورت خودکار انجام دهید که دارایی‌هایی که نیازمند بازیابی هستند از نوع نرم‌افزاری باشند، ضمن آنکه باید زیرساخت کافی برای میزبانی از دارایی‌های بازیابی‌شده در دسترس داشته باشید.

اگر بازیابی مستلزم استقرار سخت‌افزار جدید یا جایگزینی اجزای خراب باشد (که چنانچه مرکز داده دچار یک فاجعه‌ی طبیعی شده‌باشد و در آن برخی از سیستم‌ها از کار افتاده باشند، احتمالاً همین‌طور خواهد بود)، باید به نیروی انسانی برای انجام دستی کارها تکیه نمایید.

محدودیت‌های خودکارسازی مراکز داده

دلایل خوب بسیار زیادی وجود دارند تا نسبت به خودکارسازی عملیات در مراکز داده تا آخرین حد ممکن اقدام نماییم. اما بسیاری از جنبه‌های مدیریتی در مراکز داده، مناسب خودکارسازی  نیستند.

حتّی در عصر هوش مصنوعی مولّد و فناوری‌های رباتیک، تصوّر حذ ف کامل انسان‌ها از مراکز داده به این زودی‌ها دشوار به نظر می‌رسد.

منتشر شده در وب‌سایت دیتا سنتر نالج Data Center Knowledge
توسط کریستوفر توزی (Christopher Tozzi)، ۱۷ ژانویه ۲۰۲۴
برگردان توسط حامد معین‌فر
در شرکت مهندسین فناور پندار آریا – پنداریا

خنک‌سازی مستقیم تراشه‌ها: هر آنچه که بهره‌برداران مرکز داده باید بدانند

عنوان اصلی مقاله: Direct-to-Chip Cooling: Everything Data Center Operators Should Know
تاریخ انتشار و نویسنده: By Christopher Tozzi, Nov 27, 2023
Data Center Knowledgeوب‌سایت منتشر کننده: Data Center Knowledge
 لینک اصلی مقاله

خنک‌سازی مستقیم تراشه‌ها در حال تبدیل‌شدن به یک راهبرد سرمایشی جذاب در مراکز داده است.

ناتاپُل شریتُنگکوم (Nattapol Sritongcom) / آلامی (Alami)

آن دسته از سامانه‌های خنک‌کننده که هسته‌ی مرکزی تولید حرارت را هدف قرار می‌دهند، قادر هستند گرما را به شکل مؤثّرتری دفع نمایند. به همین دلیل است که خنک‌سازی مستقیم تراشه‌ها یا خنک‌سازی مستقیم بر تراشه (Direct-to-chip cooling) در حال تبدیل‌شدن به یک راهبرد سرمایشی جذّاب در مراکز داده هستند.

هرچند که خنک‌کننده‌های مستقیم بر تراشه قادرند داغ‌ترین اجزای یک سرور را هدف قرار دهند، با این حال باید توجه داشت که هزینه‌ی بالا و خطر خرابی این نوع سامانه‌ها به این معنی است که این روش نمی‌تواند همواره یک راه‌حل مناسب تلقّی شود.

برای آشنایی با روش «خنک‌سازی صفحه سرد مستقیم بر تراشه (Direct-to-chip cold plate cooling)» و اینکه چگونه کار می‌کند و چرا ممکن است روش مناسبی برای سرمایش سرورهای مرکز داده شما باشد یا نباشد، به خواندن این متن ادامه دهید.

خنک‌سازی صفحه سرد مستقیم بر تراشه چیست؟

خنک‌سازی صفحه سرد مستقیم بر تراشه، عملِ به گردش درآوردن مایع خنک‌کننده از میان یک صفحه (یا همان «صفحه‌ی سرد») است که در تماس مستقیم با منابع اصلی حرارت، از جمله واحدهای پردازنده‌ی مرکزی (CPUs) قرار گرفته‌است. مایع، گرما را از اجزاء دریافت کرده و به طور مؤثر تجهیزات را خنک می‌کند.

از آنجایی که روش خنک‌سازی مستقیم تراشه‌ها به سامانه‌های سرمایشی این اجازه را می‌دهد تا قسمت‌هایی از تجهیزات فناوری اطلاعات (IT) را که بیشترین گرما را تولید می‌کنند هدف قرار دهند، روشی سریع‌تر و کارآمدتر برای پیشگیری از گرم‌شدن بیش از حد دستگاه‌ها است.

خنک‌کننده‌ی مستقیم بر تراشه چگونه کار می‌کند؟

سامانه‌های خنک‌کننده‌ی مستقیم بر تراشه به چندین اجزاء نیاز دارند:

– مایع خنک‌کننده، که معمولاً یک سیّال دی‌الکتریک (Dielectric fluid) می‌باشد و برای کاربرد خنک‌سازی مستقیم بر تراشه شخصی‌سازی شده‌است.

– صفحه‌ی سرد، که مایع بتواند از داخل آن عبور کند.

– پمپ، که مایع را در مدار به حرکت در می‌آورد.

– ماده‌ی رابط حرارتی، که به انتقال گرما از منبع به صفحه‌ی سرد کمک می‌کند.

این اجزاء در کنار هم به روشی نسبتاً ساده کار می‌کنند؛ حرارت حاصل از پردازنده‌ها و یا سایر منابع گرمایی به صفحه‌ی سرد منتقل شده و سپس توسط مایعی که در گردش است از آن ناحیه خارج می‌شود.

مزایای خنک‌سازی مستقیم بر تراشه

مزیت اصلی خنک‌سازی مستقیم تراشه‌ها این است که گرما را سریع‌تر خارج کرده و انرژی کمتری نسبت به سامانه‌های خنک‌کننده‌ی سنّتی که در طراحی‌های مرکز داده دیده می‌شوند، مصرف می‌کند؛ مانند سامانه‌هایی که هوای سرد را از میان رَک‌های سرور به گردش در می‌آورند.

سامانه‌های سنّتی سرمایش هوا، به جای هدف قرار دادن دقیق منابع حرارتی، هوای سرد را به سمت کل یک مجموعه از تجهیزات پرتاب می‌کنند. بخش زیادی از این هوا از روی اجزایی که منابع اصلی تولید گرما نیستند، عبور می‌کند، مانند رابط‌های شبکه (Network interfaces) و بخش‌های بیرونی بُردهای‌اصلی (Mainboards)، و این بدان معنا است که هوای خنک به طور مؤثّری در حال هدر رفتن است.

در مقابل، سامانه‌های خنک‌کننده‌ی مستقیم بر تراشه قادر هستند مشخصاً آن اجزای خاصی که گرما تولید می‌کنند را خنک نمایند. در نتیجه گرمای بیشتری را با انرژی کمتری دفع می‌نمایند که این از منظر پایدارپذیری (Sustainability) (چرا که مصرف انرژی کمتر، خروجی کربن مرکز داده را کاهش می‌دهد) و همچنین از دیدگاه اطمینان‌پذیری (Reliability)، یک برد محسوب می‌شود. هر چه سامانه‌های سرمایشی در دفع گرما بهتر عمل کنند، خطر خرابی‌های فناوری اطلاعات با ریشه‌ی گرمای بیش از حد نیز کاهش می‌یابد.

چالش‌های خنک‌سازی مستقیم بر تراشه

در حالی که خنک‌سازی مستقیم بر تراشه مزایای متعددی به همراه دارد، این فناوری با چالش‌ها و محدودیت‌هایی نیز روبرو است:

هزینه: پیاده‌سازی و نگهداری سامانه‌های هوای سرد تقریباً همیشه هزینه‌ی کمتری نسبت به سامانه‌های مستقیم بر تراشه دارند؛ چرا که نیازمند قطعات گران‌تر و پیچیده‌تر است.

خطر نشت: این احتمال وجود دارد که سیّالات داخل سامانه‌های مستقیم بر تراشه نشت پیدا کنند. نشت معمولاً تهدیدی بزرگ برای تجهیزات فناوری اطلاعات محسوب نمی‌شود، چرا که این سیّالات رسانا نیستند. با این وجود هر گونه نشت، حداقل موجب از کار افتادن سامانه‌ی خنک‌کننده و بروز گرمای بیش از حد می‌شود. آن دسته از بهره‌برداران مرکز داده که نگران خطرات ناشی از نشت سیّال هستند ممکن است خنک‌کننده‌های غوطه‌ور (Immersion cooling) را انتخاب نمایند؛ از آنجا که در چنین سامانه‌هایی دیگر هیچ سیّالی در صفحات کوچک و شکننده در جریان نیست، کمتر مستعد نشتی هستند.

اثرات زیست‌محیطی: سیّالاتی که در مدارهای سامانه‌های مستقیم بر تراشه جریان دارند، اغلب با محیط زیست سازگار نیستند؛ لذا در ارتباط با این سامانه‌ها همواره مخاطراتی از نوع آلودگی وجود دارند.

اجزای خنک‌نشده: از آنجایی که سامانه‌های مستقیم بر تراشه فقط منابع اصلی گرما را خنک می‌کنند، این خطر وجود دارد که سایر بخش‌های سرور، مانند دیسک‌های سخت، بیش از حد داغ شوند. این دلیل دیگری است که چرا برخی از بهره‌برداران مرکز داده تمایل به به‌کارگیری خنک‌کننده‌های غوطه‌ور که تمام قسمت‌های یک سامانه را خنک می‌کنند، دارند.

اگر نگران هزینه‌های پیش‌راه‌اندازی هستید، سامانه‌های سنّتی‌تر خنک‌کننده‌ی هوا راه‌حل بهتری نسبت به خنک‌کننده‌های مستقیم بر تراشه هستند. البته توجه داشته باشید که در دراز مدت، خنک‌سازی مستقیم تراشه‌ها می‌تواند به دلیل مصرف انرژی کمتر، نسبت به خنک‌سازی‌ هوا بیشتر مقرون‌به‌صرفه باشد. البته این نکته نیز وجود دارد که سامانه‌های خنک‌کننده‌ی هوا مستعد مخاطرات ناشی از نشتی نیستند.

در عین حال، خنک‌کننده‌های غوطه‌ور به طور کلی مخاطرات کمتری دارند، هرچند که معمولاً اجرای آنها گران‌تر از خنک‌کننده‌های مستقیم بر تراشه است. البته ممکن است برای زیرساخت‌های مقیاس بزرگ (یعنی آنهایی که شامل صدها یا هزاران سرور هستند)، هزینه‌ی نصب خنک‌کننده‌های غوطه‌ور تقریباً مشابه یا حتی کمتر از خنک‌کننده‌های مستقیم بر تراشه که برای راه‌اندازی‌های مقیاس کوچک‌تر مناسب هستند، باشد.

از کجا می‌توان راه‌حل‌های خنک‌سازی مستقیم بر تراشه یافت

خنک‌سازی مستقیم بر تراشه وارد دوره‌ی اوج خود شده است و یک مؤلفه‌ی اصلی از بازار در حال رشد خنک‌کننده‌های مبتنی بر مایع در مراکز داده که شامل سامانه‌های خنک‌کننده‌ی غوطه‌ور نیز می‌شود، می‌باشد. در حال حاضر تعدادی از سازندگان، از جمله برخی از استارت‌آپ‌هایی که در گذشته آنها را پوشش داده‌ایم، راه‌حل‌ها و محصولاتی در این دسته ارائه می‌دهند.

با این وجود، از آنجا که سامانه‌های خنک‌کننده‌ی صفحه سرد مستقیم بر تراشه باید برای انواع خاصی از تجهیزات که از آنها پشتیبانی می‌کنند طراحی شوند، این امکان وجود ندارد که بیرون بروید و این محصول را از قفسه‌ی یک فروشگاه بخرید. شما نیاز دارید با فروشنده‌ای کار کنید که قادر است یک سامانه را بر اساس مشخصات خاص مرکز داده و سرورهای مورد نظر شما طراحی نماید.

منتشر شده در وب‌سایت دیتا سنتر نالج Data Center Knowledge
توسط کریستوفر توزی (Christopher Tozzi)، ۲۷ نوامبر ۲۰۲۳
برگردان توسط حامد معین‌فر
در شرکت مهندسین فناور پندار آریا – پنداریا