מאת: שעיה בכר, Solution Architect, ב-Dell Technologies
הרצון לקדם מחקרים בנושא מחשוב עתיר ביצועים (HPC) ובינה מלאכותית (AI) גרם לעלייה גוברת בדרישה למחשוב בעל קצב מהיר יותר. הביצועים של מערכות HPC מכפילים עצמם בכל שנתיים, בעוד שהביצועים הנדרשים לאימון מודלים של AI מכפילים עצמם בכל 3-4 חודשים.
בנוסף להתקדמות של טכנולוגיית המעבדים, שיפורים ארכיטקטוניים ומאיצי מחשוב הופכים לנורמה הנדרשת בכדי לעמוד בדרישות המחשוב הגדלות של HPC ו-AI. ארכיטקטורות ומאיצים ייעודיים יכולים לסייע להאיץ פעולות ליבה מתמטיות ייעודיות של אפליקציות כגון פעולת כפל הוספה וצבירה בייצוג נקודת צפה (floating-point multiply add and accumulate), פעולות וקטורים ומטריצות. מדובר בפעולות אשר גוזלות הרבה ממחזורי הביצוע של עומסי העבודה של HPC ו-AI.
PowerEdge R7525 של Dell EMC
ישנם מספר ענפי תעשייה הזקוקים ליכולות ה-HPC המתקדמות הללו. ניתוח נתונים, כגון Reverse Time Migration, המשמש בתעשיות הנפט והגז, דורש מחשוב מואץ בכדי לפתור את האתגרים המשמעותיים של ביצועי הקלט/פלט בשנייה (IOPS). לחברות מחקר פרטיות וממשלתיות נדרשות יכולות מחשוב ועיבוד גרפי (GPU) גבוהות בכדי להריץ סימולציות מורכבות שעליהן לפתור את הסיבוכים של תורת הכאוס. האקדמיה ממנפת מעבדים גרפיים בכדי להאיץ סימולציות של וירוסים, מחקרי גנומיקה ועומסי עבודה של פיזיקה קוונטית. מעבדים גרפיים מודרניים מגבירים את היכולות שלהם בכדי לפעול ביעילות כמעבד-שותף מחשובי עבור עומסי עבודה של HPC ו-AI, תוך שילוב תמיכת חמרה עבור מגוון של דיוקים מספריים ובכדי להגדיל את רוחב פס הזיכרון. המאיץ הגרפי Instinct MI100 של חברת AMD מהווה את החידוש האחרון בתחום מאיצי המחשוב, ומספק ביצועים חזקים יחד עם מערכת תוכנה אקולוגית גמישה ופתוחה.
"שיתוף פעולה זה מחבר יחד חומרות מדהימות בכדי להגביר את הביצועים של עומסי עבודת ה-HPC שלכם"
דל חברה ל-AMD בכדי להביא לכם את ה- PowerEdge R7525 בשילוב מאיץ Instinct MI100 של AMD. השילוב מאפשר תגליות מדעיות מהירות יותר על ידי האצת הסימולציות ומתן זמן לתובנות, וזאת באמצעות מודלים מורכבים של למידה עמוקה המיועדים למקרי השימוש שלכם להם נדרש מחשוב אינטנסיבי. מאיץ ה- Instinct MI100 של AMD עושה שימוש בארכיטקטורת ה- CDNA (Compute DNA)החדשה של AMD, עם טכנולוגיית ה- Matrix Core Technology החדשה לגמרי בכדי להגביר את ביצועי ה- FP16 בכמעט פי 7 בעבור עומסי עבודה של AI בהשוואה לדור הקודם של AMD. שימושים מדעיים ירוויחו מביצועי ה- FP32 Matrix Coreמסוג הדַּיִק-יָחִיד (single-precision), התורמים להגברה של כמעט פי 3.5 עבור עומסי עבודה של HPC ו-AI בהשוואה לדור הקודם של AMD. חוקרי AI מובילים יכולים למנף את התמיכה של MI100 לטובת פעולות של למידת מכונה חדשה יותר, כגון bfloat16, בכדי להפחית את זמן ההכשרה משבועות וימים לשעות על ה- PowerEdge R7525.
AMD Instinct MI100
שיתוף פעולה זה מחבר יחד חומרות מדהימות בכדי להגביר את הביצועים של עומסי עבודת ה-HPC שלכם. ה- R7525 בשילוב ה- MI100 ממנף יכולות של PCIe דור, והינו אידיאלי עבור יישומי HPC הדורשים רוחב פס מוגבר שבו יש תנועת נתונים רבה על אפיק ה- PCIe. הגברות ביצועים אלה מובילות לזמני פתרון קצרים יותר, ניצול משאבים יעיל יותר של ה-HPC.
ה- MI100מביא עימו יותר מרק פי 2 מכמות דחיסות העיבוד בהשוואה לדור הקודם של מוצריה של AMD- הוא גם משלים את הרכיבים האחרים בתוך ה- R7525. לכשעצמו, ה- MI100מספק:
- את מאיץ ה-HPC המהיר בעולם, עם עד פי 11.5 ביצועי TFLOPs בחישובי שיא בדַּיִק כָּפוּל (FP64)1
- כמעט פי 3.5 (FP32) ביצועי מטריצות ל-HPC ועלייה של כמעט פי 7 בביצועי ה-FP16 עבור עומסי עבודה של AI בהשוואה לדורות קודמים של AMD 2
ארכיטקטורת ה-Infinity החדשה של AMD מחברת שלושה מאיצי MI100 בתוך ה- R7525over PCIe® Gen4. בהשוואה לדור 3, ב- PCIe דור 4 ניתן למצוא רוחב פס גדול יותר והשהיות קצרות יותר. עובדה זו משפרת את השימוש במעבדים הגרפיים, וגורמת לעומסי העבודה של HPC לפעול בצורה יעילה יותר.
בנוסף, התוכנה הפתוחה ROCm של AMD מאפשרת לכם להשתמש בשפות מחשוב שונות ולהעבירם בין פלטפורמות מחשוב. מדובר במערכת אקולוגית פתוחה וניידת התומכת באריכטקטורות רב-שכבתיות, לרבות מעבדים גרפיים מספקים אחרים. AMD הוסיפה גם כלי שנקרא Hipify המאפשר המרה קלה של קוד שנכתב ב-CUDA ילידית למודל התכנות ROCm HIP של AMD, ולאחר מכן נדרשים כוונון או אופטימיזציה מינימליים.
התקווה היא שיש בכך מספיק בכדי להלהיב אתכם בנוגע להפעלת מודל ההכשרה או הסימולציה המדעית או ישיבת התגליות הבאים. אם ברצונכם ללמוד עוד, אנא בקרו בעמוד המאיצים של דל או צפו בכל יתר הפתרונות שדל מציעה עבור HPC. ה- PowerEdge R7525 של Dell EMC עם מאיץ ה- Instinct MI100 של AMD הוא הצעד הבא לעבר מסע המחשוב המואץ שלכם.
1בחישובים שבוצעו בידי מעבדות הביצועים של AMD נכון ל-18 בספטמבר 2020 בעבור מאיץ מסוג Instinct™ MI100 (32GB HBM2 PCIe® card), במהירות שיא של השעון ב- 1,502 MHz, התוצאות היו ביצועי נקודה צפה תיאורטיים בשיא שכללו ביצועי TFLOPS של 11.54 בדַּיִק כָּפוּל בשיא (FP64), ביצועי TFLOPS של 46.1 במטריצת דַּיִק-יָחִיד בשיא (FP32), ביצועי TFLOPS של 23.1 בדַּיִק-יָחִיד בשיא (FP32) וביצועי TFLOPS של 184.6 בחצי דיוק בשיא (FP16)
2 תוצאות שחושבו עבור מעבד גרפי Radeon Instinct™ MI50 במהירות שיא של השעון ב-1,725 MHz הובילו לתוצאות של ביצועי מטריצת נקודה צפה שכללו ביצועי TFLOPS של 26.5 בחצי דיוק בשיא תיאורטי (FP16) וביצועי TFLOPS של 13.25 בדַּיִק-יָחִיד תיאורטי בשיא (FP32).
יצרני השרתים יכולים לערוך שינויים בתצורות המוצעות ואלה עשויים להניב תוצאות שונות.