מידעהצהרת נגישות
תצוגת צבעים באתר(* פועל בדפדפנים מתקדמים מסוג Chrome ו- Firefox)תצוגה רגילהמותאם לעיוורי צבעיםמותאם לכבדי ראייה
סגירה
sponsored by 

PowerScale Multipath Client Driver לחווית AI טובה יותר

04/12/2024

מאמר מאת עמיר אסולין, Sales Executive, Unstructured Data Solutions at Dell Technologies

PowerScale Multipath Client Driver לחווית AI טובה יותר

על מנת להצליח בהתאמה אישית של מודל בינה מלאכותית גדול, הסקת מסקנות, הדרכה ו-GPUs נדרשים נתונים שיוגשו במהירות וביעילות. יש לתכנן ולהקנות את המחשוב והאחסון המתאימים, על מנת למנוע צווארי בקבוק פוטנציאליים בתשתית.

בכדי לספק מענה לדרישה הזה, מנהל ההתקן החדש ללקוח PowerScale multipath מאפשר צבירת ביצועים של מספר צמתי PowerScale דרך נקודת הרכבה אחת של NFS לצמתי מחשוב יחיד או רבים. כתוצאה מכך, מנהל ההתקן, בשילוב עם תמיכה ב-OneFS GPUDirect, מאפשר ל-Dell לספק את פתרון אחסון ה-Ethernet הראשון שיאושר עבור DGX SuperPOD של NVIDIA.

פתרון ייעודי ל-SuperPOD

SuperPOD היא ארכיטקטורת מרכז נתונים מותאמת בינה מלאכותית המספקת כוח חישוב אדיר הנדרש לאימון מודלי למידה עמוקה (DL) בקנה מידה, ומאיצה את הזמן לתוצאות (time to outcomes) להנעת חדשנות עתידית.

באמצעות שימוש במחשוב מבוסס GPU DGX A100, B200 או H200 יחד עם שכבת אחסון PowerScale F710 , ה-SuperPOD של NVIDIA מסוגלת לספק ביצועים פורצי דרך.

הפריסה כמערכת מדרגית משולבת במלואה, SuperPOD נבנתה באופן ייעודי לפתרון בעיות חישוביות מאתגרות במגוון רחב של עומסי עבודה AI. כולל ייעול שרשרות האספקה, בניית מודלי שפה גדולים והפקת תובנות מפטה-בייט של נתונים לא מובנים – "unstructured".

להניע תפוקה לפריסות גדולות

מעטפת הביצועים המסופקת על ידי DGX SuperPOD מאפשרת אימון מהיר של ריבוי צמתי LLMs בקנה מידה משמעותי. גישה משולבת זו של אספקה, ניהול, מחשוב, רשתות ואחסון מהיר, מאפשרת מערכת מגוונת שיכולה להשתרע על פני ניתוח נתונים, פיתוח מודלים והסקת AI, עד לעומסי העבודה הגדולים והמורכבים ביותר מבוססי שנאים, מערכות למידה עמוקה. , ודגמי בינה מלאכותית של טריליון פרמטרים.

על מנת להניע את התפוקה הנדרשת לפריסות NVIDIA SuperPOD גדולות יותר, קישוריות לקוח NFS לאשכול PowerScale יש להשתמש גם ב-RDMA וגם ב-nconnect, בנוסף ל-GPUDirect.

בעוד שהמחסנית המקורית Linux NFS תומכת בשימוש, היא אינה מאפשרת הגדרת nconnect ו-RDMA בו-זמנית.

על מנת להתמודד עם זה, מנהל ההתקן מרובה-נתיבים מאפשר ללקוחות Linux NFS להשתמש ב-RDMA בשילוב עם אפשרויות הרכבה של nconnect, תוך הגדלת מגבלת ה-nconnect המקסימלית מ-16 ל-64 חיבורים. בנוסף, פתרון ה-SuperPOD מחייב שימוש באפשרות 'localports_failover' NFS mount, שעובדת כרגע רק עם RDMA.

מנהל ההתקן Multipath Client יכול להוות תועלת ניכרת בביצועי עומסי עבודה עם קריאות וכתיבה בסטרימינג אל ומשרתים בודדים בעלי הספק גבוה, במיוחד למספר קבצים בתוך חיבור NFS יחיד - בנוסף לעומסי עבודה SuperPOD ו-BasePOD AI. לעומת זאת, זרימת קבצים בודדים וכתיבה מרובה במקביל לאותו קובץ על פני מספר צמתים בדרך כלל אינם נהנים באופן מהותי ממנהל ההתקן הרב-נתיבי.

 

ללא ה-multipath client driver, רכיב NFS יחיד יכול לנתב רק לכתובת IP אחת של צומת אחסון PowerScale.

לעומת זאת, מנהל ההתקן מרובה-נתיבים מאפשר ללקוחות NFS להפנות קלט/פלט לצמתי PowerScale מרובים לתפוקה מצטברת גבוהה יותר של לקוח יחיד.

שיפור ביצועי NFS עם  Dell Multipath Driver: פתרונות מתקדמים לפריסות  SuperPOD

ה-multipath driver מאפשר נקודת הרכבת NFS אחת לנתב למספר כתובות IP של צומת. קבוצת כתובות IP מורכבת מלקוח NFS לוגי אחד עם נקודת הקצה (אשכול) המרוחקת באמצעות מספר מכונות מרוחקות (צמתים), המיישמת ארכיטקטורת שרת מבוזר.

אפשרויות ההרכבה העיקריות של NFS בעלות עניין עם multipath client driver:

קיימות כמה אפשרויות הרכבה מתקדמות שיכולות להיות שימושיות לסחיטת תפוקה נוספת, במיוחד עם פריסות SuperPOD. אפשרויות אלו כוללות 'emoteport offsets, שיכולות לסייע בטעינת מטמון L1, ו-spread reads and writes, שיכולים לסייע באיזון עומסים.

ה-Dell multipath driver זמין להורדה באתר התמיכה לכל לקוח בעל זכאות OneFS: כאן

אין דרישה לרישיון, וגם לא תשלום, והוא מסופק גם כחבילת Linux בנויה מראש וגם כ-customer-compliable source code.. יש קובץ README הכלול בקוד המספק הוראות בסיסיות.

ה-multipath client driver פועל על מכונות פיזיות ווירטואליות כאחד, ועל פני מספר הפצות לינוקס פופולריות. המטריצה ​​הבאה מציגה את הגרסאות הנתמכות כעת, בתוספת זמינות חבילה שהורכבה מראש ו/או אפשרות self-compilation.

בעוד שגרסת המהדורה העיקרית- 1.x - נכונה בטבלה, מספר ההפצה של הספרה השנייה יוגדל לעתים קרובות ככל שיצאו גרסאות מעודכנות.

לפי התכנון, multipath driver תומך רק בגרסאות חדשות ועדכניות של הפצות לינוקס הפופולריות. גרסאות ליבה ישנות יותר של לינוקס לרוב אינן תומכות בפונקציונליות מלאה של NFS, במיוחד עבור אפשרויות תצורת ההרכבה '--remoteports' ו/או '--localports'. בנוסף, גרסאות לינוקס ישנות יותר יכולות לרוב לגרום לסיכוני אבטחה משמעותיים, במיוחד ברגע שתיקוני הפגיעויות הנוכחיים ו-hotfixes אינם זמינים.

הן ארכיטקטורות מעבד x86 והן פלטפורמות מבוססות GPU, כגון NVIDIA DGX, נתמכות.

אמנם אין צורך בתצורת ליבה ספציפית של NFS או OneFS בצד אשכול PowerScale לתמיכה ב-multipath driver, אך קיימות כמה דרישות מוקדמות בסיסיות. מטריצת התמיכה של OneFS הבאה בפינה השמאלית העליונה של שקופית זו מפרטת איזו פונקציונליות מנהל התקן זמינה באיזו מהדורה , מ-OneFS 9.5 ועד לנוכחית.

דרישות ותנאים לפריסת NVIDIA SuperPOD עם OneFS 9.9 ו-multipath driver

שימו לב כי גם OneFS 9.9 נדרש עבור כל פריסות NVIDIA SuperPOD, מכיוון שיש כמה אופטימיזציות ביצועים ב-9.9 במיוחד עבור אותה פלטפורמה.

בנוסף, ניתן להגדיר את מאגר הרשת הדינמי והסטטי באשכול לשימוש עם multipath driver. אם צמתי F710 נפרסים באשכול, נדרש OneFS 9.7 ואילך.

שימו לב כי בעת פריסת פתרון NVIDIA SuperPOD או BasePOD, ארכיטקטורת הייחוס מחייבת אשכול PowerScale המורכב מצמתי F710 All-Flash המריצים OneFS 9.9 ואילך.

על מנת שלקוח לינוקס יתחבר בהצלחה לאשכול PowerScale באמצעות multipath driver, הוא חייב להפעיל אחד מה-Linux flavors הבאים:

לפי התכנון, ה-multipath driver תומך רק בגרסאות חדשות יותר ועדכניות של הפצות לינוקס הפופולריות. ליבות לינוקס ישנות יותר לרוב אינן כוללות פונקציונליות מלאה של לקוח NFS, במיוחד עבור אפשרויות ההרכבה '--remoteports' ו-'--localports'. סביר להניח שתבחינו גם בהיעדר הבולט של Red Hat Enterprise Linux מהמטריצה ​​הזו. עם זאת, ההנדסה אכן צופה תמיכה גם ב-RHEL 8 וגם ב-9 בגרסה עתידית.

יש גם כמה דרישות לקוח מוקדמות נוספות שיש לעמוד בהן:

אם מוגדר RDMA, הלקוח חייב להכיל Ethernet NIC המתאים ל-RDMA, כגון סדרת Mellanox CX.

בלקוח Linux צריכה להיות מותקנת חבילת 'trace-cmd', יחד עם חבילות הקשורות ללקוח NFS.

השלב הבא: משפרים ביצועי AI

PowerScale Multipath Client Driver הפתרון המתקדם שלנו מאפשר צבירת ביצועים של מספר צמתי PowerScale  דרך נקודת הרכבה אחת של NFS, ומספק חווית AI חלקה ויעילה יותר. הצטרפו למהפכת הבינה המלאכותית ללא מחסומים – אנחנו כאן לפרטים נוספים ותיאום הדגמה.