מסדי נתונים ברשת – העתיד של טכנולוגיית מסדי הנתונים?

עוד בשנות ה-90, קבוצה של מהנדסים גרמנים הרכיבה את רשת מחשוב הרשת הראשונה בעולם עם למעלה מ-100 מחשבים הפועלים על הגרסה הראשונה של מערכת ההפעלה לינוקס. זו הייתה הצלחה גדולה וכולם קראו לזה שחר של טכנולוגיה חדשה שתשנה את עולם המחשוב לנצח.

מה שהמהנדסים האלה לא הבינו זה איך מנועי מסד נתונים עבדו באותה תקופה וכיצד הם בעצם קבעו את המגמות לפיתוח חומרה. מנועי מסד הנתונים קראו למערכות Massive Parallel Processing (MPP) שהציעו עשרות מעבדים בפלטפורמת שרת אחת. בדיוק כשחשבנו שהמיינפריים מת – עם מחשוב גריד, היינו עדים להולדת המיינפריים של המערכות הפתוחות.

כדי לקזז את מערכות ה-MPP הללו, אדריכלי תוכנה יצרו שכבת תווך כדי להתרחק מהמפלצות הללו. עכשיו יש לנו את מערכות MPP האלה במרכז היקום וכל שרתי התווך האלה רוקדים סביבם.

במשך שנים רבות מילאו חברות את מרכזי הנתונים שלהן במאות שרתי תווך ובעשרות מערכות MPP. הקירור וספקי הכוח פעלו בשיאם ומנהלי מרכז הנתונים לא ידעו כיצד לתמוך בעודף החומרה הזה בעתיד.

זה הפך למקום הולדתו של וירטואליזציה של שרתים. תוך מספר שנים, וירטואליזציה של שרתים הפכה למוקד העיקרי של כל חברה המחפשת חיסכון בתשתית. איחוד שרתי תווך היה משימה קלה וסיפור הצלחה עצום שחלקו בגאווה מנהלי הפרויקט.

אבל תחום אחד לא הצליח כל כך באיחוד החומרה. מערכות MPP לא נעלמו בשקט. התברר שמערכות מסדי הנתונים היו יותר מדי להתמודד עם טירוף הווירטואליזציה של השרת. כן, נעשו אינספור מאמצים להעביר את מסדי הנתונים מהמפלצות הללו, אבל העולם הווירטואלי לא יכול היה לספק את הביצועים הדרושים כדי לתמוך במסדי הנתונים.

זוכרים את סיפור מחשוב הרשת שלנו? החזון של שיתוף צבא של מחשבים קטנים כדי לייצר את אותו כוח מחשוב כמו מערכות MPP המסיביות נראה אבוד לנצח. עד שהאמת המכוערת על מערכות MPP הפכה ברורה. הפעלת מערכות MPP ענקיות אינן רק עתירות אנרגיה, אלא שעלויות התחזוקה הנלוות הן גם מכבידות. רכישת מערכת MPP חלופית הייתה האפשרות היחידה. עם זאת, הוצאת הכסף הלכה והצטמצמה במהלך השנים האחרונות. כל זה הפך ל-Catch-22. היית צריך להוציא יותר כדי להגדיל את העלויות שלך!

ספקי מסדי נתונים להצלה: נראה כי טכנולוגיית מסדי הנתונים ברשת היא הדרך לצאת מתחת למשקל העצום של מערכות MPP אלו. קח כמה שרתים בעלי עוצמה כפולה או ארבע ליבות בעלות נמוכה ופזר את עומס העבודה על מספר שרתים. לא רק שאתה מקבל זמינות גבוהה מיידית, אלא שאתה מקבל מדרגיות נוספת מעבר למגבלות הפיזיות של פלטפורמת MPP שלך. ישנן שתי מתודולוגיות עיקריות בהשגת מסדי נתונים ברשת; שיתף הכל ולא שיתף כלום.

קטגוריית הכל המשותף נשלטת על ידי Oracle ו-Sybase. שתי המערכות מסוגלות לבצע כשל מיידי בתהליכי מסד נתונים אם שרת משתתף אחד יפול, כלומר. זמינות גבוהה. ושניהם יכולים להגדיל באופן דינמי את כוח המעבד שלהם על ידי הוספת שרתים נוספים לרשת, ושתי המערכות יכולות לאזן את עומס העבודה בין כל השרתים המשתתפים. Oracle RAC ו-Sybase ASE-Cluster Edition הן המערכות המתוחכמות ביותר הקיימות כיום. אם אתה רוצה לסחוט את המקסימום מהחומרה הקיימת שלך או אם אתה מבקש להחליף מפלצות MPP הזוללות אנרגיה ואוכלות דמי תחזוקה, שני מסדי הנתונים האלה הם כלי הנשק המועדפים.

המתודולוגיה השנייה אינה משותפת כלום. Microsoft SQL Server 2008 Federation Data Store מייצג את המוביל בקטגוריה זו. בניגוד לטכנולוגיית הכל משותף, לגישת הכלום המשותף יש הבחנה ברורה בין נתונים מקומיים וגלובליים. גישת פדרציית הנתונים מאפשרת שילוב נתונים המאוחסנים באופן מקומי במספר מסדי נתונים בודדים. הוא פועל כצבר של מסדי נתונים מרובים. זה לא מתוחכם כמו גישת הכל משותף, אבל זה עושה את העבודה גם כן.

יש מתמודד שלישי, Sybase IQ Multiplex. מערכת זו משתמשת בגישה היברידית, נתונים משותפים, אך ללא מטמון משותף. זה מאוד ייחודי ולאף ספק מסד נתונים אחר אין דבר כזה. Sybase IQ הוא מנוע מחסני הנתונים של Sybase. מסד נתונים של עמודות וקטור שקבע שיאי ביצועים חדשים על ידי קיום צומת כותב ייחודי אחד באשכול ומספר כמעט בלתי מוגבל של צמתי קורא. אבל יש זהירות: לעולם אל תנסה להפעיל יישום OLTP במערכת זו. מערכת זו בנויה לאחסון נתונים ודיווח אנליטי מאסיבי, התאמה מושלמת לכלי BI רעבים לנתונים.

ישנם כמה ספקי מסדי נתונים אחרים המציעים טכנולוגיית מסד נתונים גריד בטעם מסוים. מאמר זה לא נועד ליצור ניתוח תחרותי בין כל המערכות הללו, אלא נקודת התחלה להפעיל את הדמיון שלך. השורה התחתונה היא ששמירה על אנרגיה הופכת חשובה יותר ויותר וספקי תוכנה מספקים פתרונות למקסום חומרה זולה וצורכת אנרגיה נמוכה. העתיד שייך למאגרי מידע ברשת.