ארכיטקטורת דאטה
העברת כל נתוני הארגון לData warehouse (DWH), ועל הפופולריות של ה ELT
העברת הנתונים ממערכות בארגון למסד נתונים מרכזי (Data Warehouse) באמצעות השיטה הפופולארית- ELT, מביאה עימה יתרונות רבים! הנה כמה: עלות, זמן, סקלביליות ועוד!
He
העברת נתונים ממערכות ארגוניות למסד נתונים מרכזי היא ללא ספק משימה ברת משמעות רבה לכל ארגון שעובר תהליך שכזה. קיימות מגוון שיטות, אך כאן נרצה לחלוק עמכם את שיטת ה ELT על יתרונותיה!
ראשית, נזכיר בגין מה עומדת כל אות ב ETL:
E – Extract – משיכת הנתונים ממערכות המקור.
T – Transform – ביצוע טרנספורמציה לנתונים כדי להתאים אותם למודל נתונים אנליטי.
L – Load – טעינת המודל האנליטי ל Data Warehouse.
בשנים האחרונות היתה התפתחות משמעותית בתחום הענן, ויותר ויותר חברות מבינות את היתרונות של העברת המערכות שלהן לענן.
לפני השימוש בענן, שרתי ה-DWH המסורתיים כגון Oracle או SQL Server היו מוגבלים במשאבים בהתאם לשרת הפיזי בו הם היו מותקנים. כדי לא לפגוע במשתמשי הקצה ע"י יצירת עומסים על שרת ה DWH, השיטה הנכונה היא לבצע את הטרנספורמציה לנתונים בשרתים ייעודים עם כלים ETL כגון SSIS, DataStage, Informatica וכו', ורק לאחר סיום הטרנספורמציה, לטעון את הנתונים הסופיים ל DWH כשלב אחרון.
כיוון שנפתחו אפשרויות חדשות של יישום ה Data Warehouse בכלים סקלביליים בענן, כגון snowflake, synapse, redshift, google bigquery – הוסרה הלכה למעשה מגבלת המשאבים, ולפיכך במקום לעבור בדרך המסורתית ETL, אפשר כעת לשנות את סדר הפעולות ולבצע ELT, כלומר לבצע את שלב הטרנספורמציה אחרי טעינת הנתונים הגולמיים ל Data Warehouse, ולהשתמש במשאבי ה DWH עצמו לבצע טרנספורמציות.
נו, בסדר, מה הביג דיל? ETL, ELT. מה בדיוק הבשורה אם בשורה התחתונה מגיעים לאותה תוצאה?