
ביג דאטה ו-NoSQL
היסטוריית הביג דאטה – מה זה ביג דאטה? פלטפורמות BigData הגיעו לעולם כאשר כמויות הנתונים הקיימות החלו לגדול
RDBMS – או בעברית: מערכת ניהול בסיסי נתונים רלציוניים, משמשת בעשורים האחרונים כפלטפורמת הנתונים העיקרית לאחסון נתוני תפעול ועסקאות הקריטיים ביותר של חברה.
בסיסי נתונים רלציוניים ידועים במנגנון העסקאות הבטוח שלהם מכיוון שהנתונים נשמרים באופן פרסיסטנטי, בעת השמירה. נתונים נשמרים בטבלאות עם סכימה מובנית ומוגדרת מראש, המכילה עמודות מסוגי נתונים שונים. הטבלה מציגה ישות עסקית כמו הזמנות, פריטי הזמנה, פריטים וכו’.
הרעיון של בסיסי נתונים רלציוניים הוא שכל פיסת נתונים חייבת להיות מאוחסנת פעם אחת, כדי למנוע התנגשויות בין טבלאות נתונים אחרות. כאשר למשתמש/אפליקציה, זקוקים לנתונים הוא יכול להריץ שאילתת SQL על מספר טבלאות באמצעות כדי לקשר בין טבלאות הנתונים כדי להביא רשומה לוגית אחת. לטבלה חייב להיות מפתח ראשוני המכיל עמודה אחת או יותר המגדירים את הייחודיות של הרשומה. מפתחות ראשיים משמשים למניעת כפילויות של נתונים בטבלה, ודרך לחבר בין טבלאות (ישויות).
בסיסי נתונים יחסיים ידועים גם בשלמות הנתונים שלהם כך שהנתונים יאוחסנו בצורה נקיה, לפי כללים עסקיים וללא כפילויות. לשם כך כל בסיס נתונים יחסי חייב להיות בעל האילוצים הבאים כדי לשמור על שלמות הנתונים:
לדוגמה: ב-orderItems, ה-orderID חייב להתקיים בטבלת ההזמנות
כדי לאפשר לשאילתות לרוץ מהר בטבלאות גדולות, בסיסי נתונים משתמשים באינדקסים שנוצרים על עמודה אחת או יותר עם קרדינליות גבוהה, לפיה משתמשים יכולים לסנן או למיין.
בסיסי נתונים רלציוניים משתמשים גם בהליכים ובפונקציות שמורות, וזאת כדי לאפשר הפעלה שגרתית של בסיס נתונים, מהבסיס עצמו. אובייקטים אלו משמשים להרצת פעולות וטרנזקציות כבדות בתוך בסיס הנתונים כדי להימנע מהשהייה גדולה של תעבורת רשת בין לקוחות ושרתים ולהריץ את הפעולות קרוב לנתונים בתוך שרת בסיס נתונים חזק. הליכים מאוחסנים משמשים גם כנקודה אחת של ההיגיון העסקי שכל רכיבי היישום יכולים להשתמש בה.
ניתן להשתמש בטריגרים בטבלאות כדי להריץ פעולה נוספת כאשר הנתונים משתנים בטבלה.
SeaData מתמחה בקוד Open Source, ובדאטהבייסים בענן ומספקת שירותי ייעוץ ופרויקטים בעולמות ה-DBA וה-Data Engineering לחברות המובילות בארץ ובעולם.
המומחיות הענפה שלנו באה לידי ביטוי בדאטה בייסים גדולים, וכן במספר רב של טרנזקציות ובנפחי נתונים גבוהים.
מאגרי המידע בהם אנו מומחים:
MySQL היא מערכת חינמית לניהול בסיסי נתונים רלציוניים בקוד פתוח, תחת תנאי הרישיון הציבורי הכללי של GNU.
זהו אחד ממאגרי המידע הפופולריים ביותר בשוק ומשמש חברות גדולות מאוד כמו Facebook, booking.com ועוד.
הוא תומך ב-ACID (אטומיות, עקביות, בידוד, עמידות). בסיסי נתונים של MYSQL מאוד יציבים, אמינים, ויכולים להתאים לעשרות אלפי קריאות וכתיבות במקביל, ובקלות רבה.
PostgreSQL היא מערכת ניהול דאטה בייסים רלציוניים בקוד פתוח, חינמית, ועם יכולת לטפל במחסני נתונים ואפליקציות מקוונות כמו אפליקציות אינטרנט ונייד.
PostgreSQL תומך ב-ACID (אטומיות, עקביות, בידוד, עמידות) עם פונקציונליות עשירה מאוד כמו כל בסיס נתונים Enterprise. יש לו פיצ’רים כמו תצוגת חומר, פונקציות אנליטיות, שאילתות מקבילות וכו’.
Oracle Database היא מערכת לניהול דאטה בייסים רלציונית המשמשת להפעלה על load מעורב של עיבוד עסקאות מקוון ומחסני נתונים.
Oracle ידועה באמינותה ובזמינותה הגבוהה, והפונקציונליות העשירה שלה.
המערכת משמשת בעיקר בתאגידים ארגוניים כמו בנקים, חברות כרטיסי אשראי, חברות ביטוח וכו’.
Microsoft SQL Server היא מערכת ניהול מסדי נתונים מורשית המשמשת להפעלה על Load מעורב של עיבוד עסקאות מקוון ומחסן נתונים.
SQL Server מותקן בעיקר על מערכת ההפעלה Windows, למרות שהוא התחיל לתמוך גם בלינוקס.
SQL Server הועבר בתחילה מ-Sybase ~1989 והוצא לראשונה ב-1993 (גרסה 4.2).
SQL Server מהיר מאוד, אמין ועשיר בפונקציונליות שהופכת אותו לאחד ממסדי הנתונים הפופולריים ביותר עבור חברות המבוססות על מערכות הפעלה של שרת Windows.
היסטוריית הביג דאטה – מה זה ביג דאטה? פלטפורמות BigData הגיעו לעולם כאשר כמויות הנתונים הקיימות החלו לגדול
LTP and Datawarehouse Systems.Runing POC ,Data Flow and Access Design machine.
Real Application Cluster(RAC), DataGuard on Linux,Unix and Windows Platform.
Using SQL,PLSQL TSQL and shell scripts integrated with CM tools.
Database optimzation from application level to DB,OS and HW level.
Tailoring the best backup and restore solution per application type.
Real Application Cluster(RAC), DataGuard on Linux,Unix and Windows Platform.
Using SQL, PLSQL TSQL, and shell scripts integrated with CM tools.
Database optimization from application level to DB, OS, and HW level.