22934 אלגוריתמים לנתוני עתק
22934 אלגוריתמים לנתוני עתק
4 נקודות זכות
שיוך: תואר שני / מדעי המחשב
שיוך נוסף: תואר שני / למידת מכונה וניתוח נתוני עתק
שיוך נוסף: מדעים / מדעי המחשב
תנאי קבלה: קבלה לתואר שני במדעי המחשב1.
או קבלה לתואר שני בלמידת מכונה וניתוח נתוני עתק. ידע קודם דרוש: מתמטיקה ללמידת מכונה
פיתוח הקורס: פרופ' מורן פלדמן
יעוץ: פרופ' זאב נוטוב
מהפכת האינטרנט אפשרה, באופן חסר תקדים בתולדות האנושות, גישה קלה לכמויות אדירות של מידע. לרוע המזל, שיטות אלגוריתמיות קלאסיות מתקשות לעיתים קרובות לעבד כמויות כאלה של מידע באמצעות כמות סבירה של זמן וזיכרון. לכן, בעשורים האחרונים פותחו שיטות וכלים חדשים המיועדים להתמודדות עם נתוני עתק (כמויות גדולות מאוד של מידע). מטרתו של קורס זה היא להציג את עולם נתוני העתק וכמה מהשיטות האלגוריתמיות שפותחו עבורו. הקורס מתרכז בעיקר בצד התיאורטי של שיטות אלה, אך נוגע מעט גם בצד המעשי של חלקן.
נושאי הלימוד
הקורס מחולק לשלושה חלקים. כל אחד מהחלקים עוסק במודל חישובי התופס פן שונה של עולם נתוני העתק.
-
מודל זרם המידע – במודל זה, האלגוריתם מקבל זרם רציף של נתונים, ועליו לבצע חישוב עליהם תוך שימוש בכמות זיכרון הקטנה מכמות הנתונים. אלגוריתמים למודל זה מאפשרים להתמודד עם מצבים בהם לא ניתן כלל לשמור את המידע שמתקבל בשלמותו.
-
אלגוריתמים תת-לינאריים בזמן –באופן מסורתי, סיבוכיות זמן לינארית נחשבת לאידאלית. אך, עבור יישומים רבים בעולם נתוני העתק, סיבוכיות זמן לינארית היא איטית מדי. עבור יישומים כאלה נדרשים אלגוריתמים תת-לינאריים בזמן, כלומר אלגוריתמים שזמן הריצה שלהם נמוך מהזמן הנדרש לקריאת הקלט שלהם.
-
אלגוריתמים מבוזרים ומקומיים – דרך אחת להתמודד עם נתוני עתק היא באמצעות חישוב מקבילי. במרבית המקרים חישוב מסוג זה מבוצע במציאות באמצעות אשכול מחשבים רגילים (מן המדף) שמחוברים באמצעות רשת תקשורת. כמו כן במקרים מסויימים מספיק לעבד ולנתח רק חלק מקומי של הקלט במקום את כולו כדי להאיץ את סיבוכיות הזמן והזכרון מבלי לפגוע בתקינות הפלט.
במהלך הקורס הסטודנטים יגישו מטלות תאורטיות ומעשיות ועבודה מסכמת בסיום.
1 סטודנט או סטודנטית שאינם עומדים בתנאי הקבלה, יוכלו במקרים מסויימים להרשם לקורס. לפרטים נוספים עיינו בסעיף קבלה לקורסים בודדים בתכנית הלימודים לתואר שני במדעי המחשב.