Chais2025_Heb_and

ע 29 דניאל ז'ורבל, נירית גביש, איציק בן - שלוש טבלה 1 . נתונים אודות דירוגי שאלות שביעות הרצון בכל קבוצה שאלה קבוצת האוואטאר הפורמלי קבוצת האוואטאר הספורטיבי קבוצת האוואטאר במראה יוםה - יומי F p " האוואטאר עזר לי להשתפר בראיון העבודה " M = 3.4, SD = 0.9 M = 3.5, SD = 0.9 M = 3.6, SD = 1.0 F (2,82) = 0.57 p = 0.57 " אני סומך/ת על ההמלצות שקיבלתי מהאוואטאר " M = 3.6, SD = 1.2 M = 3.8, SD = 0.6 M = 3.7, SD = 0.8 F (2,82) = 0.37 p = 0.70 " הרגשתי טוב במהלך הניסוי " M = 3.6, SD = 1.0 M = 3.6, SD = 1.1 M = 3.5, SD = 1.0 F (2,82) = 0.12 p = 0.89 " המשוב מהאוואטאר היה " מועיל M = 3.8, SD = 1.2 M = 3.9, SD = 0.9 M = 3.8, SD = 0.8 F (2,82) = 0.18 p = 0.83 " המשוב מהאוואטאר היה " ברור M = 4.0, SD = 1.0 M = 4.2, SD = 0.8 M = 4.3, SD = 0.8 F (2,82) = 0.61 p = 0.54 דיון ומסקנות השערותינו התקבלו באופן חלקי. ההבדל בין הקבוצות ניכר רק בזמני האימון, ו רק קבוצת ה אוואטאר במראה יוםה - יומי בלטה בכך . זמן האימון של קבוצת ה אוואטאר במראה יוםה - יומי היה קצר יותר מזה של קבוצות ה אוואטארים ה ספורטיבי וה פורמלי . המערכת סיימה את ה אימון כאשר נענו כל שאלות ה אוואטאר , ולכן זמן האימון הקצר עשוי להצביע על תשובות קצרות יותר של המשתתף. ייתכן כי הדבר נבע מאמון נמוך יותר של המשתתפים במערכת ורמת שיתוף פעולה נמוכה יותר במשחק התפקידים כשה אוואטאר היה בעל מראה שהוא מאוד לא רשמי . באשר לציונים הסופיים, כל המשתתפים בכל הקבוצות השתפרו ב ראיון השני ל עומת ה ראשון, אך לא היו הבדלים בי ן הקבוצות בציונים או ברמת השיפור. ייתכן שהדבר מעיד על כך שמראה ה אוואטאר לא השפיע על הביצועים בפועל במהלך הראיון. עם זאת, מאחר שזמן האימון של קבוצת ה אוואטאר במראה יום ה - יומי היה קצר יותר, ייתכן שזה נובע מחוסר רגישות בהערכת ביצועי ה ם שמבצעת ה מערכת. הסבר נוסף הוא שהתשובות של קבוצת ה אוואטאר במראה יוםה - יומי היו קצרות אך באותה איכות כמו של שתי הקבוצות האחרות. מחקר עתידי יכול לחקור לעומק את הסיבות לממצאים אלו. גם לות השא מן בנוגע לשביעות רצונם של המשתתפים עלה לא הבדל משמעותי בין הקבוצות. בנוסף, הדירוג היה דומה כמעט לכל השאלות, בין 3 )"מסכים חלקית"( ל -4 )"מסכים"(. לסיכום, מערכת האימון לראיון עבודה עם אוואטאר מבוסס ChatGPT אפשרה למשתתפים לשפר את כישוריהם, כפי ש נראה בציונים הגבוהים יותר ב ראיון השני, והמשתתפים תפסו אותה באופן חיובי. מראה ה אוואטאר ים השפיע על זמן האימון , שהיה קצר יותר עבור משתתפים ש פגשו את ה אוואטאר בעל המראה יוםה - יומי . יש לציין שייתכן ומספר הנבדקים הקטן מנע הסקת מסקנות משמעו תיות יותר, ואנו מציעים שבמחקרי המשך מספר הנבדקים יהיה גדול יותר. אף על פי שהממצאים אינם חד - משמעיים, ייתכן שיש להם השלכות מעשיות בתכנון צ'אטבוט לאימון לקראת ראיונות עבודה מבוסס LLM . מומלץ שאינטראקציה כזו עם המשתתף תתבצע עם אוואטאר בעל מראה רשמי , או לפחות לא במראה יום - יומי . בנוסף, לגבי ההשלכות על ביצוע אימון לשיפו ר כישורים רכים אחרים באמצעות משחקי תפקידים, מומלץ מראה ה ש אוואטאר ישקף נורמות חברתיות אמיתיות המתאימות לסיטואציה שאותה פוגשים המשתמשים . עולה השאלה האם המסקנות וההמלצות ממחקרנו חלות רק על מערכות אימון מבוססות LLM , או שניתן להכליל אותן למערכות צ'אטבוט אחרות, לא בהכרח מבוססות LLM . למערכות מבוססות LLM יש תכונות ייחודיות שמבדילות אותן ממערכות אימון קונבנציונליות. הן מאפשרות למשתתפים לתקשר איתן בשפה טבעית ו הן מסוגלות לחקות התנהגות אנושית במידה רבה. כתוצאה מכך, יש להן פוטנציאל לעודד משתתפים לשתף פעולה במשחקי תפקידים לצורך אימון או הכשרה במגוון תחומים . לפיכך, ההמלצה לעצב את מראה ה אוואטאר כך שיתאים לדמות אופיינית במשחק ה תפקידים עשויה להיות חשובה יותר עבור מערכת מבוססת LLM . מחקר עתידי יכול לחקור נושא זה עם מערכות אימון שאינן מבוססות LLM .

Chais2025_Heb_and_Eng-web