מתי להשתמש ב-holdout?

מתי להשתמש ב-holdout?
מתי להשתמש ב-holdout?
Anonim

מהו ערכת Holdout? המכונה לפעמים נתוני "בדיקות", תת-קבוצת מחזיקות מספקת אומדן סופי של ביצועי מודל למידת המכונה לאחר הכשרה ואימות. אסור להשתמש בערכות Holdout כדי לקבל החלטות באילו אלגוריתמים להשתמש או לשיפור או כוונון אלגוריתמים.

האם אימות צולב טוב יותר מ-holdout?

אימות צולב הוא בדרך כלל השיטה המועדפת מכיוון שהיא נותנת לדגם שלך את ההזדמנות להתאמן על מספר מקטעי מבחנים ברכבת. זה נותן לך אינדיקציה טובה יותר לגבי ביצועי המודל שלך בנתונים בלתי נראים. מאידך גיסא, החזקה תלויה בפיצול מבחן רכבת אחד בלבד.

מהי גישת החזקה?

Holdout Method היא השיטה הסוג הפשוט ביותר להערכת מסווג. בשיטה זו, ערכת הנתונים (אוסף של פריטי נתונים או דוגמאות) מופרדת לשתי ערכות, הנקראות ערכת הדרכה וערכת מבחן. מסווג מבצע פונקציה של הקצאת פריטי נתונים באוסף נתון לקטגוריית יעד או מחלקה.

האם עלי תמיד לבצע אימות צולב?

באופן כללי אימות צולב הוא נחוץ תמיד כאשר אתה צריך לקבוע את הפרמטרים האופטימליים של המודל, עבור רגרסיה לוגיסטית זה יהיה פרמטר C.

מהו היתרון של אימות צולב בקפלים?

אם אתה משווה בדיקות-MSE טובות יותר במקרה של קורות חיים פי קיפול מאשר LOOCV. קורות חיים כפולים או כל קורות חיים או שיטות דגימה מחדש לאלשפר שגיאות בדיקה. הם מעריכים שגיאות בדיקה. במקרה של קיפול k, הוא עושה עבודה טובה יותר באומדן שגיאה מאשר LOOCV.

מוּמלָץ: