מתי להשתמש ברגולציה l1 ו-l2?

תוכן עניינים:

מתי להשתמש ברגולציה l1 ו-l2?
מתי להשתמש ברגולציה l1 ו-l2?
Anonim

מנקודת מבט מעשית, L1 נוטה לכווץ מקדמים לאפס ואילו L2 נוטה לכווץ מקדמים באופן שווה. לכן L1 הוא שימושי לבחירת תכונה, מכיוון שאנו יכולים להוריד את כל המשתנים הקשורים למקדמים שעולים לאפס. L2, לעומת זאת, שימושי כאשר יש לך תכונות קולינאריות/תלויות בשיתוף פעולה.

מה השימוש ברגוליזציה מהן רגוליזציה L1 ו-L2?

L1 רגולציה נותנת פלט במשקלים בינאריים מ-0 עד 1 עבור תכונות המודל ומאומצת להפחתת מספר התכונות במערך נתונים ענק ממדי. הסדרת L2 מפזרת את מונחי השגיאה בכל המשקולות שמובילה למודלים סופיים מותאמים אישית מדויקים יותר.

מהם ההבדלים בין הסדרת L1 ו-L2?

ההבדל האינטואיטיבי העיקרי בין הסדרת L1 ו-L2 הוא ש-L1 סדירות מנסה להעריך את החציון של הנתונים בעוד שהסדרת L2 מנסה להעריך את ממוצע הנתונים כדי למנוע התאמת יתר. … ערך זה יהיה גם החציון של התפלגות הנתונים מבחינה מתמטית.

מהי רגולציה L1 ו-L2 בלמידה עמוקה?

L2 רגולציה ידועה גם כדעיכת משקל מכיוון שהיא מאלצת את המשקולות לדעוך לעבר אפס (אך לא בדיוק אפס). ב-L1, יש לנו: בזה, אנחנו מענישים את הערך המוחלט של המשקולות. שלא כמו L2, המשקולות עשויות להיות מופחתות לאפס כאן. לפיכך, זה מאוד שימושי כאשר אנו מנסים לדחוסהדגם שלנו.

איך פועלת הסדרת L1 ו-L2?

מודל רגרסיה שמשתמש בטכניקת רגוליזציה של L1 נקרא רגרסיה של Lasso ומודל שמשתמש ב-L2 נקרא רגרסיה של Ridge. ההבדל העיקרי בין שני אלה הוא תקופת הענישה. רגרסיית רכס מוסיפה "גודל ריבועי" של מקדם כמונח עונש לפונקציית ההפסד.

מוּמלָץ: