منظم سازی در واقع تکنیکی است که برای جلوگیری از برازش بیش از حد با تنظیم پیچیدگی یک مدل استفاده می شود. هدف یافتن تعادل مناسب بین داشتن مدلی بسیار ساده و کمتر از داده ها و مدلی که بیش از حد پیچیده و بیش از حد با داده ها تناسب دارد، پیدا شود.
چندین روش منظم سازی وجود دارد که معمولاً در یادگیری ماشین استفاده می شود، مانند منظم سازی L1 , L2, dropout و توقف زودهنگام.
منظمسازی L1 که به نام تنظیم Lasso نیز شناخته میشود، یک عبارت جریمه به تابع ضرر اضافه میکند که متناسب با مقدار مطلق پارامترهای مدل است. این مدل را تشویق میکند تا تنها مهمترین ویژگیها را انتخاب کند و به طور موثر انتخاب ویژگی را انجام دهد و پیچیدگی مدل را کاهش دهد.
منظمسازی L2 که به نام منظمسازی
Ridge نیز شناخته میشود، یک عبارت جریمه به تابع ضرر اضافه میکند که متناسب با مجذور پارامترهای مدل است. این مدل را تشویق می کند که مقادیر پارامترهای کوچکی داشته باشد، به طور موثر پیچیدگی مدل را کاهش می دهد و از برازش بیش از حد جلوگیری می کند.
منظمسازی dropout بهطور تصادفی برخی از نورونهای مدل را در طول آموزش حذف میکند و نورونهای باقیمانده را مجبور میکند تا ویژگیهای قویتر و قابل تعمیم بیشتری بیاموزند. این امر با کاهش وابستگی مدل به ویژگیهای خاص، به جلوگیری از برازش بیش از حد کمک میکند.
توقف زودهنگام روشی است که در آن مدل برای تعداد ثابتی از دورهها آموزش داده میشود، و زمانی که خطای اعتبارسنجی بهبود نمییابد، آموزش متوقف میشود. این کار با متوقف کردن تمرین قبل از اینکه مدل شروع به اضافه شدن کند، به جلوگیری از اضافه کردن کمک میکند.
منظمسازی میتواند ابزاری قدرتمند برای مدیریت همخطی یا همبستگی بین ویژگیها، یافتن نویز دادهها و جلوگیری از برازش بیش از حد باشد. با تنظیم پیچیدگی مدل، منظم سازی می تواند به بهبود عملکرد تعمیم مدل کمک کند و آن را برای داده های جدید قوی تر کند.