VGG16 یک معماری شبکه عصبی کانولوشن است که توسط گروه هندسه تصویری در دانشگاه آکسفورد توسعه یافته است. نام این معماری VGG16 است زیرا دارای 16 لایه است (13 لایه کانولوشن و 3 لایه کاملاً متصل).
در اینجا یک نمای کلی از معماری VGG16 آورده شده است:
1- لایه ورودی: یک تصویر با اندازه ثابت را به عنوان ورودی می پذیرد (به عنوان مثال 224x224x3 برای تصاویر RGB).
2- لایه های کانولوشن: 13 لایه کانولوشن با فیلترهای کوچک (3×3) و گامی 1. تعداد فیلترها در هر لایه با عمیق تر شدن شبکه افزایش می یابد و به آن امکان می دهد ویژگی های پیچیده تر را یاد بگیرد.
3- حداکثر لایههای ادغام: 5 لایه حداکثر با لایههای کانولوشن درهم میآیند تا وضوح فضایی نقشههای ویژگی کاهش یابد و میدان دریافتی افزایش یابد.
4-لایه های کاملا متصل: 3 لایه کاملا متصل که خروجی آخرین لایه کانولوشن را به خروجی نهایی شبکه متصل می کند.
5- لایه خروجی: یک لایه کاملاً متصل نهایی که احتمالات پیشبینیشده برای کلاسهای مسئله طبقهبندی را خروجی میدهد.
معماری VGG16 در بسیاری از کارهای طبقه بندی تصاویر موفق بوده و به طور گسترده به عنوان معیاری برای معماری های دیگر استفاده شده است.