ساخت پروژه در بینا اکسپرتز-بخش چهارم-افزایش تصاویر
برای بهبود عملکرد مدل هوش مصنوعی، بهتر است تصاویر موجود برای آموزش اضافه شود. برای تقویت تصاویر در این مرحله تصاویر بیشتر به مجموعه داده موجود اضافه می شود.
پیش پردازش تصاویر
اضافه کردن تصویر
برای بهبود عملکرد مدل هوش مصنوعی، بهتر است تصاویر موجود برای آموزش اضافه شود.
برای تقویت تصاویر در این مرحله تصاویر بیشتر به مجموعه داده موجود اضافه می شود.
این فرآیند می تواند به بهبود توانایی مدل کاربر برای تعمیم و در نتیجه عملکرد موثرتر روی تصاویر دیده نشده کمک کند.
BinaExperts از ویژگی های زیر برای تقویت تصاویر پشتیبانی می کند:
·
Flip ·
90 degree rotation ·
Random rotation ·
Random crop ·
Random shear ·
Blur ·
Exposure ·
Random noise ·
Cutout (paid plans
only) ·
Mosaic (paid plans
only) |
نکته
توصیه می شود کاربر در ابتدا پروژه را بدون هیچ گونه افزودن
تصویر جدید شروع کند. این به کاربر امکان می دهد کیفیت مجموعه داده خام خود را ارزیابی
کند. اگر عمل افزودن انجام شود و مجموعه دادهها آنطور که انتظار میرود عملکرد خوبی
نداشته باشد، مدل پایهای وجود نخواهد داشت که بتوان عملکرد مدل را با آن مقایسه
کرد. اگر بدون افزایش داده عملکرد مدل خوب نیست، ممکن است لازم
باشد تعادل کلاس، نمایش داده ها و اندازه مجموعه داده ها را بررسی کرد. هنگامی که
یک مجموعه داده بدون اضافه کردن داده جدید بر روی یک مدل با موفقیت آموزش داده شد،
می توان برای کمک به بهبود عملکرد مدل، موارد تقویتی را اضافه کرد. |
ایجاد تصاویر افزوده شده قبل از آموزش
انجام افزایش تصویر در یک نسخه ("افزایش آفلاین") به جای زمان آموزش، چند مزیت کلیدی دارد.
1. تکرارپذیری مدل افزایش یافته است. با BinaExperts ، یک کپی از نحوه افزودن هر تصویر وجود دارد. به عنوان مثال، ممکن است متوجه کاربر متوجه شود که مدل در تصاویر روشن به جای تصاویر تاریک عملکرد بهتری دارد، بنابراین باید داده های آموزشی در نور کم بیشتری جمع آوری کند.
2. زمان آموزش کاهش یافته است. افزودن داده عملیات محدود شده توسط CPU هستند. هنگامی که کاربر در حال آموزش بر روی GPU است و همین طور در حال انجام افزایش تصویر است، GPU اغلب منتظر است تا CPU دادههای افزودهشده را در هر دوره ارائه دهد تا اضافه می شود.
3. هزینه آموزشی کاهش می یابد. از آنجایی که افزایش داده عملیاتی با محدودیت CPU هستند، GPU گران قیمت و اجارهای اغلب منتظر است تا تصاویر برای آموزش داده شود.
افزودن Augmentations
برای افزودن موارد افزایش داده،کاربر باید به سر برگ نسخه های مرتبط با پروژه خود در داشبورد BinaExperts مراجعه کند. سپس، روی Augmentations کلیک کرده و گزینه افزایشی مورد نظر را برای پروژه خود تنظیم کند.
کاربر می تواند انتخاب کند که چند بار به دنبال افزایش یک تصویر خاص است. به عنوان مثال، لغزش به 3 به این معنی است که هر یک از تصاویر بر اساس تنظیماتی که انجام شده، 2 افزایش تصادفی دریافت می کند.
مثال: 3 بار افزایش -->یک سری از تصاویر ایجاد شده تنها
با تنظیمات پیش پردازشی که اعمال شده ایجاد می شود. سری 2 تصویر افزایش دیگری را
دریافت میکنند و 3 سری تعداد تصاویر برای هر تصویر منبع برای کاربر باقی میماند. |
نحوه اعمال افزایش
افزایشها به هم پیوسته هستند، با تصادفیسازی تنظیمات آگمنتیشن، و مقادیر برای هر تنظیمات، برای هر تصویر افزایش یافته اعمال میشوند. هر تصویری که در طول این فرآیند به صورت تکراری ظاهر می شود، از نسخه ایجاد شده فیلتر می شود.
به عنوان مثال، اگر کاربر "flip horizontally" و "salt and pepper noise" را انتخاب کند، یک تصویر داده شده به طور تصادفی به عنوان یک چرخش افقی منعکس می شود و نویز تصادفی نمک و فلفل دریافت می کند.
گزینه های افزایش
در ادامه آگمنتیشن های پشتیبانی شده توسط BinaExperts آورده شده است. پارامترهایی که می توان سفارشی کرد در دسترس هستند.
Flip
میتوان تصویر را به طور تصادفی به صورت عمودی یا افقی برگرداند (انعکاس داد). حاشیه نویسی به درستی منعکس شده است.
· افقی: تصویر را در جهت چپ/راست برمی گرداند.
· عمودی: تصویر را در جهت بالا/پایین برمی گرداند.
90 Degree Rotations
به طور تصادفی یک تصویر را 90 درجه یا 180 درجه بچرخانید.
جهت عقربه های ساعت: تصویر را 90 درجه در جهت عقربه های ساعت می چرخاند.
خلاف عقربه های ساعت: یک تصویر را 90 درجه در خلاف جهت عقربه های ساعت می چرخاند.
وارونه: یک تصویر را 180 درجه ( وارونه) می چرخاند.
Random Rotation
به طور تصادفی یک تصویر را در جهت عقربه های ساعت یا خلاف جهت عقربه های ساعت تا درجه ای که کاربر انتخاب می کند می چرخاند.
· درجه ها: می توان بالاترین مقداری را انتخاب کرد که یک تصویر به طور تصادفی در جهت عقربه های ساعت یا خلاف جهت عقربه های ساعت می چرخد.
توجه: حاشیه
نویسی تحت تأثیر قرار می گیرد. در حال حاضر، بهتر است اجرای هر گونه حاشیه نویسی
را که کاملاً خارج از چارچوب است حذف کرده و هر حاشیهنویسی را که تا حدی خارج از
کادر است برش داد تا با لبه تصویر همخوانی داشته باشد. برای این حاشیه نویسی های
نگهداری شده، BinaExpertsدر حال
حاضر هر مقدار از منطقه تشخیص اشیاء اصلی را نگه می دارد.
به زودی این امکان را برای کاربر فراهم خواهم شد که انتخاب کند چند درصد از ناحیه
حاشیه نویسی را که می خواهد حفظ کند - برای مثال، وقتی کاربر فقط می خواهد حاشیه
نویسی هایی را نگه دارد که حداقل 80٪ از مساحت اصلی خود را داشته باشد، این چنین
پشتیبانی خواهد شد. |
Random Shear
به طور تصادفی یک تصویر را در محور افقی یا عمودی آن تحریف می کند.
· افقی: می توان بالاترین مقدار را انتخاب کرد که یک تصویر به طور تصادفی در محور x خود برش داده شود.
· عمودی: می توان بالاترین مقدار را انتخاب کرد که یک تصویر به طور تصادفی در محور y خود برش داده شود.
Blur
تاری گاوسی را به یک تصویر اعمال می شود.
پیکسل ها: میزان تاری اعمال شده روی یک تصویر را تعیین می کند (یعنی اندازه هسته فرآیند محو کردن، همه اندازه های هسته فرد هستند). 25 پیکسل حداکثر تاری است.
Random Noise
نویز تصادفی نمک و فلفل را به یک تصویر تزریق می کند.
Percent: درصد پیکسل های یک تصویر را که تحت تأثیر قرار می گیرند، تا 25 درصد انتخاب می کند.
در ادامه توضیحاتی برای گزینه های آگمنتیشن آمده است:
HVS(Hue, Value, Saturation): HVS میزان رنگ، مقدار و سطوح اشباع تصاویر را تنظیم می کند و ظاهر رنگ آنها را تغییر می دهد.
Contrast: افزایش کنتراست سطوح کنتراست تصاویر را تغییر می دهد و تفاوت بین مناطق روشن و تاریک را مشخص می کند.
Snow: گزینه برف جلوه های برف مانند را روی تصاویر می پوشاند و ظاهری برفی ایجاد می کند.
Fog: جلوه های مه آلود را به تصاویر اضافه می کند، شبیه مه یا شرایط مه.
Rain: افکت های قطره باران را روی تصاویر می پوشاند و شرایط آب و هوایی بارانی را شبیه سازی می کند.
Sun: افزایش نور خورشید جلوه های نور خورشید را به تصاویر اضافه می کند و روشنایی و گرما را تغییر می دهد.
Vertical: تصاویر را به صورت عمودی برمیگرداند و تصاویر آینه ای را به صورت عمودی ایجاد می کند.
Horizontal: تصاویر را به صورت افقی برگردانده و تصاویر آینه ای را به صورت افقی ایجاد می کند.
این گزینههای آگمنتیشن میتواند برای ایجاد تغییرات در مجموعه دادهها، تقویت دادهها برای بهبود استحکام و تعمیم مدل استفاده شود.