ساخت پروژه در بینا اکسپرتز-بخش سوم-پیش پردازش تصاویر

برای آماده سازی داده ها برای مدل باید پیش پردازش تصاویر انجام شود.

ساخت پروژه در بینا اکسپرتز-پیش پردازش تصاویر
ساخت پروژه در بینا اکسپرتز-پیش پردازش تصاویر

برای آماده سازی داده ها برای مدل باید پیش پردازش تصاویر انجام شود.

پیش پردازش اطمینان حاصل می کند که مجموعه داده در یک قالب استاندارد است (به عنوان مثال همه تصاویر اندازه یکسانی دارند). این مرحله برای اطمینان از سازگاری مجموعه داده قبل از آموزش یک مدل ضروری است. پیش پردازش برای همه تصاویر موجود در مجموعه Train، Valid و Test اعمال می شود (برخلاف Augmentations که فقط برای مجموعه Train اعمال می شود).

پلت فرم BinaExperts گزینه های پیش پردازش زیر را ارائه می دهد:

·         Auto-Orient

·         Resize

·         Grayscale

·         Auto-Adjust Contrast

·         Isolate Objects

·         Static Crop

·         Tile

·         Modify Classes

·         Filter Null

·         Filter by Tag

 هر گزینه در ادامه توضیح داده شده است.

Auto-Orient

جهت‌گیری خودکار تصاویر را از داده‌های EXIF آن‌ها جدا می‌کند تا تصاویر به همان شکلی که روی دیسک ذخیره می‌شوند نمایش داده ‌شوند.

داده های EXIF جهت گیری یک تصویر داده شده را تعیین می کند. برنامه‌ها از این داده‌ها برای نمایش یک تصویر در یک جهت خاص استفاده می‌کنند، حتی اگر جهت‌گیری نحوه ذخیره آن روی دیسک متفاوت باشد.

·         BinaExperts توصیه می‌کند که به طور پیش‌فرض این گزینه فعال نشود، ابتدا چگونگی استنتاج تصاویر برای ارسال به مدل بررسی شود.

·         اگر می خواهید در مورد امکان جهت دهی خودکار تصاویر بیشتر بدانید وبلاگ بینااکسپرتز بررسی شود.

Resize

تغییر اندازه، اندازه تصاویر را تغییر می دهد و به صورت اختیاری، به مجموعه ای از ابعاد دلخواه مقیاس می دهد. حاشیه نویسی ها به طور متناسب تنظیم می شوند (به جز در مورد "fill").

 

·         Stretch to( کشش به):  می توان تصاویر را با ابعاد پیکسل به پیکسل کشید. حاشیه نویسی ها به نسبت مقیاس بندی می شوند. تصاویر مربع هستند، تحریف شده اند، اما هیچ داده تصویر منبع از بین نمی رود.

 

·         Fill in (پر کردن با برش مرکزی): تصویر تولید شده یک برش مرکزی از ابعاد خروجی دلخواه کاربر است. به عنوان مثال، اگر تصویر منبع 2080 *2600 باشد و گزینه تغییر اندازه روی 640*640  تنظیم شده باشد، تغییر اندازه خروجی مرکزی 640*640 از تصویر منبع است. نسبت تصویر حفظ می شود، اما داده های تصویر منبع از بین می روند.

 

·         Fit within(تناسب داخلی): ابعاد تصویر منبع با اندازه ابعاد تصویر خروجی متناسب است یعنی در حالی که نسبت تصویر منبع حفظ می شود، مقیاس بندی نیز می شود. به عنوان مثال، اگر تصویر منبع2600*2080  باشد و گزینه تغییر اندازه روی 640*640 تنظیم شده باشد، ابعاد طولانی تر (2600) به 640 و بعد ثانویه (2080) به ~512 پیکسل کوچک می شود. نسبت‌های تصویر و داده‌های اصلی حفظ می‌شوند، اما مربع نیستند.

 

·         Fit in(تناسب انعکاس لبه ها): ابعاد منبع نسبت به ابعاد تصویر خروجی مقیاس بندی می شود و در حالی که نسبت تصویر منبع را حفظ می کند، هر لایه جدید ایجاد شده بازتاب تصویر منبع است. به عنوان مثال، اگر یک تصویر منبع2600*2080 باشد و گزینه تغییر اندازه روی 416*416  تنظیم شده باشد، ابعاد طولانی تر (2600) به 416 و بعد ثانویه (2080) به ~335.48 پیکسل کوچک می شود. ناحیه پیکسل باقی مانده (80.52 پیکسل) پیکسل های منعکس شده تصویر منبع هستند. قابل توجه است که Bina به طور پیش فرض حاشیه نویسی را نیز منعکس می کند. تصاویر مربع، پر شده هستند و نسبت ابعاد به علاوه داده های اصلی حفظ می شوند.

 

·         Fit in (تناسب در لبه های سیاه): ابعاد منبع نسبت به ابعاد تصویر خروجی مقیاس‌بندی می‌شود و در حالی که نسبت تصویر منبع حفظ می‌شود، هر لایه جدید ایجاد شده ناحیه سیاه است. به عنوان مثال، اگر یک تصویر منبع 2600*2080 باشد و گزینه تغییر اندازه روی 416*416  تنظیم شده باشد، ابعاد طولانی تر (2600) به 416 و بعد ثانویه (2080) به ~335.48 پیکسل کوچک می شود. قسمت باقیمانده پیکسل (80.52 پیکسل) پیکسل های سیاه هستند. تصاویر مربعی، سیاه و سفید هستند، و نسبت ابعاد به علاوه داده های اصلی حفظ می شوند.

 

·         Fit in (تناسب در لبه های سفید): ابعاد منبع نسبت به ابعاد تصویر خروجی مقیاس بندی می شود و در حالی که نسبت تصویر منبع حفظ می شود، هر لایه جدید ایجاد شده ناحیه سفید است. به عنوان مثال، اگر یک تصویر منبع 2600*2080 باشد و گزینه تغییر اندازه روی 416*416 تنظیم شده باشد، ابعاد طولانی تر (2600) به 416 و بعد ثانویه (2080) به ~335.48 پیکسل کوچک می شود. قسمت باقیمانده پیکسل (80.52 پیکسل) پیکسل های سفید هستند. تصاویر مربعی هستند، با رنگ سفید پر شده هستند و نسبت ابعاد به علاوه داده های اصلی حفظ می شوند.

Grayscale

یک تصویر با کانال های RGB را به یک تصویر با یک کانال در مقیاس خاکستری تبدیل می کند که می تواند حافظه شما را ذخیره کند. مقدار هر پیکسل مقیاس خاکستری به عنوان مجموع وزنی پیکسل های قرمز، سبز و آبی مربوطه محاسبه می شود: Y = 0.2125 R + 0.7154 G + 0.0721 B 

این وزن ها توسط فسفرهای CRT استفاده می شوند زیرا درک انسان از قرمز، سبز و آبی بهتر از وزن های مساوی است.

Auto-Adjust Contrast

تصویر را با کنتراست کم بهبود می بخشد.

·         Contrast Stretching(کشش کنتراست): تصویر تغییر مقیاس داده می‌شود تا تمام شدت‌هایی را که در صدک‌های 2 و 98 قرار می‌گیرند، شامل شود.

·         Histogram Equalization (یکسان سازی هیستوگرام): "متداول ترین مقادیر شدت" را در یک تصویر پخش می کند. تصویر تساوی دارای توزیع تقریباً یکنواختی است که در آن همه رنگ‌های پیکسل‌ها تقریباً به یک اندازه نشان داده می‌شوند.

·        Adaptive Equalization(یکسان سازی تطبیقی): Contrast Limited Adaptive Histogram Equalization (CLAHE). الگوریتمی برای افزایش کنتراست محلی، که از هیستوگرام های محاسبه شده بر روی مناطق کاشی های مختلف تصویر استفاده می کند. بنابراین، جزئیات محلی را می‌توان حتی در مناطقی که تیره‌تر یا روشن‌تر از اکثر تصاویر هستند، افزایش داد.                    

ویژگی های پیش پردازش پیشرفته

 

این ویژگی‌ها برای Public Workspaces و حساب‌های Starter Plan و Enterprise دارای مجوز در دسترس هستند. کاربران در Sandboxes Workspacesبرای استفاده تجاری، ایجاد اثبات اولیه مفاهیم با نیاز به ویژگی های پیشرفته باید برای دسترسی با بخش فروش تماس بگیرند.

 

 

Isolate Objects

تبدیل Isolate Objects هر کادر محدود را به یک تصویر جداگانه برش داده و استخراج می کند. این مرحله مجموعه داده های تشخیص شی را به مجموعه داده های طبقه بندی تبدیل می کند.

در مواردی که بسیاری از کلاس ها در یک مجموعه داده مشابه هستند، استفاده از دو مدل به صورت متوالی معمول است. مدل اول (تشخیص شی) شی را پیدا می کند و مدل دوم (طبقه بندی) مشخص می کند که شی چیست. تبدیل Isolate Objects برای ایجاد مجموعه داده لازم برای آموزش مدل دوم مفید است.

Tile

کاشی وار کردن می تواند در تشخیص اجسام کوچک کمک کند (به ویژه در موقعیت هایی مانند تصاویر هوایی و میکروسکوپ). تنظیم پیش فرض کاشی کردن 2*2 است، با این حال، کاربر می تواند آن را به دلخواه تنظیم کند.

Filter by Tag

تبدیل Filter by Tag به کاربران این امکان را می دهد که فیلتر کنند که کدام تصاویر باید یا نباید در نسخه ای که بر اساس آن برچسب ها اعمال می شود قرار داده شوند. این تبدیل برای آموزش یک مدل بر روی یک زیر مجموعه جدید از داده ها یا حذف تصاویر ناخواسته از آموزش مفید است.

مرکز داده‌ها (ویترین)

مرکز داده‌ها

با کاوش در مجموعه‌ای گسترده از داده‌ها، پروژه‌ها و تحقیقات خود را ارتقاء دهید.

پلتفرم بینایی ماشین بینااکسپرتز

ورود به برنامه ثبت نام در برنامه