چه دیتاستی به درد اینچیه می خوره؟ (انتشار: 1402/07/04)

برای اینکه بتونیم مدل مدنظر برای اینچیه رو ترین کنیم و توسعه بدیم باید دیتاست مناسب برای این کار رو پیدا کنیم. پس لازمه اول بدونیم دیتاستی که بهش نیازداریم دقیقا چه ویژگی هایی داره و ساختارش باید چجور باشه. این ویژگی ها رو بر مبنای عملکردی که از اینچیه مد نظرمون هست در میاریم.

این چیه؟

انتظاری که ما از اینچیه داریم اینه که هر تصویری بهش داده می شه، کلاس های متناسب با اون تصویر رو بده. با این تعریف می شه فهمید که ما با یک مساله کلاسبندی تصویر روبرو هستیم و متناسب با اون دیتاست انتخاب کنیم. دیتاست های مناسب برای کلاس بندی دیتاست هایی هستن که لیبل یا تارگت هر تصویر هم مشخص باشه. یعنی دیتای آموزشی کلاسش هم مشخص باشه. یکی از مهمترین و معروفترین دیتاست ها برای آموزش مدل کلاسبند تصویری دیتا ست CFAR-10 هست.

این دیتا ست 60 هزار تا تصویر داره که تمامی این تصاویر تو ده دسته قرار گرفتن.

این دیتاست از نظر تعداد تصویر برای ترین مدل خیلی خوبه ولی یک مشکل اساسی داره و اون هم اندازه تصاویر هستش. نمونه های این دیتا ست تو اندازه های 32 در 32 پیکسل تهیه شدن. عملا تصاویری که کاربرا برای کلاس بندی به اینچیه ارسال خواهند کرد خیلی بزرگ تر از این تصاویر خواهند بود. پس باید دیتا ستی که استفاده می کنیم اندازه نمونه هاش از این بزرگتر باشه. علاوه بر این دیتاستی که می خوایم باید برای هر تارگت چندین کلاس سلسله مراتبی برای نمونه ها تارگت زده بشه. مثلا وقتی یک تصویر از سگ بهش داده بهش بتونه اونو کلاس های حیوانات، سگ ها، سگهای پاکوتاه و ... دسته بندی کنه. با این تفاسیر ممکنه لازم باشه ما دیتاست مناسب برای کارخودمون رو با اسکرپ کردن اطلاعات تو سایت های مختلف جمع آوری کنیم.


نظرات خوانندگان نوشته


نظری در این مورد دارید؟ خوشحال می‌شیم اون رو برامون ارسال کنید.