دیتا ست! (انتشار: 1402/06/28)

یکی دیگر از چالش هایی که پیش بینی می کردیم تو مسیر بهش بر بخوریم، چالش و یا بهتره بگم ابر چالش دیتا ست (Data set) هستش. دیتاست ها مجموعه ای از داده ها هستن که در فرآیند یادگیری ماشین استفاده می شن. هر نمونه در دیتا ست مستقل از سایر نمونه هاست و ستون های دیتا ست هم ویژگی های خاصی رو نشون می دن. دیتا ست ها در بحث یادگیری ماشین و توسعه ی سیستم های هوشمند واقعا نقش مهمی ایفا می کنن. عملا ماشین چیزی رو یاد میگیره که دیتاست به خوردش می ده.

این چیه؟

چیزی که ما تو اینچیه قراره بهش برسیم مدلی هوشمند برای کلاس بندی تصاویر هستش. ماشین یه تصویر رو از کاربر می گیره و کلاس هایی که این تصویر بهشون اختصاص داره رو به عنوان خروجی می ده. مثلا اگه عکس یه اردک به مدل داده بشه باید بتونه تشخصی بده که تصویر یک حیوان، یک پرنده و در نهایت اردک هستش و کلاس های اونو به عنوان خروجی نمایش بده.

classification

برای اینکه همچین مدلی داشته باشیم باید از روش های یادگیری ماشین با ناظر مدل مون رو آموزش بدیم. برای این نوع آموزش هم باید دیتا ست مون شامل نمونه ها و تارگت هاشون باشه. یعنی هر نمونه کلاس هایی که بهش تعلق داره هم مشخص بشه. هرچه تعداد نمونه های دیتا ست بیشتر باشه مدل هوشمند عملکرد بهتری تو تشخیص خواهد داشت. در ادامه این مسیر باید بگردیم و دیتا ست های مناسب این کار رو پیدا کنیم. شاید هم مجبور بشیم خودمون دیتا ست هایی رو تولید کنیم.

 

 


نظرات خوانندگان نوشته


نظری در این مورد دارید؟ خوشحال می‌شیم اون رو برامون ارسال کنید.