این ماشینها میتوانند دنیا را مشابه انسانها ببینند!
همشهری آنلاین – یکتا فراهانی: یک سیستم مبتنی بر «برنامهنویسی احتمالاتی» قادر به درک بهتر و دقیقتر صحنهها از طریق تصاویر محدود است. این فناوری میتواند تأثیر بزرگی در بهبود سیستمهای خودروهای خودران و سایر سیستمهای بینایی کامپیوتری داشته باشد.
چرا انسانها دقیقتر میبینند؟
بینایی کامپیوتری معمولاً از الگوریتمهای پیچیدهای برای تحلیل تصاویر استفاده میکند، اما گاهی اوقات این سیستمها نتایج عجیبی میدهند. برای مثال، درحالیکه یک ربات ممکن است یک ظرف غذا را نادیده بگیرد یا یک بشقاب را در هوا شناور فرض کند، انسانها معمولاً این اشکالات را سریع شناسایی میکنند. این عدم تطابق با واقعیت میتواند در کاربردهای حیاتی مانند خودروهای خودران یا رباتهای سرویسدهنده مشکلات بزرگی ایجاد کند.
استفاده از «برنامهنویسی احتمالاتی» برای بهبود بینایی ماشین
محققان MIT رویکردی نوین برای حل این مشکلات پیشنهاد کردهاند که از «برنامهنویسی احتمالاتی» بهره میبرد. این رویکرد به ماشینها اجازه میدهد تا تصاویر را از زوایای مختلف تجزیهوتحلیل و با استفاده از دادههای احتمالاتی، احتمال تطابق یا خطا در شبیهسازی صحنهها را پیشبینی کنند. این روش نهتنها به تشخیص اشیای دقیقتر کمک میکند؛ بلکه اشتباهات معمول در الگوریتمهای یادگیری عمیق را نیز اصلاح میکند.
این رویکرد با استفاده از بررسی روابط تماس بین اشیا قادر است موقعیتهای دقیقتری از اجسام را پیشبینی کند که برای سیستمهای خودروهای خودران بسیار حیاتی است.
:بیشتر بخوانید
-
آیا میتوان به خودروهای خودران اعتماد کرد؟
-
چالشهای بدن با اندامهای مصنوعی روباتیک
یادگیری از چند تصویر برای درک بهتر اشیا
به گزارش سایت scitechdaily یکی از ویژگیهای برجسته این سیستم جدید این است که تنها با مشاهده چند تصویر از یک شیء میتواند شکل و ابعاد آن را در فضای سهبعدی شبیهسازی کند. برخلاف سیستمهای یادگیری عمیق که نیاز به هزاران نمونه داده دارند، سیستم جدید MIT تنها به پنج تصویر از یک شیء نیاز دارد تا شکل و ویژگیهای آن را بیاموزد. این ویژگی باعث میشود مدل بهراحتی و سریعتر از دیگر روشها یاد بگیرد و دقت بیشتری در تشخیص اشیا و صحنهها داشته باشد.
پیشرفتهای قابلتوجه در دقت و سرعت
محققان این سیستم را با مدلهای رایج یادگیری عمیق مقایسه کردهاند و در اکثر موارد، سیستم ۳DP۳ توانسته است دقت بالاتری در شبیهسازی اشیا و صحنهها ارائه دهد. برای مثال، وقتی که یک شیء جزئی از نظر بصری مسدود شده باشد، این سیستم قادر است بهدرستی موقعیت آن را تصحیح کند. این ویژگی بهویژه در محیطهای پیچیده و زمانبر برای کاربردهایی مانند خودروهای خودران و رباتهای پیچیده بسیار حیاتی است.
این سیستم نهتنها از دقت بالاتری برخوردار است، بلکه به شکلی قابلتوجه سرعت پردازش را نیز افزایش میدهد که میتواند در بسیاری از سیستمهای واقعی کاربرد داشته باشد.
آیندهای روشن برای بینایی کامپیوتری
این پیشرفت در زمینه بینایی کامپیوتری و هوش مصنوعی نشاندهنده گام بزرگی بهسوی حل مشکلات رایج در سیستمهای خودران و رباتها ست. سیستم ۳DP۳ نهتنها دقت بیشتری در شبیهسازی دنیای واقعی دارد، بلکه میتواند به طور خودکار خطاهای شایع در پردازشهای بصری را شناسایی و اصلاح کند. این فناوری در آینده نهتنها میتواند ایمنی خودروهای خودران را افزایش دهد؛ بلکه در سیستمهای بینایی پیچیده دیگر نیز کاربردهای گستردهای خواهد داشت. با ادامه توسعه این فناوریها، میتوانیم شاهد تحولاتی اساسی در نحوه تعامل انسانها با ماشینها باشیم.