دستاورد دانشگاهی؛

شناسایی حالت چهره در شرایط کنترل نشده با هوش مصنوعی

محققان دانشگاه صنعتی امیرکبیر موفق به تحلیل تصویر با استفاده از فناوری هوش مصنوعی شدند که می‌تواند حالت چهره را به‌صورت مستقل از شخص در تصاویر کنترل‌نشده شناسایی کند.

به گزارش حوزه دانشگاهی گروه علمی پزشکی باشگاه خبرنگاران جوان، حمید صادقی، فارغ‌التحصیل دانشگاه صنعتی امیرکبیر و مجری طرح «شناسایی حالت چهره مستقل از شخص در تصاویر کنترل‌نشده» اظهار کرد: تحلیل تصاویر چهره در دنیای امروز کاربرد‌های زیادی دارد. یکی از تحلیل‌های مهم در چهره، تشخیص یا شناسایی احساسی است که فرد در چهره خود ابراز می‌کند (خشم، تنفر، ترس، شادی، غمگینی، تعجب و عادی) که به آن حالت چهره گفته می‌شود.

او افزود: حال سوالی که مطرح می‌شود این است که شناسایی حالت چهره چه کاربردی دارد که برای پاسخ به این سوال فرض کنید یک پزشک بخواهد بطور مداوم در طول شبانه‌روز شرایط بیمار را ثبت و آمار آن را بررسی کند.

صادقی تصریح کرد: با استفاده از یک دوربین و پردازنده می‌توان چهره فرد را همواره بصورت خودکار بررسی، حالت چهره آن را شناسایی و برای پزشک ثبت کرد؛ حالت درد در چهره، یکی از حالت‌های چهره‌ای است که می‌توان برای این مسأله متصور بود و از این دست نیاز‌ها در دنیای اطراف ما بسیار زیاد است.

او با اشاره به یکی از ضعف‌های تشخیص حالت چهره گفت: افت کارایی روش‌های موجود در مواجه با تصاویر دنیای واقعی (غیر آزمایشگاهی) یا به اصطلاح «تصاویر کنترل‌نشده» از ضعف‌های این حوزه به شمار می‌رود.  به همین دلیل، ما در این رساله دکتری به دنبال شناسایی حالت چهره در تصاویر کنترل‌نشده بودیم؛ یعنی تصاویری که خارج از شرایط آزمایشگاهی و در محیط واقعی ثبت می‌شود. به‌عنوان مثال در این تصاویر فرد لزوماً به‌طور مستقیم به دوربین نگاه نمی‌کند.

او اظهار کرد: در این تحقیق، با استفاده از هوش مصنوعی روش‌های جدیدی ارائه کردیم که باعث شد شناسایی حالت چهره هم در تصاویر کنترل‌شده و هم در تصاویر کنترل‌نشده که پیچیدگی بیشتری دارند، با دقت بسیار بهتری نسبت به دیگر سامانه‌های موجود انجام شود. روش‌های جدید ارائه‌شده در این تحقیق، محدود به شناسایی حالت چهره نیستند و می‌توانند در مسائل مختلف یادگیری ماشین نیز استفاده شوند. این ادعا با آزمایش در مسائل مختلف (مثل تشخیص نوع اشیا) اثبات شده‌است.

صادقی با بیان اینکه یکی از مهم‌ترین تئوری‌هایی که در این تحقیق مطرح شد، یک روش یادگیری متریک برای طبقه‌بندی ویژگی‌های هیستوگرامی است، گفت: محققانی که در زمینه بینایی ماشین کار می‌کنند، به‌خوبی می‌دانند که ویژگی‌های هیستوگرامی استفاده زیادی در این زمینه دارند و روش ارائه‌شده در حل این مسائل بسیار مؤثر خواهد بود.

او افزود: چهره‌های تصاویر کنترل‌نشده معمولاً پیچیدگی‌های زیادی دارند. مثلاً تغییرات شدید زاویه سر، پوشیدگی بخش‌های مختلف چهره، شرایط نوری نامناسب، ابعاد کوچک چهره در تصویر و ... همگی از عواملی هستند که دقت شناسایی حالت چهره را تحت تأثیر قرار می‌دهند. با این توصیف، شناسایی حالت چهره در تصاویر کنترل‌نشده مثل یک مسأله بسیار پیچیده است.

صادقی اضافه کرد: در یادگیری ماشین، برای حل این مسائل بهتر است که از یادگیری مبتنی بر نمونه استفاده شود. اگر کمی پیشرفته‌تر به مسأله نگاه کنیم، می‌توان از یادگیری متریک به‌عنوان یک رویکرد پیشرفته از یادگیری مبتنی بر نمونه در این نوع مسائل استفاده کرد. با این پیش‌زمینه، رویکرد یادگیری متریک برای شناسایی حالت چهره در تصاویر کنترل‌نشده انتخاب شد.

او گفت: در شناسایی حالت چهره، ابتدا تصویر چهره با مجموعه‌ای از اطلاعاتی که به آن بردار ویژگی گفته می‌شود، توصیف می‌شود. در ادامه از یک روش یادگیری ماشین برای طبقه‌بندی این ویژگی یا تعیین نوع حالت چهره استفاده می‌شود.  ویژگی‌هایی که در بینایی ماشین و پردازش تصویر استفاده می‌شوند معمولاً از جنس هیستوگرام هستند؛ به همین دلیل، در این طرح یک روش جدید یادگیری متریک جدید با هدف طبقه‌بندی ویژگی‌های هیستوگرامی ارائه کردیم که مبنای ریاضی آن استفاده از فاصله مربع کای است.

صادقی ادامه داد: گام بعدی در این تحقیق این بود که به‌جای استفاده از ویژگی‌های متداول هیستوگرامی، یک ویژگی قابل یادگیری برای کاربرد مد نظر خود طراحی کنیم.

او با بیان اینکه برای تحقق این هدف، یک شبکه عصبی کانولوشنی طراحی شد که ویژگی‌های از جنس هیستوگرام از تصویر استخراج می‌کند، گفت: این شبکه عصبی از تئوری یادگیری متریک بومی ذکرشده برای شناسایی حالت چهره استفاده می‌کند.

به گفته صادقی، با استفاده از این شبکه عصبی، نه تنها بخش طبقه‌بندی، بلکه بخش استخراج ویژگی از تصویر هم قابل آموزش بوده و باعث می‌شود دقت شناسایی حالت چهره افزایش قابل توجهی داشته باشد.

او با اشاره به کاربرد این تحقیقات گفت: تئوری‌های یادگیری متریک و همچنین شبکه عصبی کانولوشنی ارائه‌شده در این تحقیق در حل مسائل مختلف پردازش تصویر و بینایی ماشین قابل استفاده است. علاوه بر مسائل حوزه بینایی ماشین، روش یادگیری متریک ارائه‌شده می‌تواند در طبقه‌بندی سایر ویژگی‌های مبتنی بر هیستوگرام نیز استفاده شود.

صادقی درباره مزیت‌های رقابتی طرح گفت: علاوه بر دقت بالاتر نسبت به روش‌های دیگر، در این پژوهش سعی شده‌است که پیچیدگی محاسباتی در الگوریتم طراحی‌شده هم پایین باشد تا پیاده‌سازی آن هزینه زیادی دربرنداشته باشد. به‌عنوان مثال، معماری شبکه عصبی پیشنهادی در این تحقیق برمبنای بخشی از شبکه عصبی کانولوشنی شناخته‌شده MobileNet (نه تمام این شبکه عصبی) است که محاسبات نسبتاً کمی دارد.

او با اشاره به کاربرد‌های این پروژه گفت: معرفی این پروژه را با یک کاربرد پزشکی (تشخیص درد در چهره) انجام دادیم. اما روش‌های ارائه‌شده برای شناسایی حالت چهره در این تحقیق می‌توانند در کاربرد‌های مختلفی مانند ساخت ربات‌های با قابلیت تشخیص حالت چهره انسان، ارتباط انسان با رایانه، هوشمندسازی پخش موسیقی متناسب با حالت چهره فرد و ... مورد استفاده قرار گیرند.

گفتنی است؛ استاد راهنمای این پروژه  ابوالقاسم اسدالله راعی عضو هیئت علمی دانشگاه صنعتی امیرکبیر بوده است.

انتهای پیام/

اخبار پیشنهادی
تبادل نظر
آدرس ایمیل خود را با فرمت مناسب وارد نمایید.
آخرین اخبار