دوفصلنامه محاسبات و سامانه های توزیع شده

دوفصلنامه محاسبات و سامانه های توزیع شده

ترکیب ماشین‌های بولتزمن محدود دوبعدی و شبکه‌های LSTM برای شناسایی فعالیت‌های انسانی در ویدئو: یک رویکرد نوین

نوع مقاله : مقاله پژوهشی

نویسندگان
1 گروه کامپیوتر، دانشکده مهندسی، دانشگاه آیت اله بروجردی(ره)، بروجرد، ایران
2 گروه هوش مصنوعی، دانشکده برق و کامپیوتر، دانشگاه کاشان، کاشان
چکیده
در حوزه تحلیل ویدئو و به‌ویژه شناسایی فعالیت‌های انسانی، روش‌های پیشین علی‌رغم موفقیت‌های به دست آمده، در حفظ مستقیم ویژگی‌های فضایی بدون نیاز به پیش‌پردازش پیچیده و مدل‌سازی وابستگی‌های زمانی طولانی دچار محدودیت‌هایی بوده‌اند. در این پژوهش، یک معماری نوین مبتنی بر ترکیب ماشین‌های بولتزمن محدود دوبعدی و شبکه‌های LSTM ارائه می‌شود که با استخراج دقیق الگوهای فضایی از فریم‌های ویدئویی و مدل‌سازی مؤثر روابط زمانی، خلأ موجود در ادبیات پژوهشی را برطرف می‌کند. در روش پیشنهادی،ماشین­های بولتزمن بدون نیاز به پیش‌پردازش‌های گسترده، ویژگی‌های مهم فضایی را از تصاویر استخراج نموده و شبکه­های LSTM وابستگی‌های زمانی پیچیده را مدل‌سازی می‌کنند. نتایج تجربی حاصل از آزمایش بر روی مجموعه‌داده‌های KTH، UCF Sports و HMDB51 نشان از بهبود عملکرد با دقت‌های به ترتیب 95.3٪، 93.4٪ و 70.8٪ دارد که نسبت به روش‌های رقابتی موجود، کارایی قابل توجهی به اثبات رسانده است.
کلیدواژه‌ها
موضوعات