دوفصلنامه محاسبات و سامانه های توزیع شده

دوفصلنامه محاسبات و سامانه های توزیع شده

بهینه سازی پرس و جو در موتور پرس و جوی کلان داده Hive

نوع مقاله : مقاله پژوهشی

چکیده
در این پژوهش سعی گردیدهاست تا چالشهای مطرح در زمینه بهینهسازی پرسوجوهای محیطهاای کانن داده از جملاه نحاوه اجرای پرسوجو بر روی دادههای با حجم زیاد مورد بررسی قرار گیرد. معماری و ساختار موتور پرسوجوی هایو به تفضیل مورد بررسی قرار گرفته شده است و به نحوه بهینه سازی پرسوجوها که به طور مشخص توسط واحدهای کامپایلر و بهینهساز انجام میشود، اشاره گردیده است. در نهایت روش مبتنی بر همبستگی و همچنین روش پیشنهادی به صورت جزئی با مثالهای مختلف مورد بررسی قارار گرفته است. همچنین در انتها، نتیجه کارآمدی روشهای کلی در قالب یک نمودار تحلیلی آورده شده است.
کلیدواژه‌ها