عنوان پروژه

+

بهینه سازی پرس و جو در پایگاه داده توزیع شده

توضیحات

+

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: DOCX

تعداد صفحات: ۵۹

حجم فایل:۱,۵۶۵ کیلوبایت

.

بخشی از متن:
در یک سیستم مدیریت بانک اطلاعاتی توزیع شده قبل از طرح یک پرسجو، جهت کم کردن هزینه های ارتباطی در پرسجوهایی که در آینده مطرح خواهند شد و یا به عبارت دیگر تولید یک بستر بهینه مسئله تخصیص داده ها به سایت های مختلف مطرح می شود که جزو مسائل NP می باشد. اما وقتی پرسجویی در یکی از سایت ها مطرح می شود، جهت استخراج اطلاعات مربوط که در سایت های دیگر قرار دارند، طرح های اجرایی مختلف، مدل های انتقالی مختلفی مطرح می شوند که نتیجه یکسان ولی هزینه اجرایی متفاوتی دارند. اما سوال اینجاست که برای اجرای بهینه یک پرسجو در یک سیستم توزیع شده با توجه به مسائل فوق چه باید کرد. در این تحقیق سعی شده روشهای تخصیص داده در یک سیستم توزیع شده بررسی گردد، سپس به بیان روشهای تولید طرح بهینه و الگوریتم های موجود پرداخته شود.
 
مقدمه 
در این بخش اطلاعاتی در رابطه با کلیت سیستم های پایگاه داده توزیع شده آورده شده است. 
۱-۲ سیستم های پایگاه داده توزیع شده. 
بانک های اطلاعاتی به منظور ذخیره سازی و ساماندهی حجم زیادی از اطلاعات برای استفاده توسط کاربر یا کاربران مختلف به کار می روند. اما سوال این است که برای این حجم زیاد از اطلاعات چه مرزی وجود دارد و اینکه تا چه تعداد کاربر می توانند همزمان از این اطلاعات استفاده کنند؟
اگر از توانایی سیستم مدیریت پایگاه داده توزیع شده  در ذخیره سازی و ساماندهی حجم زیاد داده ها و تعداد کاربران صرفنظر کنیم، بدیهی است که نگهداری یک فایل اطلاعاتی در یک رایانه با محدودیت منابع ذخیره سازی( مثلا محدودیت گنجایش دیسک) و مدیریت درخواست همزمان کاربران با محدودیت منابع پردازشی مواجه خواهد شد. حتی اگر ظرفیت ذخیره سازی و توان پردازشی یک رایانه را نیز افزایش دهیم، باز هم مشکل در طولانی مدت حل نخواهد شد،. ضمن اینکه مشکلات دیگر در زمینه پهنای باند مصرفی در زمان تبادل اطلاعات در شبکه نیز بوجود خواهد آمد. بنابراین سیستم مدیریت پایگاه داده توزیع شده باید به گونه ای باشد که این مشکلات را برای طولانی مدت حل کند.
از طرفی می توان ادعا کرد در هر لحظه میلیونها کاربر در حال استفاده از اینترنت و وب هستند و علت اینکه پاسخگویی به این تعداد کاربر با مشکل مواجه نمی شود این است که سایت های وب و خدمات اینترنتی بین رایانه های مختلف توزیع شده است. وب دید روشنی از یک سیستم توزیع شده را به ما می دهد. این سیستم کاملا شفاف عمل می کند به این صورت که کاربر بدون نگرانی از اینکه یک سایت در کجا و در چه رایانه ای قرار دارد، می تواند به سایت های مختلف دسترسی پیدا کند. همچنین وب به گونه ای است که اگر در لحظه ای برخی از رایانه های متصل به آن از کار بیفتند یا از شبکه خارج شوند، باز هم به کار خود ادامه می دهد. 
به نظر می رسد که برای حل مشکلات مربوط به پایگاه داده یک راه حل ممکن توزیع اطلاعات در بین سیستم های مختلف و سازماندهی و مدیریت آنها تحت یک سیستم متمرکز و به صورت یکپارچه است. این سیستم نیز می بایست علاوه بر رفع موارد اشاره شده (نظیر حجم زیاد داده و کاربر و نیز استفاده از پهنای باند) به صورتی کاملا شفاف عمل کند به طوریکه کاربر نگران این توزیع اطلاعات نباشد و براحتی بتواند سیستم اطلاعاتی توزیع شده را بمانند یک سیستم واحد در نظر بگیرد. 
 
فهرست مطالب:
چکیده
فصل ۱: مقدمه
۱-۱ مقدمه
۱-۲ سیستم های پایگاه داده توزیع شده.
۱-۳ پایگاه اطلاعات توزیع شده
۱-۴ قوانین Date برای پایگاه داده توزیع شده
۱-۴-۱ خود مختاری محلی
۱-۴-۲ عدم وابستگی به یک سایت مرکزی
۱-۴-۳ پیوستگی عملیات
۱-۴-۴ نامرئی بودن مکان
۱-۴-۵نامرئی بودن تکه تکه کردن
۱-۴-۶ نامرئی بودن نسخه سازی
۱- ۴-۷پردازش پرسش توزیع شده
۱-۴-۸ مدیریت تراکنش توزیع شده:
۱-۴-۹ نامرئی بودن سخت افزار:
۱-۴-۱۰  نامرئی بودن سیستم عامل:
۱-۴-۱۱نامرئی بودن شبکه
۱-۴-۱۲ نامرئی بودن سیستم مدیریت پایگاه داده توزیع شده
۱-۵ روشهای توزیع داده
۱-۵-۱ روش استخراج دستی یا متمرکز
۱-۵-۲ تکه تکه کردن داده
۱-۵-۲-۱ تکه تکه کردن افقی
۱-۵-۲-۲ تکه تکه کردن عمودی
۱-۵-۲-۳ تکه تکه کردن مختلط
۱-۶ نسخه سازی از داده ها
۱-۶-۱ نسخه سازی کامل
۱-۶-۲ نسخه سازی جزئی
۱-۶-۳ تصویر فرار
۱-۷ معماری سیستم پایگاه داده توزیع شده
فصل ۲: بهینه سازی پرسجو
۲-۱ بهینه سازی پرس و جو
۲-۲ روشهای بهینه سازی پرسجو در بانک های اطلاعاتی توزیع شده
۲-۲-۱ تخصیص داده
۲-۲-۱-۱ الگوریتم های استاتیک
۲-۲-۱-۱-۱ الگوریتم ژنتیک
۲-۲-۱-۱-۲ الگوریتم Simulated Evolution
۲-۲-۱-۱-۳ هیوریستیک نگاشت
۲-۲-۱-۱-۴ الگوریتم The Mean Field Annealing (MFA)
۲-۲-۱-۱-۵ الگوریتم تخصیص داده جستجوی تصادفی همسایگی
۲-۲-۱-۲ الگوریتم تخصیص پویا
۲-۲-۱-۲-۱ الگوریتم شمارنده ساده
۲-۲-۱-۲-۲- الگوریتم Load Sensitive counter
۲-۲-۱-۲-۳ الگوریتم Incremental
۲-۲-۱-۲-۴ الگوریتم Threshold
۲-۲-۱-۲-۵ الگوریتم Near Neighborhood Allocation  با حد آستانه نسبی(RTNNA)
۲-۲-۱-۲-۶ الگوریتم Revise Relative Threshold Near Neighborhood Allocation
۲-۲-۲ تولید طرح اجرای بهینه
۲-۲-۲-۱ گراف پیوند
۲-۲-۲-۲  الگوریتم های قطعی
۲-۲-۲-۲-۱ برنامه ریزی دینامیکی
۲-۲-۲-۲-۲ الگوریتم دایجسترا
۲-۲-۲-۲-۳ الگوریتم جستجوی A*
۲-۲-۲-۳ الگوریتم های غیر قطعی
۲-۲-۲-۳-۱ گردش تصادفی
۲-۲-۲-۳-۲ نزدیکترین همسایگی در درخت پرپشت
۲-۲-۲-۳-۳ شبیه سازی سرد شدن فلزات
۲-۲-۲-۳-۴ تپه نوردی
۲-۲-۲-۳-۵ الگوریتم ژنتیک
۲-۲-۲-۳-۶ الگوریتم اصلاح مکرر
۲-۲-۲-۳-۷ اتوماتهای یادگیر
۲-۲-۲-۳-۸ ترکیب الگوریتم ژنتیک و آتاماتای یادگیر
۲-۲-۲-۳-۸-۱ ژن و کروموزوم
۲-۲-۲-۳-۸-۲ تابع برازندگی

========================================================