سازماندهی وابسته به هستی شناسی پایگاه داده وب

سازماندهی وابسته به پایگاه داده وب

قیمت :   ۶۰۰۰ تومان ( شش هزار  تومان )

تعداد صفحات:

۶۰  ( شصت )

دسته :

کامپیوتر و IT

نوع فایل:

Word

توضیحات:

مناسب جهت پروژه پایانی

فهرست مطالب :

مقدمه

فصل اول- مروری بر

۱-هستی شناسی و یکپارچه سازی معنایی داده

۱-۱ چشم انداز ایران ۱۴۰۴

۱-۲ توسعه شفاف اطلاعات

۱-۳ نمایش دانش

۱-۴ تکنیک های یکپارچه سازی داده به صورت سنتی

۱-۵ رابط های قانونمند

۱-۶

۱-۷ بهینه ساز جستجوی تک منظوره

۱-۸ چهارچوب های میان افزاری متحد

۱-۹ نقش معنا گرایی

۱-۱۰ تکنولوژی معنایی، هستی شناسی و فراتر از آن

۱-۱۱

۱-۱۲ هستی شناسی و کاربردهای تجاری

۱-۱۳ هستی شناسی (Ontology) در یکپارچه سازی

۱-۱۴ الفبای پیغام رسانی

۱-۱۴-۱ الگوهای یکپارچه سازی در پیغام رسانی

۱-۱۴-۲ الگوهای یکپارچه سازی: الگوهای پیغام ها

۱-۱۴-۳ پیغام دستور (Command Message)

۱-۱۴-۴ پیغام رخداد (Event Message)

۱-۱۵ الگوهای یکپارچه سازی: الگوهای کانال ها

۱-۱۵-۱ کانال ناشر و متقاضی (Publisher/subscriber)

۱-۱۵-۲

فصل دوم- وب معنایی و هستی شناسی

۲-واژه هستان شناسی

۲-۱ جزئیات بیشتری از وب معنایی

۲-۲ تعریف وب معنایی

۲-۳ آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (URL)

۲-۴ - (ایکس.ام.ال.)/ فرانمای چاچوب
توصیف منبع (آر.دی.اف)

۲-۵ واژگان- هستی شناسی

۲-۶ قواعد- منطق و برهان

۲-۷ امنیت- اطمینان

۲-۸ وب معنایی چگونه بر نظام شما اثر می گذارد؟

فصل سوم- (آنتولوژی) در پایگاه داده

۳-اکتشاف دانش

۳-۱ انواع روشهای اکتشاف دانش از داده ها

۳-۲ (هستی شناسی) و سناریوهای مختلف

۳-۳ یادگیری آنتولوژی

۳-۴ سناریوهای مختلف یادگیری آنتولوژی

۳-۵ نقش Knowledge Discovery در یادگیری آنتولوژی

۳-۶ کاربرد دیگری از KD برای یادگیری آنتولوژی

۳-۷ طبقه بندهای SVM

۳-۸ Focused Crawling

۳-۸-۱ جستجو و crawl کردن اسناد

۳-۸-۲ طبقه بندی و فیلتر کردن اسناد

۳-۸-۳ استخراج اطلاعات با استفاده از متن کاوی

نتیجه گیری

منابع

فهرست واژگان

 

چکیده :

هستی شناسی یکی از لایه های وب معنایی و ستون فقرات آن بشمار می آید. ( برنرزلی، هند لر، لازیلا، ۲۰۰۱ ،) سورگل هستی شناسی را یک ابزار سازماندهی منابع وب که به بازیابی متون با زبان طبیعی کمک میکند، توصیف کرده است. اما وی نیز عقیده دارد که در واقع مشکل ناشی از سازماندهی اطلاعات نیست، بلکه این مجموعه اصطلاحات هستند که مشکل ساز شده اند و در نتیجه، زمینه ظهور هستی شناسی ها بصورت مجموعه لغات و یا اصطلاحنامه های تکمیل شده یا گسترش یافته را فراهم کرده اند. (صنعت جو، ۱۳۸۴ ) محیط نوین اطلاعاتی به منظور بازنمون هوشمند دانش به نظامی انعطاف پذیرتری نیاز دارد. هستی شناسی به سبب توانایی های منحصر به فردش در تعریف واضح معانی و روابط و نیز بیان آنها به زبانی ماشین فهم به عنوان راه حل این مسائل مورد توجه قرار گرفته است. هستی شناسی نقش مهمی را در دسترسی دانش محور و میانکنش پذیری نحوی و معنایی ایفا می کند و همچنین به عنوان ستون فقرات نسل آتی وب- وب معنایی- عمل می نماید.

واژگان کلیدی :
هستی شناسی، وب معنایی، پایگاه داه وب، معماری وب، سازماندهی وابسته به هستی شناسی،

 

مقدمه :

هستی شناسی عنصر اصلی و پایه ای برای وب معنایی است چون معنایی رسمی را که قابل فهم برای رایانه هستند با معناهای دنیای واقعی که برای انسان قابل فهم هستند پیوند می دهد. در نتیجه به انسان و رایانه اجازه می دهد تا به اطلاعات مورد نیاز خود دست یابند و به نحو موثری با یکدیگر ارتباط برقرار کنند. دلیل اهمین یافتن هستی شناسی، فقدان استانداردهایی برای ارتباط نحوی و معنایی هم از منظر انسان و هم از منظر رایانه است. این مسئله با افزایش روزافزون اضافه بار اطلاعاتی ، ناکارآمدی موتورهای کاوش کنونی وب، و بازیابی درون خطی اطلاعات حادتر می گردد. هستی شناسی به عنوان تعریف رسمی و واضح مفهوم سازی تسهیم شده، نوید بخش راهی برای غلبه بر این مشکلات است. (صفری، ۱۳۸۳ ) در محیط وب معنایی، هستی شناسی با عنوان مفهوم سازی محدودی از یک حوزه معین دانش معرفی می شود که در میان جامعه کاربران آن حوزه مشترک است. این مفهوم سازی به زبان رسمی و قابل پردازش برای ماشین، و با هدف اشتراک اطلاعات معنایی در نظام های خود کار تعریف شده است در محیط وب، هستی شناسی ابزار فشرده و منظمی برای تعریف معانی منابع وب است. هستی شناسی، مفاهیم حوزه مرتبط، خصیصه های آنها، و روابط ممکن میان مفاهیم و خصیصه ها را مشخص می کند. (ژاکوب، ۱۳۸۴ ) همچنین دارای ساختار سلسله مراتبی است. نمونه این ساختار را می توان در سرعنوان های موضوعی کتابخانه کنگره مشاهده کرد. به عنوان مثال، هستی شناسی مشخص می کند که مولف نوعی پدیدآورنده است. همان طور که اشاره شد افراد کلمات را به معانی مختلف به کار می برند و ممکن است برای مفهوم از کلمات متفاوتی استفاده کنند. هستی شناسی این امکان را فراهم می سازد که رایانه ها از واژه نامه ها با سهولت و دقت بیشتری استفاده کنند. به عبارت دیگر، هستی شناسی وب، از یک نگاه کلی، مجموعه ای از تعاریف رده ها و ویژگی ها و محدودیت های موجود در نحوه به کارگیری این رده ها و ویژگی هاست. (جمالی مهموئی، ۱۳۸۲ ) هستی شناسی ها بنیاد مفهومی معناداری را تهیه می کنند که بدون آن، دستیابی به هدف وب معنایی امکان پذیر نخواهد بود. هر طرح ابر داده ای  با توجه به اینکه مجموعه ای از ویژگی های مفهومی و یا فیزیکی منابعی را مشخص می کند که برای گروهی از کاربران، مناسب به نظر می رسند، در واقع یک هستی شناسی به حساب می آیند. به عنوان مثال مجموعه ای از عناصر و پالایش های عناصری که در دابلین کورمعرفی شدند در نوع خودشان یک هستی شناسی هستند. دابلین کور با وجود کلی بودن، یک هستی شناسی ست، به دلیل اینکه مدل مفهومی تعریف شده رسمی ای را اعمال می کند. این مدل، پردازش خودکار اطلاعات را که برای حمایت از اشتراک دانش در میان نظام های رایانه ای ضروری ست، تسهیل می کند و به همین دلیل موجبات ظهور وب معنایی را فراهم می کند. ( ژاکوب، ۱۳۸۴)

کنسرسیوم وب جهانی زبان های بازنمون هستی شناسی را در گروه کاری مربوطه تعریف کرده است. زبان هستی شناسی ابزاری است که در سطحی انتزاعی- سطح مفهومی- مشخص می سازد چه چیزی در حوزه، لزوما درست است. به بیانی کوتاه تر، زبان هستی شناسی باید نشانگر قید ها یا محدودیت ها باشد. بیان واضح محدودیت ها در نمونه سازی اهمیت دارد از جمله زبان های بازنمون هستی شناسی می توان ازاو.دبلیو.ال ،او.آی.ال , ۷او.آی.ال +دی.ای.ام.ال , آر.دی.اف نام برد. از میان زبان های مطرح شده او.دبلیو.ال جدید ترین استاندارد زبانی توصیه شده است و قابلیت های بیشتری نیز نسبت به سایر زبان ها دارد. این زبان بر مبنای آر.دی.اف و مشتق شده از او.آی.ال +دی.ای.ام.ال است. او.دبلیو.ال، زبان نشانه گذاری معنایی، در مقایسه با اکس.ام.ال، آر.دی.اف.اس، آر.دی.اف به واسطه فراهم آوری واژگان بیشتر و معانی رسمی در افزایش عمل پذیری و درونی موفق تر است. (شریف، ۱۳۸۵). 

مروری بر هستی شناسی و یکپارچه سازی معنایی داده

۱-هستی  شناسی و یکپارچه سازی معنایی داده

نسل پیشرفته داده در فرآیندهای سازمان ها  نتوانستند به جواب مورد نظر از واحد تقویت و افزایش خطوط  تولیدات برسند. ناتوانی وجود استراتژی های یکپارچه سازی برای سازماندهی دانش در دسترس برای اهداف تجاری و رده علمی واقعی، برخوردی است نه فقط برای تولیدات، بلکه برای شفافیت داده ها در حساسیت درستی و کاربردهای منظم. نوع جدید تکنولوژی معنایی بر پایه هستی  شناسی، یکپارچه سازی دانش را در یک راه قابل استفاده برای چندین کاربرد در راستای تجارت توانا می سازد، از کشف گرفته تا مطالب شرکت داده شده.

۱-۱ چشم انداز ایران ۱۴۰۴

جامعه اطلاعات ذخیره شده ما در طی سالهای ۱۹۹۹ تا ۲۰۰۲ مقدار داده بیشتری را ساخت. صنایع  طی ده سال گذشته با توجه به انتخاب تکنولوژی های سطح بالا تبدیل یافت. متاسفانه، عملکرد این تکنولوژی ها برای تحمل تولیدات دنیای واقعی خوب نبوده است. هیچ یک از دسترسی به تصمیمات علمی ساخته شده در هیات داوری و نه توانایی دانشمندان برای انتقال داده ها در متن پس از مقایسه با دیگر اطلاعات مرتبط، ضمانت نشده است. به علاوه داده هایی که توسط تکنولوژی های خودکار به طور یکپارچه، در منابع ذخیره بزرگ جمع آوری شدند، در مقیاس موثر اما در استفاده محدود بودند. با وجود واسط های کاربری متفاوت، فرمت های فایل، سیستم های پایگاه داده، سیستم عامل ها و داده های معنایی، هر کدام از این منابع به یک جزیره داده در دریای ریسک تبدیل می گردد که از کشف محصول ، پیشرفت و بررسی صحیح پشتیبانی می کند. در این منابع، این دانش کمکی به سازمان نمی کند، و حتی نمی تواند به عنوان متن برای تصمیمات تجاری آینده استفاده شود.

چالش های بزرگ تجاری – انتشار و نشان دادن درستی شکل یک ماده مرکب، تغییر دادن آن به طور موثر از مواد ترکیبی رقابتی در یک کلاس مشابه، پیدا کردن مواد جایگزین و تعریف کردن استراتژیهای ترکیب محصول برای جلو زدن در رقابتهای جنس بهتر- همگی بر روی یکپارچه سازی محدوده وسیعی از داده ها در یک راه با معنی تر از صنعت امروزه اعتماد می کنند. این امر به یک تفکر دوباره به ارزش پیاده سازی اطلاعات و راه های مدیریت آن نیاز دارد.

۱-۲ توسعه شفاف اطلاعات

در محیط تولید امروزه، اهداف، نه فقط برای استخراج مواد مرکب با مسئولیت های بالقوه از خطوط تولید ، بلکه برای تفاوت های موثر مواد مرکب در مکان عرضه کالا متمرکز شده است. تفاوت به تنهایی هرگز به عنوان تعریف متریک رقابت بالقوه یک محصول  به کار نمی رود، به جز در زمینه های احتیاج. هر چند این مورد برای مواد مرکب بدون شکل صحیح برتر خیلی مشکل است که در فرمول ها مورد قبول واقع شوند و در لیست محصولات توسعه داده شده سازمانهای نگهداری قرار بگیرند . سرعتی که مواد مرکب در این لیست مورد قبول واقع می شوند بسیار کم است (هفته ها یا حتی سالها). کلاً صنایع امروزه تحت فشار زیادی قرار گرفته و نقش نیروهای انسانی منظم بیشتر از قبل زیر نظر بررسی های عمومی در آمده است. بیشتر بی اعتمادی بنیادی به این علت است که قانون گذاران، مصرف کنندگان و کارشناسان برای شناخت بیشتر یک محصول  و برای شناخت سریع تر و توانایی تبدیل بهتر اطلاعات، هنوز به رویای خود دست نیافته اند. برای مواد مرکب قابل عرضه در بازار، ابزار جمع آوری اطلاعات صحیح، یکپارچه سازی و تحلیل، به علت یک ناتوانی و شکست برای نگهداری اطلاعات با تکنولوژی ساخته شده در ۱۰ سال گذشته، زیر سوال رفته است. وضعیت کنونی در گزارشات اتفاقات، اخیراً به این صورت در آمده که کاغذ جای خود را به اسناد الکترونیکی داده است و حتی اینها برای بازیابی مجدد اطلاعات ضعیف هستند. جمع آوری داده در فرم های الکترونیکی اولین قدم در پردازش وسیع به حساب می آید.

۱-۳ نمایش دانش

ضعف کل پردازش تولید، می تواند به ناکارایی استفاده اطلاعات و به مشکلات ساختن دانش در منابع ذخیره داده توزیعی در سازمانهای نظم دهنده، نسبت داده شود. راه حل متعهد برای این مشکل، یکپارچه سازی داده ها است. تعهد این است که اگر تمام اطلاعات مجزا بتوانند یکپارچه شوند، پس تمام جزیره ها متصل شده و یک بدنه بزرگتر از دانش به محققان نشان داده می شود و تصمیمات، بهتر سریعتر و آگاهانه تر گرفته می شوند.

هر چند یکپارچه سازی داده بدون چالش ها و دردسرهای خودش نیست. مدیریت دانش (KM) و استراتژیهای یکپارچه سازی داده به علت پیاده سازی تکه تکه و فهرست سازی تکامل نیافته و محدودیت های ذاتی موفقیت های کمی داشته اند. یکی از ریسک های بزرگ، که باعث بیش از نیمی از شکست های پروژه KM شده است، مقیاس منبع مورد نیاز برای یکپارچه سازی منبع داده است که در ابتدای هر پروژه معین می گردد. این یکپارچه سازی داده معمولا به تدریج در مخازن داده و انبارهای ایستا عمل می کند و به طور متوسط قابل استفاده مجدد بین پروژه ها است، هر چند پروژه جدید باید یکپارچه سازی داده را خودش انجام دهد. این موضوع می تواند چالش هایی از جمله تاخیر پروژه و از دست دادن کلید را شامل شود.

۱-۴ تکنیک های یکپارچه سازی داده به صورت سنتی

راه های زیادی برای یکپارچه سازی داده وجود دارد، که بیان آن ها در این مقال نمی گنجد و انشاءالله در زمانی دیگر به آن خواهیم پرداخت.

۱-۵ رابط های قانونمند

رابط های قانونمند شامل ساده ترین استراتژی یکپارچه سازی هستند. این راه کار بر پایه این حقیقت استوار است که خیلی از منابع داده نام هایی را برای موجودیت های پایه ای  به اشتراک می گذارند، یا بین منابع و دیگر پایگاه داده ها صورت آشکار ایجاد می کنند.

۱-۶ انبار داده

انبار داده از پایگاه داده به خصوصی برای خلاصه سازی و ذخیره یک کپی داده که از چندین منبع تهیه شده استفاده می کند و آن داده ها را قادر می سازد تا برای یک پرس وجوی ساده مورد سوال واقع شوند. یک جدول مرکزی که فقط قطعه های کلیدی اطلاعات را برای هر مفهوم نگهداری می کند در نظر گرفته شده است و هر جزئیات و مشخصات اضافه در جداول حجمی ماهواره ای ذخیره شده اند به دلیل جلوگیری آنها از تاثیر گذاری روی ظاهر سوالات کلیدی تجاری که انبار داده حول آن طراحی شده است.

۱-۷ بهینه ساز جستجوی تک منظوره

بهینه سازهای جستجوی تک منظوره، سیستم هایی هستند که برای پیدا کردن راه بهینه تلاش می کنند. راه بهینه کلمه بندی کردن یک سوال، وقتی داده ای پاسخ سوال را می دهد ممکن است بین چند جدول یا پایگاه داده توسعه پیدا کند. کاربر یک سوال می پرسد، سپس سیستم یک استراتژی برای بررسی منبع داده های گوناگون پیشنهاد می دهد و ممکن است که تکه های بررسی شده را آزمایش کند تا بهترین راه فرمول سازی بررسی برای ظاهر بهینه را انتخاب کند.

۱-۸ چهارچوب های میان افزاری متحد

چهارچوب های میان افزاری متحد سیستمهایی هستند که پیشرفته ترین استراتژی های یکپارچه سازی را به کار می گیرند. آنها تلاش می کنند تا صرف نظر از فرمت، نوع و یا ساختمان یک داده بنا نهاده شده، بین کاربردهای چندگانه و رابط های کاربر منابع داده ارتباط بر قرار کنند. آنها به پیشرفت یک نمایش معمولی (یا مدل) داده موجود در منابع داده نیاز دارند. به وسیله تایید یک قرارداد بین اجزای یک نوع دیتای داده شده که همیشه به یک فرم نشان داده می شود، سیستم های میان افزاری می توانند خیلی انعطاف پذیر باشند و موثرترین تکنیک برای یکپارچه سازی داده، کاربرد و فرآیندها در مجموعه کاربردهای سازمان به شمار می روند.

تمام این تکنیک ها توانایی ها و ضعف هایی دارند. سیستم های شکل گرفته بر اساس رابط های قانونمند از یکی از محدودیت های بنیادی سیستم یکپارچه سازی رنج می برد: هیاهوی روابط بین منابع داده. تلاش کمتری برای پیشرفت و پشتیبانی تعدادی از روابط بین منابع لازم است، اگر که از یک فرمت معمولی به جای هر منبع مرکب استفاده شود.

گذشته از این، سیستم رابط های قانونمند شامل دانش معناگرای موجود در پشت قانون های ساده به فرم “ارزش در این زمینه با ارزش موجود در آن زمینه مقایسه می شود” نیست. این نقطه شروع ساده ممکن است مانع از گرفتن جزئیات و توانایی روابطی شود که از منابع چند منظوره موجود بین مفاهیم بدست آمده اند و این منجر به از دست دادن ارتباطات مجاز و شامل شدن ارتباطات غیرمجاز می شود.

ساخت انبارهای داده آشکارا سخت و نگهداری از آنها گران است و در برابر تغییر در سوالات پرسیده شده انعطاف ناپذیر هستند و این عمدتا به علت نیاز به یک کپی از داده ها شامل تمام منابع داده پیاده سازی شده در طی عملیات استخراج، تغییرات و بارگیری (ETL[1]) است. داده های وارد نشده داخل انبار نمی توانند به راحتی مورد جستجو قرار بگیرند و تغییر داده های انتخاب شده کار طراحی دوباره قابل توجهی را می طلبد. این کار وقت طراحی زیادی را روی شکل انبار و فرآیند ETL قرار می دهد. اساساً، انبارها و مراکز عرضه داده برای جوابگویی به تعدادی از سوالات مکرر که با در دسترس قرار دادن داده های جدید مطرح می شوند، طراحی شده اند: چیزی که برای فروش مفیدتر از به کار بردن برای کشف محصول است. خود انبارهای داده هیچ اطلاعات معناگرایی را در بر نمی گیرند و به عنوان مثال مسئولیت دانستن اینکه دو ترکیب با اسم های مختلف دارای ساختارهای یکسان هستند، به نویسنده سوال مربوط است. بهینه سازی سیستم جست و جوی تک منظوره با همان مشکلات جمع بندی معناگرایی مواجه است. اگر چه بعضی ها این مشکل را با محدود ساختن تشابه اسم ها (اسم ستون ها در پایگاه های داده) پیچیده می سازند. این اغلب نیازمند تغییر پایگاه داده منبع است، البته با تغییرات انتشار ترتیبی کاربردها که داده را از آن پایگاه داده ها در دسترس می سازند.

سیستم های میان افزاری متحد سعی در طرح ریزی انواع داده نگهداری شده در منابع داده می کنند. و راه های معمول برای انتقال آن نوع های داده بین اجزا و فرآیندها فراهم می کنند. موقعیت آنها در این عمل عمدتا به توانمندی معنایی و تک تک مدل های به کار برده شده وابسته است.

چون اکثر صنایع ما پروژه های یکپارچه سازی داده را با ضعف معنایی واقعی بر عهده گرفته اند، در بسیاری از موارد میراث مخزن های بزرگ از اطلاعات نسبتا مرتبط که دیگر در دسترس نیستند را از دست می دهند. دربسیاری موارد، یکپارچه سازی به صورت ایستا انجام می شود و سوال ها و متن های جدید به آسانی اصلاح نمی شوند، در برخی دیگر از موارد پروژه های یکپارچه سازی با ارزش به علت کمبود نتایج ملموس رها می شوند.

راه موثرتر دسترسی، تمرکز بیشتر روی نمایش دانش، نسبت به مدیریت آن است. اگر یک نمایش معناگرای توضیحی، از دانش در دسترس ساخته شود می تواند برای نیرومند کردن کاربردهای تجاری گوناگون، بدون نیاز به تمرین های یکپارچه سازی مکرر استفاده شود. دانش جدید جمع آوری شده از منابع مختلف می تواند بر اساس دانش امروزی ساخته شود، زیرا همه آن در چهارچوب معناگرایی وجود دارد.

۱-۹ نقش معنا گرایی

کلید توانایی یکپارچه سازی اطلاعات در یک راه قابل استفاده، استفاده از معنا شناسی است که معنی یا مفهوم یک لغت را توصیف می کند. اولا معنا شناسی برای دو مفهوم که ممکن است در بانک های داده متفاوت و در غالب های متفاوت با اسامی متفاوت ظاهر شوند استفاده شده است. این حالت ممکن است در بانک های داده بزرگ وقتی دو رکورد، یک نام مشابه اما دو مفهوم متفاوت در دو متن جدا از هم داشته باشند، مبهم است. و بعضی دیگر ممکن است به این مفاهیم مرتبط باشند. توانایی تشخیص این لغت هم معنی، هم آوا و شبیه به هم، برای یکپارچه سازی داده از منابع مختلف ضروری است.

ثانیا، معنا شناسی فرم اختصاصی ارتباطی که بین مفاهیم موجود است، را نسبت به رویدادهای مشترک در متن یا شباهت لغوی یک عنوان توصیف می کند، این موضوع یک توصیف کاملتر از همه اطلاعات در دسترس را فعال می کند، تا نشان دهند که اشیا با چه چیزی در عمل هستند و چه نقشی در متن داده شده دارند.

۱-۱۰ تکنولوژی معنایی، هستی  شناسی و فراتر از آن

اخیرا نمایشی واقعی از دانشی که ذاتا انعطاف پذیرتر و شمارش پذیرتر است، و همچنین قابلیت بیشتری برای پشتیبانی چندین کاربرد دارد، در مقیاسی مناسب ارائه گردیده است. این نمایش هستی  شناسی نام دارد که در زمینه های فلسفه و علوم کامپیوتر بنیان گذاری شده است و در مرکز موج جدید تکنولوژی های معنایی از قبیل وب معناگرا یا سمنتیک وب قرار می گیرد.

یک هستی  شناسی شامل ارائه ای از تمام زمینه های موجود در یک حیطه و نیز تمام روابط بین آنها می گردد.

وابستگی های بین زمینه های فوق در یک فرم به صورت ارتباط هایی که به دو زمینه توسط رابطه ای داده شده نسبت دارد جمع آوری شده اند. این سه تایی ها (که به صورت مفهوم-ارتباط-مفهوم و فاعل-مسند-مفعول بیان می شود) بلوک های سازنده اکثر ساختارهای هستی  شناسی هستند که شامل استانداردهای سمنتیک وب از RDF و OWL می گردند. علاوه بر محصولات تجاری، چندین ابزار به منظور پشتیبانی از کاربردهای این استانداردها ارائه گردیده اند.

این بیانیه ها می توانند در ساده ترین شکل خود از روابط IS-A استفاده کنند که وقتی به هم می پیوندند تشکیل یک طبقه بندی و یا سلسله مراتب می دهند. طبقه یندی زمینه ها (و روابط) می تواند در جای خود بسیار مفید باشد، بخصوص چنانچه به زمینه ها خصوصیاتی از قبیل مشابه ها ضمیمه شده باشد. این امر کاربران را قادر می سازد که زمینه های سطح بالای ‘خانوادگی’ از قبیل GPCR را در هنگام اجرای جستجو ویا انتخاب داده برای آنالیز مشخص کند.

هستی  شناسی های صحیح، دامنه وسیعی از روابط بین زمینه های مختلف از قبیلIS-EXPRESSED-IN, BINDS-TO, HAS-AFFINITY-FOR, IS-USED-FOR-TREATMENT-OF دارند. این روابط همچنین شامل تمام هم ارزهای شناخته شده می گردد. این امر باعث می گردد که تمام اشکال مختلف انگلیسی از روابط BINDS-TO بین اجزاء سیستم ها و ترکیب ها بتوانند برای ساخت یک تصویر کامل و با جزئیات از تعاملات بین یک جزء و یا خانواده آن جزء مورد استفاده قرار گیرد.

هر چند از زمان ارسطو و معاصرانش، هستی  شناسی به عنوان شرحی متا فیزیکی از جهان مطرح بوده است، اخیرا هستی  شناسی به منظور بیان محاسباتی دامنه دانش بطور گسترده بکار گرفته شده است. در حال حاضر هستی  شناسی نه تنها در پروژه های تحقیقاتی مدرن، بلکه در پروژه های تجاری واقعی نیز در صنایع استفاده می گردد. نمونه ای از این قبیل پروژه ها، استفاده از هستی  شناسی در هدایت ابزارهای طبیعی پردازش زبان (NLP)، در شناسایی و آنالیز پارامترهای مشترک جنسی با توجه به اطلاعات مختلف است. در سطحی برابر با یک دانشمند حرفه ای، سیستم هستی  شناسی، کارایی جستجو را حداقل با ضریب ۱۰ افزایش می دهد. صرف نظر از سایر کاربردها، ارزش این نوع از افزایش به مقدار ده ها میلیون دلار تخمین زده شده است.

۱-۱۱ هستی  شناسی به عنوان جمع کننده داده

نقشه راه کارها و روابط در یک هستی  شناسی، دسترسی اصلی منبع برای یکپارچه سازی داده های معنایی صحیح را فراهم می آورد. هستی  شناسی اطلاعات را قادر می سازد که از یک منبع با دقت بسیار بالا به اطلاعات منبع دیگر نگاشته شود. چندین نمونه از یک مفهوم (ویا موارد مشابه آن) در منابع با ساختار متفاوت و یا ساختاردهی نشده می توانند به یک مفهوم هستی  شناسی خاص نگاشته شوند، و لذا داده های این منابع اصلی می توانند به صورت معنایی جمع آوری گردند.

هستی  شناسی، اصطلاحات یکسانی را برای تجمع داده ها فراهم می کند – با نشان دادن نام های مورد نظر برای یک مفهوم، هم مفهوم ها و خواص مرتبط با آن. این امر، امکان تجمع پیشگویانه را توسط جمع آوری داده از روی نام هایی که قبلا بخوبی درک شده اند را فراهم می آورد. این موضوع شبیه سازی اطلاعات جدید و ارتباط بین گروه ها را سریع تر و راحت تر می سازد. سازمان دهی تجمع داده در هستی  شناسی، لایه ای میانی ایجاد می کند که تجمع داده را – با کاهش هزینه، نگهداری و خطر پروژه – کاراتر می کند. بعلاوه، بدلیل اینکه هستی  شناسی می تواند در طول زمان با اضافه شدن داده های جدید گسترش یابد، ارتباط های جدیدی به مرور زمان اضافه می گردند و دانش جدید مشابه هستی  شناسی موجود می گردد.

فایل کامل این تحقیق ۶۰ صفحه بصورت ورد WORD می باشد.
در تمامی ساعات شبانه روز >> پرداخت آنلاین و دانلود آنلاین پروژه

 


توجه مهم :

*دوست عزیز در صورت نداشتن رمز پویا یا قطع بودن درگاه بانکی ، لطفا نام پروژه درخواستی خود را جهت هماهنگی برای دریافت شماره کارت واریزی و دریافت لینک دانلود، به واتساپ پشتیبانی سایت  ۰۹۳۹۲۷۶۱۶۳۰  ارسال کنید *(از ساعت ۸ الی ۲۳)

Related posts

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *