مقاله ساپورت بازیابی اطلاعات در مورد استفاده وساخت آنتولوژی (antology)
چکیده:
بازیابی اطلاعات میتواند به ساخت آنتولوژیها و کاربرد مؤثر و مفید آنها، کمک کند. ما از استخراج واژة اصلی مبتنی بر ترکیب و تجانس (Collocation)، جهت ارائه مفاهیم جدید، استفاده و در مورد ارائة ارتباط وسیع جهت اتوماتیک سازی جمعیت آنتولوژی با مثال، مطالعه میکنیم. ما، متدهای خود را در تنظیم پروژة کتابخانة دیجیتال، با استفاده از متدولوژی ارزیابی اطلاعات، ارزیابی میکنیم. در یک تنظیم مشابه، در مورد متدهای بازیابی مطالعه میکنیم که ساپورت جهتیابی ارائه شده توسط روابط معنایی و لغوی موجود در اغلب آنتولوژیها را جهت کمک به کاربران در بررسی آنتولوژی تکمیل میکنند.
مقدمه:
متدهای جستجو، جهت یابی و سازماندهی اطلاعات اینترنت رایج امروز، دهههای تحقیق دوره بازیابی اطلاعات را پایه و مبنا قرار میدهند. این متدها مبنی بر قوانین آماری کنترل کنندة استفاده انسان از زبان، نه تنها در بازیابی سند و مدرک، بلکه در امورغنیتر به لحاظ معنایی مثل پاسخگویی به پرسش، مورد استفاده قرار میگیرند. یک شکل Semantic Web این است که بسیار شبیه به Web است که ما امروزه میشناسیم و انتظار داریم که اسناد مدارک، سرشار از منافع قابل فهم باشند. این تفسیرها را در مورد اسناد وعبارات قابل توجیهی که در جستجوی معانی مضمون اسناد ومدارک هستند، ارائه خواهند داد. ما توضیح میدهیم که صورتهای صرفی IR چگونه میتوانند در این امر، با کمک آرشیتکتهای آنتولوژی غیرمعمولی، مؤثر باشند. تکنیکهای IR میتوانند به تعریف، تشخیص و بررسی ثبات و تداوم آنتولوژی کمک کنند. هشت مرحله میتوانند در پروسه ایجاد آنتولوژی متمایز شوند.
1- تعیین محدودة آنتولوژی
2- توجه به استفادة مجدد از قسمتهای مربوط به آنتولوژی موجود
3- بر شماری و ذکر کلیة مفاهیمی که میخواهید
4- تعریف و تشخیص تاکونومی این مفاهیم
5- تعریف و تشخیص ویژگیهای مفاهیم
6- تعریف و تشخیص جنبههایی از مفاهیم مثل اصول و ارزشهای مورد نیاز وغیره
7- تعریف و تشخیص نمونهها
8- بررسی ثبات و تداوم آنتولوژی
ما، از میان این مراحل، مراحل 3 و7 را با تکنیکهای مبتنی بر IR بررسی کرده و معتقدیم که این مراحل میتوانند به طور مفیدی با استفاده از تکنولوژی بازیابی قابل دسترس امروزی، انجام شوند. مرحلة 4 برای اتوماتیک سازی، مناسب است، در عین حال، مسئله حلشدهای به شمار نمی رود و مرحله 8 در مورد متدهای استدلال سمبولیک به گونهای که مثلاً در PACER و FACT اجرا میشوند، بهترین گزینه است. تکنیکهای IR ، علاوه بر اینکه جهت کمک به سازندگان آنتولوژی مورد استفاده قرار میگیرند، میتوانند در جستجو، مرورگری و ارائه موارد غیرمترقبه نیز به کاربران کمک کنند. مردم تمایل دارند که از Semantic Web شرکتها جهت جستجوی اسناد و مدارک، بلکه جهت جستجوی اطلاعاتی در مورد روابط معنایی خاص، مثلاً در تنظیم کتابخانه های دیجیتال، استفاده کنند. بنابراین، روشهایی را جهت «بازیابی در یک سلسله مراتب مفهومی» ارائه میدهیم، که در آنها به جستجوی واقعی هماهنگی به نحوییکه توسط اغلب ابزارهای جهتیابی و ویراستارهای آنتولوژی ارائه میشود. ممکن است مناسب و کافی نباشد. پیشرفتهای گذشته، با ایجاد آلگوریتمهای بازیابی سند و مدرک مفید امروزی جهت ایجاد و بهکارگیری زیرساختار Semantic web، مستقیماً منجر به ایجاد پیشرفتهایی در آینده میشوند. اما دلیل متدولوژیکی بیشتری برای نزدیک تر که من اقدامات Semantic web در IR به هم داریم، جامعه IR بر اهمیت ارزیابی، تأکید کرده است. با ظهور کنفرانسهای بازیافت متن (IRC)، ارزیابی آزمایشی امور مربوطه به بازیابی، به پیشرفت چشمگیری رسیده که منجر به پیشرفت سریع در امور ارزیابی شده، شده است. منافع مشابهی با اقدامات ارزیابی مربوط به بازیایب و اقدامات مربوط به امور پردازش زبان غنیتر به لحاظ معنایی، وجود دارند. جامعه Semantic web، از تأکید شدیدتر بر ارزیابی و اموری که میتوانند ارزیابی شوند، سود میبرد. با خوردن غذای سگ خود، ارزیابی تجربی در مورد کلیه امور مورد بررسی در این مقاله انجام میدهیم.
بخش 2، تنظیمی را بررسی میکند که کلیة امور در آن رخ میدهند. پروژه Language Links و (Lolali )Logic ، به هدف فراهم آوری امکان دستیابی مبتنی بر آنتولوژی به یک کتاب راهنمای الکترونیکی در فصل مشترک و واسط زبانشناسی و منطق. در بخش 3، اتوماتیک سازی مرحله 3 و ارزیابی آنرا، توصیف میکنیم. در بخش 4، در مورد اتوماتیک سازی مرحله 7 و ارزیابی آن، صحبت میکنیم در بخش 5، جستجو در سلسله مراتب مفهوم LaLaLi را ارزیابی میکنیم. در بخش 6، نتیجه گیری میکنیم.