سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

مصطفی حق جو سانیجی – استادیار نرم افزار دانشگاه علم و صنعت ایران، دانشکده کامپیوتر
سامان پورسیاه ناوی – کارشناس ارشد نرم افزار از دانشگاه علم و صنعت ایران
مهدی سخایی نیا – مربی و کارشناس ارشد نرم افزار دانشگاه آزاد اسلامی واحد همدان

چکیده:

با توجه به نقش بانکهای اطلاعاتیXML و نیز اهمیت XML به عنوان یک زبان نشانه گذاری استاندارد که می تواند انواعداده ها را در خود نگهداری نماید، نیاز به روشهایی که بتوانند اطلاعات موجود در اسنادXMLرا در زمان کوتاهی بدست آورند، به شدت احساس می شود. یکی از خصوصیات اسنادXMLنیمه ساختیافتگی ،آنها می باشد. در این ساختار یک رکورد می تواند بعضی از فیلدها را نداشته باشد و یا فیلدهای رکوردها می توانند مثل هم نباشد. در این مقاله با استفاده از ویژگیهای نیمه ساختیافته اسنادXML وتکنیک های طبقه بندی داده ها به بهینه سازی پرس وجو می پردازیم. در روش پیشنهادی تعداد اسنادی که پرس و جو بر روی آنها اجرا می شود را کم می کنیم و در نتیجه زمان اجرای پرس وجو را کاهش می دهیم. در این میان تشخیص و ارجاع پرس وجوها به طبقه ها چالش تازه ای در زمینه مدیریت پرس وجو می باشد. در روش پیشنهادی با تبدیل درخت سندXML به درخت دودویی وبا ارایه الگوریتمی، از ویژگی درختان دودویی برای طبقه بندی اسنادXML استفاده می کنیم. علت این تبدیل، تشخیص آسان وجود یا عدموجود المانها در درختان دودویی می باشد. سپس با ارایه روشی سلسله مراتبی برای ذخیره سازی فیزیکی طبقه ها در کنار هم و استفاده از بخش هدایتگر پرس وجو، به پرس وجوی کاربر پاسخ داده می شود.