پایان نامه ارشد رشته هوش مصنوعی: استفاده از کاربرانی با دقت پیشگویی بالا در سیستمهای فیلترینگ اشتراکی |
2-5-1- فیلترینگ اشتراکی مبتنی بر حافظه…………………………………………………………………………24
2-5-1-1- فیلترینگ اشتراکی مبتنی بر حافظه با پیشبینی بر اساس کاربران…………………….25
2-5-1-2- فیلترینگ اشتراکی مبتنی بر حافظه با پیشبینی بر اساس اقلام…………………………25
2-5-1- 3- تفاوت فیلترینگ اشتراکی بر اساس کاربران و بر اساس اقلام……………………………..26
2-5-2- فیلترینگ اشتراکی مبتنی بر مدل……………………………………………………………………………..26
2-6- نحوه تشخیص علائق کاربران………………………………………………………………………………………….27
2-6-1- تشخیص علائق به صورت صریح…………………………………………………………………………………27
2-6-2- تشخیص علائق به صورت ضمنی……………………………………………………………………………….27
2-7- محاسبه شباهت……………………………………………………………………………………………………………….28
2-7-1- معیار همبستگی پیرسون……………………………………………………………………………………………28
2-7-2- معیار اندازهگیری کسینوس………………………………………………………………………………………..29
2-8- انتخاب همسایه……………………………………………………………………………………………………………….30
2-8-1- استفاده از حد آستانه………………………………………………………………………………………………….30
2-8-2- انتخاب تعداد ثابتی از همسایگان……………………………………………………………………………….30
2-9- پیشبینی و تخمین رتبه…………………………………………………………………………………………………31
2-9-1- استفاده از امتیازهای خام……………………………………………………………………………………………31
2-9-2- استفاده از امتیازهای نرمال شده………………………………………………………………………………..31
2-10- مشکلات فیلترینگ اشتراکی………………………………………………………………………………………..32
2-10-1- پراکنده بودن داده…………………………………………………………………………………………………….32
2-10-2- مقیاس پذیری………………………………………………………………………………………………………….32
2-10-3- اقلام مشابه……………………………………………………………………………………………………………….33
2-10-4- گریشیپ…………………………………………………………………………………………………………………33
2-11- بررسی چگونگی کارکرد سایت آمازون…………………………………………………………………………33
فصل 3 : روش محتوا محور………………………………………………………………………………………………………36
3-1- پیشگفتار………………………………………………………………………………………………………………………….37
3-2- روند کار روش محتوا محور……………………………………………………………………………………………..37
3-2-1- تحلیلگر محتوا…………………………………………………………………………………………………………..38
3-2-2- یادگیرنده نمایه …………………………………………………………………………………………………..39
3-2-3- جزء فیلترینگ…………………………………………………………………………………………………………….42
3-3- مزایای روش محتوا محور………………………………………………………………………………………………..42
3-3-1- استقلال کاربر……………………………………………………………………………………………………………..42
3-3-2- شفافیت……………………………………………………………………………………………………………………….42
3-3-3- قلم جدید…………………………………………………………………………………………………………………….43
3-4- معایب روش محتوا محور…………………………………………………………………………………………………43
3-4-1- کمبود محتوا……………………………………………………………………………………………………………….43
3-4-2- خصوصی سازی افزون…………………………………………………………………………………………………43
3-4-3- کاربر جدید………………………………………………………………………………………………………………….44
فصل 4 : روش پیشنهادی………………………………………………………………………………………………………….45
4-1- پیشگفتار………………………………………………………………………………………………………………………….46
4-2- بر کارهای انجام شده در این راستا……………………………………………………………………..46
4-3- مقدمهای بر روش پیشنهادی…………………………………………………………………………………………..48
4-4- روش پیشنهادی………………………………………………………………………………………………………………48
4-4-1- پیش پردازش………………………………………………………………………………………………………………49
4-4-1-1- پیش پردازش بر روی پایگاه داده MovieLens………………………………………………………………….
4-4-1-2- پیش پردازش بر روی پایگاه داده EachMovie………………………………………………………………..
4-4-2- وزندهی به اقلام…………………………………………………………………………………………………………51
4-4-3- انتخابهمسایگی…………………………………………………………………………………………………………53
4-4-4- پیشبینی……………………………………………………………………………………………………………………54
فصل 5 : آزمایشها و نتایج……………………………………………………………………………………………………….56
5-1- پایگاه دادههای مورد استفاده…………………………………………………………………………………………..57
5-2- نحوهاجرای روش پیشنهادی روی پایگاه دادهMovieLens……………………………………………………..
5-3- نحوهاجرای روش پیشنهادی روی پایگاه دادهٍEachMovie……………………………………………………
5-4- معیارهایارزیابی………………………………………………………………………………………………………………58
5-4-1- میانگین خطای مطلق…………………………………………………………………………………………………58
5-4-2- دقت و فراخوانی………………………………………………………………………………………………………….59
5-4-3- معیار ارزیابیF1…………………………………………………………………………………………………………60
5-5- ارزیابی روش پیشنهادی توسط معیارهای معرفی شده…………………………………………………..61
فصل 6 : بحث و نتیجه گیری…………………………………………………………………………………………………….66
6-1- بحث…………………………………………………………………………………………………………………………………67
6-2- نتیجهگیری……………………………………………………………………………………………………………………..67
6-4- پیشنهادات……………………………………………………………………………………………………………………….68
مراجع………………………………………………………………………………………………………………………………..69
چکیده:
سیستمهای پیشنهادگر ابزارهای نرم افزاری و تکنیکهایی هستند که اقلام را مطابق با نیاز کاربر به او معرفی میکنند. روشهای محتوا محور و فیلترینگ اشتراکی از راهکارهای موفق در سیستمهای پیشنهادگر میباشند. روش محتوا محور بر اساس ویژگیهای اقلام تعریف میشود. این روش بررسی میکند که اقلام مورد علاقه کاربر دارای چه ویژگیهایی بودهاند، سپس اقلام دارای ویژگیهای مشابه را به او پیشنهاد میکند. روش فیلترینگ اشتراکی بر اساس تعیین اقلام مشابه یا کاربران مشابه کار میکند که به ترتیب فیلترینگ اشتراکی مبتنی بر اقلام و مبتنی بر کاربران نامیده میشود. در این پایان نامه یک روش تلفیقی از روشهای فیلترینگ اشتراکی و محتوا محور ارائه شده است. این روش میتواند به عنوان روش فیلترینگ اشتراکی مبتنی بر کاربر در نظر گرفته شود. به این صورت که به منظور یافتن کاربرانی با سلیقه مشابه با کاربر فعال به عنوان کاربرانی با دقت پیشگویی بالا از ویژگیهای مربوط به محتوای اقلام برای افزایش تاثیر امتیازهایی که توسط کاربران به اقلام مشابه تخصیص داده شده است استفاده میکند. به بیان دیگر دو کاربر مشابه هستند در صورتی که امتیازهایی که به اقلامی که از نظر محتوا مشابه هستند نسبت دادهاند، همسان باشند. برای این منظور در هنگام سنجیدن شباهت دو کاربر، به امتیاز نسبت داده شده به هر قلم، با توجه به میزان شباهت آن به قلم هدف، وزن تخصیص می یابد.
فصل اول
1- مقدمه
1-1- پیشگفتار
پیدایش اینترنت و وب جهان گستر[1] موجب شده است که در رابطه با هر موضوع قابل تصور، حجم بسیار زیادی از اطلاعات وجود داشته باشد که کاربران[2] بتوانند با استفاده از آن نیاز اطلاعاتی خود را برطرف سازند. افزایش روز افزون اطلاعات باعث شد که مشکل سربار اطلاعات[3] به وجود آید و کاربران به تنهایی قادر به برطرف کردن نیازهای خود نباشند. . زیرا کاربران مجبور بودند به صورت بر خط[4] تمامی صفحات را جستجو کنند تا بتوانند آن قسمتی را که مورد نیازشان است پیدا کنند. به همین دلیل موتورهای جستجوگر[5] به وجود آمدند تا کاربران بتوانند با استفاده از آنها بدون نیاز به بررسی تعداد زیادی از صفحات به اطلاعات مورد نظرشان دسترسی پیدا کنند.
1-2- موتورهای جستجوگر
به عبارت دیگر یک موتور جستجوگر وب سایتی است که میتوان از آن برای پیدا کردن صفحات وب استفاده کرد. وقتی کاربر درخواست خود را در قالب کلمات کلیدی وارد موتور جستجوگر میکند موتور جستجوگر در بین بیلیونها صفحه وب جستجو کرده و به کاربر کمک میکند اطلاعاتی که به دنبال آن است را بیابد. با استفاده از این ابزار سرعت و دقت در جستجو بسیار افزایش یافت و کاربران توانستند به سادگی و در کمترین زمان به بهترین نتایج دست یابند.
انواع زیادی از موتورهای جستجوگر توسط کمپانیهای مختلف ساخته شده است که معروفترین آنها بینگ[6]، یاهو[7] و گوگل[8] میباشد (شکل شماره 1).
هر موتور جستجوگر راه و روش خود را برای سازماندهی اطلاعات دارد، پس نتیجه از یک موتور جستجوگر تا دیگری متفاوت خواهد بود.
موتورهای جستجوگر به دو دسته کلی تقسیم میشوند : موتورهای جستجوگر پیمایشی[9] و فهرستهای تکمیل دستی[10]. موتورهای جستجوگر ترکیبی[11] نیز حاصل ترکیب دو نوع بالا میباشند. گونهای جدید از موتورهای جستجوگر نیز تحت عنوان ابر جستجوگرها[12] وجود دارد که در ادامه به طور خلاصه به توضیح هر کدام از این موارد خواهیم پرداخت.
1-2-1- موتورهای جستجوگر پیمایشی
این موتورهای جستجوگر، وب را پیمایش و اطلاعاتی را ذخیره میکنند. سپس کاربران از میان این اطلاعات آنچه را که میخواهند جستجو میکنند. اگر در صفحه وب تغییراتی اعمال شود موتورهای جستجوگر پیمایشی به طور خودکار آنها را مییابند و تغییرات مذکور را در فهرستها اعمال میکنند. نمونههایی ازموتورهای جستجوگر پیمایشی گوگل و یاهو میباشند.
1-2- 2- فهرستهای تکمیل دستی
فهرستهای تکمیل دستی وابسته به کاربرانی میباشد که آن را تکمیل میکنند. یا کاربر خودش صفحه مورد نظر را به همراه توضیحی کوتاه در فهرست ثبت میکند یا این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده صورت میپذیرد. در این حالت عمل جستجو تنها بر روی توضیحات ثبت شده انجام میگیرد و اگر تغییری روی صفحه وب به وجود آید در فهرست تغییر به وجود نخواهد آمد. نمونهای از فهرستهای تکمیل دستی Open Directoryمیباشد[13].
1-2-3- موتورهای جستجوگر ترکیبی
این موتورهای جستجوگر نتایج حاصل از جستجوی هر دو نوع بالا را با هم ترکیب میکنند و نشان میدهند. علاوه بر این میتوانند برای نتایج یک نوع، اولویت قائل شوند. مثلا موتور جستجوی MSN اولویت را روی نتایج حاصل از فهرستهای تکمیل دستی قرار میدهد. ولی برای درخواستهای پیچیده، نتایج حاصل از جستجوی پیمایشی را نیز بررسی میکند.
1-2-4- ابر جستجوگرها
این نوع جدید از موتورهای جستجوگر نتایج حاصل از چند موتور جستجوگر را ترکیب نموده و نشان میدهد. به عبارتی دیگر درخواست کاربر را در چندین موتور جستجوگر جستجو کرده، سپس نتایج یافته شده را با هم ترکیب نموده و یک نتیجه کلی در اختیار کاربر قرار میدهد. به عنوان مثال موتور جستجوگر dogpile[14] نتایج حاصل از موتورهای جستجوگرGoogle ، Yahoo، MSN و ASK را با هم ترکیب میکند و به کاربر ارائه میدهد.
1-3- سیستمهای پیشنهادگر
مطالعات اخیر نشان دادهاند که عمده موتورهای جستجوگر با نرخ پایین موفقیت مواجه هستند. این نرخ با میزان دریافت نتایج مرتبط، نسبت به میانگین کاربران جستجو کننده تعیین میشود. به عنوان مثال در یکی از مطالعات[1] بیش از 20000 درخواست جستجو بررسی شده و مشخص گردیده که به طور میانگین در 48% موارد، کاربر در نتایجی که به او ارائه شده حداقل یک مورد مرتبط با جستجویش که ارزش انتخاب داشته باشد پیدا میکند. به بیان دیگر در 52% موارد، کاربر هیچ کدام از مواردی را که به عنوان نتیجه جستجو به او بازگشت داده میشود انتخاب نمیکند. البته این مشکل همان قدر که به موتور جستجوگر بستگی دارد به میزان دانش کاربر جستجو کننده در چگونگی نحوه جستجو نیز بستگی دارد. زیرا درخواست جستجو ممکن است منجر به ابهام شود و به ندرت میتواند به روشنی نیاز کاربر جستجو کننده را بیان کند. در این مواقع کاربر با لیست نتیجهای که نمیتواند نیاز اطلاعاتی او را برطرف سازد روبرو میشود. او در این شرایط معمولا درخواست خود را تعویض یا اصلاح میکند تا نتیجه دلخواهش به او ارائه شود.
فرم در حال بارگذاری ...
[چهارشنبه 1399-10-17] [ 05:54:00 ب.ظ ]
|