
همانند جویی
همانند جویی مقالات، ابزاری است که از آن برای تشخیص سرقت علمی/ادبی استفاده می شود. در یک روش همانند جویی مقالات، هدف تشخیص تمام قسمت های همانند موجود در یک متن مشکوک با توجه به تعدادی متن منبع احتمالی است. روش های زیادی برای همانندجویی ارائه شده اما از یک طرف، استفاده از روش های همانندجویی موجود برای سایر زبان ها به منظور همانند جویی در زبان فارسی مناسب نیست و از طرف دیگر، اغلب روش های ارائه شده برای همانند جویی مقالات در زبان فارسی قادر به تشخیص متون بازنویسی شده نیستند. با توجه به این مهم، دو روش همانند جویی جدید با هدف تشخیص متون فارسی بازنویسی شده، روش شناسی پژوهش براساس مطالعه منابع و مستندات معتبر علمی در این خصوص و روش کتابخانه ای.
انواع همانند جويي مقالات
روش اول پیشنهادی روشی معنایی است و از لغت نامه جهت بررسی همانندی جملات متون استفاده می کند. روش دوم پیشنهادی روشی احتمالاتی است و از اطلاعات آماری به دست آمده از پیکره ای عظیم از متون برای همانندجویی استفاده می کند. روش معنایی پیشنهادی در مقايسه با روش های معنایی موجود از معیارهای جدیدتری برای بررسی همانندی متون استفاده کرده و روش احتمالاتی پیشنهادی اولین روش همانندجویی احتمالاتی ارائه شده برای زبان فارسی است.
درحالیکه در سایر روش های موجود، همانندی هر دو جمله از متون موردنظر به صورت مستقل بررسی می شود، در روش های پیشنهادی همانندی جملات همسایه نیز در بررسی همانندی دو جمله در نظر گرفته شده است. نتایج پیاده سازی و آزمایشات صورت گرفته بر روی روش های پیشنهادی نشان می دهد که در حالیکه هر دو روش از کیفیت مناسب و تقریبا یکسانی برخوردار هستند، روش همانندجویی احتمالاتی پیشنهادی بسیار کاراتر بوده و زمان موردنیاز برای همانندجویی با استفاده از آن به طور متوسط برابر با 3. 8% زمان موردنیاز توسط الگوریتم همانندجویی معنایی پیشنهادی است.