خرید و دانلود فصل دوم پایان نامه پیکره متنی موازی و تعریف آن با فرمت docx در قالب 24 صفحه ورد
تعداد صفحات | 24 |
حجم | 87/927 کیلوبایت |
فرمت فایل اصلی | doc |
پیکره، مجموعهای است از مواد متنی یا گفتاری که بر اساس مجموعه مشخصی از معیارهای از پیش تعیین شده گردآوری شده است. پیکره قابل خوانش توسط ماشین است به عبارتی دیگر دیجیتالی است، دامنه مشخصی دارد و محدود (دارای نهایت) است. پیکره برای پژوهشهای زبانی مورد استفاده قرار میگیرد. از آنجایی که در این پژوهش کاربردهای متنی ترجمه ماشینی مدنظر است، منظور از پیکره، پیکره متنی میباشد؛ اما از این پس جهت سهولت تنها از لفظ پیکره به جای پیکره متنی استفاده میکنیم.
فهرست مطالب
2-1. پیکره 14
2-1-1. پیکره موازی 15
2-1-2. پیکره تطبیقی 17
2-2. همترازی 18
2-2-1. همترازی در سطح سند 19
2-2-2. همترازی در سطح جمله 19
2-2-3. همترازی در سطح کلمه (همترازی لغوی) 21
همترازی لغوی با استفاده از مدلهای آیبیام 22
2-3. ارزیابی ترجمه ماشینی 23
2-3-1. بلو 23
2-3-2. متریک NIST 24
2-3-3. نرخ خطای کلمه 24
2-3-4. نرخ خطای ترجمه (TER) 25
3. مروری بر تحقیقات انجام شده 28
3-1. مقدمه 28
3-2. ساخت پیکره موازی از روی متون همترجمه 28
3-3. استخراج جملات موازی از وب 30
3-4. استخراج جملات موازی از پیکرههای تطبیقی 32
3-5. تشخیص جملات موازی با استفاده از طبقهبند آنتروپی بیشینه 34
3-6. ساخت پیکره موازی انگلیسی – فارسی 36
منابع