Search In this Thesis
   Search In this Thesis  
العنوان
Automatic Machine Translation in Medical Domain /
المؤلف
Abd El-Kader, Rana Ehab.
هيئة الاعداد
باحث / رنا اهاب عبد القادر جاويش
مشرف / محمود جاد الله
مشرف / اسلام عامر
مناقش / محمود جاد الله
الموضوع
Machine translating.
تاريخ النشر
2019.
عدد الصفحات
103 p. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
علوم الحاسب الآلي
تاريخ الإجازة
1/1/2019
مكان الإجازة
جامعة بنها - كلية الحاسبات والمعلومات - الحاسبات و المعلومات
الفهرس
Only 14 pages are availabe for public view

from 103

from 103

Abstract

تحتوي السجلات الطبية على معلومات معقدة يجب ترجمتها بشكل صحيح وفقًا لمعناها الطبي وليس معناها باللغة الإنجليزية فقط. لذلك ، فإن جودة الترجمة الآلية في هذا المجال مهمة للغاية.
في هذه الأطروحة ، تم تطبيق نظام الترجمة الآلية باستخدام تقنية الترجمة الآلية المبنية على سبيل المثال وذاكرة الترجمة لترجمة المصطلحات الطبية الإنجليزية إلى المصطلحات الطبية العربية بالمقارنة مع استخدام الترجمة من Google فقط للترجمة ، ونظام الترجمة الآلية المبني على المثال باستخدام مرحلة المطابقة فقط وأخيراً مع نظام هجين يستخدم مثال الترجمة الآلية على أساس وترجمة جوجل.
وفقًا للدرجات التي حققها النظام المطبق مقارنة بنتيجة التجارب الأخرى بسبب استخدام ذاكرة الترجمة التي تخزن ترجمة كل مصطلح طبي ، عند استخدامه لترجمة الأجزاء غير المتطابقة من جملة الإدخال (Si) تمت الإضافة إلى الترجمة المصاحبة (St) لأقرب جملة (Se) من قاعدة البيانات في مرحلة إعادة التركيب للتأكد من ترجمة الأجزاء غير المتطابقة إلى المصطلح الطبي العربي الصحيح. استخدام تقنية المستندة إلى المثال وذاكرة الترجمة تكون فعالة عندما تكون اللغة الهدف هي اللغة العربية.
كما أن ترجمة جوجل ليست فعالة للغاية للترجمة من الإنجليزية إلى العربية في المجال الطبي لأنها تترجم وفقًا لمعنى اللغة الإنجليزية فقط وليس المعنى الطبي.
أيضًا ، نظرًا لأن مجموعة البيانات المستخدمة في نظام الترجمة مهمة جدًا لربطها كثيرًا بالمجال ، فقد تم إنشاء مجموعتي بيانات من منشورات الطب الباطني و HTH Worldwide Arabic Translation Medical Guide مصطلحات طبية عامة مصنفة حسب اللغة العربية وهي عبارة عن طب إنجليزي-عربي قاموس. كما هو موضح ، حققت مجموعة البيانات الأولى دقة أكثر من المجموعة الثانية لأن مجموعة بيانات الاختبار الثانية تحتوي على المزيد من جمل مكونة من كلمة واحدة وتحتوي على المثال المبني على جمل متعددة الكلمات حيث خلال الكثير من الجمل أضافت أجزاء من الجمل شظايا إلى الجملة الناتجة النهائية . هذه الأجزاء لا يمكن العثور عليها في ذاكرة الترجمة. لذا ، فإن تقسيم البيانات إلى تدريب واختبار هو مرحلة مهمة تسببت في دقة منخفضة لمجموعة البيانات الثانية.