Your Cart
Loading

consultant expert dr mohamed taha A generic framework for Arabic to English machine translation of simplex sentences using the Role and Reference Grammar linguistic model

On Sale
$0.00
$7.99
Added to cart
consultant expert dr mohamed taha
A generic framework for Arabic
to English machine translation
of simplex sentences using the
Role and Reference Grammar
linguistic model
Abstract
The aim of this research is to develop a rule-based lexical framework for Arabic language
processing using the Role and Reference Grammar linguistic model. A system, called
UniArab is introduced to support the framework. The UniArab system for Modern Standard Arabic (MSA), which takes MSA Arabic as input in the native orthography, parses
the sentence(s) into a logical meta-representation, and using this, generates a grammatically correct English output with full agreement and morphological resolution. UniArab
utilizes an XML-based implementation of elements of the Role and Reference Grammar
theory, and its representations for the universal logical structure of Arabic sentences.
Role and Reference Grammar (RRG) is a functional theory of grammar that posits a
direct mapping between the semantic representation of a sentence and its syntactic representation. The theory allows a sentence in a specific language to be described in terms
of its logical structure and grammatical procedures. RRG creates a linking relationship
between syntax and semantics, and can account for how semantic representations are
mapped into syntactic representations. We claim that RRG is highly suitable for machine
translation of Arabic via an Interlingua bridge implementation model. RRG is a mono
strata–theory, positing only one level of syntactic representation, the actual form of the
i
sentence and its linking algorithm can work in both directions from syntactic representation to semantic representation, or vice versa. In RRG, semantic decomposition of predicates and their semantic argument structures are represented as logical structures. The
lexicon in RRG takes the position that lexical entries for verbs should contain unique information only, with as much information as possible derived from general lexical rules.
For this reason and due to the functional nature of our linguistic model, we will create
our own lexicon.
We use the RRG theory to motivate the architecture of the lexicon and the RRG bidirectional linking system to design and implement the parse and generate functions between
the syntax-semantic interfaces. Through an input process with seven phases, including
morphological and syntactic unpacking, UniArab extracts the universal logical structure
of an Arabic sentence. Using the XML based metadata representing the RRG logical
structure (XRRG), UniArab accurately generates an equivalent grammatical sentence in
the target language through four output phases. We outline the conceptual structure of
the UniArab System which utilizes the framework and translates the Arabic language
into another natural language. We follow the Interlingua design approach for machine
translation. We analyse the Arabic sentences to create a universal, abstract logical representation, and from this representation we generate English translations.
We also explore how the characteristics of the Arabic language will affect the development of a Machine Translation (MT) tool. Several characteristics of Arabic pertinent
to MT will be explored in detail with reference to some potential difficulties that they
present. We will conclude with a proposed model incorporating the Role and Reference
Grammar techniques to achieve this end. The UniArab system has been tested by generating equivalent grammatical sentences, in English, via the universal logical structure of
Arabic sentences, based on MSA Arabic input with very significant and accurate results.
ii
It provides more accurate translations when compared with automated translators from
Google and Microsoft though these systems have a much wider coverage than UniArab
at present. The free word order nature of Arabic and the challenges of incorporating transitivity into the logical structure will be outlined in detail. This research demonstrates the
capabilities of the Role and Reference Grammar as a base for multilingual translation
systems.
الخبير الاستشاري د محمد طه
إطار عام للغة العربية
إلى الترجمة الآلية الإنجليزية
من الجمل البسيطة باستخدام
قواعد الدور والمراجع
نموذج لغوي
الملخص
الهدف من هذا البحث هو تطوير إطار معجمي قائم على القواعد للغة العربية
المعالجة باستخدام نموذج الدور والمراجع اللغوي النحوي. نظام يسمى
تم تقديم UniArab لدعم الإطار. نظام UniArab للغة العربية الحديثة (MSA) ، والذي يأخذ MSA العربية كمدخل في قواعد الإملاء الأصلية ، parses
الجملة (الجمل) في تمثيل ميتا منطقي ، وباستخدام هذا ، يولد مخرجات إنجليزية صحيحة نحويًا باتفاق كامل ودقة صرفية. UniArab
يستخدم تطبيقًا مستندًا إلى XML لعناصر القواعد النحوية والدور المرجعي
النظرية وتمثيلاتها للبنية المنطقية العالمية للجمل العربية.
قواعد الدور والمراجع (RRG) هي نظرية وظيفية لقواعد اللغة التي تفترض أ
رسم الخرائط المباشر بين التمثيل الدلالي للجملة واستياء مندوبها النحوي. تسمح النظرية لوصف جملة بلغة معينة بعبارات
من هيكلها المنطقي والإجراءات النحوية. RRG يخلق علاقة ربط
بين النحو والدلالات ، ويمكن أن تفسر كيف تكون التمثيلات الدلالية
تعيين التمثيل النحوي. ندعي أن RRG مناسب للغاية للآلة
ترجمة اللغة العربية عبر نموذج تنفيذ جسر Interlingua. RRG هو أحادي
strata- نظرية ، تفترض مستوى واحدًا فقط من التمثيل النحوي ، وهو الشكل الفعلي لـ
أنا
الجملة وخوارزمية الربط الخاصة بها يمكن أن تعمل في كلا الاتجاهين من التمثيل النحوي إلى التمثيل الدلالي ، أو العكس. في RRG ، يتم تمثيل التحلل الدلالي للجليد السابق وهياكل الحجة الدلالية الخاصة بهم على أنها هياكل منطقية. ال
يأخذ المعجم في RRG الموقف القائل بأن المدخلات المعجمية للأفعال يجب أن تحتوي على فريد في التشكيل فقط ، مع أكبر قدر ممكن من المعلومات المشتقة من القواعد المعجمية العامة.
لهذا السبب ، وبسبب الطبيعة الوظيفية لنموذجنا اللغوي ، سننشئ
معجمنا الخاص.
نحن نستخدم نظرية RRG لتحفيز بنية المعجم ونظام الربط الثنائي RRG لتصميم وتنفيذ التحليل وتوليد الوظائف بين
واجهات بناء الجملة الدلالية. من خلال عملية إدخال ذات سبع مراحل ، بما في ذلك
التفريغ الصرفي والنحوي ، يستخرج UniArab البنية المنطقية العالمية
جملة عربية. استخدام البيانات الوصفية القائمة على XML والتي تمثل مجموعة RRG المنطقية
بنية (XRRG) ، يولد UniArab بدقة جملة نحوية مكافئة بتنسيق
اللغة الهدف من خلال أربع مراحل إخراج. نحدد الهيكل المفاهيمي لـ
نظام UniArab الذي يستخدم الإطار ويترجم اللغة العربية
إلى لغة طبيعية أخرى. نتبع نهج تصميم Interlingua للآلة
ترجمة. نقوم بتحليل الجمل العربية لإنشاء تمثيل منطقي تجريدي شامل ، ومن هذا التمثيل نقوم بتوليد ترجمات باللغة الإنجليزية.
نستكشف أيضًا كيف ستؤثر خصائص اللغة العربية على تطوير أداة الترجمة الآلية (MT). عدة خصائص عربية وثيقة الصلة بالموضوع
إلى MT سيتم استكشافها بالتفصيل مع الإشارة إلى بعض الصعوبات المحتملة التي يواجهونها
الحالي. سنختتم بنموذج مقترح يتضمن الدور والمرجع
تقنيات القواعد لتحقيق هذه الغاية. تم اختبار نظام UniArab عن طريق إنشاء جمل نحوية مكافئة ، باللغة الإنجليزية ، عبر البنية المنطقية العالمية لـ
جمل عربية تستند إلى المدخلات العربية الفصحى مع نتائج دقيقة ودقيقة للغاية.
ثانيا
يوفر ترجمات أكثر دقة عند مقارنتها بالمترجمين الآليين من
جوجل ومايكروسوفت على الرغم من أن هذه الأنظمة لديها تغطية أوسع بكثير من UniArab
في الوقت الحاضر. سيتم تحديد طبيعة ترتيب الكلمات المجانية للغة العربية وتحديات دمج موقع التحويل في الهيكل المنطقي بالتفصيل. يوضح هذا البحث
قدرات قواعد الدور والمراجع كأساس للترجمة متعددة اللغات
الأنظمة.
You will get a PDF (3MB) file

Customer Reviews

There are no reviews yet.