Communications of the ACS, Vol 4, No 1 (2011)

Font Size:  Small  Medium  Large

استخراج المصطلحات البسيطة والمركبة من النّصوص العربية: تطبيق على النّص القرآني الكريم

Soraya Zaidi Ayad, Soraya Zaidi Ayad, Ahmed Abdelali, Mohamed-Tayeb Laskri

Abstract


الخلاصة. إنّ التزايد المذهل لكمّية المعلومات على الانترنت، ولّد لدى الباحثين حاجة ماسة إلى أدوات مختصة تسمح باستغلال أمثل لمحتوى الوثائق الرقمية. فبينما تتوفر اللغات الأخرى على أدوات عديدة لاستخراج المصطلحات من النصوص، نلاحظ أن اللغة العربية تفتقر لمثل هذه الأنظمة، الشيء الذي يضطرّنا أحيانا إلى عملية تكييف معقدة بغية تطبيقها على النصوص العربية. نهتم في هذا البحث بإشكالية استخراج المصطلحات بطريقة آلية من مدونات عربية،  يمكن تقسيم المصطلحات إلى بسيطة (كلمة واحدة) ومركبة على شكل متلازمات اللفظية (كلمتين أو أكثر). نقترح في هذا البحث مقاربة إحصائية للحصول على المصطلحات البسيطة ومقاربة لسانية لاستخراج المصطلحات المركبة والتي تخضع للنماذج التالية: اسم-اسم، اسم-صفة، فعل-اسم واسم-حرف-اسم. قمنا بداية بتجريب هذه الطريقة على مدونة القرآن الكريم لقدسية كلام الله عز وجل، و نعتزم تطبيقها على مدونات عربية أخرى. الهدف من استخراج هذه المصطلحات هو بناء انطولوجيا مجال معين قصد توظيفها في تطبيقات مختلفة منها الترجمة و الفهرسة الآليتين و تحسين البحث على الشبكة العنكبوتية.


Full Text: DOCX