به گزارش پایگاه خبری تحلیلی اندیشه معاصر؛ حجتالاسلام والمسلمین مسیح توحیدی وحدت، مدیر پایگاه قاموس و لغت، در نشستی که با موضوع رونمایی از نرمافزار قاموس نور ۳ به همراه نسخه همراه و وبگاه، در قم برگزار شد از رونمایی این نرم افزار در ۱۴ اردیبهشت ساعت ۱۰ صبح با سخنرانی حجتالاسلام والمسلمین شهریاری، دبیرکل مجمع جهانی تقریب مذاهب اسلامی خبر داد.
وی استفاده وسیع از هوش مصنوعی در تولید، فرآوری و عرضه محصولات لغوی را مورد توجه قرار داد و بیان داشت: الان ۲ میلیون مدخل با توصیفات آن در این مرکز می باشد که بخشی از آن از کتب لغت عربی و ۴۸۰ هزار مدخل از کتب لغت فارسی می باشد.
وی با بیان این که از جمله کارهای دیگری که صورت گرفت، هماهنگسازی مدخلها بود، بیان داشت: منظور از هماهنگ سازی یعنی کتابهای لغت برای توصیف کلمهی مورد نظرشان، همگی از یک مدخل خاص استفاده نمیکردند بلکه هر نویسنده کلمهای را به عنوان مدخل انتخاب مینمود. این امر باعث آشفتگی پایگاه داده میشود و لازم است برای یک معنا و توصیف ما یک مدخل واحد داشته باشیم.
وی با بیان این که در استخراج مدخل و توصیف از کتابهای لغت، کار دستی انجام نگرفت و سامانههای هوشمند مرکز نور توانستند تمامی اطلاعات را از کتب لغت استخراج و به صورت پایگاه داده درآورند، اضافه کرد: در حال حاضر در این مرکز نور پایگاه دادهای در موضوع لغت وجود دارد که فعالیتهای لغوی بر اساس آن شکل گرفته است. در این رابطه می توان نرمافزار قاموس نور ۳ و نرمافزار قاموس همراه و پایگاه اینترنتی قاموس اشاره کرد.
حجتالاسلام والمسلمین توحیدی وحدت ایجاد شبکه مرتبطات یک مدخل مورد توجه قرار داد و بیان داشت: در حال حاضر تلاش ما برای سازماندهی شبکه مرتبطات و تکمیل توصیفات یک مدخل که اقدام به ارائه شواهد از آیات قرآن کریم یا از متون کهن که به آن غریب الحدیث می گویند به ثمر نشسته است.
وی اشاره به تفاوت نرمافزار قاموس نور و پایگاه اینترنتی قاموس نور و نرمافزار همراه قاموس در استفاده از پایگاه داده یکسان در این نرم افزارها بیان داشت: ارائه متن کامل کتابها، امکان مطالعه کتب لغت از نقاط قوت نرمافزار رایانهای قاموس نور ۳ محسوب میشود. استفاده از جستجوی هوشمند لغات و ارائه نزدیکترین مدخل و توصیف به کلمه مورد نظر کاربر نیز از مزایای وبگاه اینترنتی قاموس نور میباشد. همچنین نرمافزار همراه قاموس علاوه بر ارائه متن ۳ عنوان کتاب لغت عربی و کتاب لغتنامه دهخدا در بخش فارسی به صورت برونخط، امکان استفاده از تمامی کتب لغت در وبگاه قاموس نور را در صورت برخط بودن، خواهد داشت.
پس برای توصیفات یک شکل، یک مدخل انتخاب کردیم و تمامی مدخلهایی که دارای توصیف یکسانی بودند را به آن متصل کردیم. در حقیقت یک مدخل از باقی مدخلهای هممعنا نمایندگی میکند.
وی در نسخه قبلی نرمافزار قاموس ما کتابخانهای دیجیتالی ارائه کردیم که ۳۰ عنوان کتاب در ۲۰۰ جلد را داشته و کاربر ضمن مطالعه و جستجو در متن کتب، میتوانست از فهرست مدخلهای لغت عربی که هنوز در گامهای اول و مقدماتی بود، استفاده کند. اما در نسخه سوم قاموس، کاربران ۱۴۱ عنوان کتاب در ۳۸۰ جلد را در اختیار دارند که افزوده شدن ۹ عنوان فرهنگ فارسی، از تازههای آن محسوب میشود.
وی با بیان این که به وسیله سامانه صرف هوشمند مرکز نور، تاکنون بیش از ۲ میلیارد کلمه ریشهیابی، بررسی و تایید کارشناسان مرکز قرار گرفته، اضافه کرد: اما هوشمندی قاموس نور در بخش ارائه خدمات به کاربران نیز دارای مقدماتی است که بدون هوشمصنوعی امکان پذیر نبود. وقتی برای فهمیدن معنای کلمهای به سراغ کتاب لغت میرویم، انتظار داریم همان کلمه دقیقا در کتب لغت توصیف شده باشد. ولی چنین نیست! ما در ۶۰۰۰ کتاب از مخزن کتب مرکز نور، نزدیک به ۲ میلیارد کلمه داریم ولی در کتب لغت تنها ۱۳۰ هزار مدخل با توصیف وجود دارد. چگونه این ۲ میلیارد به این ۱۳۰ هزار کلمه متصل شود که توصیف مناسبی را ارائه کند؟ اینجا است که هوشمصنوعی به کمک میآید.
وی بیان داشت: ابتدا کلمه مورد نظر کاربر در مدخلها جستجو میشود؛ اگر وجود نداشت آن را از پشوندها و پسوندها پیراسته میکنیم و مجددا در مدخلها جستجو میکنیم؛ اگر باز هم پیدا نشد، سامانه هوشمند صرف برای کشف ریشه کلمه وارد میشود و کلمه را ریشهیابی میکند.
پایان*/
اندیشه معاصر را در روبیکا دنبال کنید.
برای عضویت در کانال بله اندیشه معاصر کلیک کنید.
برای عضویت در کانال تلگرامی اندیشه معاصر کلیک کنید.