خروجی دادگان و ابزارهای پردازش خط و زبان فارسی آزادرسانی خواهد شد

شماره :
42670
آخرین به روزرسانی :
سه شنبه 1402/06/28 ساعت 16:40
دسته بندی

خروجی دادگان و ابزارهای پردازش خط و زبان فارسی آزادرسانی خواهد شد

به گزارش روابط عمومی پژوهشگاه ارتباطات و فناوری اطلاعات، دکتر علیرضا یاری رئیس پژوهشکده فناوری اطلاعات ضمن خبر از آزادرسانی ابزارها و دادگان پردازش خط و زبان فارسی در پژوهشگاه ارتباطات و فناوری اطلاعات گفت: رشد فناوری اطلاعات و گسترش اینترنت، مرز‌های تاثیرگذاری خط و زبان را از مرز‌های جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی/ بین المللی جهت استفاده بهینه از منابع اطلاعاتی مطرح گردیده است.

رئیس پژوهشکده فناوری اطلاعات ضمن توضیح از نگاه کاربرد‌های مبتنی بر پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها که اهمیت زیادی پیدا کرده است، به سرمایه گذاری کشورها در این حوزه اشاره کرده و از اهمیت ارائه زیرساخت‌های پردازش خط و زبان فارسی برای نیل به اهداف کلان در فضای مجازی به عنوان دلیل اصلی این سرمایه گذاری یاد کرد.

در ادامه دکتر یاری، ضمن تشریح برنامه پیشنهادی برای توسعه خط و زبان فارسی، محور‌های توسعه خط و زبان را در سه مقوله دادگان و محتوا، ابزارها و کاربردها دانسته و گفت : پژوهشگاه ارتباطات و فناوری اطلاعات از چندین سال قبل تاکنون فعالیت­‌های متعددی را در قالب 30 پروژه درونسپاری و برونسپاری (12 پروژه توسط شرکت­‌های دانش بنیان، 13 پروژه توسط دانشگاه­ها و 5 پروژه توسط پژوهشگاه ارتباطات و فناوری اطلاعات) آغاز نموده است که برخی از آنها خاتمه یافته و برخی نیاز به توسعه بیشتری دارند. وی  به نمونه‌هایی از دستاورد‌های حاصله نظیر گراف دانش فارسی با حدود 500 هزار موجودیت، وردنت عمومی زبان فارسی با عنوان فارس­نت شامل 100هزار واژه عمومی زبان فارسی و نیز شبکه تصویری تصویرنت با حدود 33هزار واژه و 8 میلیون تصویر و ابزار‌های خطایاب املایی و گرامری و نیز ابزار‌های پایه پردازش زبان فارسی مانند ابزار تشخیص موجودیت نام­مند و مرجع­گزینی اشاره کرده و خبر از آزادرسانی کلیه دستاورد‌های حاصله داد که به زودی انجام خواهد شد.

دكتر یاری افزود: در راستای توسعه خدمات وب بومی فعالیت­‌های متعددی در حوزه توسعه جویشگر‌های متنی، تصویری، خبری، نقشه و مستندات علمی و نیز مترجم­‌های دوزبانه فارسی/انگلیسی انجام شده است که ابزارها و دادگان خط و زبان فارسی از زیرساخت‌های ضروری آنهاست .

وی  برنامه آتی پژوهشکده در این خصوص را توسعه ابزار‌های مورد نیاز و بسط حوزه‌هایی نظیر خدمات مبتنی بر صوت، نویسه خوان نوری دست نوشته فارسی و همچنین ابزار‌های معنایی خط و زبان فارسی و تاثیر آنها در بهبود کیفیت خدمات و کاربرد‌های بومی عنوان كرد.

گفتنی است کلیه اطلاعات و خروجی‌های مربوط به این حوزه در سایت اطلاع رسانی دیدرس (didras.ir) قابل دسترسی می‌باشد.

X