خروجی دادگان و ابزارهای پردازش خط و زبان فارسی آزادرسانی خواهد شد
به گزارش روابط عمومی پژوهشگاه ارتباطات و فناوری اطلاعات، دکتر علیرضا یاری رئیس پژوهشکده فناوری اطلاعات ضمن خبر از آزادرسانی ابزارها و دادگان پردازش خط و زبان فارسی در پژوهشگاه ارتباطات و فناوری اطلاعات گفت: رشد فناوری اطلاعات و گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان را از مرزهای جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی/ بین المللی جهت استفاده بهینه از منابع اطلاعاتی مطرح گردیده است.
رئیس پژوهشکده فناوری اطلاعات ضمن توضیح از نگاه کاربردهای مبتنی بر پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها که اهمیت زیادی پیدا کرده است، به سرمایه گذاری کشورها در این حوزه اشاره کرده و از اهمیت ارائه زیرساختهای پردازش خط و زبان فارسی برای نیل به اهداف کلان در فضای مجازی به عنوان دلیل اصلی این سرمایه گذاری یاد کرد.
در ادامه دکتر یاری، ضمن تشریح برنامه پیشنهادی برای توسعه خط و زبان فارسی، محورهای توسعه خط و زبان را در سه مقوله دادگان و محتوا، ابزارها و کاربردها دانسته و گفت : پژوهشگاه ارتباطات و فناوری اطلاعات از چندین سال قبل تاکنون فعالیتهای متعددی را در قالب 30 پروژه درونسپاری و برونسپاری (12 پروژه توسط شرکتهای دانش بنیان، 13 پروژه توسط دانشگاهها و 5 پروژه توسط پژوهشگاه ارتباطات و فناوری اطلاعات) آغاز نموده است که برخی از آنها خاتمه یافته و برخی نیاز به توسعه بیشتری دارند. وی به نمونههایی از دستاوردهای حاصله نظیر گراف دانش فارسی با حدود 500 هزار موجودیت، وردنت عمومی زبان فارسی با عنوان فارسنت شامل 100هزار واژه عمومی زبان فارسی و نیز شبکه تصویری تصویرنت با حدود 33هزار واژه و 8 میلیون تصویر و ابزارهای خطایاب املایی و گرامری و نیز ابزارهای پایه پردازش زبان فارسی مانند ابزار تشخیص موجودیت ناممند و مرجعگزینی اشاره کرده و خبر از آزادرسانی کلیه دستاوردهای حاصله داد که به زودی انجام خواهد شد.
دكتر یاری افزود: در راستای توسعه خدمات وب بومی فعالیتهای متعددی در حوزه توسعه جویشگرهای متنی، تصویری، خبری، نقشه و مستندات علمی و نیز مترجمهای دوزبانه فارسی/انگلیسی انجام شده است که ابزارها و دادگان خط و زبان فارسی از زیرساختهای ضروری آنهاست .
وی برنامه آتی پژوهشکده در این خصوص را توسعه ابزارهای مورد نیاز و بسط حوزههایی نظیر خدمات مبتنی بر صوت، نویسه خوان نوری دست نوشته فارسی و همچنین ابزارهای معنایی خط و زبان فارسی و تاثیر آنها در بهبود کیفیت خدمات و کاربردهای بومی عنوان كرد.
گفتنی است کلیه اطلاعات و خروجیهای مربوط به این حوزه در سایت اطلاع رسانی دیدرس (didras.ir) قابل دسترسی میباشد.