ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از فناوریهای خط و زبان در فضای مجازی
محورهای موضوعی : تخصصیحبیب الله اصغری 1 * , فاطمه مستاجر خیرخواه 2
1 - پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی، تهران، ایران
2 - پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی، تهران، ایران
کلید واژه: پردازش زبان طبیعی, فناوریهای زبانی, توسعه خط و زبان فارسی, ابزارهاي سياستي حمایت از خط و زبان,
چکیده مقاله :
فناوریهای زبانی یکی از مؤلفههای اقتدار ملی در فضای مجازی است که حفظ و ارتقاء آن از وظايف اصلي دولتهاست. در چشم انداز رو به توسعه و تحول فضای مجازی، نقش سیاستهای حمایتی دولتها در این حوزه، ضرورتی انکارناپذیر مینماید. کشورهای مختلف برنامههای متعددی با هدف صیانت از خط و زبان خود تدوین نمودهاند. این سیاستگذاریهای حمایتی، غالبا با هدف توسعه ابزارهای کاربردی در زمینههای مختلف مانند گردشگری، سلامت، آموزش و یا دیگر حوزههای عمومی تبیین و تدوين شدهاند. در این مقاله به بررسی رویکردهای نوآورانه اتخاذ شده توسط دولتها جهت حمایت از فناوریهای زبانی در فضای مجازی مي پردازيم. در این راستا ابتدا نقشه راه و اسناد منتشر شده و شیوههای توسعه ابزارهای زیرساختی و محصولات کاربردی در حوزه حمایت از خط و زبان در کشورهای هند، ایالات متحده آمریکا، ولز ، اسپانیا و اتحادیه اروپا از جوانب مختلف در يك مطالعه محك زني مورد بررسی قرار گرفته اند. در نهایت از دستاوردهای حاصل از اين مطالعه، با بررسی نقاط مشترک و مواردی که قابلیت اجرا در مورد زبان فارسی را دارند جهت ارائه راهکارهای مناسب برای تدوین یک سند راهبردی ملی در حمایت از خط و زبان فارسی استفاده گردیده است
Language technologies are one of the important components of national authority in the cyberspace, and its promotion are the main duties of governments. The importance of language technologies makes the role of government support policies in this field an undeniable necessity. These support policies are often explained and compiled with the aim of developing practical tools in various fields such as tourism, health, education or other public areas.
In this article, the innovative approaches adopted by governments to support language technologies and writing practices in cyberspace have been investigated. In this regard, the road map and documents have been published and the development methods of infrastructure tools and practical products in the field of script and language support in the countries of India, the United States of America, Wales, Spain, and the European Union have been examined and reviewed from different aspects. Finally, the achievements of this study have been used by examining the common points and the cases that have the ability to be implemented in the case of the Persian language to provide suitable solutions for developing a national strategic document in support of the Persian language
1. Cazden, C. B. (2003). Sustaining indigenous languages in cyberspace. Nurturing Native Languages, 2002(1). https://files.eric.ed.gov/fulltext/ED482034.pdf .
2. Cohen, J. (2007). The GALE project: A description and an update. Automatic Speech Recognition & Understanding. https://doi.org/10.1109/asru.2007.4430115.
3. COMM. (2013). LT2013 - status and potential of the European language technology markets - digital single market - European Commission. Retrieved June 4, 2016, https://economie.fgov.be/en/themes/online/strategy-european-digital/connecting-europe-facility-cef.
4. Diki-Kidiri M (2007), Securing a place for a language in cyberspace. Paris: UNESCO. Retrieved 4 June 2016, http://unesdoc.unesco.org/images/0014/001497/149786E.pdf.
5. European Commission. (2014). Horizon 2020 work programme for 2014-2015. European Commission Decision C (2015)2453 of 17 April 2015. Retrieved June 4, 2016, https://ec.europa.eu/research/participants/data/ref/h2020/wp/2014_2015/main/h2020-wp1415-security_en.pdf.
6. European Commission. (2015). Horizon 2020 work programme for 2016-2017. European Commission Decision C (2015)6776 of 13 October 2015. Retrieved June 4, 2016, https://ec.europa.eu/research/participants/data/ref/h2020/wp/2016_2017/main/h2020-wp1617-intro_en.pdf.
7. Kumar A., Goyal V. (2010) TDIL Programme: A Government Initiative, an International Journal of Engineering Sciences, 2010. https://ijoes.vidyapublications.com/paper/JSI/1.pdf
8. Olive, J. P., Christianson, C., & McCary, J. (2011). Handbook of Natural Language Processing and Machine Translation: DARPA Global Autonomous Language Exploitation. http://ci.nii.ac.jp/ncid/BB05333792
9. Ong, T. W. S., & Said, S. B. (2021). Selective language maintenance in multilingual Malaysia. In Advances in religious and cultural studies (ARCS) book series (pp. 207–228). https://doi.org/10.4018/978-1-7998-2959-1.ch009
10. Pedtke, T. R. (1997). U.S. Government Support and Use of Machine Translation: Current Status. ACL Anthology. https://aclanthology.org/1997.mtsummit-plenaries.1
11. United Nations. (n.d.). Protecting languages, preserving cultures | United Nations. https://www.un.org/en/desa/protecting-languages-preserving-cultures-0
12. Rehm, G., Berger, M., Elsholz, E., Hegele, S., Kintzel, F., Marheinecke, K., Piperidis, S., Deligiannis, M., Galanis, D., Gkirtzou, K., Labropoulou, P., Bontcheva, K., Jones, D. L., Roberts, I., Hajič, J., Hamrlová, J., Kačena, L., Choukri, K., Arranz, V., . . . Klejch, O. (2020). European Language Grid: An Overview. arXiv (Cornell University). http://arxiv.org/pdf/2003.13551.pdf
13. Sepln, (2015) Plan de Impulso de las Tecnologías del Lenguaje, Retrieved June 4, 2016, http://www.sepln.org/news/plan-de-impulso-de-las-tecnologias-del-lenguaje/
14. St. Clair, R. N. (2010, November 17). Review of Reyhner & Lockard (2009): Indigenous Language Revitalization: Encouragement, Guidance & Lessons Learned. Language Problems and Language Planning, 34(3), 267–269. https://doi.org/10.1075/lplp.34.3.05stc. Stiles, D. B. (1997). Four Successful Indigenous Language Programs. Teaching Indigenous Languages. https://eric.ed.gov/?id=ED415079
15. The Government of Spain promotes language as a factor for modernization and economic development, 2022, https://www.lamoncloa.gob.es/lang/en/gobierno/councilministers/Paginas/2022/20220301_council.aspx
16. Vikas, O. (2001). Language Technology Development in India. Ministry of Information Technology, New Delhi, India. http://www.emille.lancs.ac.uk/lesal/omvikas.pdf
17. Warschauer, M. (1998). Technology and Indigenous Language Revitalization: Analyzing the experience of Hawai’i. Canadian Modern Language Review-revue Canadienne Des Langues Vivantes, 55(1), 139–159. https://doi.org/10.3138/cmlr.55.1.139
18. Welsh language technology action plan, October 2018, https://www.gov.wales/sites/default/files/publications/2018-12/welsh-language-technology-and-digital-media-action-plan.pdf
19. Welsh language | GOV.WALES. (2024, February 20). GOV.WALES. http://gov.wales/topics/welshlanguage/?lang=en
20. White, R. M. (1993). Machine Translation Technology: A Potential Key to the Information Age. Report of the FCCSET Committee on Industry and Technology, PB-93-134336, Office of Science and Technology Policy, Washington, DC (January 1993).
21. اصغری، حبیب اله و محتاج، سالار، «سند ارتقاء خط و زبان فارسی در فضای مجازی»، معاونت علمی و فناوری ریاست جمهوری، ستاد توسعه فناوری اطلاعات و ارتباطات، فروردین ماه 1395.
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از
فناوریهای خط و زبان در فضای مجازی
* حبیبالله اصغری ** فاطمه مستاجر خیرخواه
* پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی، تهران، ایران.
** پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی، تهران، ایران.
تاریخ دریافت: 30/10/1402 تاریخ پذیرش: 30/05/1403
چکيده
فناوریهای زبانی یکی از مؤلفههای اقتدار ملی در فضای مجازی است که حفظ و ارتقاء آن از وظايف اصلي دولتهاست. در
چشمانداز رو به توسعه و تحول فضای مجازی، نقش سیاستهای حمایتی دولتها در این حوزه، ضرورتی انکارناپذیر مینماید. کشورهای مختلف برنامههای متعددی با هدف صیانت از خط و زبان خود تدوین نمودهاند. این سیاستگذاریهای حمایتی، غالبا با هدف توسعه ابزارهای کاربردی در زمینههای مختلف مانند گردشگری، سلامت، آموزش و یا دیگر حوزههای عمومی تبیین و تدوين شدهاند. در این مقاله به بررسی رویکردهای نوآورانه اتخاذ شده توسط دولتها جهت حمایت از فناوریهای زبانی در فضای مجازی ميپردازيم. در این راستا ابتدا نقشه راه و اسناد منتشر شده و شیوههای توسعه ابزارهای زیرساختی و محصولات کاربردی در حوزه حمایت از خط و زبان در کشورهای هند، ایالات متحده آمریکا، ولز ، اسپانیا و اتحادیه اروپا از جوانب مختلف در يك مطالعه محك زني مورد بررسی قرار گرفته اند. در نهایت از دستاوردهای حاصل از اين مطالعه، با بررسی نقاط مشترک و مواردی که قابلیت اجرا در مورد زبان فارسی را دارند جهت ارائه راهکارهای مناسب برای تدوین یک سند راهبردی ملی در حمایت از خط و زبان فارسی استفاده گردیده است.
واژههای کلیدی: پردازش زبان طبیعی، فناوریهای زبانی، توسعه خط و زبان فارسی، ابزارهاي سياستي حمایت از خط و زبان.
نوع مقاله: پژوهشی
1- مقدمه
زبان و خط هر کشور از جمله داراییهای فرهنگی و نیز میراث ارزشمند بشری به شمار میرود. در سالهای اخیر، با رشد فناوری اطلاعات و همچنین با توجه به گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان از مرزهای جغرافیایی فراتر رفته است. علاوه بر اين، تاثيرپذيري خط و زبان از ديگر فرهنگها نيز به واسط حذف مرزهاي فرهنگي دو چندان شده است. لذا دولتها توجه ویژهای به حمایت از خط و زبان در فضای مجازی معطوف داشتهاند.
پردازش زبان طبیعی، به علم فهم عمیق خودکار مهمترین تولید بشر (زبان) با کمک کامپیوتر اطلاق میشود. فناوري زباني به عنوان یک مفهوم فراگیر، بسیاری از کاربردهای مختلف مرتبط با زبان را در برمیگیرد. به عنوان نمونه ترجمه ماشینی، تشخیص و پردازش صوت، تحلیل و استخراج اطلاعات از دادههای متنی از جمله زیرشاخههای پردازش زبان محسوب مي گردد.
نویسندة عهدهدار مکاتبات: حبیبالله اصغری Habib.asghari@ictrc.ac.ir
|
با وجود بازار رو به رشد صنایع مرتبط با پردازش زبان طبیعی و ترجمه ماشینی، سرمایهگذاری بخش دولتی در کنار بخش خصوصی در بسیاری از کشورهای دنیا در این صنعت قابل مشاهده است و این به دو دلیل عمده صورت میگیرد: امنیت ملی و تحریک بازار. دولتها به نمایندگی از مردم، خود را موظف میدانند به گونه مؤثر و مستقیم در بحثهای مرتبط با امنیت ملی وارد شوند. بحث تحریک بازار نیز در شرایطی مطرح میگردد که شرکتهای خصوصی به دلایل اقتصادی، انگیزه لازم برای سرمایهگذاری را نداشته باشند. در این صورت دولت خود را موظف می دادند با توجه به ضرورت و زیرساختی بودن، به این عرصه وارد شده و این فقدان را جبران نماید.
در این موارد، دولتها به شیوهها و رویههای مختلفی روی میآورند که سادهترین آن، حضور مستقیم خود دولت برای انجام اين مجموعه فعالیتهاست. نگاه دیگر، ديدگاه حمایتی به سایر بخشها برای ورود به زمینه مورد نظر است که هم میتواند در قالب جبران بخشی از هزینههای شرکتها مدنظر قرار گیرد و هم با ایجاد مشوقهایی مانند معافیتهای مالیاتی، سهلگیریهای قانونی و غيره، جذابیتهایی را برای شرکتها فراهم آورد. نگاه سوم نیز نوعی نگاه سرمایهگذاری است که دولت به خاطر منافع بلندمدت و همگانی و در راستای مأموریتهای حاکمیتی خود، به صورت هدفمند و برنامهریزی شده در برخی حوزههای موردنظر سرمایهگذاری می کند.
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 224 |
با توجه به فضای فعلی و آتی که در آن فناوری اطلاعات و ارتباطات بستر اغلب فعالیتهای بشری را تشکیل داده یا خواهد داد، قاعدتاً نداشتن دیدگاهی راهبردی، معادل آن است که فضای بازی به نفع زبانها و فرهنگهای دیگر واگذار شود. نتیجه آنکه صنعت فناوریهای زبانی یکی از مؤلفههای اقتدار ملی در فضای مجازی است که حفظ و ارتقاء آن حکم نانوشتهای است که برخی کاملاً آگاهانه از آن بهرهبرداری مینمایند و دیگرانِ منفعل، عملاً در روندهای مدیریتشده دیگرانِ آگاه، منافع عمده و بلندمدت خود را از دست میدهند.
عامل دیگر، لزوم توسعه و تولید ابزارهای زیرساختی برای نیل به اهداف کلانتر است. به عبارت دیگر، وابستگی صنعت تکنولوژی زبان به ابزارهای پایهای و پیکرهها که عموماً فاقد جذابیت اقتصادی برای بازگشت سرمایه هستند، دولت ها را مجاب به حمایت از این بخش به منظور توسعه این ابزارها نموده است. این ابزارها پس از رسیدن به استانداردهای کیفی لازم توسط دولتها به صورت رایگان یا با قیمت ارزان در اختیار دانشگاهها، مؤسسات تحقیقاتی و شرکتهای فعال در این زمینه قرار داده میشوند. در واقع از این منظر، دولتها نقش رابط و تسهیلکننده را برای حرکت از توسعه ابزارهای زیرساختی به سمت تولید و توسعه سیستمهای کلان مرتبط با پردازش زبان طبیعی ایفا میکنند. حمایتهای دولتها از پردازش زبان طبیعی از این زاویه را میتوان در قالب نقش تعریف شده حمایت آنها از زبان ملی تفسیر نمود.
با توجه به نکات ذکر شده در این مقاله تلاش میگردد تا مجموعهای از مدلهای حمایت از خط و زبان در فضای مجازی را در کشورهای منتخب شامل هندوستان، ایالات متحده آمریکا، ولز، اسپانیا و اتحادیه اروپایی مورد بررسی قرار گیرد. برای این منظور نقشه راه و اسناد منتشر شده و در دسترس دولتها و نیز مقالات علمی موسسات علمی و پژوهشی مرتبط مورد بررسی قرار گرفته است. در نهایت با درنظر گرفتن عوامل مختلف سیاسی، فرهنگی و اقتصادی حاکم به عنوان درسهای آموخته از این مطالعات، به تدوین راهبردهای حمایت از خط و زبان فارسی در حوزه فضای مجازی میپردازیم.
2- مبانی نظری و پيشينه
بررسی سیاستهای توسعه کشورها نشان میدهد که در کنار توجه به توسعه فناوری، توسعه فرهنگ با استفاده از ابزار فناوری نیز به صورت ویژه مورد توجه حاکمیت قرار دارد. خط و زبان در هر کشور از اجزای اصلی فرهنگ ملی به شمار میروند. از این رو ضروری است تا از این نشانه¬های اساسی فرهنگ صیانت صورت گیرد (کازدن، 2003).
بهره مندي از فناوريهاي پيشرفته در حوزههاي مرتبط با خط و زبان امری ضروری است. امروزه ارتباطی جدایی ناپذیر فیمابین فناوری اطلاعات و مقوله خط و زبان در هر کشور به وجود آمده است. فناوری اطلاعات با توسعه ابزارهای گوناگون و با قابلیتهایی که دارا است به گسترش و ماندگاری خط و زبان کمک مینماید. همچنین خط و زبان ابزار تولید، توسعه و اشاعه محتوا در رایاسپهر است (دیکی کیدیری، 2007).
با توجه به مطالب ذکر شده در بخش قبلی و با توجه به بند دوم ماده الحاقی ۴۱ برنامه هفتم توسعه کشور، معاونت علمی، فناوری و اقتصاد دانشبنیان رئیسجمهور مکلف است با همکاری فرهنگستان زبان و ادب فارسی و وزارتخانههای فرهنگ و ارشاد اسلامی، ارتباطات و فناوری اطلاعات و علوم، تحقیقات و فناوری با نظارت مرکز ملی فضای مجازی در طی اجرای برنامه، اقدامات لازم را در خصوص تأمین و تقویت زیرساختهای فناورانه توسعه خط و زبان فارسی در فضای مجازی (از قبیل پیکرهبندی داده، پردازش زبان طبیعی، واژهسازی، واژهپردازی، خط و قلم، مترجمها، مبدلها، تشخیص صدا و دستیار صوتی) انجام دهد.» تاکید بر اهمیت تکنولوژی های زبانی در فضای مجازی و حمایت دولتها از این حوزه، تبیین یک سند راهبردی و ملی در توسعه ابزارهای سیاستی در حمایت از فناوریهای حمایت از خط و زبان فارسی در فضای مجازی امری ضروری است.
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 225 |
در برنامههای ملی توسعه، توجه ویژه ای به خط و زبان ملی معطوف میگردد (استایلز، 1997). تحقیقات مختلفی برای احیا و ارتقای خط و زبان با استفاده از ابزار فناوری در دیگر کشورها انجام شده است که از آن جمله میتوان به (وارشاور، 1998) ، (کلیر، 2010) و (اونگ، 2021 ( اشاره نمود. حفظ زبان های ملی به قدری دارای اهمیت است که یونسکو نیز در این حوزه وارد شده و سال 2019 را به عنوان سال زبانهای محلی قرار داده است.
3- روششناسی پژوهش
هدف اساسی این پژوهش، تبیین روابط بین نهادهای اصلی تاثیرگذار در توسعه و نیز صیانت از خط و زبان ملی در فضای مجازی است. به بیان دیگر، استخراج شیوه تعامل میان ذینفعان حقوقی در حاکمیت میتواند در توسعه یک سیاستگذاری ملی ارتقای خط و زبان فارسی کمک نماید. همچنین دیگر هدف این پژوهش، بررسی طرحها و
سیاستهای اساسی اجرا شده در دیگر کشورها به منظور اقتباس و نیز بومیسازی آنها در ایران است.
این پژوهش از تحقیق مروری بر پایه مطالعات کتابخانهای بهره میگیرد که در آن بررسی و تحلیل متغیرهای پژوهش از طریق موردکاوی صورت گرفته است. بدین ترتیب که سیاست توسعه چند کشور منتخب (شامل کشورهای هند، ایالات متحده آمریکا، ولز ، اسپانیا و اتحادیه اروپا) در حوزه اسناد و برنامههای راهبردی و ملی در حمایت از خط و زبان در فضای مجازی مورد بررسی و مطالعه قرار گرفته و بر اساس آن اطلاعات مربوط به این برنامهها و نحوه
سیاستگذاریهای حاکم بر این حمایتها در هر کشور استخراج گردیده است. این اطلاعات از اسناد ملی منتشر شده توسط این دولتها و مقالات پژوهشی منتشر شده توسط محققان این کشورها بصورت موردی بدست آمده است. سپس بر مبنای موردکاوی انجام گرفته ابزارهای سیاستی متناسب برای حمایت از خطو زبان فارسی در فضای مجازی پیشنهاد گردیده است.
4- یافتههای پژوهش
4-1- مدل حمایتی هندوستان
دپارتمان الکترونیک و فناوری اطلاعات وزارت ارتباطات و فناوری اطلاعات کشور هندوستان بهعنوان متولی فناوری اطلاعات در این کشور از سال 1991 پروژه توسعه فناوری برای زبانهای هندی2 (TDIL) را آغاز نموده است. با توجه به تنوع فرهنگی و زبانی در کشور هندوستان (وجود 22 زبان به رسمیت شناخته شده در قانون اساسی و 12 خط نوشتاری متفاوت در این کشور)، وزارت ارتباطات و فناوری اطلاعات هندوستان در پروژه TDIL با توسعه ابزارها و تکنیکهای پردازش اطلاعات جهت افزایش نفوذ فناوری اطلاعات در بین اقشار مختلف مردم و تسهیل تعامل انسان و ماشین را بدون موانع زبانی پایهریزی نموده است. تمرکز این مدل بر هفت ابتکار اصلی بود: منابع دانش، ابزارهای دانش، سیستمهای پشتیبانی ترجمه، سیستمهای رابط ماشین انسانی، محلیسازی، استانداردسازی و توسعه منابع انسانی فناوری زبانی (ویکاس، 2001). طی فرآیند حمایت از پروژههای مرتبط با تکنولوژی زبانی در TDIL، مجموعهای از ابزارهای کاربردی با مشارکت موسسات تحقیقاتی و شرکتهای تجاری فعال در این برنامه توسعه داده شدهاند. این ابزارها شامل طیف وسیعی از سیاستگذاریهای پایهای تا کاربردی مرتبط با زبان مانند افزونههای برنامه MSWord تا ابزارهای غلطگیر املایی، فونتها و غیره هستند (کومار و گویال، 2010).
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 226 |
§ اهداف مدل حمايت هند:
هدف اصلی این پروژه، توسعه ابزارها و فناوریهای مرتبط با پردازش اطلاعات جهت توسعه امکان تعامل انسان و ماشین بدون موانع زبانی، ایجاد دسترسی به منابع چندزبانه دانش و ادغام آنها برای توسعه محصولات و سرویسهای نوآورانه بیان شده است. همچنین ارتقای استاندارهای مرتبط با فناوری زبان از طریق ارتباط مؤثر با مجامع بینالمللی و ملی مرتبط با استانداردسازی مانند ایزو، یونیکد و کنسرسیوم جهانی وب3 در این برنامه پیشبینی شده است.
همچنین مقرر گشته است محصولات (خروجیهای) مرتبط با این برنامه بلندمدت شامل فونتها، پیکرهها و دیکشنریهای توسعه داده شده به صورت رایگان در اختیار عموم قرار گیرند (کومار و گویال، 2010).
§ برنامههای مدل حمايت هند:
برنامه جامع وزارت فناوری اطلاعات و ارتباطات هند شامل هفت بخش اصلی به شرح ذیل برای توسعه ابزارهای فناوری زبانی است:
الف - توسعه سیستمهای ترجمه ماشینی(MAT) :
بخش توسعه ترجمه ماشینی(MAT4) در برنامه TDIL شامل توسعه فناوریهای مرتبط در سه زیربخش هستند. بخش اول شامل توسعه سیستمهای ترجمه ماشینی انگلیسی به شش زبان محلی هندی شامل هندو، اردو، تامیل، بنگالی، اوریا و ماراتی است. با توجه به هدف اولیه این برنامه که فراهمسازی امکان استفاده مردم هند از محتوای فضای فناوری اطلاعات به زبان خود است، این بخش به منظور ترجمه محتوای انگلیسی به زبانهای محلی با تشکیل یک کنسرسیوم ایجاد شده است. برای این منظور چهار تکنولوژی ترجمه ماشینی مختلف ترکیب شده و سیستم جامعی تحت نام Anuvadak را تشکیل میدهند. در فاز اول این بخش، توسعه این سیستم در حوزه گردشگری مدنظر قرار گرفته شده است.
بخش دوم، توسعه سیستمهای ترجمه ماشینی انگلیسی به زبانهای هندی با استفاده از فناوری Angla-Bharti را در بر میگیرد. این یک متدولوژی ترجمه ماشینی است که با مشارکت چهار موسسه مختص ترجمه انگلیسی به زبانهای هندی طراحی شده است.
بخش سوم توسعه سیستم ترجمه ماشینی برای ترجمه زبانهای هندی به زبانهای هندی دیگر (Sampark) است. در این بخش، توسعه سیستمهای ترجمه ماشینی برای ترجمه زبانهای محلی هندی به یکدیگر با استفاده از سیستمهای یادگیری ماشین آماری پیش بینی شده است.
ب - توسعه سیستمهای دسترسی به اطلاعات چند زبانه5 :
این سیستمها کاربران را قادر میسازند تا به اطلاعات موجود در زبان دیگری به جز زبانی که پرسوجو را وارد نمودهاند دسترسی پیدا کنند. به بیان روشنتر، سیستم قادر به ترجمه پرسوجوی کاربر و بازیابی اطلاعات در زبانهای دیگر به جز زبان مبدأ است. این پروژه نیز به صورت کنسرسیوم و با مشارکت یازده موسسه آغاز شده است و حوزههای گردشگری و سلامت را پشتیبانی می نماید.
ج - توسعه سیستم بازشناسی و تحلیل اسناد (OCR):
هدف این سیستم تبدیل اسناد اسکن شده به فایلهای قابل ویرایش در زبانهای هندی است. قابلیت کارکرد در پانزده زبان محلی برای این پروژه پیشبینی شده است.
د - توسعه سیستم تشخیص برخط دستخط6 :
در این پروژه هفت موسسه جهت تشخیص برخط دستخط به منظور تسهیل فرآیند ورود متن و اطلاعات در هشت زبان هدف، همکاری میکنند.
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 227 |
در این پروژه کنسرسیومی متشکل از چندین موسسه جهت توسعه سیستم تبدیل متن به گفتار برای شش زبان هندی به ویژه با هدف تسهیل مشارکت افراد نابینا تشکیل شده است.
و - توسعه سیستم تشخیص گفتار برای زبانهای هندی8: توسعه فناوری جهت تشخیص گفتار به زبانهای هندی توسط رایانه است.
ز - توسعه سیستم ترجمه ماشینی برای زبان سانسکریت:
این زبان به نوعی زبان آئینی و باستانی هند محسوب
می گردد.
§ چالشهای مدل حمايت هند:
برنامه TDIL برای دستیابی به اهداف خود با چالشهایی نیز روبرو بوده است. یکی از چالشهای اصلی عدم استانداردسازی در تمامی سطوح است. این امر منجر به توسعه ابزارها و فناوریهایی شده است که با یکدیگر قابل همکاری نیستند و ادغام آنها را در یک سیستم دشوار
میکند.
چالش دیگر فقدان منابع زبانی کافی است. توسعه ابزارهای فناوری زبان به حجم زیادی از دادهها مانند پیکرههای متنی، پیکرههای گفتاری و واژگان نیاز دارد. با این حال، در دسترس بودن چنین منابعی برای بسیاری از زبانهای هندی محدود است و توسعه ابزارهای فناوری زبان برای این زبانها را دشوار میسازد.
برنامه TDIL همچنین از نظر بودجه و پایداری با
چالشهایی روبرو بوده است. این برنامه به منابع مالی قابل توجهی برای توسعه و نگهداری ابزارها و منابع فناوری زبان نیاز دارد.
در نهایت بطور اجمال می توان به نکات اساسی که در
طرحهای حمایتی کشور هند در این حوزه وجود دارد بصورت زیر اشاره کرد:
§ اهمیت ارتباط با مجامع و سازمانهای بینالمللی در این حوزه
§ دسترسی عموم به نتایج حاصل از طرحها به منظور توسعه سریع این حوزه در بین شرکتهای دانشبنیان داخلی
§ استفاده از توان شرکتهای داخلی به صورت کنسرسیوم در بخشهای مختلف طرح
§ توسعه امکانات ترجمه ماشینی به زبان انگلیسی جهت ارتقا تعاملات افراد هندی زبان با جامعه بینالملل
§ حفظ اسناد موجود به زبانهای هندی
§ برنامهریزی بلندمدت و اختصاص بودجه مناسب
4-2- مدل حمایتی ولز
طبق چشمانداز دولت ولز آنگونه که در سیاست استراتژیک این کشور برای سالهای 2012 تا 2017 تحت عنوان «یک زبان زنده، یک زبان برای زندگی9» و از سال 2017 به بعد تحت عنوان Cymraeg 2050: یک میلیون ولزی زبان، تبیین شده است.
§ اهداف مدل حمايت ولز:
دولت یک مجموعه برنامه به منظور رشد این زبان و افزایش کارکرد آن در بخشهای مختلف زندگی مردم این کشور ترتیب داده است. در واقع امکان دسترسی ولزی زبانان به فناوریهایی که استفاده از زبان ولزی را در جنبههای مختلف زندگی تسهیل نماید، جزء اهداف دولت در حمایت از تکنولوژی پردازش زبان است (Welsh language action plan, 2013).
در سال 2015 دولت این کشور تا سقف یکصد هزار یورو از پروژههای شاخص10 حمایت نموده است. همچنین معمولا خط مشی دولت ولز حمایت مالی از شرکتها پس از انجام پروژه است (Welsh language action plan, 2013).
شکل1. اهداف دولت ولز در طرح های حمایتی از
فناوریهای زبانی
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 228 |
§ برنامههای مدل حمايت ولز:
کارگروه فناوری زبان ولزی و رسانههای دیجیتال11 شامل نمایندگان موسسات آموزشی، مراکز تحقیقاتی، تهیهکنندگان تلویزیونی و خبرگان حوزه محتوای دیجیتال و فناوری، یک برنامه در حوزه خط و زبان ولزی ترتیب دادهاند. حوزههای تمرکز این برنامه عملیاتی شامل موارد زیر است:
§ بازاریابی و آگاهیدهی
§ ایجاد انگیزه در شرکتهای اصلی فعال در این حوزه
§ تشویق برای توسعه برنامههای کاربردی و خدمات دیجیتال مرتبط با حوزه زبان
§ ایجاد انگیزه جهت تولید، اشتراکگذاری و استفاده از محتوای زبان ولزی
§ حمایت از اقدامات مثبت در بخش دولتی و خصوصی
در سالهای بعدی یعنی از سال 2017 و با پیاده سازی برنامه جدید، این حوزهها شامل موارد زیر گردید:
§ فناوری گفتاری زبان ولزی
§ ترجمه به کمک کامپیوتر
§ هوش مصنوعی مکالمه ای
نتیجه پایش و ارزیابی پیوسته این برنامه عملیاتی توسط این کارگروه به اطلاع وزیر آموزش و پروزش ولز میرسد. در ادامه برنامهها و نیازمندیهای بخش دولتی در هریک از این حوزه ها به اختصار بیان شده است.
الف-بازاریابی و آگاهیدهی:
تحقیقات دولت ولز نشان میدهد علیرغم تلاشهای دولت جهت افزایش نفوذ زبان ولزی در محیط دیجیتال مانند برنامههای کاربردی و محیط وب، مردم این کشور حدود یک درصد از زمان خود در محیط وب را به گشتن در سایتهای ولزی زبان اختصاص میدهند. همچنین این آمار برای برنامههای تلویزیونی و رادیویی به ترتیب 6 و 15 درصد است. با توجه به این آمار و ارقام، دولت یک هدف اساسی خود در این برنامه عملیاتی را افزایش آگاهی مردم از فناوریها و محتوای در دسترس آنها به زبان ولزی اختصاص داده است. بنابراین نقاط هدف دولت شامل موارد زیر است:
§ سرمایهگذاری در پروژههای مرتبط با افزایش نرخ آگاهی مردم از نرمافزارها، سرویسهای آنلاین، ابزارهای تولید محتوا به زبان ولزی
§ توسعه استراتژی بازاریابی برای حمایت از نرم افزارها و سرویسهای موجود به زبان ولزی
§ همکاری با ذینفعانی مانند BBC و ... برای ترویج کاربری زبان ولزی
§ تاکید بر ایجاد سهولت در انتخاب زبان ولزی در نرم افزارهای مربوطه
ب-ایجاد انگیزه در شرکتهای پیشرو:
هدف دولت ولز تسهیل امکان مشارکت ولزی زبانان در فضای دیجیتال از طریق زبان ولزی است. دولت برای تحقق این امر، پشتیبانی هر چه بیشتر شرکتهای سرآمد در فضای دیجیتال از زبان ولزی را ضروری میداند. بههمین منظور دولت، شرکتهای بزرگ از قبیل اپل، مایکروسافت، گوگل و آمازون را تشویق به ارائه واسط کاربری به زبان ولزی در سیستمهای عامل، نرم افزارها و سرویسهایشان جهت امکان انتخاب ساده این زبان مینماید. علاوه بر این دولت قصد دارد تا ایجاد محتواهایی از قبیل کتابهای الکترونیک به زبان ولزی با همکاری شرکتهای مرتبط مانند Adobe به منظور حل مشکل پشتیبانی از الفبای این زبان در محیطهای مربوطه را تسهیل نماید. لذا دولت در این بخش شرکتهای مطرح فناوری را تشویق می نماید تا موارد زیر را در محصولات خود برقرار نمایند:
§ ایجاد واسط کاربری ولزی و امکان انتخاب این زبان به صورت ساده و شفاف
§
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 229 |
§ ایجاد اطمینان از اینکه کاربر بهسادگی قادر به یافتن محتوای ولزی است
§ حمایت از زبان ولزی در محیط نرمافزارهای خود
ج-تشویق توسعه برنامههای کاربردی و خدمات مرتبط:
علاوه بر برنامه دولت جهت همکاری با شرکتهای بزرگ به منظور پشتیبانی از زبان ولزی، دولت به توسعه و حمایت از برنامههای کاربردی کوچکتر برای توسعه زبان ولزی در آنها علاقهمند است. بنابراین در پی حمایت مالی از پروژههایی است که ولزی زبانان را قادر به دستیابی به اطلاعات به زبان ولزی با استفاده از آخرین فناوریهای روز نماید.
توسعه دهندگان جهت تولید و توسعه نرم افزارهای مرتبط با زبان ولزی نیازمند استفاده از طیف وسیعی از زیرساختها و فناوریهای مرتبط با این زبان هستند. این فناوریها شامل تبدیل متن به گفتار، تشخیص صوت، ترجمه ماشینی و ... است. این فناوریها زیرساخت لازم جهت تسهیل توسعه ابزارهای مرتبط با زبان ولزی را فراهم مینمایند. همچنین در بلند مدت برای اطمینان از وجود تعداد کافی متخصص ولزی زبان برای توسعه زیرساخت فناوری زبانی، دولت قصد ایجاد انگیزه در جوانان برای فعالیت در حوزه علوم مرتبط با کامپیوتر و برنامه نویسی را دارد. لذا اقدامات زیر را در برنامه خود قرار داده است:
§ حمایت مالی از ابزارهای ولزی در پلتفرمهای مختلف
§ حمایت مالی از پروژههای زیرساختی (سیستمهای تبدیل متن به گفتار، تشخیص صوت، ترجمه ماشینی و ...) منجر به توسعه ابزارها و نرمافزارهای ولزی.
§ حمایت مالی از طرحهای ایجاد مهارت برنامهنویسی در جوانان
د-ایجاد انگیزه جهت تولید، اشتراکگذاری و استفاده از محتوای زبان ولزی:
دولت ولز یک عامل اساسی در رابطه با بقاء و نشاط و چالاکی زبان ولزی را میزان محتوای تولید شده و به اشتراک گذاشته شده میداند، لذا در پی تسهیل تولید و به
اشتراکگذاری محتوا به زبان ولزی است. با توجه به اهمیت نسل جوان در این امر، دولت این کشور حمایت مالی از ابتکارات و تشویق نسل جوان در این فعالیتها را در برنامه دارد. در واقع دولت این کشور در پی ایجاد اعتماد و مهارت در افراد در تمامی ردههای سنی به منظور ایجاد محتوای آنلاین به زبان ولزی است. اقدامات دولت در این بخش شامل موارد زیر است:
§ سهولت امکان تولید محتوای دیجیتال برای ولزی زبانان در وبلاگها، وبسایتها و شبکههای اجتماعی با حمایت مالی از تولید ابزارهای مرتبط
§ ایجاد مهارت جهت تولید محتوای آنلاین از طریق حمایت مالی از ابتکارات
§ تشویق و حمایت از فعالیتهای جوانان به منظور تولید محتوا، حمایت از طرحهای ویکیپدیا در آموزش به ولزی زبانان و افزایش سطح آگاهی با اضافه نمودن مطالب به ویکی پدیا، کسب اطمینان از در دستور کار قرار گرفتن زبان ولزی در بخش دیجیتال دولت ولز
§ تشویق و حمایت از سازمانها و مجتمعهای مرتبط با زبان ولزی به منظور افزایش نرخ استفاده از فناوری و ایجاد برنامههای آموزشی
ه-حمایت از اقدامات مثبت دولتی و خصوصی:
این بخش از سیاست دولت برای حمایت از زبان ولزی شامل دو بخش استفاده از این زبان در محیط کار و خدمات عمومی است. در رابطه با استفاده از زبان ولزی در محیط کار، دولت در پی اجبار سازمانها و شرکتها برای تسهیل استفاده کارمندان از زبان ولزی از طریق ایجاد نرمافزارها و فناوریهای مرتبط است. همچنین دولت در رابطه با خدمات عمومی، بخشهای مختلف را مکلف به ارائه خدمات به زبان ولزی و تسهیل استفاده از این زبان در محیطهای مرتبط نموده است.
و-ایجاد و حفظ زیرساخت دیجیتال
اطمینان از وجود زیرساختهای دیجیتالی لازم برای زبان ولزی، مانند تبدیل گفتار به متن، ترجمه ماشینی، مجموعههای داده مرتبط و بزرگ، یادگیری ماشین، و غیره.
ز-توسعه فرهنگ نوآوری باز
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 230 |
ح-تحول دیجیتال در بخش عمومی
زبان ولزی باید بخش جداییناپذیر از دستورکار تحول دیجیتال در بخش دولتی باشد.
همچنین دولت در طول عمر این طرح، تلاش برای توسعه موارد زیر را نموده است:
§ فناوری گفتاری زبان ولزی.
§ هوش مصنوعی مکالمه ای برای زبان ولزی.
§ بهبود تجربه کاربری (UX) برای کاربران فناوری ولزی زبان.
§ تشویق شرکتهای فناوری به استفاده بیشتر از زبان ولزی.
§ تسهیلات برای ایجاد بانک داده صدای افراد به زبان ولزی.
§ منابع یادگیری فنی مرتبط برای کسانی که ولزی یاد میگیرند.
در نهایت بطور اجمال می توان به نکات اساسی که در
طرحهای حمایتی کشور ولز در این حوزه وجود دارد بصورت زیر اشاره کرد:
§ با توجه به جمعیت اندک ولزی زبانان سیاست اصلی برنامههای حمایتی دولت در راستای توسعه این زبان در فضای مجازی است.
§ افزایش تعاملات با شرکتها و سازمانهای بین المللی این حوزه
§ سرمایهگذاری در حوزه تولید محتوا به زبان ولزی با استفاده از تکنولوژیهای زبانی
§ سرمایهگذاری در حوزه آموزش و تربیت افراد متخصص در حوزه های مرتبط
§ برنامهریزی بلند مدت و تخصیص بودجه
4-3- مدل حمایتی ایالات متحده آمریکا
دولت ایالات متحده آمریکا برای بیش از چهار دهه نقش حمایت و توسعه سیستمهای ترجمه ماشینی را در سرتاسر دنیا ایفا نموده است. پیش از گزارش معروف کمیته آلپاک12 در 1966 دولت بیش از 13 میلیون دلار صرف توسعه چنین سیستمهایی نمود (پدتکه، 1997). اما گزارش کمیته آلپاک در این سال در ارتباط با ارزیابی سیستمهای ترجمه ماشینی و زبان شناسی رایانشی در آمریکا در آن سالها تردیدهایی را در رابطه با کیفیت و توسعه این سیستمها وارد نمود و منجر به کاهش شدید بودجه دولتی در سالهای پس از آن در این بخش و تقریبا قطع حمایت دولتی از توسعه این سیستمها در آمریکا شد. پس از انتشار این سند، بخش خصوصی تبدیل به بخش پیشگام در توسعه سیستمهای ترجمه ماشینی در آمریکا شد. با توجه به جنگ سرد بین ایالات متحده و اتحاد جماهیر شوروی در آن سالها، تمرکز دولت در توسعه سیستمهای ترجمه ماشینی انگلیسی- روسی بوده است.
گزارش سال 1993 کمیته صنعت و فناوری13 شورای هماهنگی علوم، فناوری و مهندسی14 دفتر ریاست جمهوری ایالات متحده با عنوان «فناوری ترجمه ماشینی، یک توان کلیدی در عصر اطلاعات» بر لزوم نقشپذیری دولت این کشور در توسعه سیستمهای ترجمه ماشینی به عنوان عنصر شتاب دهنده در توسعه به منظور پیشی گرفتن این کشور در این صنعت از کشور ژاپن به عنوان کشور پیشگام در صنعت ترجمه در آن سالها، تاکید دارد. همچنین در این سند بر اهمیت این فناوری در دیگر بخشهای اقتصادی و اجتماعی مانند سلامت، علوم، فناوری و محیط زیست تاکید شده است. سیاستگذاری، ایجاد هماهنگی و پشتیبانی دولت از این بخش موجب تقویت موضع دفاعی این کشور در مقابل رقیبان عنوان شده است. پیشنهادات این کمیته به دولت به طور مشخص شامل: حمایت از پژوهش، حمایت از توسعه سیستمهای موجود برای پاسخگویی به نیازمندیهای دولت، ارزیابی عملکرد سیستمهای موجود، حمایت از کارگاههای آموزشی مرتبط با ترجمه ماشینی و شناسایی نیازمندیهای جدید بخش خصوصی و دولتی در رابطه با این موضوع است (وایت، 1993).
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 231 |
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 231 |
هدف اولیه مطرح شده در این پروژه همکاری با سه گروه از محققان از IBM، SRI و BBN بوده است که طی دوره اجرای پروژه عملکرد هر گروه به صورت سالانه بررسی شده و در صورت لزوم تیم دارای کمترین کیفیت از روند پروژه حذف میشود. همچنین امکان توقف کلی پروژه پیش از اتمام آن در صورت عدم کسب موفقیتهای برنامهریزی شده، در طرح اولیه پیشبینی شده است (الیو، کریستینسون، مککاری، 2011)
هدف GALE رسیدن به دقت بین 90 تا 95 درصد در ترجمه چینی و عربی به انگلیسی در 2010 تبیین شده است. همچنین هدف تعریف شده برای این پروژه در سال اول رسیدن به دقت 65 درصد در ترجمه صوت و دقت 75 درصد در ترجمه متن برای دو زبان یاد شده عنوان شده است. تحقیقات DARPA پیش از آغاز پروژه، نمایانگر دقت حدود 55 درصدی سیستمهای موجود در ترجمه اخبار بوده است. اما DARPA خواستار دقت بیان شده نه تنها در حوزههای رسمی مانند خبر، بلکه حوزههای محاورهای مانند گپهای اینترنتی و مصاحبههای تلویزیونی بوده است.
شکل 2. اهداف پروژه GALE
نکات اساسی که از بررسی طرحهای حمایتی کشور ایالت متحده می توان ذکر کرد:
§ به دلیل توسعه مناسب زبان انگلیسی، دولت در این حوزه بطور گسترده ای وارد نشده است
§ ورود دولت در حوزه هایی است که نیازهای امنیتی و سیاسی اقتضا می نماید.
4-4- مدل حمایتی اتحادیه اروپا
اتحادیه اروپا طی سیاستگذاریهای هفت ساله FP7 17 و H2020 و CEF برنامههای جامعی جهت حمایت از فناوریهای مختلف از جمله فناوری زبان شناسی و حوزههای وابسته در نظر گرفته است. برنامه جامع FP7 مربوط به سالهای 2007 تا 2013 میلادی و برنامه جامع H2020 مربوط به سالهای 2014 تا 2020 است. این حمایتها شامل حوزههای مرتبط با زبان مانند ترجمه ماشینی، شناسایی صوت، تولید پیکره، منابع دادهای و ... هستند.
§ اهداف مدل حمايت اتحادیه اروپا:
با توجه به اهمیت از بین بردن مرز میان کشورها به عنوان هدف اولیه تشکیل اتحادیه اروپا، از میان برداشتن مرزهای زبانی میان کشورهای این اتحادیه یکی از اهداف مهم کنونی آن به شمار میرود. لذا، توسعه ترجمه ماشینی و حمایت از تولید داده برای استفاده در سیستمهای مرتبط با فناوری زبان از جمله مهمترین اهداف این اتحادیه هستند (کام، 2013 ).
استراتژی زنجیره ارزش داده18 با هدف ایجاد ارزش افزوده تجاری و اجتماعی در داده بر اساس استفاده، مدیریت و استفاده مجدد هوشمند از منابع داده در اروپا از طریق ترکیب تحقیقات و نوآوری و پیادهسازی قوانین مورد نیاز شکل گرفته است. بر همین اساس از سال 2012 میلادی پرتالی برای مدیریت دادههای موجود در اتحادیه اروپا در نظر گرفته شده است. دادههای موجود در این پرتال توسط دولتها و بخشهای مختلف اتحادیه تولید شده و برای استفاده در اختیار عموم قرار میگیرند(رهم و همکاران، 2020).
§
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 232 |
برنامه CEF 19 : برنامه CEF یک برنامه جامع به منظور توسعه شبکه کارآمد و مطمئن در اتحادیه اروپا در حوزههای زیرساختی انرژی، حمل و نقل و سرویسهای دیجیتال است. در بخش مخابرات هدف از این پروژه تسهیل تعاملات بین مرزی برای بخش دولتی، کسبوکارها و شهروندان اروپایی با توسعه یک زیرساخت سرویسهای دیجیتال20 و شبکههای پهن باند ایمن با عملکرد مناسب است. سرمایه گذاری انجام شده برای حمایت طرحها تا سال 2027 است. یکی از بخشهای این برنامه بهعنوان زیرساختهای توسعه دیجیتال اتحادیه، توسعه سیستمهای ترجمه ماشینی و منابع زبانی شامل ابزارها و واسطهای برنامهنویسی در راستای توسعه سرویسهای دیجیتال در محیط چند زبانی است.
برنامه H2020: علاوه بر برنامه CEF، توسعه فناوری زبانی در برنامه جامع H2020 اتحادیه اروپا نیز دیده شده است. این برنامه بزرگترین برنامه تحقیقاتی اتحادیه اروپا از سال 2014 تا 2020 با بودجه ای نزدیک به 80 میلیارد یورو برای توسعه علم و فناوری در این اتحادیه است. این برنامه جنبههای مختلف علوم مانند علوم فضایی، فناوری اطلاعات، سلامت و غیره را در بر میگیرد. شاخه فناوری اطلاعات و ارتباطات در بخش علوم نیازمند توسعه سریعتر، برای در اختیار گرفتن بازارهای آینده جهانی در این برنامه قرار گرفته است. برنامه عملیاتی 2014 و 2015 از برنامه جامع H2020 شامل 39 بخش در توسعه فناوری اطلاعات و ارتباطات است که حوزههای مرتبط با زبان در سه بخش از این برنامه مورد اشاره قرار گرفتهاند.
اولین حوزه مرتبط با توسعه فناوری زبان در برنامه عملیاتی مرتبط با توسعه سیستم دادهی باز است که در آن بر توسعه سیستم فعلی تاکید شده است. بخش دوم مرتبط با توسعه پردازش زبان طبیعی از برنامه عملیاتی توسعه فناوری اطلاعات در اتحادیه اروپا، مربوط به تحقیقات در حوزه کلان دادهها با محوریت توسعه دادهکاوی و فهم زبانی است. سومین و مهمترین بخش مرتبط با توسعه ابزارهای زبانی از این برنامه عملیاتی تحت عنوان از بین بردن موانع زبانی در این برنامه گنجانده شده است. در این بخش مشابه برنامه جامع CEF، هدف ایجاد محیط یکپارچه دیجیتال با حذف موانع زبانی است. سیستمهای مدنظر در این بخش باید قابلیت مدیریت حجم بالایی از داده، پردازش انواع مختلف متون و دقت بالا در ترجمه به زبانهای مختلف اروپایی را دارا باشند. همچنین توسعه سیستم برای 21 زبان اروپایی با اولویت زبانهای فاقد سیستم ترجمه ماشینی یا دارای سیستمهای ضعیف در این برنامه مدنظر بوده است. در چشم انداز این برنامه، تمرکز بر حوزههای زبانی دارای کیفیت پایین و حوزههایی که توسعه سیستمهای موجود نیازمند هزینه هنگفت یا دادههای حجیمی است که در حال حاضر امکان فراهم نمودن آنها نیست، بیان شده است. برای این منظور مبلغ 15 میلیون یورو در 2014 در نظر گرفته شده است (European Comission,2014).
همچنین برنامه عملیاتی سال 2016 و 2017 میلادی برنامه جامع H2020 ، توسعه فناوری زبانی را در سه بخش مدنظر قرار داده است. توسعه فناوری زبانی در این برنامه شامل توسعه سیستمهای بین زبانی و بین بخشی برای تجمیع دادهها و آزمایشات است. در این بخش توسعه یک سیستم هوشمند و یکپارچه به منظور اشتراکگذاری دانش و اطلاعات در تمامی اتحادیه اروپا به عنوان هدف مد نظر قرار گرفته است. (European Comission,2015).
چند مورد از پروژههای اجرا شده تحت برنامه جامع H2020 عبارتند از:
الف - پروژه شبکه زبان اروپایی (ELG21): هدف آن دسترسی آسان به صدها فناوری زبانی تجاری و غیرتجاری برای همه زبانهای اروپایی با هدف بهبود بازار واحد دیجیتال چندزبانه و ایجاد مشاغل جدید است. پروژه ELG یک پلتفرم مقیاسپذیر ایجاد کرده است که شامل ابزارها و خدمات در حال اجرا، مجموعه دادهها و منابع است.
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 233 |
ج - پردازش زبان طبیعی برای علوم انسانی دیجیتال (CLARIN): هدف این پروژه توسعه زیرساخت تحقیقاتی برای علوم انسانی دیجیتال است که دسترسی آسان به منابع و ابزار زبان را فراهم میکند.
د - برابری زبان اروپایی (ELE22): هدف این پروژه ترویج برابری زبان در اتحادیه اروپا با توسعه سیاستها و ابزارهای زبانی است که از چندزبانگی پشتیبانی میکند.
در نهایت بطور اجمال می توان به نکات اساسی که در طرحهای حمایتی اتحادیه اروپا در این حوزه وجود دارد به شرح زیر اشاره نمود:
- با توجه به تنوع زبانی در اتحادیه اروپا حمایت از پروژهها در حوزه فناوریهای زبانی اهمیت خاصی است لذا در اکثرهای برنامههای این اتحادیه بخشی برای این حوزه در نظر گرفته میشود.
- سرمایهگذاری در این حوزه علاوه بر مباحث فرهنگی در حوزه اقتصادی، توسعه و ایجاد کسب و کارها نیز بسیار مناسب است.
4-5- مدل حمایتی اسپانیا
دولت اسپانیا برنامه جامع ترویج فناوری زبانی را از سال 2016 آغاز نموده است و در این برنامه 90 میلیون یورو برای ارتقای فناوری زبان هزینه می نماید. وزارت ارتباطات اسپانیا به عنوان متولی برنامه، برای اجرای آن یک کمیته راهبری با همکاری سازمانهای دولتی این کشور ترتیب داده است. این کمیته راهبری شامل دبیرخانه بنگاههای کوچک و متوسط، وزارت علوم و تحقیقات، وزارت فرهنگ، وزارت آموزش، فرهنگ و ورزش، بخش آمریکای لاتین وزارت امور خارجه، معاون رئیس جمهور، وزارت گردشگری و وزارت بهداشت و خدمات عمومی است. این کمیته راهبری در اولین گام از این برنامه، یک کمیته از خبرگان به منظور تنظیم یک سند اولیه به عنوان سند پشتیبان برنامه اصلی ایجاد نموده است. کمیته خبرگان شامل فرهنگستان سلطنتی زبان اسپانیایی، موسسه سروانتس، کتابخانه ملی، آکادمی سلطنتی مهندسی، متخصصان گروه پردازش زبان طبیعی، شرکتهای بزرگ اسپانیایی فعال در IT، گروههای کسب و کار تخصصی در حوزه زبان و ترجمه، کمیته سیاستگذاری استفاده مجدد از اطلاعات بخش دولتی، کمیته اصلاح نظام اداری و گروه همکاری بینالمللی با آمریکای لاتین تشکیل شده است. گروه خبرگان همچنین تحلیلی جامع از نقاط ضعف، قوت، فرصتها و تهدیدهای پیش روی دولت در حوزه پردازش زبان را ارائه نموده اند (سپلن،2015).
§ اهداف مدل حمايت اسپانیا:
هدف اساسی دولت اسپانيا در این برنامه، جلوگیری از دوبارهکاری و افزایش همافزایی از طریق ترکیب پروژههای موجود جهت ممانعت از تعدد سازمانهای ارائه دهنده خدمات مشابه بیان شده است. دولت اهداف کلی این برنامه را افزایش کیفیت و کمیت ابزارهای زیرساختی پردازش زبان برای زبان اسپانیایی و دیگر زبانهای رسمی این کشور، ارتقای صنعت زبانشناسی با تسهیل انتقال دانش از دانشگاه به صنعت، کمک به فعالیت بینالمللی شرکتهای فعال در این حوزه و بهبود کیفیت و ظرفیت خدمات عمومی با بهرهگیری از فناوریهای پردازش زبان و ترجمه ماشینی بیان شده است.
توسعه زیرساختهای زبان شناسی شامل توسعه صنعت پردازش زبان و ایجاد بسترهای زیرساختی و دادهای لازم، کاهش فاصله بین ابزارهای زیرساختی زبان اسپانیایی و انگلیسی از منظر کیفیت، کمیت و دسترسپذیری، کسب اطمینان از رایگان یا ارزان بودن ابزارهای زیرساختی برای بخشهای دولتی و پژوهشی، جلوگیری از دوباره کاری در توسعه ابزار و ایجاد استاندارها و قوانین لازم از ديگر اهداف اين برنامه است.
توسعه صنایع مرتبط با زبان شناسی در بخش IT شامل تسهیل انتقال دانش به بخش صنعت و افزایش اطلاعات در رابطه با ابزارهای موجود و کمک به فعالیت بین المللی بخشهای صنعتی فعال در این حوزه در این کشور است. این امر با ایجاد تعاملات بینالمللی به خصوص با کشورهای آمریکای لاتین (با توجه به نزدیکی زبانی) و کمک به بازاریابی شرکتهای فعال در این بخش انجام میپذیرد.
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 234 |
§ برنامههای مدل حمايت اسپانیا:
مراحل انجام برنامه با توجه به اهداف و محورهای مختلف در این برنامه جامع شامل دولت، پشتیبانی از توسعه زیرساختهای زبانی، ارتقای پردازش زبان، بخش عمومی به عنوان محرک صنعت پردازش زبان، گامهایی برای رسیدن به اهداف تعیین شده در هریک از محورهای تبیین شده است.
الف - محور دولت
دلیل وجود این محور ایجاد مکانیزمی به منظور هماهنگی، کنترل و پایش اجزای برنامه و افراد و سازمانهای مرتبط با آن است. همچنین گامهای پیشروی دولت به ترتیب زیر تبیین شده است.
§ ایجاد کمیته راهبری به عنوان رکن اصلی تولید برنامه
§ ایجاد کمیته خبرگان که نقش مشاوره فنی برنامه را ایفا خواهد نمود.
§ ارزیابی میزان اجرا و کیفیت اجرای برنامه
§ هماهنگی با دیگر برنامههای موجود مانند برنامههای اتحادیه اروپا و ایجاد امکان فعالیت بینالمللی شرکتهای فعال به خصوص در آمریکای لاتین
ب - محور توسعه ابزارهای زیرساختی
این محور به توسعه ابزارهای زیرساختی، منابع دادهای و پیکرهها میپردازد. بنابراین دولت در طول این برنامه قصد حمایت از تولید چنین ابزارها و دادههایی و در اختیار قرار دادن آنها برای پژوهشگران و شرکتهای فعال در این حوزه را خواهد داشت. گامهای رسیدن به این مهم در برنامه به شرح زیر عنوان شدهاند:
§ انتخاب استانداردهای فنی تعامل متقابل، سیاستهای صدور مجوز و مکانیزمهای لازم به منظور حمایت از تولید منابع دادهای مورد نیاز
§ جذب یا توسعه ابزارهای لازم به منظور ایجاد زیرساخت زبانی مورد نیاز
§ تهیه فهرست ابزارهای زیرساختی موجود و ارزیابی کمی و کیفی ابزارهای زیرساختی
§ تسهیل دسترسی عمومی به ابزارهای زیرساختی
ج - محور ارتقای صنعت پردازش زبان
این محور جهت لزوم شناساندن بخش پردازش زبان و ترجمه ماشینی به مقامات دولتی و بخشهای مولد صنعت و همچنین تربیت نیروهای خبره در این زمینه جهت کسب اطمینان از حفظ روند رو به رشد این فناوری عنوان شده است. برای نیل به این هدف، گامهای زیر پیشبینی شده است:
§ توسعه یک برنامه خاص به منظور افزایش آگاهی در رابطه با این فناوری
§ برنامهریزی اقداماتی با هدف بهبود آگاهی و آموزش نیروهای خبره در این حوزه با مشارکت دولتهای دیگر، به خصوص کشورهای آمریکای لاتین
§ افزایش آگاهی از طریق برگزاری کنفرانسهای پایه برای شرکتهای متوسط و حرفهای، برگزاری انجمنها و نمایشگاههای ملی و بینالمللی
همچنین در این محور حمایت دولت از فعالیت بینالمللی شرکتها و ایجاد بازارهای بینالمللی برای آنها، با توجه به نرخ بالای اسپانیایی زبانان در دنیا دیده شده است. برای رسیدن به این هدف، گامهای زیر در این برنامه پیشبینی شده است:
§ توسعه یک برنامه برای بینالمللی سازی فعالیتهای مرتبط با فناوری زبانی
§ افزایش رایزنی با موسسات فعال در آمریکای لاتین
§ تشویق به توسعه ابزارهای زیرساختی و منابع دادهای برای گویشهای دیگر اسپانیایی
د - محور بخش عمومی
با توجه به بهرهمندی بیشمار بخش عمومی از مزایای سیستمهای پردازش زبان طبیعی و ترجمه ماشینی شامل افزایش ظرفیت، کیفیت و خودکارسازی خدمات عمومی، کاهش هزینه در انتقالات بین زبانی، افزایش کیفیت خدمات به معلولین، بخش عمومی به عنوان محرک صنعت پردازش زبان محسوب شده و سه گام در این محور در نظر گرفته شده است.
§ توسعه طرحی به منظور ایجاد یک سکوی استفاده از پردازش زبان طبیعی و ترجمه ماشینی در دولت است.
§
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 235 |
میپردازد.
§ ایجاد پلتفرم مشترک برای استفاده از خدمات پردازش زبان طبیعی و ترجمه ماشینی در بخش دولتی مدنظر قرار گرفته است.
همچنین در این محور، پتانسیل بالای دولتی در تولید اطلاعات به عنوان منابع دادهای مورد نیاز مدنظر قرار گرفته است. با توجه به این موارد، گامهای پیش رو برای رسیدن به اهداف تعیین شده در این محور به شرح زیر عنوان شده است:
§ معرفی و گسترش سیاست استفاده مجدد از اطلاعات بخش دولتی در بدنه دولت
§ انتخاب استانداردهای فنی و سیاستهای صدور مجوز لازم برای حمایت از اطلاعات فردی و دولتی
§ شناسایی منابع مهم و کارای بخش دولتی که قابلیت تبدیل به پیکره و منابع داده برای پردازش زبان را دارند.
ه - محور پروژههای شاخص پردازش زبان طبیعی
هدف این محور معرفی پروژههای شاخص عمومی با ضریب تأثیرگذاری بالا در خدمات عمومی و اجتماعی جهت تکمیل زنجیره ارزش پروژههای زیرساختی است. وجود چنین برنامههایی باعث بهرهمندی بخش عمومی از پردازش زبان طبیعی و ترجمه ماشینی و موجب بهبود کیفیت خدمات این پروژهها در نظر گرفته شده است. برای رسیدن به این مهم تعریف تعداد محدودی پروژه با بکارگیری پردازش زبان طبیعی و ترجمه ماشینی با میزان تاثیر اجتماعی بالا مدنظر قرار گرفته است. اولویت اولیه تعریف پروژه در بخشهای سلامت، گردشگری و آموزش در سال ابتدایی برنامه و تعریف پروژه در زمینههای دیگر مانند خدمات شهروندی، امنیت و غیره در سالهای آتی است.
در این راستا طرح TL ( Plan de Impulso de las Tecnologías del Lenguaje) یک ابتکار دولت اسپانیا است که با هدف ترویج توسعه پردازش زبان طبیعی، ترجمه ماشینی، و سیستمهای مکالمه به زبان اسپانیایی و زبانهای رسمی مشترک است. این طرح در سال 2019 راهاندازی شد و بخشی از طرح ملی فناوریهای زبان طبیعی است. بودجه آن 30 میلیون یورو است و انتظار می رود بیش از 1000 شغل در این بخش ایجاد کند.
دولت اسپانیا اخیراً نیز یک پروژه استراتژیک به نام «اقتصاد زبانی جدید23» را برای بهبود و تحول اقتصادی (PERTE) و ترویج استفاده از زبان در هوش مصنوعی، علم و فرهنگ و تشویق آموزش و یادگیری آن توسط شورای وزیران اسپانیا در مارس 2022 تصویب کرده است. این پروژه بسیج سرمایهگذاری عمومی و خصوصی برای به حداکثر رساندن ارزش زبان اسپانیایی و زبانهای رسمی مشترک در فرآیند تحول دیجیتال در مقیاس جهانی است.
نکات اساسی که در طرحهای حمایتی اسپانیا وجود دارد شامل موارد زیر است:
§ تشکیل کمیته راهبردی از اعضای اکثر ارگانها و سازمان های دولتی که به نوعی با حوزه زبان و فرهنگ در ارتباط هستند و تشکیل کمیته نخبگان از متخصصین این حوزه جهت تصمیم گیری های واحد در این حوزه
§ استفاده از ظرفیت های دانشگاهی و همچنین ارتباطات بین المللی
§ ایجاد استانداردهای موردنیاز
5- بحث و نتيجهگيری
در این تحقیق نحوه سیاستگذاری حمایتی از پروژههای مرتبط با پردازش زبان طبیعی در کشورهایی از نقاط مختلف دنیا مورد بررسی قرار گرفت. مجموعه راهبردها و سیاستهای توسعه خط و زبان در این مقاله شامل بررسی چگونگی حمایتهای مادی و معنوی از پروژهها و محصولات مرتبط با فناوری زبان طبیعی در کشورهای هند، ایالات متحده آمریکا، ولز، اسپانیا و اتحادیه اروپا است.
با توجه به برخی تفاوتها در شرایط هر یک از این کشورها با ایران، تمامی راهبردهای مطرح شده در اسناد فوق قابل اعمال در سیاستهای حاکمیتی ایران در فضای مجازی نیستند، ولی با تطبیق شباهتهای موجود، برخی از اهداف و راهبردهای استخراج شده می توانند با اعمال تغييراتي مورد استفاده قرار گیرند. از جمله این راهبردها میتوان به موارد ذیل اشاره نمود (اصغری و محتاج، 1395):
§ فراهمسازی امکان استفاده جامعه از محتوای فضای فناوری اطلاعات به زبان فارسی
§ تسهیل امکان مشارکت فارسی زبانان در فضای دیجیتال از طریق زبان فارسی
§
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 236 |
§ تلاش در جهت بقاء و نشاط و چالاکی زبان فارسی از طریق افزایش میزان محتوای تولیدشده و همچنين محتواي به اشتراک گذاشته شده
§ ارائه رایگان محصولات زیرساختی مرتبط با فناوریهای زبانی (مانند فونتها، پیکرهها و ابزارهای زیرساختی) از طریق درگاههای مرتبط و جلوگیری از دوباره کاری در توسعه ابزار
§ ایجاد یک سکوی واحد در بخش پردازش زبان در دولت
§ گسترش سیاست استفاده مجدد از اطلاعات دولتی بصورت دسترسی باز جهت توسعه ابزارها و پیکرههای زبانی و تسهیل فرآیند تولید دادههای معیار
§ ایجاد بانکهای داده مناسب مرتبط با زبان و خط و گفتار فارسی جهت استفاده در پروژهها و نرم افزارها به ویژه در حوزه هوش مصنوعی
§ تدوین استانداردهای مورد نیاز برای محصولات خط و زبان فارسی
§ پیوند محصولات خط و زبان با یکی از فعالیتهای کلیدی در کشور (از جمله اپراتورهای تلفن همراه، حوزه گردشگری، حوزه سلامت)
§ حمایت از برنامههای کاربردی که فارسی زبانان را قادر به دستیابی سریعتر به اطلاعات فارسی نموده و کار آنان را در جنبههای مختلف زندگی تسهیل نماید
§ تعامل با شرکتهای بینالمللی به منظور حمایت از زبان فارسی در محیطهایی مانند سیستمهای عامل، برنامه کاربردی MS Office و محیط رایانامهها در راستای تسهیل استفاده از زبان فارسی در امور روزمره
§ ارائه راهنمایی و مشاوره به شرکتهای بین المللی و مطرح در حوزه فناوری به منظور حمایت از زبان فارسی در محیط نرمافزارهای خود
§ توسعه استراتژی بازاریابی برای حمایت از نرم افزارها و سرویسهای مرتبط با زبان فارسی
§ ایجاد محتوای آموزشی برخط به زبان فارسی و نیز بهبود دروس دانشگاهی مرتبط
§ تسهیل آموزش زبان فارسی مبتنی بر فناوری
§ حمایت از ایجاد و توسعه انجمنهای علمی مرتبط
§ برگزاری کنفرانسها و نمایشگاههای ملی و بینالمللی
§ تبیین طرح حمایتی فراتر از این طرح جهت ايجاد يك چتر حمايتي به منظور کسب اطمینان از استمرار آن ورای طول عمر برنامه
§ تشویق و حمایت از فعالیتهای تولید، اشتراکگذاری و استفاده از محتوای فارسی در فضای مجازی
شكل 3 دسته بندي فعاليتهاي راهبردي در اين حوزه را به نمايش مي گذارد.همانگونه كه ملاحظه مي گردد حمايت از محصولات خط و زبان را مي توان در چهار حوزه راهبردي دسته بندي نمود. در اولويت بندي فعاليتها مواردي چون نیاز بازار، نزدیکی محصول به بازار، اندازه بازار و تنوع کاربرد در سه حوزه متن، صوت و تصویر مي بايست مورد نظر قرار گيرد. همچنين شناسایی تمامی بازیگران این حوزه جهت
اجرای یک تقسیم کار ملی و حذف مقوله های مستقل از
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 237
|
یکی از چالشها و مسائل موجود در ایران در خصوص تدوین این اسناد، تعدد مراکز سیاستگذاری جهت تدوین و تبیین راهبردهای حمایت از خط و زبان فارسی در محیط مجازی است. بر این اساس باید با در نظر گرفتن تمامی نقش آفرینان این حوزه به تدوین یک سند جامع اقدام نمود. همچنین پایش مستمر و ارزیابی پیوسته برنامه نیز یکی از نکات مهمی است که باید مدنظر قرار گیرد.
[1] . European Language Technology (ELT)
[2] . Technology Development for Indian Languages
[3] . World-wide-Web consortium (W3C)
[4] . Machine Aided Translation (MAT)
[5] . Cross-lingual Information Access (CLIA)
[6] . On-line handwriting recognition system (OHWR)
[7] . Text to Speech System (TTS)
[8] . Automatic Speech Recognition (ASR)
[9] . A living language: a language for living
[10] . Ambitious Infrastructural Projects
[11] . Digital Media Group
[12] . Automatic Language Processing Advisory Committee (ALPAC)
[13] . Committee on Industry and Technology
[14] .Federal Coordinating Council for Science, Engineering and Technology
[15] . Global Autonomous Language Exploitation
[16] . Defense Advanced Research Projects Agency (DARPA)
[17] . 7th Framework Program (FP7)
[18] . The Data Value Chain Strategy
[19] . Connecting Europe Facility
[20] . Digital Service Infrastructures (DSIs)
[21] . European Language Grid
[22] . European Language Equality
[23] . New Language Economy
رديف | حوزه راهبردی | عنوان فعالیت |
1 | زیربنایی | ایجاد یک نظام ارزیابی، و استاندارد سازی محصولات خط و زبان (شامل داده محک، آزمایشگاه تایید نمونه، استانداردسازی) |
پروژه پایش و ارزیابی محصولات خط و زبان | ||
حمایت از ایجاد یک نهاد غیر دولتی جهت پایش و راهبری فعالیتهای خط و زبان | ||
سرمایه گذاری و حمایت جهت تولید پیکرگان زیربنایی | ||
تشویق/ حمایت از تولید محتوای فارسی | ||
تشویق ارائه دهندگان پیکره ها و ابزارهای متن باز/رایگان | ||
تشویق تولید بستر تولید محتوی | ||
2 | حقوقی | تدوین آیین نامه اعطای یارانه به دستگاههای دولتی جهت خرید محصولات خط و زبان |
آیین نامه مالکیت فکری | ||
تدوین و تصویب آیین نامه دسترسی آزاد به اطلاعات | ||
3 | ترویج و آگاهی سازی | برگزاری همایش سالانه خط و زبان فارسی و رایانه |
آموزش و تربیت نیروی انسانی کارآمد | ||
دعوت از کنفرانسهای بین المللی | ||
حمایت از برگزاری مسابقات تخصصی | ||
حمایت از انتشار نشریات تخصصی | ||
برگزاری برنامه های تخصصی حوزه خط و زبان در صدا و سیما | ||
4 | حمایت از توسعه محصول | سیستم خطایاب / سیستم پرسش و پاسخ / مشابهتیاب / خلاصهساز / ایدهکاوی / تحلیل اخبار |
تبدیل گفتار به متن / تبدیل متن به گفتار (TTS) / شناسایی گوینده | ||
بازشناسی تصویر حروف و کلمات (نویسه خوان نوری) شامل ارقام و حروف چاپی / بازیابی و بازشناسی متن در ویدئو / بازیابی تصویری متن / بازشناسی ارقام ، حروف و کلمات دستنویس (کلمات محدود دستنویس / رسم الخط تحریری) | ||
توسعه پیکره | ||
توسعه ابزارهای زیرساختی |
شكل 3. حوزههای راهبردی و فعالیتها در برنامه اقدام
سپاسگزاري
این مقاله در راستای تدوین «سند توسعه خط و زبان فارسی در فضای مجازی» با حمایت ستاد توسعه فناوری اطلاعات و ارتباطات معاونت علمی ریاست جمهوری تالیف شده است.
منابع
1. Cazden, C. B. (2003). Sustaining indigenous languages in cyberspace. Nurturing Native Languages, 2002(1). https://files.eric.ed.gov/fulltext/ED482034.pdf .
2. Cohen, J. (2007). The GALE project: A description and an update. Automatic
نویسندگان مقاله مراتب قدردانی خود را از اعضای گروه پژوهشی مدلهای کسب و کار در پژوهشکده فناوری اطلاعات جهاد دانشگاهی ابراز میدارند.
Speech Recognition & Understanding. https://doi.org/10.1109/asru.2007.4430115.
3. COMM. (2013). LT2013 - status and potential of the European language technology markets - digital single market - European Commission. Retrieved June 4, 2016, https://economie.fgov.be/en/themes/online/strategy-european-digital/connecting-europe-facility-cef.
4. Diki-Kidiri M (2007), Securing a place for a language in cyberspace. Paris: UNESCO. Retrieved 4 June 2016, http://unesdoc.unesco.org/images/0014/001497/149786E.pdf.
5. European Commission. (2014). Horizon 2020 work programme for 2014-2015. European Commission Decision C
(2015)2453 of 17 April 2015. Retrieved June 4, 2016, https://ec.europa.eu/research/participants/data/ref/h2020/wp/2014_2015/main/h2020-wp1415-security_en.pdf.
6. European Commission. (2015). Horizon 2020 work programme for 2016-2017. European Commission Decision C (2015)6776 of 13 October 2015. Retrieved June 4, 2016, https://ec.europa.eu/research/participants/data/ref/h2020/wp/2016_2017/main/h2020-wp1617-intro_en.pdf.
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 238 |
8. Olive, J. P., Christianson, C., & McCary, J. (2011). Handbook of Natural Language Processing and Machine Translation: DARPA Global Autonomous Language Exploitation. http://ci.nii.ac.jp/ncid/BB05333792
9. Ong, T. W. S., & Said, S. B. (2021). Selective language maintenance in multilingual Malaysia. In Advances in religious and cultural studies (ARCS) book series (pp. 207–228). https://doi.org/10.4018/978-1-7998-2959-1.ch009
10. Pedtke, T. R. (1997). U.S. Government Support and Use of Machine Translation: Current Status. ACL Anthology. https://aclanthology.org/1997.mtsummit-plenaries.1
11. United Nations. (n.d.). Protecting languages, preserving cultures | United Nations. https://www.un.org/en/desa/protecting-languages-preserving-cultures-0
12. Rehm, G., Berger, M., Elsholz, E., Hegele, S., Kintzel, F., Marheinecke, K., Piperidis, S., Deligiannis, M., Galanis, D., Gkirtzou, K., Labropoulou, P., Bontcheva, K., Jones, D. L., Roberts, I., Hajič, J., Hamrlová, J., Kačena, L., Choukri, K., Arranz, V., . . . Klejch, O. (2020). European Language Grid: An Overview. arXiv (Cornell University). http://arxiv.org/pdf/2003.13551.pdf
13. Sepln, (2015) Plan de Impulso de las Tecnologías del Lenguaje, Retrieved June 4, 2016, http://www.sepln.org/news/plan-de-impulso-de-las-tecnologias-del-lenguaje/
14. St. Clair, R. N. (2010, November 17). Review of Reyhner & Lockard (2009): Indigenous Language Revitalization: Encouragement, Guidance & Lessons Learned. Language Problems and Language Planning, 34(3), 267–269. https://doi.org/10.1075/lplp.34.3.05stc.
Stiles, D. B. (1997). Four Successful Indigenous Language Programs. Teaching Indigenous Languages. https://eric.ed.gov/?id=ED415079
15. The Government of Spain promotes language as a factor for modernization and economic development, 2022,
https://www.lamoncloa.gob.es/lang/en/gobierno/councilministers/Paginas/2022/20220301_council.aspx
16. Vikas, O. (2001). Language Technology Development in India. Ministry of Information Technology, New Delhi, India. http://www.emille.lancs.ac.uk/lesal/omvikas.pdf
17. Warschauer, M. (1998). Technology and Indigenous Language Revitalization: Analyzing the experience of Hawai’i. Canadian Modern Language Review-revue Canadienne Des Langues Vivantes, 55(1), 139–159. https://doi.org/10.3138/cmlr.55.1.139
ارائه مدلی برای توسعه ابزارهای سیاستی در حمایت از.../ حبیب الله اصغری و همکار 239 |
https://www.gov.wales/sites/default/files/publications/2018-12/welsh-language-technology-and-digital-media-action-plan.pdf
19. Welsh language | GOV.WALES. (2024, February 20). GOV.WALES. http://gov.wales/topics/welshlanguage/?lang=en
20. White, R. M. (1993). Machine Translation Technology: A Potential Key to the Information Age. Report of the FCCSET Committee on Industry and Technology, PB-93-134336, Office of Science and Technology Policy, Washington, DC (January 1993).
21. اصغری، حبیباله و محتاج، سالار، «سند ارتقاء خط و زبان فارسی در فضای مجازی»، معاونت علمی و فناوری ریاست جمهوری، ستاد توسعه فناوری اطلاعات و ارتباطات، فروردین ماه 1395.