تعداد نشریات | 25 |
تعداد شمارهها | 938 |
تعداد مقالات | 7,697 |
تعداد مشاهده مقاله | 12,623,347 |
تعداد دریافت فایل اصل مقاله | 8,986,129 |
واژههای پایهی زبان فارسی مبتنیبر متون مطبوعاتی | ||
زبان پژوهی | ||
مقاله 15، دوره 11، شماره 33، اسفند 1398، صفحه 353-378 اصل مقاله (593.89 K) | ||
نوع مقاله: مقاله پژوهشی | ||
شناسه دیجیتال (DOI): 10.22051/jlr.2019.19564.1520 | ||
نویسندگان | ||
رضامراد صحرائی* 1؛ امیرحسین مجیری فروشانی2؛ مروارید طالبی3 | ||
1دانشیار گروه زبانشناسی ـ دانشگاه علامه طباطبایی ـ مدیر هستة گروه پژوهش های بنیادی برای توسعۀ آموزش زبان فارسی به خارجیان دانشگاه علامه طباطبائی | ||
2پژوهشگر / بنیاد سعدی | ||
3عضو هسته پژوهش‏ های بنیادی برای توسعه آموزش زبان فارسی به خارجیان: دانشگاه علامه طباطبائی | ||
چکیده | ||
آموزش واژههای زبان، یکی از مهمترین مؤلفههای آموزش زبان خارجی است که میتواند هر چهار مهارت اصلی زبان (شنیداری، گفتاری، خواندن و نوشتن) را تحت تأثیر قرار دهد. بر پایة پژوهشهایی که در حوزۀ آموزش واژه انجام شدهاست، واژههای پربسامد و پایة زبان، به دلیل فراگیری آسان و کاربرد فراوان در زبان روزمره، از اهمیت ویژهای برخوردار هستند. فهرست واژههای پربسامد یا پایه، مجموعهای از واژههاست که در پیکرهای زبانی، فراوانی (تکرار) بیشتری داشتهاند. برای دستیابی به پیکرهای مناسب، از متنهای مطبوعاتی در هفت حوزة گوناگون (مشتمل بر فرهنگی، اجتماعی، سیاسی، ورزشی، ادبیات داستانی، اقتصادی و علمی) استفاده شد. سپس به مدت 100 روز کاری، پیکرهای 2400 متنی، مشتمل بر یک میلیون و دویستهزار واژه استخراج گردید. سپس، با استفاده از نرمافزاری که برای انجام این پژوهش طراحی شده بود، واژهها براساس گونه برچسبگذاری شدند. در پایان، از میان واژههای برچسبگذاریشده، 2000 واژهای که بیش از 50 بار تکرار شدهاند، به عنوان واژههای پایة زبان فارسی مبتنی بر متون مطبوعاتی معرفی شدند. | ||
کلیدواژهها | ||
پژوهش پیکره بنیاد؛ پیکرۀ متون مطبوعاتی؛ آموزش واژه؛ واژههای پایه؛ واژههای پربسامد فارسی | ||
عنوان مقاله [English] | ||
Persian basic words based on texts by press | ||
نویسندگان [English] | ||
Rezamorad Sahraee1؛ Amir Hosein Mojiri Forushani2؛ Morvarid Talebi3 | ||
1associate professor of linguistics department and director of fundamental research in teaching Persian to foreigners group _ Allameh Tabataba’i University | ||
2Researcher / Saadi Foundation | ||
3member of fundamental research in teaching Persian to foreigners group_ Allameh Tabataba’i University | ||
چکیده [English] | ||
No information can be transmitted without familiarity with language words. Teaching vocabulary is one of the most important components of foreign language teaching that can affect all the four main language skills (listening, speaking, reading and writing). The first step in teaching vocabulary is to access the list of basic words. According to the studies conducted in the related area, high-frequency words as well as the basic vocabularies are significant in language teaching since they are easy to learn and frequently used in everyday conversations. Frequently-used words list or frequency dictionary is a set of words that have more repetition in a collection of texts (corpus). Basic words are generally extracted from the architecture of the corpus-based researches, and the output of each linguistic corpus can be a basic words list (depending on the language and type of the corpus texts). From 1897 there are many lists of basic words in different languages of the world. English language researches is more than any other researches in this field. Since the year 1971, researches have also been conducted in Persian to extract frequent words. Thorndike (1921) presented 30,000 basic English words. In 1923, Ogden and Richards listed 850 basic words of English. Dolch (1936) listed 220 and West (1953) presented 2,000 basic English words. Coxhead (2000) has derived basic words in four areas of art, commerce, law and science. In 2001, Verlinde and Selva provided a list of frequent words in French. Also, 100 and 1000 English basic words were extracted by Fry et al. (2000). Jones and Tschirner (2006) extracted 4,307 frequent German words. Davies and Gardner (2010) extracted 1,000 to 5,000 basic English words. The list of 100 frequent words of Oxford English dictionary and the 3,000 basic words of Langman’s dictionary are other instances. In Iran, Barahani (1975), Imen (1978), Safarpour (1991), Tahriryan (1994), Hasani (2005), Gharavi Qouchani (2006), Doroody et al. (2008), Alahmad et al. (2009), Bijankhan (2011), Nematzadeh et al. (2011) were among the scholars of studying basic words. This research has two main stages: a) extracting texts and registering in database: 8 persons within 100 working days, each day extracted 3 passages with an average of 500 words from three newspapers in one of the seven different areas (including culture, society, politics, sports, fiction, economics and science), resulting in a corpus with 1,203,589 words (2401 texts). The software used for this project was written specifically for this research using the PHP programming language and is a web-based software. Types of words in the software are “name”, “verb” (and in particular “compound verb”), “preposition”, “proper noun”, “adjective” and “adverb”. Also, in this corpus, each text has metadata of “type of text” (cultural, social, political, etc.), the name of the newspaper, the date of printing, the date of the text typing, the date of frequency extraction and the name of the researcher. A list of the collections was also made to identify broken plurals. For example, ."آثار: اثر" Also, a list of inflectional affix (prefixes and suffixes) and rules governing them was provided. This list specifies what suffixes or prefixes any type of word can take. For example, verb can start with the "می" prefix, the "ات" suffix can be added to the word "آیه" but before that, the letter "ه" should be deleted from the end of the word. Each word in the software also has attributes like prefix, suffix, word root, word category, text numbers, word frequency, and main word (the word used in the text). b) Labeling Words: Labeling involves specifying the word category (noun, adjective, verb or preposition), and the lemma. Words with derivational affixes and without inflectional affixes and clitics were recorded. The verbs were recorded as infinitive. Compound verbs were recorded in an infinitive form, and their nominal and verbal parts were not separated. After the end of the previous stage, the words of the texts (including 1,203,598 words) were obtained along lemma of each word. After corrections such as label correction and lemma correction, the “Basic words” table (including 2,150 words with a frequency of 50 and above) was obtained. In addition, the list of 50 most frequent names, prepositions, adjectives and 20 most frequent adverbs in Persian were also obtained. Then, the specific base words of each topic (including 500 specific words of each topic with a frequency of 12 and above) were obtained. | ||
کلیدواژهها [English] | ||
corpus-based research, newspaper texts corpus, teaching vocabulary, basic words, high-frequency Persian words | ||
سایر فایل های مرتبط با مقاله
|
||
مراجع | ||
ایمن، لیلی (1357). فهرست پربسامدترین واژههای خردسالان 6 تا 12 سال. تهران: کمیتۀ ملی پیکار جهانی با بیسوادی. بدرهای، فریدن (1350). واژگان نوشتاری کودکان دبستانی ایران. تهران: فرهنگستان زبان ایران. براهنی، محمد تقی (1354). بررسی میزان فراوانی واژهها و تأثیر آن بر خواندن. تهران: پژوهشکدۀ تعلیم و تربیت. بیجنخان، محمود (1390). فرهنگ بسامدی بر اساس پیکرة متنی زبان فارسی امروز. تهران: مؤسسه انتشارات دانشگاه تهران. تحریریان، محمد حسن (1373). «نگاهی به فراوانی واژهها و واژگان پایه در فارسی». مجموعه مقالات دانشگاه علامه طباطبائی. به کوشش سید علی میرعمادی. تهران: دانشگاه علامه طباطبایی. شمارة 80. صص 47-70. حسنی، حمید (1384). واژههای پرکاربردِ فارسیِ امروز بر مبنای پیکرة یکمیلیون لغتی شاملِ بیش از 8000 لغتِ قاموسی و غیرِ قاموسی. تهران: کانون زبان ایران. دبیرمقدم، محمد (1376). «فعل مرکب در زبان فارسی». زبانشناسی. سال . شمارة 1. صص 2-46. درودی احسان، هما برادرانهاشمی، ابوالفضل آلاحمد، امیر حسین حبیبیان، محمد علی زارع، فرزاد مهدیخانی، آزاده شاکری و مسعود رهگذر (1387). محک استاندارد برای تحقیقات بازیابی اطلاعات وب فارسی، تهران: گزارش فنی گروه تحقیقاتی پایگاه داده ها دانشگاه تهران، شماره: DBRG-TR-138702. صحرایی، ر ضا مراد و شهناز احمدیقادر (1394). «آموزش مستقیم واژه در متن: مقایسة تأثیر دو رویکرد یادگیری مستقیم و تصادفی در یادگیری واژه». زبانپژوهی. دورة 7. شمارة 17. صص 97-100. صحرایی، رضا مراد (1391). «انگارۀ زایشی فراگیری زبان». زبان پژوهی. دورة 4. شمارة7. صص 166-169. صفارپور، عبدالرحمن (1370). واژگان پایۀ کلاسهای اول تا پنجم دبستان. تهران: انتشارات کمک آموزشی وزارت آموزش و پرورش. غروی قوچانی، مهدی (1385). تعیین واژگان پایة فارسی معیار گفتاری در بزرگسالان و تجزیه و تحلیل تواتر آنها بر اساس قانون زیف (پایاننامۀ کارشناسی ارشد چاپنشده). دانشگاه پیام نور تهران. نعمتزاده، شهین، محمد دادرس، مهدی دستجردیکاظمی و محرم منصوریزاده (1390). واژههای پایه فارسی از زبان کودکان ایرانی. تهران: موسسه فرهنگی مدرسه برهان (انتشارات مدرسه). AleAhmad, A., Amiri, H., Darrudi, E., Rahgozar, M., & Oroumchian, F. (2009). Hamshahri: A Standard Persian Text Collection. Knowledge-Based Systems, 22(5), 382–387 [In Persian].
Badreee, F. (1971). Writing vocabulary of Iranian elementary school children. Tehran: Academy of Iranian Language [In Persian].
Barnett, B., Lehmann, H., & Zoeppritz, M. (1986). A word database for natural language processing. Proceedings of the 11th International Conference on Computational Linguistics COLING86 (pp. 435-440). Bonn, West Germany, Agust 1986.
Bijan Khan, M. (1994). A look at the abundance of basic words and vocabulary in Farsi. In S. A. Miremadi (Ed.), Proceedings of Allameh Tabataba'i University (vol. 80. pp. 47-70). Tehran: Allameh Tabataba’i University [In Persian].
Bijnkhan, M. (2011). Frequency dictionary based on the textual corpus of Contemporary Persian language. Tehran: Tehran University Press [In Persian].
Carroll, J. B., Davies, P., & Richman, B. (1971). The American heritage word frequency book. Boston: Houghton Mifflin.
Carter, R. (2002). Vocabulary. In R. Carter & D. Nunan (Eds.), The Cambridge guide to teaching English to speakers of other languages (pp. 42-47). Cambridge: Cambridge University Press.
Cook, V. (1991). Second language learning and language teaching. London: Edward Arnold.
Coxhead, A. (2000). A new academic word list. TESOL Quarterly, 34(2), 213-238.
Dabirmoghaddam, M. (1997). Compound verb in Persian language. Journal of Linguistics, 12(1), pp. 2-46 [In Persian].
Davies, M. & Gardner, D. (2010). A frequency dictionary of contemporary American English: word sketches, collocates and thematic lists. London: Routledge.
Dixon, R. M. W. (1971). A method of semantic description. In D. D. Steinberg & L. A. Jakobovits. Semantics: An Interdisciplinary Reader in Philosophy, Linguistics and Psychology (pp. 436-471). Cambridge: Cambridge University Press.
Dolch, E. W. (1936). A Basic sight vocabulary. Elementary School Journal, 36, 456-460.
Doroodi, A., BaradaranHashemi, H., AleAhmad, A., ZareBidaki, A., Habibian, A., Mehdikhani, F., Shakeri A. & Rahgozar M. (2009). dorIR collection for Persian web retrieval. Tehran: Technical Report of the Databases Research Group, University of Tehran, No. DBRG-TR-138702[ In Persian].
Fry, E. B., Kress, J. E., & Fountoukidis, D. L. (2000). The reading teachers book of lists (4nd ed). London: Pearson PTR.
Gourori Gouchani, M. (2006). Determination of basic Persian words speech standard in adults and analysis of their continuity based on Ziff law (Unpublished Master’s thesis), Payam-e Nour University, Tehran, Iran [In Persian].
Hasani, H. (2005). The most widely used words in contemporary Persian based on a one-million-word corpus of more than 8,000 lexical and non-lexical words. Tehran: Iran Language Institute [In Persian].
Imen, L. (1978). The most frequent words list for 6 to 12 children years old. Tehran: National Committee of the World Campaign on Illiteracy [In Persian].
Jones, R. L., & Tschirner, E. (2006). A frequency dictionary of German. London: Routledge.
Käding, F.W. (1897). Häufigkeitswörterbuch der deutschen Sprache. Steglitz: No publ.
Laufer, B. (1997). The Lexical plight in second language reading: words you do notknow, words you think you know, and words you cannot guess. In J. Coady & T. Huckin (Eds.). Second language vocabulary acquisition (pp 20-34). Cambridge: Cambridge University Press.
McCarthy, M. (1990). Vocabulary. Oxford: Oxford University Press.
Meara, P. (1980). Vocabulary acquisition: a neglected aspect of language learning. Language Teaching. Language Teaching, 13(3-4), 221-246.
Nation, P. (2001). Learning vocabulary in another language. Cambridge: Cambridge University Press.
Nation, P. (2006). How large a vocabulary is needed for reading and listening? The Canadian Modern Language Review, 63(1), 59–82.
Nematzadeh, S., Dadras, M., DastjerdiKazemi, M., & Mansourizadeh, M. (2011). Basic Persian words from Iranian childre. Tehran: Borhan School of Cultural Education (Madrese Publishing) [In Persian].
Osgood, C. E. (1976). Focus on meaning: explorations in semantic space. New York: Mouton.
Oxford (2008). My Oxford Wordlist. Oxford University Press.
Safarpour, A. (1991). Basic words offirst to fifth grade. Tehran: Educational assistance Publications, Ministry of Education [In Persian].
Sahraee, R. (2012). The generative model for language acquisition rethinking the nature of core grammar and its representation in child language. Zabanpazhuhi, 4(7), 145-176 [In Persian].
Sahraee, R. M., & Ahmadiye Ghader, Sh. (2016). Direct teaching of vocabulary in context: the comparison of effect of direct and incidental teaching in learning vocabulary. Zabanpazhuhi, 7(17), 97-100 [In Persian].
Shin, D. & Nation, P. (2008).Beyond single words: the most frequent collocations in spoken English. ELT Journal, 62(4), 339-348.
Thorndike, E. L. (1921). The teacher’s word book. New York: Columbia University Press.
Verlinde, S., Selva, T. (2001). Nomenclature de dictionnaire et analyse decorpus. Cahiers de Lexicologie, 79(2) ,113-139.
West, M. (1953). A general service list of English words. London: Longman.
Wilkins, D. A. (1972). Linguistics in language teaching. London: Edward Arnold.
Wilkins, D. A. (1976). Notional Syllabuses. Oxford: Oxford University Press. | ||
آمار تعداد مشاهده مقاله: 1,942 تعداد دریافت فایل اصل مقاله: 475 |