Wednesday, March 18, 2020

Korpus Linguistik Essays - Free Essays, Term Papers, Research Papers

Korpus Linguistik Essays - Free Essays, Term Papers, Research Papers Korpus Linguistik Rosemary | 25 Mei 2014 [pic] 1.0 Pengenalan Apakah itu korpus linguistik? Corpus linguistik adalah satu kajian bahasa dan kaedah analisis linguistik yang menggunakan koleksi teks asli atau "sebenar perkataan" yang dikenali sebagai corpus. Corpus linguistik digunakan untuk menganalisis dan penyelidikan beberapa soalan linguistik dan menawarkan wawasan yang unik ke dalam dinamik bahasa yang telah menjadikan ia salah satu daripada metodologi linguistik yang paling banyak digunakan. Sejak corpus linguistik melibatkan penggunaan korpora besar yang terdiri daripada berjuta-juta atau kadangkala bilion kata-kata, ia banyak bergantung kepada penggunaan komputer untuk menentukan apa kaedah-kaedah mengawal bahasa dan apa patters (tatabahasa atau leksikal misalnya) berlaku. Oleh itu, ia tidak menghairankan bahawa linguistik korpus muncul dalam bentuk moden hanya selepas revolusi komputer pada 1980-an. The Brown Corpus, corpus moden dan boleh dibaca secara elektronik yang pertama, bagaimanapun, telah dicipta oleh Henry Kucera dan W. Nelson Francis seawal tahun 1960-an. 2.0 Kaedah korpus lingustik Corpus Linguistik telah menjana beberapa kaedah penyelidikan, cuba untuk mengesan laluan dari data teori. Wallis dan Nelson (2001) mula diperkenalkan apa yang mereka dipanggil perspektif 3A: Anotasi, Pengekstrakan dan Analisis. . Anotasi terdiri daripada permohonan skim untuk teks. . Pengekstrakan terdiri daripada terjemahan (pemetaan) istilah di dalam skim ini kepada terma dalam model didorong secara teori atau dataset. Pengekstrakan biasanya termasuk ahli bahasa-diarahkan carian tetapi mungkin termasuk contohnya, memerintah-pembelajaran untuk parsers. . Analisis terdiri daripada statistik menyelesaikan sesuatu, memanipulasi dan generalising dari dataset itu. Analisis mungkin termasuk penilaian statistik, pengoptimuman peraturan asas atau kaedah penemuan pengetahuan. Kebanyakan korpora leksikal hari ini adalah sebahagian-of-ucapan-tagged (POS-tagged). Walau bagaimanapun juga ahli bahasa corpus yang bekerja dengan 'teks biasa unannotated' tidak dapat tidak memohon kaedah untuk mengasingkan beberapa terma-terma penting. Dalam situasi ini anotasi dan abstraksi digabungkan dalam carian leksikal. Kelebihan menerbitkan corpus beranotasi ialah pengguna lain boleh melakukan uji kaji ke atas korpus. Ahli bahasa dengan kepentingan-kepentingan lain dan perspektif berbeza daripada ciptaan asal boleh mengeksploitasi kerja ini. Dengan berkongsi data, ahli bahasa corpus dapat merawat korpus sebagai lokus perdebatan linguistik, dan bukannya sebagai satu bentuk huruf lengkap pengetahuan. 3.0 Kelebihan korpus linguistik . Memberi akses kepada maklumat linguistik naturalistik. Seperti yang dinyatakan sebelum ini, korpora terdiri daripada "perkataan yang benar" teks yang kebanyakannya hasil daripada situasi kehidupan sebenar.Ini menjadikan korpora sumber kajian yang berharga untuk Dialektologi, sosiolinguistik dan gaya bahasa. . Memudahkan penyelidikan linguistik. Korpora boleh dibaca secara elektronik telah dikurangkan secara mendadak masa yang diperlukan untuk mencari perkataan atau frasa tertentu. Satu penyelidikan yang akan mengambil hari atau tahun untuk disiapkan secara manual boleh dilakukan dalam masa beberapa saat dengan tahap tertinggi ketepatan. . Membolehkan kajian pola yang lebih luas dan penempatan bersama kata- kata.Sebelum kemunculan komputer, linguistik korpus belajar hanya kata- kata tunggal dan kekerapan mereka. Teknologi moden dibenarkan kajian patters lebih luas dan penempatan bersama kata-kata. . Membolehkan analisis pelbagai parameter pada masa yang sama. Pelbagai program perisian linguistik korpus, pemasaran online dan alat-alat analitikal membenarkan penyelidik untuk menganalisis bilangan yang lebih besar daripada parameter serentak. Selain itu, banyak korpora diperkaya dengan pelbagai maklumat linguistik seperti anotasi. . Memudahkan kajian bahasa kedua. Kajian bahasa kedua dengan penggunaan bahasa semula jadi membolehkan pelajar untuk mendapatkan "perasaan" lebih baik untuk bahasa dan belajar bahasa seperti ia digunakan dalam sebenar dan bukannya "mencipta" situasi. 4.0 Kelemahan korpus lingustik . Tidak menjelaskan mengapa. Kajian korpora memberitahu kita apa dan bagaimana berlaku tetapi ia tidak memberitahu kami mengapa kekerapan perkataan tertentu telah meningkat dari masa ke masa misalnya. . Tidak mewakili keseluruhan bahasa. Korpus linguistik mengkaji bahasa dengan menggunakan korpora dipilih secara rawak atau sistematik. Mereka biasanya terdiri daripada sebilangan besar yang berlaku secara semulajadi teks, bagaimanapun, ia tidak mewakili keseluruhan bahasa. Analisis linguistik yang menggunakan kaedah dan alat linguistik korpus itu tidak mewakili keseluruhan bahasa. Deny Arnos Kwary dan Linguistik Korpus 02 March 2016 Dosen merupakan seseorang yang memiliki posisi terpenting dalam kelangsungan sistem pendidikan di setiap universitas seluruh dunia. Dosen akan selalu diharapkan agar dapat memberikan sebuah perkembangan besar dan signifikan dalam dunia akademik itu sendiri. Seakan membuktikan pernyataan tersebut, tahun ini salah seorang dosen sekaligus kepala Departemen Sastra Inggris Universitas Airlangga, Bapak Deny Arnos Kwary, tengah mengumumkan rencana penelitian besarnya yang harapannya akan menciptakan sebuah perkembangan besar dalam bidang yang beliau geluti, yaitu linguistik korpus. Penelitian tersebut berjudul Formulasi Klasifikasi Kosakata, Jenis Pemarkah Waktu, dan Bentuk Kalimat di Artikel Ilmiah Jurnal Internasional. Penelitian ini mendapatkan dana hibah dari Universitas Airlangga sebagai bentuk usaha universitas untuk meningkatkan publikasi ilmiah bagi tenaga-tenaga akademiknya. Dosen di Indonesia terus didorong untuk menggiatkan publikasi di tataran internasional. Akan tetapi, seringkali dosen kesulitan dalam mengumpulkan hasil penelitiannya ke jurnal-jurnal kelas

Monday, March 2, 2020

Using Readability Formulas

Using Readability Formulas Any readability formula is one of many methods of measuring or predicting the difficulty level of text by analyzing sample passages. A conventional readability formula measures average word length and sentence length to provide a grades and Observations, below. Five popular readability formulas are the Dale-Chall readability formula (Dale Chall 1948), the Flesch readability formula (Flesch 1948), the FOG index readability formula (Gunning 1964), the Fry readability graph (Fry, 1965), and the Spache readability formula (Spache, 1952). Examples and Observations: Because researchers have been examining readability formulas for almost 100 years, the research is comprehensive and reflects both the positive and negative aspects of formulas. Essentially, research firmly supports that sentence length, and word difficulty provide viable mechanisms for estimating difficulty, but they are imperfect. . . .As with many tools that work with normally developing readers, readability formulas may require some tweaking when the target population includes struggling readers, learning-disabled readers, or English language learners. When readers have little or no background knowledge, readability formula results may underestimate the difficulty of the material for them, particularly for English language learners. (Heidi Anne E. Mesmer, Tools for Matching Readers to Texts: Research-Based Practices. The Guilford Press, 2008) Readability Formulas and Word Processors Today many widely used word processors offer readability formulas along with spell checkers and grammar checkers. Microsoft Word provides a Flesch-Kincaid Grade Level. Many teachers use the Lexile Framework, a scale from 0 to 2000 that is based on average sentence length and average word frequency of texts found in an extensive database, the American Heritage Intermediate Corpus (Carroll, Davies, Richman, 1971). The Lexile Framework circumvents the need to perform ones own calculations. (Melissa Lee Farrall, Reading Assessment: Linking Language, Literacy, and Cognition. John Wiley Sons, 2012) Readability Formulas and Textbook Selection There are probably more than 100 readability formulas currently in use today. They are widely used by teachers and administrators as a way of predicting if a text is written at a level appropriate for the students who will use it. While we can say with relative ease that readability formulas are fairly reliable, we need to be cautious in using them. As Richardson and Morgan (2003) point out, readability formulas are useful when textbook selection committees need to make a decision but have no students available to try out the materials on, or when teachers want to assess materials that students may be asked to read independently. Basically, a readability formula is a quick and easy way to determine the grade level of written material. However, we must remember that it is only one measure, and the grade level obtained is only a predictor and thus may not be exact (Richardson and Morgan, 2003). (Roberta L. Sejnost and Sharon Thiese, Reading and Writing Across Content Areas, 2nd ed. Cor win Press, 2007) The Misuse of Readability Formulas as Writing Guides One source of opposition to readability formulas is that they are sometimes misused as writing guides. Because formulas tend to have just two major inputs- word length or difficulty, and sentence length- some authors or editors have taken just these two factors and modified writing. They sometimes end up with a bunch of short choppy sentences and moronic vocabulary and say that they did it because of a readability formula. Formula writing, they sometimes call it. This is a misuse of any readability formula. A readability formula is intended to be used after the passage is written to find out for whom it is suitable. It is not intended as a writers guide.(Edward Fry, Understanding the Readability of Content Area Texts. Content Area Reading and Learning: Instructional Strategies, 2nd ed., edited by Diane Lapp, James Flood, and Nancy Farnan. Lawrence Erlbaum, 2004)Dont bother with the readability statistics. . . . The averages of sentences per paragraph, words per sentence, and characte rs per word have little relevance. The Passive Sentences, Flesch Reading Ease, and Flesch-Kincaid Grade Level are computed statistics that dont accurately assess how easy or hard the document is to read. If you want to know whether a document is hard to understand, ask a colleague to read it. (Ty Anderson and Guy Hart-Davis, Beginning Microsoft Word 2010. Springer, 2010) Also Known As: readability metrics, readability test