UNIVERSITI SAINS MALAYSIA. CPT346 Natural Language Processing [Pemprosesan Bahasa Tabii]

Similar documents
SULIT FP511: HUMAN COMPUTER INTERACTION/SET 1. INSTRUCTION: This section consists of SIX (6) structured questions. Answer ALL questions.

INSTRUCTION: This section consists of SIX (6) structured questions. Answer FOUR (4) questions only.

SIMILARITY MEASURE FOR RETRIEVAL OF QUESTION ITEMS WITH MULTI-VARIABLE DATA SETS SITI HASRINAFASYA BINTI CHE HASSAN UNIVERSITI TEKNOLOGI MALAYSIA

SIJIL PELAJARAN MALAYSIA 2011

SYARAT-SYARAT KEMASUKAN DI TATI UNIVERSITY COLLEGE

PROBLEMS IN ADJUNCT CARTOGRAPHY: A CASE STUDY NG PEI FANG FACULTY OF LANGUAGES AND LINGUISTICS UNIVERSITY OF MALAYA KUALA LUMPUR

RANCANGAN KURSUS. Muka surat : 1 daripada 6. Nama dan Kod Kursus: Komputer dalam Pendidikan Kimia(MPS1343) Jumlah Jam Pertemuan: 3 x 14 = 42 jam

UNIVERSITI PUTRA MALAYSIA TYPES OF WRITTEN FEEDBACK ON ESL STUDENT WRITERS ACADEMIC ESSAYS AND THEIR PERCEIVED USEFULNESS

CHAPTER III RESEARCH METHODOLOGY. A. Research Method. descriptive form in conducting the research since the data of this research

UNIVERSITI PUTRA MALAYSIA IMPACT OF ASEAN FREE TRADE AREA AND ASEAN ECONOMIC COMMUNITY ON INTRA-ASEAN TRADE

CHAPTER III RESEARCH METHODOLOGY. A. Research Type and Design. questions. As stated by Moleong (2006: 6) who makes the synthesis about

Lulus Matrikulasi KPM/Asasi Sains UM/Asasi Sains UiTM/Asasi Undang-Undang UiTM dengan mendapat sekurangkurangnya

UNIVERSITI PUTRA MALAYSIA

yang menghadapi masalah Down Syndrome. Mereka telah menghadiri satu program

KEPERLUAN SUSUNATUR DAN PERANCANGAN TAPAK BAGI KESELAMATAN KEBAKARAN (ARIAL 18 ) NORAINI BINTI ISMAIL FAKULTI ALAM BINA UNIVERSITI MALAYA 2007

NATIONAL INSTITUTE OF OCCUPATIONAL SAFETY AND HEALTH

ABSTRAK. Tamil pelajar Tingkatan 6. Pendekatan penyelidikan yang digunakan ialah kaedah

GARIS PANDUAN BAGI POTONGAN PERBELANJAAN DI BAWAH PERENGGAN 34(6)(m) DAN 34(6)(ma) AKTA CUKAI PENDAPATAN 1967 BAGI MAKSUD PENGIRAAN CUKAI PENDAPATAN

Abstrak. Masalah Pembelajaran Bahasa bukan Saintifik dalam Pembelajaran Sains

UNIVERSITI PUTRA MALAYSIA SKEW ARMENDARIZ RINGS AND THEIR RELATIONS

BODJIT KAUR A/P RAM SINGH

UNIVERSITI PUTRA MALAYSIA

Abstrak. Penerapan Rutin Berfikir dalam Membina Penguasaan Kosa Kata Murid. Khuraisah Mohd Abthar

AN INVESTIGATION INTO THE FACTORS AFFECTING SECOND LANGUAGE LEARNERS CLASSROOM PARTICIPATION

TEACHING WRITING DESCRIPTIVE TEXT BY COMBINING BRAINSTORMING AND Y CHART STRATEGIES AT JUNIOR HIGH SCHOOL

KESAN DASAR PENGAJARAN MATEMATIK DAN SAINS DALAM BAHASA INGGERIS Dl SEKOLAH RENDAH

UNIVERSITY ASSET MANAGEMENT SYSTEM (UniAMS) CHE FUZIAH BINTI CHE ALI UNIVERSITI TEKNOLOGI MALAYSIA

PENGGUNAAN ICT DALAM KALANGAN GURU PELATIH KEMAHIRAN HIDUP FAKULTI PENDIDIKAN, UTM

STUDENTS SATISFACTION LEVEL TOWARDS THE GENERIC SKILLS APPLIED IN THE CO-CURRICULUM SUBJECT IN UNIVERSITI TEKNOLOGI MALAYSIA NUR HANI BT MOHAMED

An Investigation into Teacher Practice of Jigsaw Technique in Teaching Narrative for Eight Graders of SMPN 1 Menganti

ILLOCUTIONARY ACTS FOUND IN HARRY POTTER AND THE GOBLET OF FIRE BY JOANNE KATHLEEN ROWLING

PENGGUNAAN GAMBAR RAJAH DALAM MENYELESAIKAN MASALAH GERAKAN LINEAR SITI NOR HIDAYAH BINTI ISMAIL UNIVERSITI TEKNOLOGI MALAYSIA

ISU KRITIKAL PENGGUNAAN TULISAN JAWI DALAM PELAKSANAAN KURIKULUM PENDIDIKAN ISLAM PERINGKAT SEKOLAH MENENGAH: PANDANGAN PAKAR

CVT COLOUR VIBRATION THERAPY SDN BHD BORANG PERMOHONAN KEMASUKAN KE PROGRAM KURSUS TERTINGGI COLOUR VIBRATION THERAPY

KURIKULUM STANDARD SEKOLAH MENENGAH SAINS PELAKSANAAN PENTAKSIRAN SEKOLAH

PENGHASILAN BAHAN E-PEMBELAJARAN BAGI TOPIK POLYGONS II UNTUK PELAJAR TINGKATAN TIGA BERASASKAN MOODLE

PEMBINAAN DAN PENILAIAN KESESUAIAN MODUL PENGAJARAN KENDIRI PERMODELAN OBJEK PADU MATA PELAJARAN REKABENTUK BERBANTU KOMPUTER

UNIVERSITI PUTRA MALAYSIA ECONOMIC VALUATION OF CONSERVATION OF LIVING HERITAGE IN MELAKA CITY, MALAYSIA CHIAM CHOOI CHEA

Jurnal Pendidikan Bahasa Melayu JPBM (Malay Language Education Journal MyLEJ)

CHAPTER II LITERATURE REVIEW AND THEORETICAL FRAMEWORK. five subheadings. The first part discusses the English teaching kits.

Pendekatan Pengajaran Guru Dan Kesannya Terhadap Pencapaian Pelajar Dalam Mata Pelajaran Kemahiran Hidup Di Sekolah Menengah Kebangsaan Senai, Johor

PEMBANGUNAN DAN PENGESAHAN INSTRUMEN UJIAN KEMAHIRAN BERFIKIR ARAS TINGGI FIZIK BAGI TAJUK DAYA DAN GERAKAN ROHANA BINTI AMIN

INCREASING STUDENTS ABILITY IN WRITING OF RECOUNT TEXT THROUGH PEER CORRECTION

FAKTOR-FAKTOR YANG MUNGKIN MEMPENGARUHI PERLAKSANAAN PROGRAM BIMBINGAN TAULAN DALAM MEMBANTU GURU SAINS MENGUASAI BAHASA INGGERIS DI SEKOLAH

DFVBCPIft-m ASD (VALUATION OF A FIBRE OPTIC i.earning mudi.hi:: for iethnology-based. it mm. SVlViA t i s AI IIMS. i u»y I tuwv!...

HUBUNGAN ANTARA KEBIMBANGAN TERHADAP MATEMATIK DENGAN PENCAPAIAN DALAM KALANGAN PELAJAR SEKOLAH RENDAH

BAB 4 METODOLOGI KAJIAN

PROGRAM I SEE YOU ; APLIKASI PEMBELAJARAN MASTERI DALAM MATAPELAJARAN SAINS PMR DI SMK (P) TEMENGGONG IBRAHIM, BATU PAHAT, JOHOR ABSTRAK

UNIVERSITI PUTRA MALAYSIA GENDER, PASSAGE CONTENT AND TEXT TYPES IN READING COMPREHENSION AMONG ESL LEARNERS

TAHAP PERANCANGAN BAHAN SUMBER, KEMUDAHAN DAN PERALATAN PENGAJARAN DALAM KALANGAN GURU PENDIDIKAN JASMANI

IBAN LANGUAGE PARSER USING RULE BASED APPROACH

KEBOLEHAN PENULISAN KANAK-KANAK BERUMUR 6 HINGGA 9 TAHUN SURAYAH BINTI ZAIDON

HUBUNGAN MINAT DAN SIKAP TERHADAP PENCAPAIAN PELAJAR DALAM KURSUS DPA3043 AUDITING. Fazlina Binti. Abd Rahiman. Aniza Suriati Binti Abdul Shukor

KOLABORASI DALAM PEMBELAJARAAN BERASASKAN MASALAH MELALUI PENDEKATAN LESSON STUDY

TINJAUAN TENTANG AMALAN KOMUNIKASI GURU MATEMATIK SEKOLAH MENENGAH

MINAT MEMBACA DALAM KALANGAN GURU PELATIH TAHUN DUA FAKULTI PENDIDIKAN UTM SKUDAI MD ZAKI BIN MD GHAZALI

PENILAIAN ESEI BERBANTUKAN KOMPUTER MENGGUNAKAN TEKNIK BAYESIAN DAN PENGUNDURAN LINEAR BERGANDA

Language Choice in the Malaysia-Thailand Border: A Domain-based Analysis

LEARNER-COMPUTER TEXTUAL GLOSS INTERACTIONS FOR SECOND LANGUAGE VOCABULARY ACQUISITION MOHAMAD ALI YUSUF

PENGESAHAN PENYELIA. Tandatangan : PROF DR. NOOR AZLAN BIN AHMAD ZANZALI

ΡΤ PENTAKSIHAN TINGKAIAN3

Faculty Of Information and Communication Technology

Pada akhir pengajaran dan pembelajaran Bahasa Melayu sekolah rendah murid dapat :

PENGGUNAAN BAHAN ILUSTRASI OBJEK PADANAN ABJAD (IOAP) BAGI MENINGKATKAN KEUPAYAAN MENGECAM HURUF KANAK-KANAK PRASEKOLAH

UNIVERSITI MALAYA PERAKUAN KEASLIAN PENULISAN. Nama: Nur Hakimah Binti Md Sallehuddin (No. K.P/Pasport: )

Jurnal Pendidikan Bahasa Melayu JPBM (Malay Language Education Journal MyLEJ)

MAJLIS PEPERIKSAAN MALAYSIA. Perbandingan bilangan dan peratusan calon (mendaftar) STPM 2009 dengan calon STPM 2010

BIBLIOGRAPHIC INFORMATION

Aas Samrotul Faidah¹ Metty Agustine Primary².

HUBUNGAN ANTARA KUALITI GURU BAHASA ARAB DAN KECENDERUNGAN MINAT PELAJAR DALAM BAHASA ARAB

qwertyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopasdfgh jklzxcvbnmqwertyuiopasdfghjklzxcvb nmqwertyuiopasdfghjklzxcvbnmqwer

IMPROVING STUDENTS SPEAKING ABILITY THROUGH SHOW AND TELL TECHNIQUE TO THE EIGHTH GRADE OF SMPN 1 PADEMAWU-PAMEKASAN

MEMBANGUN WEB PORTAL BERASASKAN MOODLE BERTAJUK PROBABILITY SPM

COOPERATIVE LEARNING TIME TOKEN IN THE TEACHING OF SPEAKING

SIFU Oleh: HANITA LADJAHARUN SMK Bandaraya Kota Kinabalu, Sabah ABSTRAK

THE EFFECT OF USING SILENT CARD SHUFFLE STRATEGY TOWARD STUDENTS WRITING ACHIEVEMENT A

SEMESTER: TARII<H : /4 20 DIS 2005 (SELASJ~) KURSUS: DAT/SPK MASA : PG (2 jal1r1)

BAB 3 KEBERKESANAN PELAKSANAAN SISTEM SEBUTAN BAKU DALAM PENGAJARAN DAN PEMBELAJARAN BAHASA MELAYU

UNIVERSITI PUTRA MALAYSIA

PROFORMA KURSUS Course Proforma. FAKULTI PENDIDIKAN Faculty of Education SEMESTER I, SESI

Noor Chahaya Ngosman Sekolah Kebangsaan Rantau Panjang, Kementerian Pendidikan Malaysia

PEMBELAJARAN MOBILE BAGI KURSUS JAVA DI POLITEKNIK

REKACIPTA INSTRUMEN PUZZLE HEKSAGON KIT BAGI UJIAN KETANGKASAN AHMAD SYUKRI BIN MUHAMMAD

UNIVERSITI PUTRA MALAYSIA KESALAHAN BAHASA MELAYU DI KALANGAN MAHASISWA FAKULTI PENGAJIAN PENDIDIKAN UNIVERSITI PERTANIAN MALAYSIA

Dian Wahyu Susanti English Education Department Teacher Training and Education Faculty. Slamet Riyadi University, Surakarta ABSTRACT

UNIVERSITI PUTRA MALAYSIA RELATIONSHIP BETWEEN LEARNING STYLES AND ENTREPRENEURIAL COMPETENCIES AMONG STUDENTS IN A MALAYSIAN UNIVERSITY

KEMAHIRAN EMPLOYABILITY:TANGGAPAN GURU TERHADAP PENERAPANNYA DI SEKOLAH SATU KAJIAN KES

KESEDIAAN PENGAJAR DAN PELAJAR TERHADAP PROGRAM KOUZA MEETING DI KOLEJ KEMAHIRAN TINGGI MARA BERANANG NURIMAN BIN YUSOP

PENGGUNAAN KOMPUTER DI KALANGAN GURU DALAM PENGAJARAN MATA PELAJARAN MATEMATIK DI DAERAH KOTA STAR, KEDAH DANIEL CHAN

CADANGAN PELAKSANAAN ASSESSMENT CENTRE 1GUNASAMA

A SURVEY ON UTM TESL UNDERGRADUATES READING PREFERENCE: BETWEEN HYPERTEXTS AND BOOKS

PENDEKATAN P-P FIT DALAM PROSES PEMILIHAN CALON GURU DI INSTITUSI PENGAJIAN TINGGI AWAM DI MALAYSIA. Oleh:

Jurnal Pendidikan Bahasa Melayu JPBM (Malay Language Education Journal MyLEJ)

TAHAP PENGETAHUAN DAN TAHAP KEPUASAN GURU TERHADAP LATIHAN DALAM PERKHIDMATAN DI SEKOLAH MENENGAH DAERAH SEGAMAT

Research Journal ADE DEDI SALIPUTRA NIM: F

Novi Riani, Anas Yasin, M. Zaim Language Education Program, State University of Padang

THE ROLE OF ENGLISH TEACHERS ON HELPING PASSIVE LEARNERS IN CLASSROOM (A Study at The Ninth Grade Students of SMP N 31 Andalas Padang)

Katakunci : E-learning, MOODLE, Photosynthesis, KBSM PENGENALAN

THE ROLES OF INTEGRATING INFORMATION COMMUNICATION TECHNOLOGY (ICT) IN TEACHING SPEAKING AT THE FIRST SEMESTER OF ENGLISH STUDENTS OF FKIP UIR

AMALAN PEMBANGUNAN PROFESIONAL (LDP) DALAM KALANGAN GURU SEKOLAH MENENGAH DAERAH MANJUNG

Transcription:

UNIVERSITI SAINS MALAYSIA First Semester Examination 2014/2015 Academic Session December 2014/January 2015 CPT346 Natural Language Processing [Pemprosesan Bahasa Tabii] Duration : 2 hours [Masa : 2 jam] INSTRUCTIONS TO CANDIDATE: [ARAHAN KEPADA CALON:] Please ensure that this examination paper contains FOUR questions in ELEVEN printed pages before you begin the examination. [Sila pastikan bahawa kertas peperiksaan ini mengandungi EMPAT soalan di dalam SEBELAS muka surat yang bercetak sebelum anda memulakan peperiksaan ini.] Answer ALL questions. [Jawab SEMUA soalan.] You may answer the questions either in English or in Bahasa Malaysia. [Anda dibenarkan menjawab soalan sama ada dalam bahasa Inggeris atau bahasa Malaysia.] In the event of any discrepancies, the English version shall be used. [Sekiranya terdapat sebarang percanggahan pada soalan peperiksaan, versi bahasa Inggeris hendaklah diguna pakai.]...2/-

- 2-1. Given below are some Malay complex words. menulis, menuliskan, tulisan, penulisan, bertulis bersembunyi, menyembunyikan, penyembunyian, persembunyian, sembunyian membaca, membacakan, terbaca, keterbacaan, pembaca Segmentise the group of words to find their root or base form. (7.5/25) Define the terms morpheme, affix, and derivational morphology and give examples. (4.5/25) What is a finite state transducer (FST), and how it is used in computational linguistics? How does it differ from a finite state automaton? Draw an FST which could able output word associated with regular adverbs in English. Demonstrate that your FST correctly handles cases such as bright brightly, simple simply, silly sillily and terrific terrifically. (8/25) 2. Consider the following context-free grammar: S -> NP VP NP -> Det N VP -> V VP -> V NP N -> dog N ->cat N -> mouse Det -> the V -> sees V -> hates V -> sneezes Which of the following sentences are recognised by this grammar, and why? (i) (iii) (iv) the dog sneezes the cat. the mouse hates. the cat the mouse hates. the mouse hates the mouse. (4/25)...3/-

- 3 - Modify the grammar so that the following sentence is now accepted by contextfree grammar: the dog the cat the mouse sees hates sneezes Justify your choice. (6/25) The semantics of natural language expressions can be expressed in first order predicate logic (FOPL). For instance, the dog sneezes can be approximately expressed as x dog(x) sneeze(x) Following this pattern, express the semantics of the sentence in part in FOPL. (1/25) Contrast this construction to the one in part in terms of semantics and syntax. How would you modify the original grammar in part to account for this construction? (14/25) 3. Speech processing is a study of speech signals and the processing methods of these signals. Briefly define what is meant by the semantics of a natural language utterance, and how this differs from the pragmatics What is automatic speech recognition (ASR)? What are the factors affect the accuracy of word error rate?...4/-

- 4 - The figure represents an HMM speech recogniser processing a single utterance if music be the food of love. Explain briefly the process stages involved in this recognition. MFCC features phone likelihoods if music be the food of love (9/25) Write down one path that could be taken through the following Hidden Markov model that produces the output C1 C2 C3 C4 C5 and the probability of this path being taken. 0.8 S2 0.7 0.2 S1 0.3 S3 State S1: State S2: State S3: C1 0.5 C2 0.8 C4 0.5 C2 0.3 C3 0.1 C5 0.5 C3 0.2 C4 0.1 You don t have to calculate the actual answer as a number, as long as you show the formula that would be used to calculate it. (6/25)...5/-

- 5-4. The following figure shows the speech representations of the words Atlanta and Georgia A B C Source: ( Timothy J. Hazen, I. Lee Hetherington, Han Shu, and Karen Livescu. Pronunciation modeling using a finite-state transducer representation. In Proceedings of the ISCA Workshop on Pronunciation Modeling and Lexicon Adaptation., Sep. 14-15, 2002, Estes Park, Colorado, pp. 99-10 ) What kinds of speech representation do we have in A and B? Explain your answer. (11.5/25) C represents the phonetic transcriptions of the two words Atlanta and Georgia. (i) Why IPA symbols are not included in these transcriptions? (2.5/25) What kind of phonetic transcription is it? (2.5/25) What acoustic feature that causes shade (bands) in speech representation of B? (1/25)...6/-

- 6 - (i) What is the name of the organized horizontal shades (bands) in B? Explain your answer. (2.5/25) How these organized horizontal shades (bands) can be used to disambiguate vowels?...7/-

KERTAS SOALAN DALAM VERSI BAHASA MALAYSIA - 7-1. Perkataan berikut adalah beberapa perkataan kompleks bahasa Malaysia. menulis, menuliskan, tulisan, penulisan, bertulis bersembunyi, menyembunyikan, penyembunyian, persembunyian, sembunyian membaca, membacakan, terbaca, keterbacaan, pembaca Segmenkan kumpulan perkataan-perkataan tersebut untuk mendapatkan bentuk akar atau dasarnya. (7.5/25) Takrifkan istilah morfem, imbuhan, dan morfologi terbitan serta berikan contohcontohnya. (4.5/25) Apakah Transdusor Keadaan Finit (FST), dan apakah kegunaannya dalam pemprosesan bahasa tabii? Bagaimanakah ia berbeza dengan automata keadaan finit? Lukis FST yang boleh menghasilkan perkataan dengan adverb nalar dalam bahasa Inggeris. Tunjukkan bahawa FST anda mengendalikan kes-kes seperti bright brightly, simple simply, silly sillily and terrific terrifically dengan betul. (8/25) 2. Pertimbangkan tatabahasa bebas konteks berikut: S -> NP VP NP -> Det N VP -> V VP -> V NP N -> dog N ->cat N -> mouse Det -> the V -> sees V -> hates V -> sneezes...8/-

- 8 - Yang manakah daripada ayat-ayat berikut yang diterima oleh tatabahasa ini, dan kenapa? (i) the dog sneezes the cat. (iii) (iv) the mouse hates. the cat the mouse hates. the mouse hates the mouse. (4/25) Ubahsuaikan tatabahasa itu supaya ayat yang berikut boleh diterima sebagai tambahan: the dog the cat the mouse sees hates sneezes Terangkan pilihan anda. (6/25) Semantik bagi ungkapan bahasa tabii dapat dinyatakan dalam perintah pertama logik predikat (FOPL). Sebagai contoh, the dog sneezes boleh dinyatakan secara tepat sebagai x dog(x) sneeze(x) Mengikuti pola ini, nyatakan semantik bagi ayat dalam bahagian dalam FOPL. (1/25) Bandingkan pembinaan ini dengan yang ada di bahagian dari segi semantik dan sintaks. Bagaimana anda boleh mengubahsuai tatabahasa asal itu pada bahagian untuk diambil kira dalam pembinaan ini? (14/25) 3. Pemprosesan pertuturan ialah kajian isyarat pertuturan dan kaedah-kaedah pemprosesan isyarat-isyarat ini. Secara ringkas definisikan apa yang dimaksudkan dengan semantik ucapan bahasa tabii, dan bagaimana ia berbeza daripada pragmatik. Apakah pengecaman pertuturan secara automatik (ASR)? Apakah faktor-faktor yang memberi kesan kepada ketepatan kadar ralat perkataan?...9/-

- 9 - Rajah di bawah menunjukkan satu pengecaman pertuturan HMM memproses ungkapan tunggal if music be the food of love. Terangkan secara ringkas peringkat proses yang terlibat dalam pengecaman ini. MFCC features phone likelihoods if music be the food of love (9/25) Tulis satu laluan yang boleh diambil melalui model Hidden Markov yang menghasilkan output C1 C2 C3 C4 C5 dan kebarangkalian bagi laluan ini diambil. 0.8 S2 0.7 0.2 S1 0.3 S3 State S1: State S2: State S3: C1 0.5 C2 0.8 C4 0.5 C2 0.3 C3 0.1 C5 0.5 C3 0.2 C4 0.1 Anda tidak perlu mengira jawaban sebenar sebagai satu nombor, asalkan anda menunjukkan formula yang digunakan untuk mengira kebarangkalian itu. (6/25)...10/-

- 10-4. Gambar rajah berikut menunjukkan perwakilan pertuturan bagi perkataan Atlanta dan Georgia. A B C Sumber: ( Timothy J. Hazen, I. Lee Hetherington, Han Shu, and Karen Livescu. Pronunciation modeling using a finite-state transducer representation. In Proceedings of the ISCA Workshop on Pronunciation Modeling and Lexicon Adaptation., Sep. 14-15, 2002, Estes Park, Colorado, ms. 99-10 ) Apakah jenis perwakilan yang diwakili oleh A dan B? Terangkan jawapan anda. (11.5/25) C mewakili transkripsi fonetik bagi perkataan Atlanta dan Georgia. (i) Mengapa simbol IPA tidak dimasukkan dalam transkripsi ini? (2.55/25) Apakah jenis transkripsi fonetiknya? (2.5/25) Apakah ciri akustik yang menyebabkan bayang (bands) dalam perwakilan pertuturan B? (1/25)...11/-

- 11 - (i) Apakah nama bayang (bands) melintang tersusun dalam B? Terangkan jawapan anda. (2.5/25) Bagaimana bayang (bands) melintang tersusun ini boleh digunakan untuk menyahtaksa vokal? - ooooooo -