Một phân tích giữa các kỹ thuật trong dự đoán kết quả học tập Nguyễn Thái Nghe 1, Paul Janecek 2, Peter Haddawy 3

Size: px
Start display at page:

Download "Một phân tích giữa các kỹ thuật trong dự đoán kết quả học tập Nguyễn Thái Nghe 1, Paul Janecek 2, Peter Haddawy 3"

Transcription

1 Một phân tích giữa các kỹ thuật trong dự đoán kết quả học tập Nguyễn Thái Nghe 1, Paul Janecek 2, Peter Haddawy 3 Tóm tắt Bài viết này so sánh độ chính xác giữa giải thuật cây quyết định (Decision Tree) và mạng Bayes (Bayesian Network) trong việc dự đoán kết quả học tập của sinh viên đại học và sau đại học ở hai trường khác nhau: Đại học Cần Thơ (CTU) một trường đại học ở khu vực đồng bằng sông Cửu Long với quy mô đào tạo khoảng sinh viên và Viện công nghệ Châu Á (AIT) một viện quốc tế trong đào tạo sau đại học ở Thái Lan, quy tụ sinh viên từ 86 quốc gia trên thế giới. Mặc dù tính đa dạng của sinh viên ở hai trường khác nhau nhưng việc khai phá dữ liệu đã cho thấy độ chính xác gần tương tự nhau trong dự đoán kết quả học tập nếu được chia thành 4 mức {rớt, trung bình, khá, giỏi} là 71/73 và 2 mức {đậu, rớt} là 93/94 tương ứng cho AIT và CTU. Những dự đoán này rất hữu ích trong việc xác định và hỗ trợ các sinh viên có kết quả kém ở CTU (chính xác 64), và trong việc lựa chọn các sinh viên giỏi để cấp học bổng ở AIT (chính xác 82). Trong phân tích này, cây quyết định đã cho thấy kết quả chính xác hơn mạng Bayes từ 3 đến 12. Kết quả phân tích ở hai tình huống trên đã cho một cái nhìn sâu hơn trong việc sử dụng các kỹ thuật để dự đóan kết quả học tập của sinh viên, so sánh độ chính xác giữa các giải thuật trong khai phá dữ liệu, và demo kết quả dựa trên ứng dụng mã nguồn mở. Từ khóa: Khai phá dữ liệu, Dự đoán, Cây quyết định, Mạng Bayes. GIỚI THIỆU Dự đoán kết quả học tập của sinh viên một các chính xác là rất hữu ích trong nhiều ngữ cảnh khác nhau ở các trường đại học và sau đại học. Chẳng hạn, việc xác định các ứng viên xuất sắc để cấp học bổng toàn phần hoặc bán phần là một công việc rất cần thiết cho các trường đào tạo sau đại học, hoặc ngay cả việc xác định các sinh viên có năng lực yếu kém để có những biện pháp thích hợp hỗ trợ họ học tập tốt hơn cũng không kém phần quan trọng. Bài viết này nghiên cứu khả năng ứng dụng của khai phá dữ liệu trong việc dự đoán kết quả học tập của sinh viên ở hai tình huống khác nhau. Trong tình huống thứ nhất - Viện công nghệ Châu Á (AIT) Thái Lan, đề tài đã sử dụng các thông tin từ hồ sơ dự tuyển của ứng viên như độ tuổi, giới tính, quốc gia, trình độ Anh văn, và điểm GPA đầu vào để dự đoán kết quả cho cuối năm thứ nhất. Trong tình huống thứ 2 - Đại học Cần Thơ (CTU), đề tài đã sử dụng các thông tin từ hồ sơ đầu vào như độ tuổi, giới tính, trình độ Anh văn, và điểm trung bình tích lũy (CGPA) ở cuối năm thứ hai để dự đoán kết quả của năm thứ 3. Bài viết cũng so sánh độ chính xác của hai giải thuật Cây quyết định và Mạng Bayes khi được áp dụng vào hai tình huống khác nhau nêu trên. Nghiên cứu này đã đưa ra một số đóng góp quan trọng. Thứ nhất, kết quả mà đề tài thực hiện đã cung cấp một cái nhìn sâu hơn trong toàn bộ quy trình ứng dụng khai phá dữ liệu vào thực tế, bao gồm cả những phương pháp trong việc điều chỉnh tập dữ liệu đầu vào và cải thiện độ chính xác của các giải thuật trong dự đoán. Thứ hai, các kết quả từ hai tình huống đã cho thấy rằng giải thuật Cây quyết định cho kết quả chính xác hơn giải thuật Mạng Bayes trong dự đoán kết quả học tập. (thử nghiệm trên công cụ mã nguồn mở Weka [1]) Các phần tiếp theo sẽ trình bày phương pháp nghiên cứu của đề tài, lựa chọn các công cụ hỗ trợ khai phá dữ liệu, so sánh kết quả dự đóan của hai giải thuật, kế tiếp là việc so sánh kết quả của nghiên cứu này với các nghiên cứu liên quan. Sau cùng là việc thảo luận, kết luận. PHƯƠNG PHÁP NGHIÊN CỨU Trong phần này chúng ta sẽ tìm hiểu phương pháp nghiên cứu của đề tài bao gồm việc lựa chọn các công cụ hỗ trợ khai phá dữ liệu; thu thập, phân tích và tiền xữ lý dữ liệu; mô hình hóa trong dự đoán kết quả học tập, và điều chỉnh dữ liệu đầu vào cũng như các tham số của giải thuật để cải thiện độ chính xác. I. Lựa chọn các công cụ hỗ trợ cho khai phá dữ liệu Nghiên cứu này đã xây dựng một bảng so sánh chi tiết các công cụ có thể sử dụng trong khai phá dữ liệu. Trước hết, đề tài bắt đầu với việc lựa chọn 30 công cụ, sau khi tìm hiểu các tính năng của từng công cụ chúng tôi đã chọn lọc ra được 10 công cụ hỗ trợ tốt trong trực quan hóa (visualization). Sau đó đề tài đã áp dụng phương pháp phân tích trên các điều kiện như: khả năng tính toán, tính năng, tính tiện dụng, dựa trên mô hình của Collier [2] để chọn ra một công cụ nhằm phục vụ cho đề tài. Do hệ thống cần được xây dựng để vận hành trên nhiều hệ điều hành khác nhau và hơn thế nữa là tiết kiệm chi phí tối đa nên phương án phát triển từ mã nguồn mở đã được cân nhắc. Điều này đã đưa đến việc tập trung trên 3 công 1 Nguyễn Thái Nghe, Khoa Công nghệ thông tin và Truyền thông, Đại học Cần Thơ, ntnghe@cit.ctu.edu.vn. 2 Paul Janecek, Assistant Professor, AIT, Thailand, paul_janecek@ait.ac.th 3 Peter Haddawy, Professor, AIT, Thailand, haddawy@ait.ac.th 1

2 cụ mã nguồn mở: Weka [1], Orange [3], và Yale [4]. Về mặt tính năng, Weka và Yale hỗ trợ nhiều giải thuật hơn Orange, đồng thời cũng có công cụ tiền xữ lý dữ liệu tốt hơn. Mặt khác, Weka hỗ trợ tốt cho những tập dữ liệu lớn nên chúng tôi đã lựa chọn Weka như là một công cụ để phát triển ứng dụng cho đề tài này. II. Tiền xữ lý dữ liệu Bước tiếp theo là thu thập, phân tích và tiền xữ lý dữ liệu cho cả hai tình huống CTU và AIT. Đối với CTU, nghiên cứu này đã thu thập 20,492 mẫu tin của các sinh viên tốt nghiệp từ năm 1995 đến Đối với AIT, có 936 mẫu tin được thu thập ở các sinh viên tốt nghiệp từ năm 2003 đến Hình 1 dưới đây trình bày sự phân phối dữ liệu của thuộc tính mà đề tài cần dự đoán: Điểm GPA ở cuối năm thứ 3 của sinh viên đại học ở CTU, và GPA ở cuối năm thứ nhất của sinh viên sau đại học ở AIT. Các màu {,,, } trong hình tương ứng đại diện cho các kết quả {Fail, Fair,, }. CTU AIT Hình 1 PHÂN PHỐI DỮ LIỆU ĐIỂM GPA - CTU (TRÁI) VÀ AIT (PHẢI) Trong giai đoạn tiền xữ lý dữ liệu, đề tài đã lựa chọn các thuộc tính có liên quan đến công việc dự đoán dựa trên dữ liệu thu thập được từ các Phòng đào tạo, kết hợp giá trị của các thuộc tính thành các nhóm có nghĩa và dẫn xuất ra các thuộc tính mới. Bảng I và II trình bày tóm tắt các thuộc tính cần dùng để dự đoán cho trường hợp CTU và AIT, giá trị tương ứng của từng thuộc tính và độ lợi thông tin (Information ) trên mỗi thuộc tính. Dựa trên độ lợi thông tin, ta có thể xác định sơ bộ thuộc tính nào ảnh hưởng nhiều nhất trong dự đoán/phân loại kết quả (classification) khi áp dụng giải thuật Cây quyết định. Đối với tập dữ liệu của CTU trong bảng I, hai thuộc tính có độ lợi thông tin cao nhất và ảnh hưởng nhiều nhất đến kết quả dự đoán là điểm trung bình tích lũy ở cuối năm thứ 2 (CGPA2) và trình độ Anh văn (English Skill). Từ phân phối dữ liệu của thuộc tính English Skill, ta có thể suy luận được rằng nếu sinh viên có ngoại ngữ tốt thì kết quả học tập cũng sẽ tốt hơn - có thể do họ có khả năng đọc thêm các tài liệu chuyên ngành hoặc có khả năng tìm kiếm thông tin từ một thư viện khổng lồ - Internet. Đối với tập dữ liệu của AIT trong bảng II, thuộc tính có độ lợi thông tin cao nhất là Xếp hạng các Trường, Viện đầu vào (Institute Rank), đây là một thuộc tính dẫn xuất, sẽ được mô tả chi tiết phía sau. Một thách thức lớn trong khi tiền xữ lý dữ liệu cho trường hợp của AIT là làm thế nào để so sánh điểm GPA đầu vào của các sinh viên từ 329 trường, viện đại học khác nhau của hơn 40 quốc gia trên thế giới (các số này thống kê từ tập dữ liệu mà đề tài thu thập được). Hai vấn đề quan trọng cần giải quyết ở đây là: Thứ nhất, ở mỗi trường khác nhau có thang điểm khác nhau (ví dụ: thang điểm [0-10], [1-5], [0-100], [0-4], ), những thang điểm này cần được chuyển về một thang điểm thống nhất (cụ thể là thang điểm [0-4], thường được sử dụng ở các trường quốc tế). Vấn đề thứ hai khó giải quyết hơn đó là mỗi trường có tiêu chí đánh giá kết quả khác nhau do vậy rất khó khăn để xác định GPA đầu vào của sinh viên ở trường nào là tốt hơn. Chẳng hạn, điểm GPA ở một số trường rất cao còn một số trường khác thì khá thấp, tuy nhiên năng lực thật sự của sinh viên thì không hề thua kém. Bảng I CTU Attributes, Information, and Relative Contribution # Attribute # Val Values Info Rel 1 CGPA Year2 4 {Fail, Fair,, } {A, B, C, N} English Skill Field of Study 18 {Accounting- Finance, } Faculty 7 {Agriculture, } Gender 2 {M, F} Entry Mark Range 4 { , , , } Age Range 4 {15-17, 18, 19, 20-40} Policy Priority 2 {Yes, No} Area Priority 2 {Yes, No} Institute Rank 10 {1, 2,, 10} {AnGiang, BenTre, CaMau- BL, CanTho, DongThap, HauGiang, KienGiang, SocTrang, TienGiang, 11 Province 11 VinhLong, Others} Family Job 7 {Aquaculture, Business, Employee, Farmer, Gardener, Worker, Others} Ethnic 2 {KINH, OTHERS} Religion 2 {No, Yes} Bảng II AIT Attributes, Information, and Relative Contribution # Attribute # Val Values Info Rel Institute Rank 10 {1, 2,, 10} {Bangladesh, Cambodia, India, Indonesia, Laos, Myanmar, Nepal, Pakistan, PRChina, SriLanka, 2 Country 13 Thailand, Vietnam, Others} Entry GPA 4 { , , } English 4 Proficiency 4 {TOEFL, Certificate, Other, No Donor 8 scholarship providers Current FOS 10 {ICT group,, Others} Previous FOS 8 {IT group,, Others} Current School 3 {Engineering, Resources and Development, Management} Fund {Fellowship, Scholarship, 9 Category 4 Self-Support, Others} Marital Status 2 {Married, Single} Gross National 11 Income 3 {Lower, Middle, Upper} {20-24, 25-26, 27-30, Age Range 4 50} Gender 2 {M, F} TOEFL 3 { , 551, 590, } 2

3 Trong tập dữ liệu của AIT mà nghiên cứu này sử dụng, các sinh viên đến từ hơn 329 trường khác nhau, do đó thuộc tính Đến từ trường đại học phải được số hóa và chia thành các khoảng (cụ thể là 10 khoảng với các giá trị từ 1 đến 10). Sau khi đã thử nghiệm trên nhiều phương pháp khác nhau, nghiên cứu này đã sử dụng cách xếp hạng cho các trường đầu vào (trường đầu vào là nơi sinh viên đã tốt nghiệp trước khi đến AIT). Trước hết giả định rằng điểm GPA mà các sinh viên đã tốt nghiệp tại AIT có giá trị ngang với điểm GPA mà họ đã tốt nghiệp từ trường họ đã học trước khi đến AIT. Kế tiếp, chúng tôi sẽ tìm ra độ lệch trung bình giữa GPA của các sinh tốt nghiệp tại AIT và trường trước đây của họ theo công thức: Diff Institute = AVG Institute (GPA Graduation GPA Entry ) (1) Sau đó sẽ tạo ra thuộc tính xếp hạng cho các trường bằng cách chuẩn hóa độ lệch này về các giá trị từ 1 đến 10. Giá trị càng lớn là độ lệch càng cao, điều đó có nghĩa là sinh viên ở các trường này sẽ có năng lực tương đối tốt hơn. Biểu đồ phân phối dữ liệu của thuộc tính Institute Rank cho CTU và AIT được trình bày trong hình 2. Các màu sắc thể hiện cho các kết quả tương ứng như trong hình 1. Chẳng hạn, màu xanh dương biểu diễn cho các sinh viên có kết quả Fail, màu đỏ biểu diễn cho các sinh viên Fair,... (Cần lưu ý rằng việc xếp hạng này chỉ là cách số hóa các trường để tiện lợi cho dữ liệu đầu vào, đồng thời cũng phản ánh cho các chính sách điểm khác nhau chứ không phải là chất lượng đào tạo từ các trường) lượng sinh viên nhiều nhất ở khoảng điểm 3.0) thì độ chính xác của mô hình là Cách thứ hai là chia thuộc tính điểm GPA này thành 4 nhóm {Fail, Fair,, } (tương ứng với {C, C+, B, B+/A} hoặc { , [ , [ , [ }) thì độ chính xác có phần giảm đi. Giải pháp thứ 3 là ghép các sinh viên có GPA từ thành một nhóm, kết quả có cải thiện chút ít nhưng vẫn thấp hơn giá trị GPA liên tục. Giải pháp thứ 4 là chia điểm GPA ở mức 3.3 thay vì 3.5 thì độ chính xác tăng 1.3 so với sử dụng giá trị liên tục. Bảng III Tuning the values of the Entry GPA attribute for the AIT Solution Continuous [ ] { Fail, Fair,, } { Warning,, } { , , } Data Distribution Correct - 4 classes CTU AIT Hình 2 PHÂN PHỐI DỮ LIỆU XẾP HẠNG CÁC TRƯỜNG, VIỆN Từ bảng II ta thấy rằng, thuộc tính dẫn xuất Institute Rank có độ lợi thông tin cao nhất trong trường hợp của AIT (gấp 2.5 lần thuộc tính Entry GPA). III. Mô hình hóa công việc dự đoán Bước kế tiếp trong vấn đề dự đoán của đề tài là xây dựng và đánh giá các mô hình. Giải thuật Decision Tree và Bayesian Network được cung cấp trong công cụ Weka đã được sử dụng cho việc mô hình hóa. Từ những mô hình này, đề tài đã từng bước điều chỉnh giá trị của các thuộc tính đầu vào bằng cách chuyển thành kiểu số hoặc chia thành nhiều đoạn và đánh giá sự thay đổi của độ chính xác trong kết quả. Trong một số trường hợp, cách làm này cải thiện độ chính xác một cách đáng kể. Chẳng hạn, đề tài đã thử nghiệm trên thuộc tính điểm GPA đầu vào (Entry GPA) như trong bảng III. Ở dòng thứ nhất của bảng III, nếu ta chọn điểm GPA đầu vào là kiểu số (liên tục từ 2.0 đến 4.0; số Nghiên cứu này đã phân tích trên từng thuộc tính theo cách tương tự như trên để xác định những giá trị nào của mỗi thuộc tính sẽ cho độ chính xác tốt nhất cho mô hình. Một số thuộc tính sau khi điều chỉnh có cải thiện tương đối như trong trường hợp của CTU (<1) gồm Religion, Entry Mark, Area Priority, Policy Priority. Từ sự phân phối dữ liệu của thuộc tính Entry Mark chúng ta sẽ dễ dàng nhận ra rằng nếu điểm thi tuyển đầu vào càng cao thì kết quả học tập của sinh viên càng tốt. Kết quả cuối cùng của các giá trị trên từng thuộc tính được trình bày trong bảng I và bảng II. IV. Điều chỉnh các tham số của giải thuật Đề tài cũng đã so sánh độ chính xác trên ba giải thuật phân loại/dự đóan được cung cấp trong Weka: Giải thuật J48-Decision Tree, M5P-Model Tree, và BayesNet-Bayesian Network. Trong phần này chúng ta sẽ tìm hiểu các tham số quan trọng trên từng giải thuật mà đề tài đã sử dụng. Giải thuật J48-Decision Tree trong Weka được cung cấp ở lớp Java có tên weka.classifiers.trees. J48. Giải thuật này sinh ra cây cắt (pruned) hoặc không cắt (un-pruned) C4.5 Decision Tree, và có 3 tham số quan trọng (xem bảng IV): 3

4 confidencefactor: Nhân tố sử dụng cho việc cắt tỉa (Nếu giá trị này càng nhỏ thì cây sinh ra sẽ được cắt càng nhiều) minnumobj: Số thể hiện (instances) tối thiểu trên một nút lá trong cây. Unpruned: Nếu là True thì cây sinh ra sẽ được cắt tỉa và ngược lại. Bảng IV Parameter Values for the Decision Tree Predicted Values: GPA Classes 4: {Fail, Fair,, } 3: {Fail,, } 2: {Fail, Pass} Parameters CTU AIT confidencefactor MinNumObj 2 3 Unpruned False False confidencefactor MinNumObj 2 3 Unpruned False False confidencefactor MinNumObj 2 7 Unpruned False True Giải thuật M5P- Model Tree trong WEKA được cung cấp ở lớp Java weka.classifiers.trees.m5p gồm có hai tham số chính (xem bảng V): buildregressiontree: Nếu tham số này là True thì sẽ xây dựng Regression Tree, ngược lại là Model Tree. minnuminstances: Số thể hiện tối thiểu trên một nút lá. Bảng V Parameter Values for the Model Tree Predicted Values: GPA Classes Numeric Parameters CTU AIT BuildRegressionTree False MinNumInstances 4 Giải thuật Bayesian Network trong Weka được cung cấp ở lớp Java weka.classifiers.bayes.bayes Net, và có hai tham số chính (xem bảng VI): Estimator: Sử dụng cho việc tìm bảng phân phối xác suất, nó ước lượng xác suất trực tiếp từ dữ liệu vào. SearchAlgorithm: Sử dụng để tìm cấu trúc cho mạng Bayes. Bảng VI Parameter Values for the Bayesian Network Predicted Values: GPA Classes 4, 3, and 2 Estimator Parameters CTU AIT SearchAlgorithm KẾT QUẢ VÀ PHÂN TÍCH SimpleEstimator HillClimbing Trong bảng VII sẽ so sánh độ chính xác của kết quả dự đoán cho tình huống của CTU và AIT khi sử dụng giải thuật Decision Tree (DT) và Bayesian Network (BN). Bảng VIII đến bảng XII trình bày kết quả chi tiết cho giải thuật Decision Tree trong dự đoán điểm GPA khi chia thành 4, 3, và 2 lớp. Trong trường hợp của CTU đề tài đã dự đoán GPA của sinh viên đại học ở cuối năm thứ 3, và dự đóan GPA ở cuối năm thứ nhất của sinh viên sau đại học ở AIT. Độ chính xác khi dự đoán được đánh giá bởi phương pháp kiểm tra chéo với 10 đường (Cross-Validation with 10-folds). Các kết quả của CTU và AIT từ bảng VII đến bảng XII được thử nghiệm trên cả dữ liệu ban đầu (original data) lẫn dữ liệu khi tái lấy mẫu (re-sampling data). Bảng VII Comparison of GPA Prediction Results for CTU and AIT Algo CTU (20,492 records) AIT (936 records) Accuracy Accuracy Accuracy Accuracy Original Resampled Original Resampled Data Data Data Data Predicted GPA Classes 4 classes: {Fail, Fair,, } 3 classes: {Fail,, } DT BN DT BN DT classes: {Fail, Pass} BN Kết quả tóm tắt trong bảng VII đã cho thấy rằng khi dự đoán trên tập dữ liệu của CTU cho độ chính xác tốt hơn trên tập dữ liệu của AIT do số lượng mẫu tin của CTU đầy đủ hơn và nhiều hơn. Bên cạnh đó, từ bảng phân tích này cũng đã cho ta thấy giải thuật Decision Tree cho kết quả tốt hơn giải thuật Bayesian Network (chẳng hạn, đến 12 trong trường hợp dự đoán 4 lớp GPA). Bảng VIII Decision Tree Confusion Matrix, CTU Case Study, 4 Classes Class Fail Fair Predicted Class (CTU) Fail Fair Fail Fair Hit Bảng IX Decision Tree Confusion Matrix, AIT Case Study, 4 Classes Predicted Class (AIT) Class Fail Fair Fail Fair Fail Fair Hit

5 Bảng X Decision Tree Confusion Matrix, CTU Case Study, 3 Classes Class Fail Predicted Class (CTU) Fail Fail Hit Bảng XI Decision Tree Confusion Matrix, AIT Case Study, 3 Classes Class Fail Predicted Class (AIT) Fail Fail Hit Bảng XII Decision Tree Confusion Matrix, CTU and AIT Cases, 2 Classes CTU Data Predicted Class AIT Data Original Re-Sampled Original Re-Sampled Class Fail Pass Fail Pass Fail Pass Fail Pass Fail Pass Hit II. Phân tích các Confusion Matrix Các Confusion Matrix trong dự đoán 4, 3, và 2 lớp (bảng VIII đến XII) cho thấy những thay đổi trong phân phối của các giá trị thực và giá trị dự đoán cho cả dữ liệu ban đầu lẫn dữ liệu tái lấy mẫu. Độ chính xác khi dự đoán trên dữ liệu tái lấy mẫu cải thiện đáng kể đối với những tập dữ liệu có kích thước nhỏ của các lớp ít (minority classes. Xem hình 1 để thấy rõ phân phối dữ liệu thực của các lớp cần dự đoán). Chẳng hạn, trong trường hợp của CTU, độ chính xác khi dự đoán các sinh viên có kết quả Fail tăng từ 34 lên 55 nếu sử dụng resampling (bảng VIII), và từ 0 lên 22 trong trường hợp của AIT (bảng IX) bằng giải thuật Decision Tree. Tương tự, độ chính xác khi dự đoán các sinh viên Fail khi dùng 2 lớp GPA tăng từ 30 lên 64 cho CTU và 2 lên 47 cho AIT (bảng XII). Như vậy, việc dự đoán GPA với 3 lớp thì độ chính xác của toàn bộ mô hình cao hơn so với dự đoán 4 lớp (như trong bảng VII) nhưng thấp hơn khi dự đoán 2 lớp. Khi dự đoán các sinh viên có kết quả Fail, độ chính xác cao nhất thuộc về trường hợp dự đoán 2 lớp ở cả 2 tập dữ liệu (CTU: 64; AIT: 47, bảng XII). Còn khi dự đoán các sinh viên có kết quả thì độ chính xác cao nhất thuộc về trường hợp dự đoán 4 lớp. (CTU: 58 và AIT: 82, bảng VIII, IX). Bảng XIII Phân tích ROC (Receiver Operating Characteristic), 4 Classes CTU Data AIT Data I. Tái lấy mẫu (Re-sampling) Các Confusion Matrix ở các bảng từ VIII đến XII, ta thấy rằng sự phân phối dữ liệu trên thuộc tính cần dự đoán không được cân bằng (imbalance dataset), do đó độ chính xác ở các lớp có giá trị ít hơn (minority classes) sẽ thấp hơn ở các lớp nhiều (majority classes). Chẳng hạn, số lượng sinh viên thuộc lớp Fail trong tập dữ liệu của CTU (bảng VIII, mục ) nhỏ hơn 6 lần so với số sinh viên trong lớp, và độ chính xác cho 2 lớp này tương ứng là 34 và 79. Kết quả đã cho thấy độ chính xác khi dự đoán cho lớp có giá trị nhỏ hơn thì luôn thấp hơn trên cả hai tập dữ liệu mà đề tài thực hiện. Để cải thiện vấn đề này, đề tài đã sử dụng chức năng resample được cung cấp trong Weka. Tính năng này sẽ nâng giá trị của lớp ít (oversample- minority classes) lên nhiều hơn, và giảm giá trị của lớp nhiều (undersample- majority classes) để làm cho tập dữ liệu cân bằng hơn. Bảng VII trình bày độ chính xác khi huấn luyện mô hình trên tập dữ liệu ban đầu và tập dữ liệu sau khi resample. Việc dự đoán sử dụng tái lấy mẫu trên tập dữ liệu đã giúp cho độ chính xác phần nào được cải thiện. Fail AUC = 0.90 AUC = 0.85 AUC = 0.88 AUC = 0.70 Bảng XIII trình bày các giá trị AUC (Area Under the ROC Curve) khi dự đoán cho 4 lớp kết quả GPA. Từ các giá trị AUC trên, ta thấy rằng khi dự đoán các sinh viên có kết quả cho cả 2 tình huống và kết quả Fail cho tình huống của CTU là rất tốt (>0.85). Riêng trường hợp dự đoán Fail cho các sinh viên của AIT thì chỉ ở mức khá và cần phải được cải thiện thêm (do tập dữ liệu thực là quá ít, chỉ có 21 sinh viên thuộc lớp này). Những kết quả dự đoán khá tin cậy trong đề tài này sẽ góp phần quan trọng để hỗ trợ cho những người ra quyết định ở các trường sau đại học trong việc phân phối ngân sách học bổng cho các ứng viên khi đăng ký vào trường của họ. 5

6 SO SÁNH VỚI NHỮNG NGHIÊN CỨU LIÊN QUAN Khai phá dữ liệu đã được ứng dụng cho nhiều mục đích khác nhau trong giáo dục đào tạo. Delavari [6] đã trình bày một mô hình trong đó có nhiều câu hỏi nghiên cứu ở các lĩnh vực khác nhau và các kỹ thuật khai phá dữ liệu tương ứng với từng loại câu hỏi khi áp dụng trong giáo dục đào tạo. Chẳng hạn, [6] đã trình bày các vấn đề như dự đoán năng lực của sinh viên, phân cụm những sinh viên có đặc điểm giống nhau, mối quan hệ giữa từng loại sinh viên với các môn học, Luan [5] cũng đã trình bày một nghiên cứu trong việc phân cụm các sinh viên có các đặc điểm giống nhau ( self starters và high interaction ). Đề tài này cũng đã so sánh với hai nghiên cứu khác trong lĩnh vực dự đoán năng lực của sinh viên [7,8] như trong bảng XIV. Tập dữ liệu mà đề tài này đã sử dụng lớn hơn tập dữ liệu ở hai nghiên cứu trước. Kết quả dự đoán trên 3 lớp cũng chính xác hơn nghiên cứu [8] trong trường hợp của AIT. Trong trường hợp của CTU thì kết quả cao hơn [8] khoảng 14. Khi dự đoán GPA 2 lớp, [8] tốt hơn đề tài này 3-4. Tuy nhiên, việc so sánh này chỉ là tương đối (do ngữ cảnh ứng dụng, tập dữ liệu và số thuộc tính khác nhau) để giúp chúng ta có một cái nhìn chung khi ứng dụng khai phá dữ liệu vào lĩnh vực dự đoán kết quả học tập của sinh viên. Bảng XIV Comparison with Related Work Criteria Prediction Problem Student type This Research Previous Research CTU AIT [7] [8] Mathematics Final grade of Student GPA / English Physics course performance Undergraduate Graduate High School Undergraduate Data set 20, Number of attributes Predict attribute values 4-classes (Fail, Fair,, ), 3-classes (Fail,, ), 2-classes (Fail, Pass), Numeric GPA Decision Tree/Model Tree 3-classes (Below, Satisfactory, Above) Bayesian Network 9-classes (0.0,..,4.0) 3-classes (High, Middle, Low) 2-classes (Fail, Pass) Genetic Algorithm Techniques Accuracy percentage (9-classes) (4-classes) (3-classes) (2-classes) System type Web-based Application Application Platform Weka BNJ, Weka MATLAB THẢO LUẬN VÀ KẾT LUẬN Dự đoán kết quả học tập của sinh viên rất hữu ích trong nhiều ngữ cảnh. Trong công việc tuyển chọn ứng viên đầu vào ở các trường sau đại học, dự đoán này có thể dùng để xác định các sinh viên xuất sắc để tài trợ những suất học bổng toàn phần hoặc bán phần tùy theo năng lực của họ, cũng như việc xác định những sinh viên không có khả năng tốt nghiệp. Công việc này thật sự khó khăn khi dự đoán kết quả của các sinh viên quốc tế do họ đến từ nhiều trường đại học với những nền tảng kiến thức và hệ thống đánh giá kết quả (GPA) khác nhau. Độ chính xác cho toàn bộ mô hình trong dự đoán kết quả (khi chia GPA thành 3 lớp) của nghiên cứu này là 86 cho CTU và 74 cho AIT. Trong dự đoán các sinh viên xuất sắc (vd: B+/A) để cấp học bổng ở AIT thì độ chính xác đạt được là 82, và xác định các sinh viên có kết quả yếu kém là 47. Do đó trong khi việc dự đoán là tin cậy được trong trường hợp xác định các sinh viên xuất sắc thì nghiên cứu này cũng cần phải tiếp tục trong trường hợp xác định các sinh viên có kết quả thấp. Đề tài này đã được xây dựng và triển khai như một ứng dụng web cho các sinh viên và giáo viên ở AIT sử dụng. Mặc dù Weka là một ứng dụng desktop nên không hỗ trợ khi thực thi trên web, tuy nhiên đây là một ứng dụng mã nguồn mở, do đó chúng ta hoàn toàn có thể trích ra những lớp Java cần thiết của nó để tạo một ứng dụng khai phá dữ liệu cho riêng mình khi vận hành trên nền web. LỜI CẢM ƠN Nghiên cứu này xây dựng dựa trên một phần của luận văn tốt nghiệp Thạc sĩ ngành Quản lý thông tin của tác giả thứ nhất, được tài trợ bởi chương trình học bổng ngân sách Nhà Nước (Đề án 322) của Bộ giáo dục và Đào tạo Việt Nam. TÀI LIỆU THAM KHẢO [1] Weka, University of Waikato, New Zealand, [2] Collier, K., Carey, B., Sautter, D., and Marjaniemi, C., A methodology for evaluating and selecting data mining software, in Proceedings of the 32nd Annual Hawaii International Conference on System Sciences, IEEE, [3] Orange, University of Ljubljana, Slovenia, [4] Yale, Rapid-I, [5] Luan, J., Zhao, C.-M., and Hayek, J., Exploring a new frontier in higher education research: A case study analysis of using data mining techniques to create NSSE institutional typology, Paper presented at the California Association for Institutional Research, Anaheim, California, November 17-19, [6] Delavari N. & Beikzadeh M. R & Shirazi M. R. A., A New Model for Using Data Mining in Higher Educational System, in Proceedings of 5th International Conference on Information Technology Based Higher Education and Training (ITHET), Istanbul, Turkey, May 31 to June 2, [7] Bekele, R. and Menzel, W., A Bayesian approach to predict performance of a student (BAPPS): A case with Ethiopian students, in Proceedings of the International Conference on Artificial Intelligence and Applications (AIA-2005), Vienna, Austria, [8] Minaei-Bidgoli, B., Kashy, D. A., Kortemeyer, G., and Punch, W. F, Predicting student performance: an application of data mining methods with an educational web-based system, in Proceedings of 33rd Annual Conference on Frontiers in Education (FIE 2003), volume 1, 2003, pages

TRƯỜNG ĐẠI HỌC XÂY DỰNG KHOA CÔNG NGHỆ THÔNG TIN GIÁO TRÌNH PHẦN III NGÔN NGỮ LẬP TRÌNH PASCAL -2

TRƯỜNG ĐẠI HỌC XÂY DỰNG KHOA CÔNG NGHỆ THÔNG TIN GIÁO TRÌNH PHẦN III NGÔN NGỮ LẬP TRÌNH PASCAL -2 TRƯỜNG ĐẠI HỌC XÂY DỰNG KHOA CÔNG NGHỆ THÔNG TIN ------------ ------------ GIÁO TRÌNH MÔN HỌC: NHẬP MÔN TIN HỌC PHẦN III NGÔN NGỮ LẬP TRÌNH PASCAL -2 Giảng viên: ĐÀO TĂNG KIỆM Bộ môn : TIN HỌC XÂY DỰNG

More information

PHƯƠNG PHÁP SIXFRAME

PHƯƠNG PHÁP SIXFRAME TIN SINH HỌC ĐẠI CƯƠNG (Introduction to Bioinformatics) PGS.TS. Trần Văn Lăng Email: langtv@vast.vn Chương 4: PHÂN TÍCH TRÌNH TỰ DNA Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY

More information

Higher Education Accreditation in Vietnam and the U.S.: In Pursuit of Quality

Higher Education Accreditation in Vietnam and the U.S.: In Pursuit of Quality Higher Education Accreditation in Vietnam and the U.S.: In Pursuit of Quality OLIVER, Diane E. Texas Tech University NGUYEN, Kim Dung Center for Higher Education Research and Accreditation, Institute for

More information

HIGHER EDUCATION IN VIETNAM UPDATE MAY 2004

HIGHER EDUCATION IN VIETNAM UPDATE MAY 2004 HIGHER EDUCATION IN VIETNAM UPDATE MAY 2004 PREPARED BY IIE VIETNAM Institute of International Education Tung Shing Square 2 Ngo Quyen, Suite 505 Hanoi, Vietnam Tel: (84-4) 935-0412 Fax: (84-4) 935-0418

More information

Double Master Degrees in International Economics and Development

Double Master Degrees in International Economics and Development Double Master Degrees in International Economics and Development I. Recruitment condition The admissions procedure is open to all students who meet the following conditions: - Condition of diploma: + Candidates

More information

Developing Autonomy in an East Asian Classroom: from Policy to Practice

Developing Autonomy in an East Asian Classroom: from Policy to Practice DOI: 10.7763/IPEDR. 2013. V68. 2 Developing Autonomy in an East Asian Classroom: from Policy to Practice Thao Thi Thanh PHAN Thanhdo University Hanoi Vietnam Queensland University of Technology Brisbane

More information

Curriculum Vitae. Jonathan D. London. Assistant Professor of Sociology, City University of Hong Kong, January 2008-

Curriculum Vitae. Jonathan D. London. Assistant Professor of Sociology, City University of Hong Kong, January 2008- Curriculum Vitae Jonathan D. London Present Appointments Assistant Professor of Sociology, City University of Hong Kong, January 2008- Programme Leader, MSc Development Studies, City University of Hong

More information

Building a Semantic Role Labelling System for Vietnamese

Building a Semantic Role Labelling System for Vietnamese Building a emantic Role Labelling ystem for Vietnamese Thai-Hoang Pham FPT University hoangpt@fpt.edu.vn Xuan-Khoai Pham FPT University khoaipxse02933@fpt.edu.vn Phuong Le-Hong Hanoi University of cience

More information

OF CHILDREN WITH DISABILITIES

OF CHILDREN WITH DISABILITIES MINNISTRY OF EDUCATION AND TRAINING READINESS FOR EDUCATION OF CHILDREN WITH DISABILITIES IN EIGHT PROVINCES OF VIET NAM 2015 REPORT READINESS FOR EDUCATION OF CHILDREN WITH DISABILITIES IN EIGHT PROVINCES

More information

CATALOG. Educating Tomorrow s Missionaries. A Roman Catholic College Seminary owned and operated by the Society of the Divine Word

CATALOG. Educating Tomorrow s Missionaries. A Roman Catholic College Seminary owned and operated by the Society of the Divine Word 2010-20130 CATALOG Educating Tomorrow s Missionaries A Roman Catholic College Seminary owned and operated by the Society of the Divine Word Updated July, 2011 EPWORTH, IOWA 52045-0380 Divine Word College

More information

TOEIC LC 1000: A? (Korean Edition)

TOEIC LC 1000: A? (Korean Edition) TOEIC LC 1000: A? (Korean Edition) If you are searching for the ebook TOEIC LC 1000: A? (Korean edition) in pdf form, then you've come to right site. We furnish the utter variation of this book in PDF,

More information

The 9 th International Scientific Conference elearning and software for Education Bucharest, April 25-26, / X

The 9 th International Scientific Conference elearning and software for Education Bucharest, April 25-26, / X The 9 th International Scientific Conference elearning and software for Education Bucharest, April 25-26, 2013 10.12753/2066-026X-13-154 DATA MINING SOLUTIONS FOR DETERMINING STUDENT'S PROFILE Adela BÂRA,

More information

James H. Williams, Ed.D. CICE, Hiroshima University George Washington University August 2, 2012

James H. Williams, Ed.D. CICE, Hiroshima University George Washington University August 2, 2012 James H. Williams, Ed.D. jhw@gwu.edu CICE, Hiroshima University George Washington University August 2, 2012 Very poor country, but rapidly growing economy Access has improved, especially at primary Lower

More information

Jack Jilly can play. 1. Can Jack play? 2. Can Jilly play? 3. Jack can play. 4. Jilly can play. 5. Play, Jack, play! 6. Play, Jilly, play!

Jack Jilly can play. 1. Can Jack play? 2. Can Jilly play? 3. Jack can play. 4. Jilly can play. 5. Play, Jack, play! 6. Play, Jilly, play! Dr. Cupp Readers & Journal Writers Name Date Page A. Fluency and Comprehension New Sight Words Students should practice reading pages -. These pages contain words that they should automatically recognize,

More information

Learning From the Past with Experiment Databases

Learning From the Past with Experiment Databases Learning From the Past with Experiment Databases Joaquin Vanschoren 1, Bernhard Pfahringer 2, and Geoff Holmes 2 1 Computer Science Dept., K.U.Leuven, Leuven, Belgium 2 Computer Science Dept., University

More information

Rule Learning With Negation: Issues Regarding Effectiveness

Rule Learning With Negation: Issues Regarding Effectiveness Rule Learning With Negation: Issues Regarding Effectiveness S. Chua, F. Coenen, G. Malcolm University of Liverpool Department of Computer Science, Ashton Building, Ashton Street, L69 3BX Liverpool, United

More information

Rotary Club of Portsmouth

Rotary Club of Portsmouth Rotary Club of Portsmouth Scholarship Application Each year the Rotary Club of Portsmouth seeks scholarship applications from high school seniors scheduled to graduate who will be attending a post secondary

More information

CS Machine Learning

CS Machine Learning CS 478 - Machine Learning Projects Data Representation Basic testing and evaluation schemes CS 478 Data and Testing 1 Programming Issues l Program in any platform you want l Realize that you will be doing

More information

Knowledge-Based - Systems

Knowledge-Based - Systems Knowledge-Based - Systems ; Rajendra Arvind Akerkar Chairman, Technomathematics Research Foundation and Senior Researcher, Western Norway Research institute Priti Srinivas Sajja Sardar Patel University

More information

College of Agriculture and Life Sciences Catalog Submitted November 12, 2012 to FSCC

College of Agriculture and Life Sciences Catalog Submitted November 12, 2012 to FSCC S12-7 Page 1 of 5 College of Agriculture and Life Sciences 2013-2014 Catalog Submitted November 12, 2012 to FSCC I. SIGNIFICANT TRENDS: Enrollment in the College of Agriculture and Life Sciences hit an

More information

Malicious User Suppression for Cooperative Spectrum Sensing in Cognitive Radio Networks using Dixon s Outlier Detection Method

Malicious User Suppression for Cooperative Spectrum Sensing in Cognitive Radio Networks using Dixon s Outlier Detection Method Malicious User Suppression for Cooperative Spectrum Sensing in Cognitive Radio Networks using Dixon s Outlier Detection Method Sanket S. Kalamkar and Adrish Banerjee Department of Electrical Engineering

More information

Regional Training of Facilitators

Regional Training of Facilitators Regional Training of Facilitators Strengthening Forest Tenure Systems and Governance Training Report Report prepared by Reymondo Caraan TABLE OF CONTENTS 1. INTRODUCTION 1 2. OBJECTIVES 2 3. COMPOSITION

More information

Machine Learning from Garden Path Sentences: The Application of Computational Linguistics

Machine Learning from Garden Path Sentences: The Application of Computational Linguistics Machine Learning from Garden Path Sentences: The Application of Computational Linguistics http://dx.doi.org/10.3991/ijet.v9i6.4109 J.L. Du 1, P.F. Yu 1 and M.L. Li 2 1 Guangdong University of Foreign Studies,

More information

Santiago Canyon College 8045 East Chapman Avenue, Orange, CA AGENDA CURRICULUM AND INSTRUCTION COUNCIL Monday, October 30, :30pm B-104

Santiago Canyon College 8045 East Chapman Avenue, Orange, CA AGENDA CURRICULUM AND INSTRUCTION COUNCIL Monday, October 30, :30pm B-104 RANCHO SANTIAGO COMMUNITY COLLEGE DISTRICT Santiago Canyon College 8045 East Chapman Avenue, Orange, CA 92869 AGENDA CURRICULUM AND INSTRUCTION COUNCIL Monday, October 30, 2017 1:30pm B-104 I. APPROVAL

More information

Applications of data mining algorithms to analysis of medical data

Applications of data mining algorithms to analysis of medical data Master Thesis Software Engineering Thesis no: MSE-2007:20 August 2007 Applications of data mining algorithms to analysis of medical data Dariusz Matyja School of Engineering Blekinge Institute of Technology

More information

Southern Wesleyan University 2017 Winter Graduation Exercises Information for Graduates and Guests (Updated 09/14/2017)

Southern Wesleyan University 2017 Winter Graduation Exercises Information for Graduates and Guests (Updated 09/14/2017) I. Ceremonies II. Graduation Timeline III. Graduation Day Schedule IV. Academic Regalia V. Alumni Receptions VI. Applause VII. Applications VIII. Appropriate Attire for Graduates IX. Baccalaureate X. Cameras,

More information

Reducing Features to Improve Bug Prediction

Reducing Features to Improve Bug Prediction Reducing Features to Improve Bug Prediction Shivkumar Shivaji, E. James Whitehead, Jr., Ram Akella University of California Santa Cruz {shiv,ejw,ram}@soe.ucsc.edu Sunghun Kim Hong Kong University of Science

More information

TABLE OF CONTENTS TABLE OF CONTENTS COVER PAGE HALAMAN PENGESAHAN PERNYATAAN NASKAH SOAL TUGAS AKHIR ACKNOWLEDGEMENT FOREWORD

TABLE OF CONTENTS TABLE OF CONTENTS COVER PAGE HALAMAN PENGESAHAN PERNYATAAN NASKAH SOAL TUGAS AKHIR ACKNOWLEDGEMENT FOREWORD TABLE OF CONTENTS TABLE OF CONTENTS COVER PAGE HALAMAN PENGESAHAN PERNYATAAN NASKAH SOAL TUGAS AKHIR ACKNOWLEDGEMENT FOREWORD TABLE OF CONTENTS LIST OF FIGURES LIST OF TABLES LIST OF APPENDICES LIST OF

More information

REGIONAL CAPACITY BUILDING ON ICT FOR DEVELOPMENT

REGIONAL CAPACITY BUILDING ON ICT FOR DEVELOPMENT REGIONAL CAPACITY BUILDING ON ICT FOR DEVELOPMENT Item 5 Fourth Session of the Committee on ICT 15 October 2014 Bangkok, Thailand Hyeun-Suk Rhee, Ph.D. Director United Nations APCICT-ESCAP REGIONAL CAPACITY

More information

Setting the Scene and Getting Inspired

Setting the Scene and Getting Inspired Setting the Scene and Getting Inspired Inclusive Education and Schools Sheldon Shaeffer Save the Children Learning Event Inclusive Education: From Theoretical Concept to Effective Practice Bangkok, Thailand

More information

Why Is the Chinese Curriculum Difficult for Immigrants Children from Southeast Asia

Why Is the Chinese Curriculum Difficult for Immigrants Children from Southeast Asia Why Is the Chinese Curriculum Difficult for Immigrants Children from Southeast Asia Chiu-Jung Chen 1,* 1 Department of E-Learning, Design and Management, National Chia-yi University, Taiwan *Correspondence:

More information

Cultural Diversity in English Language Teaching: Learners Voices

Cultural Diversity in English Language Teaching: Learners Voices English Language Teaching; Vol. 6, No. 4; 2013 ISSN 1916-4742 E-ISSN 1916-4750 Published by Canadian Center of Science and Education Cultural Diversity in English Language Teaching: Learners Voices 1 The

More information

Exemplar for Internal Achievement Standard French Level 1

Exemplar for Internal Achievement Standard French Level 1 Exemplar for internal assessment resource French for Achievement Standard 90882 Exemplar for Internal Achievement Standard French Level 1 This exemplar supports assessment against: Achievement Standard

More information

TEKS Correlations Proclamation 2017

TEKS Correlations Proclamation 2017 and Skills (TEKS): Material Correlations to the Texas Essential Knowledge and Skills (TEKS): Material Subject Course Publisher Program Title Program ISBN TEKS Coverage (%) Chapter 114. Texas Essential

More information

Regional Capacity-Building on ICT for Development Item 7 Third Session of Committee on ICT 21 November, 2012 Bangkok

Regional Capacity-Building on ICT for Development Item 7 Third Session of Committee on ICT 21 November, 2012 Bangkok Regional Capacity-Building on ICT for Development Item 7 Third Session of Committee on ICT 21 November, 2012 Bangkok Hyeun-Suk Rhee, Ph.D. Director United Nations APCICT-ESCAP Brief on APCICT APCICT :

More information

Welcome to. ECML/PKDD 2004 Community meeting

Welcome to. ECML/PKDD 2004 Community meeting Welcome to ECML/PKDD 2004 Community meeting A brief report from the program chairs Jean-Francois Boulicaut, INSA-Lyon, France Floriana Esposito, University of Bari, Italy Fosca Giannotti, ISTI-CNR, Pisa,

More information

Rule Learning with Negation: Issues Regarding Effectiveness

Rule Learning with Negation: Issues Regarding Effectiveness Rule Learning with Negation: Issues Regarding Effectiveness Stephanie Chua, Frans Coenen, and Grant Malcolm University of Liverpool Department of Computer Science, Ashton Building, Ashton Street, L69 3BX

More information

Introduction Research Teaching Cooperation Faculties. University of Oulu

Introduction Research Teaching Cooperation Faculties. University of Oulu University of Oulu Founded in 1958 faculties 1 000 students 2900 employees Total funding EUR 22 million Among the largest universities in Finland with an exceptionally wide scientific base Three universities

More information

5.7 Country case study: Vietnam

5.7 Country case study: Vietnam 5.7 Country case study: Vietnam Author Nguyen Xuan Hung, Secretary, Vietnam Pharmaceutical Association, xuanhung29@vnn.vn Summary Pharmacy workforce development has only taken place over the last two decades

More information

Overall student visa trends June 2017

Overall student visa trends June 2017 Overall student visa trends June 2017 Acronyms Acronyms FSV First-time student visas The number of visas issued to students for the first time. Visas for dependants and Section 61 applicants are excluded

More information

1. Share the following information with your partner. Spell each name to your partner. Change roles. One object in the classroom:

1. Share the following information with your partner. Spell each name to your partner. Change roles. One object in the classroom: French 1A Final Examination Study Guide January 2015 Montgomery County Public Schools Name: Before you begin working on the study guide, organize your notes and vocabulary lists from semester A. Refer

More information

Education: Setting the Stage. Abhijit V. Banerjee and Esther Duflo Lecture , Spring 2011

Education: Setting the Stage. Abhijit V. Banerjee and Esther Duflo Lecture , Spring 2011 Education: Setting the Stage Abhijit V. Banerjee and Esther Duflo Lecture 9 14.73, Spring 2011 1 Educating Yaprak The story of a kurdish girl who goes to boarding school after education is made compulsory

More information

STUDENTS SATISFACTION LEVEL TOWARDS THE GENERIC SKILLS APPLIED IN THE CO-CURRICULUM SUBJECT IN UNIVERSITI TEKNOLOGI MALAYSIA NUR HANI BT MOHAMED

STUDENTS SATISFACTION LEVEL TOWARDS THE GENERIC SKILLS APPLIED IN THE CO-CURRICULUM SUBJECT IN UNIVERSITI TEKNOLOGI MALAYSIA NUR HANI BT MOHAMED STUDENTS SATISFACTION LEVEL TOWARDS THE GENERIC SKILLS APPLIED IN THE CO-CURRICULUM SUBJECT IN UNIVERSITI TEKNOLOGI MALAYSIA NUR HANI BT MOHAMED AN ACADEMIC EXERCISE INPARTIAL FULFILMENT FOR THE DEGREE

More information

CFAN 3504 Vertebrate Research Design and Field Survey Techniques

CFAN 3504 Vertebrate Research Design and Field Survey Techniques Syllabus Thailand International Field Course: December 27 2016 / 15 January 2017 CFAN 3504 Vertebrate Research Design and Field Survey Techniques 1. COURSE DESCRIPTION This course provides participants

More information

Task-Based Language Teaching: An Insight into Teacher Practice

Task-Based Language Teaching: An Insight into Teacher Practice International Journal of Education, Culture and Society 2017; 2(4): 126-131 http://www.sciencepublishinggroup.com/j/ijecs doi: 10.11648/j.ijecs.20170204.14 ISSN: 2575-3460 (Print); ISSN: 2575-3363 (Online)

More information

Education for an Information Age

Education for an Information Age Education for an Information Age Teaching in the Computerized Classroom 7th Edition by Bernard John Poole, MSIS University of Pittsburgh at Johnstown Johnstown, PA, USA and Elizabeth Sky-McIlvain, MLS

More information

16-17 NOVEMBER 2017, MOSCOW, RUSSIAN FEDERATION OVERVIEW PRESENTATION

16-17 NOVEMBER 2017, MOSCOW, RUSSIAN FEDERATION OVERVIEW PRESENTATION 16-17 NOVEMBER 2017, MOSCOW, RUSSIAN FEDERATION OVERVIEW PRESENTATION Tuberculosis is the leading infectious killer Current actions and investments are falling far short ENDING TB IN THE SUSTAINABLE DEVELOPMENT

More information

For Jury Evaluation. The Road to Enlightenment: Generating Insight and Predicting Consumer Actions in Digital Markets

For Jury Evaluation. The Road to Enlightenment: Generating Insight and Predicting Consumer Actions in Digital Markets FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTO The Road to Enlightenment: Generating Insight and Predicting Consumer Actions in Digital Markets Jorge Moreira da Silva For Jury Evaluation Mestrado Integrado

More information

Detecting English-French Cognates Using Orthographic Edit Distance

Detecting English-French Cognates Using Orthographic Edit Distance Detecting English-French Cognates Using Orthographic Edit Distance Qiongkai Xu 1,2, Albert Chen 1, Chang i 1 1 The Australian National University, College of Engineering and Computer Science 2 National

More information

Lecture 1: Machine Learning Basics

Lecture 1: Machine Learning Basics 1/69 Lecture 1: Machine Learning Basics Ali Harakeh University of Waterloo WAVE Lab ali.harakeh@uwaterloo.ca May 1, 2017 2/69 Overview 1 Learning Algorithms 2 Capacity, Overfitting, and Underfitting 3

More information

CAVE LANGUAGES KS2 SCHEME OF WORK LANGUAGE OVERVIEW. YEAR 3 Stage 1 Lessons 1-30

CAVE LANGUAGES KS2 SCHEME OF WORK LANGUAGE OVERVIEW. YEAR 3 Stage 1 Lessons 1-30 CAVE LANGUAGES KS2 SCHEME OF WORK LANGUAGE OVERVIEW AUTUMN TERM Stage 1 Lessons 1-8 Christmas lessons 1-4 LANGUAGE CONTENT Greetings Classroom commands listening/speaking Feelings question/answer 5 colours-recognition

More information

Product Feature-based Ratings foropinionsummarization of E-Commerce Feedback Comments

Product Feature-based Ratings foropinionsummarization of E-Commerce Feedback Comments Product Feature-based Ratings foropinionsummarization of E-Commerce Feedback Comments Vijayshri Ramkrishna Ingale PG Student, Department of Computer Engineering JSPM s Imperial College of Engineering &

More information

Xinyu Tang. Education. Research Interests. Honors and Awards. Professional Experience

Xinyu Tang. Education. Research Interests. Honors and Awards. Professional Experience Xinyu Tang Parasol Laboratory Department of Computer Science Texas A&M University, TAMU 3112 College Station, TX 77843-3112 phone:(979)847-8835 fax: (979)458-0425 email: xinyut@tamu.edu url: http://parasol.tamu.edu/people/xinyut

More information

Detecting Student Emotions in Computer-Enabled Classrooms

Detecting Student Emotions in Computer-Enabled Classrooms Proceedings of the Twenty-Fifth International Joint Conference on Artificial Intelligence (IJCAI-16) Detecting Student Emotions in Computer-Enabled Classrooms Nigel Bosch, Sidney K. D Mello University

More information

Netpix: A Method of Feature Selection Leading. to Accurate Sentiment-Based Classification Models

Netpix: A Method of Feature Selection Leading. to Accurate Sentiment-Based Classification Models Netpix: A Method of Feature Selection Leading to Accurate Sentiment-Based Classification Models 1 Netpix: A Method of Feature Selection Leading to Accurate Sentiment-Based Classification Models James B.

More information

Mining Association Rules in Student s Assessment Data

Mining Association Rules in Student s Assessment Data www.ijcsi.org 211 Mining Association Rules in Student s Assessment Data Dr. Varun Kumar 1, Anupama Chadha 2 1 Department of Computer Science and Engineering, MVN University Palwal, Haryana, India 2 Anupama

More information

The Demographic Wave: Rethinking Hispanic AP Trends

The Demographic Wave: Rethinking Hispanic AP Trends The Demographic Wave: Rethinking Hispanic AP Trends Kelcey Edwards & Ellen Sawtell AP Annual Conference, Las Vegas, NV July 19, 2013 Exploring the Data Hispanic/Latino US public school graduates The Demographic

More information

Disambiguation of Thai Personal Name from Online News Articles

Disambiguation of Thai Personal Name from Online News Articles Disambiguation of Thai Personal Name from Online News Articles Phaisarn Sutheebanjard Graduate School of Information Technology Siam University Bangkok, Thailand mr.phaisarn@gmail.com Abstract Since online

More information

ARTICULATION AGREEMENT

ARTICULATION AGREEMENT ARTICULATION AGREEMENT between Associate of Sciences in Engineering Technologies and The Catholic University of America School of Engineering Bachelor of Science with Majors in: Biomedical Engineering

More information

Computerized Adaptive Psychological Testing A Personalisation Perspective

Computerized Adaptive Psychological Testing A Personalisation Perspective Psychology and the internet: An European Perspective Computerized Adaptive Psychological Testing A Personalisation Perspective Mykola Pechenizkiy mpechen@cc.jyu.fi Introduction Mixed Model of IRT and ES

More information

Practical Integrated Learning for Machine Element Design

Practical Integrated Learning for Machine Element Design Practical Integrated Learning for Machine Element Design Manop Tantrabandit * Abstract----There are many possible methods to implement the practical-approach-based integrated learning, in which all participants,

More information

A Coding System for Dynamic Topic Analysis: A Computer-Mediated Discourse Analysis Technique

A Coding System for Dynamic Topic Analysis: A Computer-Mediated Discourse Analysis Technique A Coding System for Dynamic Topic Analysis: A Computer-Mediated Discourse Analysis Technique Hiromi Ishizaki 1, Susan C. Herring 2, Yasuhiro Takishima 1 1 KDDI R&D Laboratories, Inc. 2 Indiana University

More information

SENIOR HIGH SCHOOL PROGRAM: CORE CURRICULUM, POLICIES AND UPDATES

SENIOR HIGH SCHOOL PROGRAM: CORE CURRICULUM, POLICIES AND UPDATES SENIOR HIGH SCHOOL PROGRAM: CORE CURRICULUM, POLICIES AND UPDATES JOCELYN DR ANDAYA Director IV Bureau of Curriculum Development November 21, 2016 2 Overview K to 12 Curriculum Framework Curriculum Contextualization

More information

Young Leaders Program

Young Leaders Program 2018-2019 YLP-MEXT Scholarship Program Young Leaders Program School of Government School of Local Governance A World of Opportunities for Young Leaders Message from the Program Director The Young Leaders

More information

Ideas for Intercultural Education

Ideas for Intercultural Education Ideas for Intercultural Education Ideas for Intercultural Education Simon Marginson and Erlenawati Sawir ideas for intercultural education Copyright Simon Marginson and Erlenawati Sawir, 2012 Softcover

More information

Python Machine Learning

Python Machine Learning Python Machine Learning Unlock deeper insights into machine learning with this vital guide to cuttingedge predictive analytics Sebastian Raschka [ PUBLISHING 1 open source I community experience distilled

More information

We are strong in research and particularly noted in software engineering, information security and privacy, and humane gaming.

We are strong in research and particularly noted in software engineering, information security and privacy, and humane gaming. Computer Science 1 COMPUTER SCIENCE Office: Department of Computer Science, ECS, Suite 379 Mail Code: 2155 E Wesley Avenue, Denver, CO 80208 Phone: 303-871-2458 Email: info@cs.du.edu Web Site: Computer

More information

California State University, Los Angeles TRIO Upward Bound & Upward Bound Math/Science

California State University, Los Angeles TRIO Upward Bound & Upward Bound Math/Science Application must be completed in black or blue ink only. STUDENT INFORMATION Name: Social Security # - - First Middle Last Address: Apt.# Phone: ( ) City: State: Zip Code: Date of Birth: Place of Birth:

More information

Application and Admission Process

Application and Admission Process Application and Admission Process The Graziadio School seeks students with excellent academic and career potential, highly motivated self-starters who thrive on challenge. We carefully select each new

More information

UNIT IX. Don t Tell. Are there some things that grown-ups don t let you do? Read about what this child feels.

UNIT IX. Don t Tell. Are there some things that grown-ups don t let you do? Read about what this child feels. UNIT IX Are there some things that grown-ups don t let you do? Read about what this child feels. There are lots of things They won t let me do- I'm not big enough yet, They say. So I patiently wait Till

More information

GHSA Global Activities Update. Presentation by Indonesia

GHSA Global Activities Update. Presentation by Indonesia GHSA Global Activities Update Presentation by Indonesia as the GHSA chair in 2016 2016 Global Activities JEE Process Action Packages Coordination Jakarta Call for Action A Systemic Network Model : Coordination

More information

Criterion Met? Primary Supporting Y N Reading Street Comprehensive. Publisher Citations

Criterion Met? Primary Supporting Y N Reading Street Comprehensive. Publisher Citations Program 2: / Arts English Development Basic Program, K-8 Grade Level(s): K 3 SECTIO 1: PROGRAM DESCRIPTIO All instructional material submissions must meet the requirements of this program description section,

More information

Palomar College Curriculum Committee Meeting Agenda Wednesday March 1, 2017 Room AA 140 at 3:00 pm

Palomar College Curriculum Committee Meeting Agenda Wednesday March 1, 2017 Room AA 140 at 3:00 pm I. Call to Order Palomar College Curriculum Committee Meeting Agenda Wednesday March 1, 2017 Room AA 140 at 3:00 pm II. Announcements III. Minutes of the February 1, 2017 Curriculum Committee Meeting (Attachment

More information

Evaluating and Comparing Classifiers: Review, Some Recommendations and Limitations

Evaluating and Comparing Classifiers: Review, Some Recommendations and Limitations Evaluating and Comparing Classifiers: Review, Some Recommendations and Limitations Katarzyna Stapor (B) Institute of Computer Science, Silesian Technical University, Gliwice, Poland katarzyna.stapor@polsl.pl

More information

Accounting 380K.6 Accounting and Control in Nonprofit Organizations (#02705) Spring 2013 Professors Michael H. Granof and Gretchen Charrier

Accounting 380K.6 Accounting and Control in Nonprofit Organizations (#02705) Spring 2013 Professors Michael H. Granof and Gretchen Charrier Accounting 380K.6 Accounting and Control in Nonprofit Organizations (#02705) Spring 2013 Professors Michael H. Granof and Gretchen Charrier 1. Office: Prof Granof: CBA 4M.246; Prof Charrier: GSB 5.126D

More information

KUTZTOWN UNIVERSITY KUTZTOWN, PENNSYLVANIA COE COURSE SYLLABUS TEMPLATE

KUTZTOWN UNIVERSITY KUTZTOWN, PENNSYLVANIA COE COURSE SYLLABUS TEMPLATE KUTZTOWN UNIVERSITY KUTZTOWN, PENNSYLVANIA COE COURSE SYLLABUS TEMPLATE DEPARTMENT OF SECONDARY EDUCATION I. Course Description: Course Prefix, Number and Title Secondary Education SEU 520 Education Theory

More information

Integrating E-learning Environments with Computational Intelligence Assessment Agents

Integrating E-learning Environments with Computational Intelligence Assessment Agents Integrating E-learning Environments with Computational Intelligence Assessment Agents Christos E. Alexakos, Konstantinos C. Giotopoulos, Eleni J. Thermogianni, Grigorios N. Beligiannis and Spiridon D.

More information

GRAMMATICAL MORPHEME ACQUISITION: AN ANALYSIS OF AN EFL LEARNER S LANGUAGE SAMPLES *

GRAMMATICAL MORPHEME ACQUISITION: AN ANALYSIS OF AN EFL LEARNER S LANGUAGE SAMPLES * Volume 8 No. 1, Februari 2008 : 22-37 GRAMMATICAL MORPHEME ACQUISITION: AN ANALYSIS OF AN EFL LEARNER S LANGUAGE SAMPLES * Paulus Widiatmoko Duta Wacana Christian University Jl. Dr. Wahidin Sudirohusodo

More information

Mangalagangothri , D.K. District, Karnataka

Mangalagangothri , D.K. District, Karnataka MANGALORE UNIVERSITY Mangalagangothri 574 199, D.K. District, Karnataka APPLICATION FOR TEACHING/PRINCIPAL/ACADEMIC POSTS (To be submitted in sets along with all enclosures) DD/Challan & Date Bank & Branch

More information

ACCOMMODATING WORLD ENGLISHES IN DEVELOPING EFL LEARNERS ORAL COMMUNICATION

ACCOMMODATING WORLD ENGLISHES IN DEVELOPING EFL LEARNERS ORAL COMMUNICATION ACCOMMODATING WORLD ENGLISHES IN DEVELOPING EFL LEARNERS ORAL COMMUNICATION Nur Mukminatien (nursunaryo@gmail.com) Universitas Negeri Malang Jl. Semarang 05 Malang 65145, Indonesia Abstract: This article

More information

INDIAN STATISTICAL INSTITUTE 203, BARRACKPORE TRUNK ROAD KOLKATA

INDIAN STATISTICAL INSTITUTE 203, BARRACKPORE TRUNK ROAD KOLKATA INDIAN STATISTICAL INSTITUTE 203, BARRACKPORE TRUNK ROAD KOLKATA 700 108 A D V E R T I S E M E N T Applications are invited from Indian Nationals for recruitment of following posts required at Kolkata,

More information

Economics 201 Principles of Microeconomics Fall 2010 MWF 10:00 10:50am 160 Bryan Building

Economics 201 Principles of Microeconomics Fall 2010 MWF 10:00 10:50am 160 Bryan Building Economics 201 Principles of Microeconomics Fall 2010 MWF 10:00 10:50am 160 Bryan Building Professor: Dr. Michelle Sheran Office: 445 Bryan Building Phone: 256-1192 E-mail: mesheran@uncg.edu Office Hours:

More information

4-H Ham Radio Communication Proficiency Program A Member s Guide

4-H Ham Radio Communication Proficiency Program A Member s Guide 4-H Ham Radio Communication Proficiency Program A Member s Guide OVERVIEW The 4-H Ham Radio Communication Proficiency program helps you learn what you need to know about your 4-H project. Your project

More information

EARL WOODS SCHOLAR PROGRAM APPLICATION

EARL WOODS SCHOLAR PROGRAM APPLICATION 2017-2018 APPLICATION EARL WOODS Chairman in Memoriam, Tiger Woods Foundation Earl Woods was the last of six children born March 5, 1932 to Maude and Miles Woods in Manhattan, Kansas. He attended Kansas

More information

System Implementation for SemEval-2017 Task 4 Subtask A Based on Interpolated Deep Neural Networks

System Implementation for SemEval-2017 Task 4 Subtask A Based on Interpolated Deep Neural Networks System Implementation for SemEval-2017 Task 4 Subtask A Based on Interpolated Deep Neural Networks 1 Tzu-Hsuan Yang, 2 Tzu-Hsuan Tseng, and 3 Chia-Ping Chen Department of Computer Science and Engineering

More information

In reviewing progress since 2000, this regional

In reviewing progress since 2000, this regional United Nations Educational, Scientific and Cultural Organization EFA Global Monitoring Report 2 0 1 5 Regional overview: East Asia and the Pacific United Nations Educational, Scientific and Cultural Organization

More information

Australian Journal of Basic and Applied Sciences

Australian Journal of Basic and Applied Sciences AENSI Journals Australian Journal of Basic and Applied Sciences ISSN:1991-8178 Journal home page: www.ajbasweb.com Feature Selection Technique Using Principal Component Analysis For Improving Fuzzy C-Mean

More information

SPRING GROVE AREA SCHOOL DISTRICT

SPRING GROVE AREA SCHOOL DISTRICT SPRING GROVE AREA SCHOOL DISTRICT PLANNED INSTRUCTION Course Title: Spanish III Length of Course: 30 cycles Grade Level(s): 10-12 Units of Credit: 1 Required: Elective: X Periods Per Cycle: Length of Period:

More information

Guide to Teaching Computer Science

Guide to Teaching Computer Science Guide to Teaching Computer Science Orit Hazzan Tami Lapidot Noa Ragonis Guide to Teaching Computer Science An Activity-Based Approach Dr. Orit Hazzan Associate Professor Technion - Israel Institute of

More information

Laboratorio di Intelligenza Artificiale e Robotica

Laboratorio di Intelligenza Artificiale e Robotica Laboratorio di Intelligenza Artificiale e Robotica A.A. 2008-2009 Outline 2 Machine Learning Unsupervised Learning Supervised Learning Reinforcement Learning Genetic Algorithms Genetics-Based Machine Learning

More information

International Series in Operations Research & Management Science

International Series in Operations Research & Management Science International Series in Operations Research & Management Science Volume 240 Series Editor Camille C. Price Stephen F. Austin State University, TX, USA Associate Series Editor Joe Zhu Worcester Polytechnic

More information

Iterative Cross-Training: An Algorithm for Learning from Unlabeled Web Pages

Iterative Cross-Training: An Algorithm for Learning from Unlabeled Web Pages Iterative Cross-Training: An Algorithm for Learning from Unlabeled Web Pages Nuanwan Soonthornphisaj 1 and Boonserm Kijsirikul 2 Machine Intelligence and Knowledge Discovery Laboratory Department of Computer

More information

Knowledge management styles and performance: a knowledge space model from both theoretical and empirical perspectives

Knowledge management styles and performance: a knowledge space model from both theoretical and empirical perspectives University of Wollongong Research Online University of Wollongong Thesis Collection University of Wollongong Thesis Collections 2004 Knowledge management styles and performance: a knowledge space model

More information

Fruitvale Station Shopping Center > Retail

Fruitvale Station Shopping Center > Retail Oakland, CA > Retail > Very rare (i.e. high barriers of entry) freeway visible, surface parked, high volume grocery anchored regional serving center. > Notable tenants include: Food Maxx, Starbucks, Office

More information

A Decision Tree Analysis of the Transfer Student Emma Gunu, MS Research Analyst Robert M Roe, PhD Executive Director of Institutional Research and

A Decision Tree Analysis of the Transfer Student Emma Gunu, MS Research Analyst Robert M Roe, PhD Executive Director of Institutional Research and A Decision Tree Analysis of the Transfer Student Emma Gunu, MS Research Analyst Robert M Roe, PhD Executive Director of Institutional Research and Planning Overview Motivation for Analyses Analyses and

More information

Experiments with SMS Translation and Stochastic Gradient Descent in Spanish Text Author Profiling

Experiments with SMS Translation and Stochastic Gradient Descent in Spanish Text Author Profiling Experiments with SMS Translation and Stochastic Gradient Descent in Spanish Text Author Profiling Notebook for PAN at CLEF 2013 Andrés Alfonso Caurcel Díaz 1 and José María Gómez Hidalgo 2 1 Universidad

More information

HARVARD GLOBAL UPDATE. October 1-2, 2014

HARVARD GLOBAL UPDATE. October 1-2, 2014 HARVARD GLOBAL UPDATE October 1-2, 2014 All photos are part of the Office of International Education s annual photography contest and were taken by Harvard undergraduates engaged in study, work, internship,

More information

Wenguang Sun CAREER Award. National Science Foundation

Wenguang Sun CAREER Award. National Science Foundation Wenguang Sun Address: 401W Bridge Hall Department of Data Sciences and Operations Marshall School of Business University of Southern California Los Angeles, CA 90089-0809 Phone: (213) 740-0093 Fax: (213)

More information

(Effective from )

(Effective from ) PADHO PARDESH - SCHEME OF INTEREST SUBSIDY ON EDUCATIONAL LOANS FOR OVERSEAS STUDIES FOR THE STUDENTS BELONGING TO THE MINORITY COMMUNITIES (Effective from 2013-14) GOVERNMENT OF INDIA MINISTRY OF MINORITY

More information

A THESIS. By: IRENE BRAINNITA OKTARIN S

A THESIS. By: IRENE BRAINNITA OKTARIN S THE EFFECTIVENESS OF BLENDED LEARNING TO TEACH WRITING VIEWED FROM STUDENTS CREATIVITY (An Experimental Study at the English Education Department of Slamet Riyadi University in the Academic Year of 2014/2015)

More information