Tôi rất hân hạnh thông báo đến các bạn một khoá học về ứng dụng mô hình hồi qui (applied regression analysis) và công bố quốc tế do Đại học Văn Lang tổ chức. Khoá học 7 ngày sẽ diễn ra từ 19/12 đến 26/12/2022.

Các mô hình hồi qui là ‘guồng máy’ đằng sau Machine Learning (ML) và Khoa học Dữ liệu. Tuy nhiều bạn làm ML và data science nhưng kiến thức và kĩ năng về các mô hình hồi qui còn hạn chế. Do đó, mục tiêu của khoá học này là đem lại kiến thức và trang bị kĩ năng phân tích dữ liệu dùng mô hình hồi qui tuyến tính và hồi qui logistic. Sau khi hoàn tất khoá học, chúng tôi kì vọng rằng học viên sẽ:
- biết sử dụng ngôn ngữ R;
- biết cách hiển thị dữ liệu khoa học;
- diễn giải ý nghĩa của các mô hình hồi qui;
- biết cách soạn bài báo khoa học;
- biết tiêu chuẩn đứng tên tác giả;
- biết nguyên lí của đạo đức khoa học trong công bố;
- biết cách phân biệt tập san chánh thống và dỏm.
Chương trình học bao gồm 20 bài giảng được chia ra 2 phần như sau:
Phần 1: Các mô hình hồi qui
Bài giảng 1: Giới thiệu R. Ngày nay, học về khoa học dữ liệu hay phương pháp phân tích đòi hỏi phải biết ngôn ngữ R. (Hãy quên đi mấy software thương mại vì mắc tiền quá). Học viên sẽ học về các hàm/lệnh căn bản trong R để đọc dữ liệu, biên tập dữ liệu, và làm các phân tích đơn giản.
Bài giảng 2: RStudio và R Markdown. Trong phần này học viên sẽ làm quen với RStudio và RMarkdown, hai phần rất quan trọng trong các công cụ của khoa học dữ liệu. RStudio là một ‘add on’ nhằm giúp người sử dụng R quản lí file tốt hơn. RMarkdown là một sáng kiến tuyệt vời nhằm giúp cho việc lưu trữ các mã phân tích và chia xẻ files với nhau. Với RMardown, người dùng có thể tạo ra một trang web cá nhân trên Rpubs.com và ‘báo cáo’ kết quả phân tích ngay trên đó.
Bài giảng 3: Quản lí và biên tập dữ liệu bằng tidyverse. Bài này sẽ giới thiệu các nguyên lí quản lí dữ liệu cho phân tích (vì đây là một bước rất quan trọng). Bài giảng cũng sẽ hướng dẫn sử dụng các hàm căn bản trong việc biên tập dữ liệu, đặc biệt là dùng chương trình tidyverse.
Bài giảng 4-5: Nguyên lí hiển thị dữ liệu và giới thiệu “ggplot2” cho biểu đồ chất lượng cao. Ngày nay, bài báo khoa học với biểu đồ phẩm chất cao là vô cùng quan trọng, vì nó thể hiện tính chuyên nghiệp và tinh tế của nhà khoa học. Nhu liệu ‘ggplot2’ là một chương trình tuyệt vời để cho nhà khoa học soạn các biểu đồ ‘không chê vào đâu được’. Học về ggplot2 không dễ, nhưng chúng tôi đã tìm ra một cách giới thiệu mà học viên có thể học rất nhanh.
Bài giảng 6: Phân tích mô tả. Bài giảng giới thiệu cách mô tả dữ liệu liên tục (continuous data) và dữ liệu phân nhóm (categorical data) dùng các hàm đơn giản trong R.
Bài giảng 7: Giới thiệu mô hình hồi qui tuyến tính. Giới thiệu mô hình hồi qui tuyến tính, cách ước tính tham số, giả định và ứng dụng. Nói chung, mô hình hồi qui tuyến tính có 3 ứng dụng: tìm hiểu mối liên quan, hiệu chỉnh cho yếu tố nhiễu, và tiên lượng.
Bài giảng 8: Kiểm tra giả định, ảnh hưởng tương tác, hoán chuyển dữ liệu: Trong phần này, học viên sẽ học cách diễn giải các tham số trong mô hình như RMSE, R-squared.
Bài giảng 9: Ứng dụng mô hình hồi qui tuyến tính. Bài giảng hướng dẫn cách ứng dụng mô hình hồi qui tuyến tính trong việc thay thế t-test, đánh giá sự tương tác, cách đánh giá tầm quan trọng của biến số, và cách chọn mô hình tối ưu.
Bài giảng 10: Khái niệm odds và odds ratio. Giới thiệu khái niệm odds, odds ratio, và log odds.
Bài giảng 11: Mô hình hồi qui logistic. Học viên sẽ học về mô hình hồi qui logistic và cách diễn giải kết quả của mô hình logistic.
Bài giảng 12: Phương pháp tìm mô hình “tối ưu” (tìm các yếu tố liên quan). Một trong những vấn đề làm nhiều người ‘đau đầu’ là trong số hàng trăm — thậm chí hàng triệu — biến số, thì biến nào có liên quan đến outcome. Nhiều người nghĩ đến phương pháp stepwise, nhưng đó là cách làm sai. Trong bài này, chúng tôi sẽ giới thiệu một phương pháp Bayes và LASSO để tìm các biến số liên quan.
Phần 2: Công bố khoa học
Phần 2 của khoá học là 3 ngày tập trung vào cách soạn và công bố bài báo khoa học. Mục tiêu chung của khoá học (3 ngày) này là trang bị kiến thức và kĩ năng cho học viên trong việc soạn một bài báo khoa học. Chúng tôi kì vọng rằng sau khi xong lớp học, học viên sẽ:
- hiểu tại sao cần phải công bố khoa học;
- biết cơ cấu của một bài báo khoa học;
- biết các nguyên tắc viết phần Dẫn nhập, Bàn luận, Kết quả của một bài báo; và
- biết phân biệt tập san dỏm và thật.
Bài giảng 13: Phương pháp viết Title. Bài giảng sẽ giới thiệu cấu trúc chuẩn của một bài báo khoa học là IMRaD. Những bước cần chuẩn bị cho việc soạn một bài báo khoa học. Phần nào cần viết trước và phần nào cần viết sau sẽ được bàn luận trong bài giảng. Tựa đề bài báo khoa học là một yếu tố rất quan trọng, có khi quyết định sự thành bại của bài báo, nhưng rất ít được các tác giả chú ý. Bài giảng này sẽ giới thiệu những nguyên tắc trong việc đặt tựa đề, cùng những điều không nên làm khi đặt tựa đề. Một số nghiên cứu khoa học về tựa đề bài báo cũng sẽ được trình bày để minh họa cho các nguyên tắc chung.
Bài giảng 14: Phương pháp viết phần Abstract. Bài báo khoa học đòi hỏi phải có một abstract (tóm tắt), thường giới hạn trong 250 đến 300 chữ. Tóm lược một bài báo 20-30 trang thành 250-300 chữ là một thách thức. Bài giảng này sẽ giới thiệu hai dạng abstract: loại có cấu trúc và loại không có cấu trúc. Bài giảng cũng sẽ bàn về những chiến lược cụ thể để viết phần abstract sao cho đầy đủ thông tin trong vòng 250-300 chữ.
Bài giảng 15: Phương pháp viết phần Kết Quả. Kết quả là trái tim của một công trình nghiên cứu. Nhưng viết phần Kết quả có khi là một thách thức đáng kể cho những người mới vào nghiên cứu, vì không biết viết cái gì trước và cái gì sau, hay viết sao cho thuyết phục. Bài giảng này sẽ trình bày một số phương pháp và nguyên tắc quan trọng trong việc mô tả kết quả nghiên cứu. Phần đầu sẽ bàn về cách viết. Phần hai hướng dẫn cách thiết kế bảng số liệu và những biểu đồ có phẩm chất cao.
Bài giảng 16: Phương pháp viết phần Dẫn Nhập và Bàn Luận. Phần Dẫn nhập của một bài báo khoa học là lí do tồn tại của bài báo, nên cần phải được quan tâm đúng mức. Bài giảng sẽ giới thiệu công thức viết dẫn nhập có tên là CaRS (creating a research space). Bàn luận là phần khó viết nhất trong một bài báo khoa học. Trong bài giảng này, học viên sẽ học một công thức đơn giản (gồm 6 đoạn văn) nhưng rất hiệu quả trong việc cấu trúc phần bàn luận.
Bài giảng 17: Phương pháp viết phần Phương Pháp. Bài giảng sẽ giới thiệu những thông tin liên quan đến thiết kế nghiên cứu, đối tượng nghiên cứu, phương pháp đo lường, phương pháp phân tích, v.v. cho một bài báo khoa học. Mỗi mục sẽ được minh họa bằng những câu văn quen thuộc hay những mô tả đã được công bố trên các tập san khoa học nổi tiếng trên thế giới.
Bài giảng 18: Tiếng Anh trong khoa học. Tiếng Anh là một khó khăn đáng kể cho các nhà nghiên cứu mà tiếng mẹ đẻ không phải là tiếng Anh. Tiếng Anh trong khoa học càng là một loại ‘ngôn ngữ’ khá đặc thù. Trong bài giảng này, chúng tôi sẽ giới thiệu nguyên lí IDEA cho viết văn khoa học dùng tiếng Anh.
Bài giảng 19: Tiêu chuẩn đứng tên tác giả. Đứng tên tác giả một bài báo khoa học là một vấn đề tế nhị nhưng quan trọng. Bài giảng sẽ điểm qua các tiêu chuẩn đứng tên tác giả theo Tuyên bố ICMJE và trách nhiệm của tác giả bài báo khoa học.
Bài giảng 20: Tiêu chuẩn chọn tập san khoa học để công bố. Chọn tập san thích hợp để công bố kết quả nghiên cứu đang là một vấn đề thời sự, vì có quá nhiều tập san “dỏm” trên thế giới. Điều nguy hiểm hơn nữa là có những tập san nằm ở biên giới dỏm và thật. Rất nhiều nhà khoa học Việt Nam đã trở thành nạn nhân của những tập san dỏm. Bài giảng này sẽ giới thiệu các tiêu chuẩn để giúp các bạn phân biệt tập san dỏm và tập san thật, cùng những tiêu chí để chọn tập san chuyên ngành thích hợp cho nghiên cứu.
Liên lạc
Mọi thông tin chi tiết về chương trình, học viên vui lòng liên hệ Trung tâm Đào tạo và Phát triển – Tập đoàn Giáo dục Văn Lang
Hotline: 0287.1099.137 – 0908.046.521
Email: dtpt.vlg@vlu.edu.vn
Link đăng ký: http://bit.ly/dangky-DHVL