gnuh_gnauq
New Member
Download Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất N-Acylpiperidine
MỤC LỤC
A – MỞ ĐẦU
LỜI MỞ ĐẦU . 1
B –TỔNG QUAN
Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA
CẤU TRÚC VÀ HOẠT TÍNH . 3
1.1. HOẠT TÍNH . . . 4
1.1.1. Hoạt tính sinh học. . 4
1.1.2. Hoạt tính hóa học . . . . 4
1.2. CÁC THAM SỐ CẤU TRÚC . . 5
1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR. 5
Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ. 9
2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG
BORN-OPPENHEIMER . . 9
2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM . 11
2.2.1. Giới thiệu . . . 11
2.2.2. Phương pháp PM3 . . . 13
Chương 3: PHƯƠNG PHÁP XỬ LÝ SỐ LIỆU . . 16
3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH. . 16
3.1.1. Tương quan và hồi qui . . 16
3.1.2. Phân tích hồi qui đa biến tuyến tính . 20
3.1.2.1. Các thủ tục chọn biến . . . 20
3.1.2.1. Đánh giá mô hình . . . 21
3.2. PHƯƠNG PHÁP MẠNG NƠRONNHÂN TẠO . . 22
3.2.1. Nơron sinh học và nơron nhân tạo. 25
.2.2.1. Nơron sinh học . . 23
3.2.2.2. Nơron nhân tạo . . 24
3.2.2. Cấu trúc mạng nơron đa lớp . . 25
3.2.3. Luyện mạng: Kỹ thuật lan truyền ngược . 26
3.2.4. Ngừng tiến trình luyện . . 27
3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng . . 28
Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE . 30
4.1. BỆNH DOMUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔIMUỖI. 30
4.2. N-ACYLPIPERIDINE –CHẤT ĐUỔI MUỖI MỚI. 33
C –PHƯƠNG PHÁP
Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN. 37
5.1. PHẦN MỀM . . . 37
5.1.1. Hyperchem 8.03. . . 37
5.1.2. Stagraphics Centurion XV . . . 37
5.1.3. NeuroSolution 5.07 . . . 37
5.1.4. Microsoft Excel . . . 37
5.2. CÁC BƯỚC THỰC HIỆN. . 37
5.2.1. Tính toán hóa lượng tử . . 38
5.2.2. Phân tích hồi qui đa biến tuyến tính . 38
5.2.3. Tính toán mạng nơron . . 39
D –KẾT QUẢ VÀ BÀN LUẬN
Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH
CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE . 42
6.1. DỮ LIỆU . . . . 42
6.2. KẾT QUẢVÀ BÀN LUẬN . . 44
6.2.1. Phương pháp hồi qui đa biến tuyến tính. 44
6.2.1.1. Tính toán với hoạt tính PT 25 . . 45
6.2.1.2. Tính toán với hoạt tính PT 2.5 . . 47
6.2.2. Phương pháp mạng nơron . . 48
6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN
HOẠT TÍNH . . . 55
E –KẾT LUẬN
KẾT LUẬN . . . 60
TÀI LIỆU THAM KHẢO
PHỤ LỤC
http://cloud.liketly.com/flash/edoc/jh2i1fkjb33wa7b577g9lou48iyvfkz6-swf-2013-10-19-luan_van_khao_sat_moi_quan_he_dinh_luong_giua_cau.R01yEUvLui.swf /tai-lieu/de-tai-ung-dung-tren-liketly-41097/
Để tải bản DOC Đầy Đủ xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
biểu thức toán học ấy được gọi là đường hồi qui của y theo x.
i
k
j
ijjiikkiii xxxxy
1
022110 ... (3.2)
i thường được gọi là sai số, là chênh lệch giữa giá trị quan sát được yk và
trung bình của tập con các giá trị của biến y tại điểm xk.
i được xem là biến ngẫu nhiên, độc lập có phân phối chuẩn, có trung bình
bằng 0 và phương sai là 2 .
Các hệ số trong phương trình được ước lượng theo nguyên tắc bình phương tối
thiểu nghĩa là làm sao cho tổng bình phương các phần dư dưới đây là nhỏ nhất.
N
i
k
j
ijji xy
1
2
1
0 (3.3)
Khi thu được các dữ liệu cần thiết (yi, xji) trong đó số bộ dữ liệu N ít nhất phải
lớn hơn số biến độc lập k thì người ta có thể xác định được các hệ số hồi qui theo
chuẩn bình phương cực tiểu như sau:
)min()min(
1
2
2
1
eyyMin
N
i
i
N
i
tính
ii
(3.4)
Điều kiện này đạt được khi đạo hàm của i2 theo các hệ số i triệt tiêu.
Chương 3
19
,0
i
e
với i = 1, 2,..., N. (3.5)
Ta giả thiết rằng hàm f phụ thuộc tuyến tính vào bộ kxxx ,...,, 21 như vậy ta chỉ
cần tìm kiếm các hệ số phù hợp. Trong khảo sát QSAR, biến yi là hoạt tính hoá chất,
biến xi là các tham số hoá lí.
Giá trị thống kê đặc trưng cho mô hình hồi qui là hệ số xác định (coefficient of
determination) hay hệ số R2.
Một số mô hình hồi qui đa biến tuyến tính
Mô hình MLR có dạng tổng quát như sau:
Dạng lý thuyết:
kk xxx ...22110 (3.6)
Dạng ước tính
exbxbxbby kk ...22110 (3.7)
Dạng ước tính với N trường hợp quan sát:
ikikiii exbxbxbby ...22110 (3.8)
Dạng ước tính bằng phương pháp bình phương cực tiểu:
kikiii xbxbxbby ...ˆ 22110 (3.9)
Trong đó: iyˆ là giá trị đoán của y.
ix là biến độc lập.
ib là các hệ số hồi qui.
Mô hình MLR có thể xuất hiện dưới một số dạng đặc biệt như sau:
Dạng tương tác: giả sử hai biến x1 và x2 có hệ tương tác thì mô hình MLR có
thể được viết:
21222110ˆ xxbxbxbbyi (3.10)
Dạng đa thức: mô hình hồi qui dạng đa thức bậc k có thể biểu diễn dưới dạng
Chương 3
20
tổng quát sau:
k
k xbxbxbby ...ˆ
2
210 (3.11)
3.1.2 Phân tích hồi qui đa biến tuyến tính
Các mô hình hồi qui đa biến tuyến tính có thể được thiết lập một cách tự động
bởi các chương trình phân tích thống kê như SPSS, SAS, BMDP, MINITAB,
Stagraphics-Plus, Microsoft EXEL, Stagraphics Centurion XV….
3.1.2.1 Các thủ tục chọn biến
Nhiều mô hình hồi qui có thể được xây dựng từ cùng một tập biến. Muốn sàn
lọc các biến độc lập xi có liên quan tuyến tính với biến phụ thuộc trong một nhóm dữ
liệu có N trường hợp quan sát, người ta có thể dùng nhiều phương pháp. Ba thủ tục
phổ biến mà ta sẽ nghiên cứu là: đưa dần vào (forward selection), loại trừ dần
(backward elimination), và hồi qui từng bước. Sau đây là các thủ tục chọn biến được
thực hiện trong phần mềm Stagraphics Centurion XV.
Phương pháp đưa dần vào: biến đầu tiên được xem xét để đưa vào phương
trình là biến có tương quan thuận hay nghịch lớn nhất với biến phụ thuộc. Có 2 tiêu
chuẩn để đưa biến vào:
F-to-enter: là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được
để được đưa vào.
F-to-remove: là giá trị F tối thiểu mà thống kê F của biến độc lập đó
phải đạt được để ở lại trong phương trình.
Phương pháp loại trừ dần: khởi đầu với tất cả các biến đều ở trong phương
trình, sau đó loại trừ dần bằng tiêu chuẩn loại trừ. Có hai tiêu chuẩn loại trừ:
F-to-enter: là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được
để được đưa vào.
F-to-remove: là giá trị F tối thiểu mà thống kê F của biến độc lập đó
phải đạt được để ở lại trong phương trình.
Phương pháp chọn từng bước: là sự kết hợp của thủ tục đưa dần vào và thủ
tục loại trừ dần, đây là phương pháp phổ biến nhất. Biến thứ nhất được chọn giống
Chương 3
21
như cách chọn dần từng bước. Sau khi biến thứ nhất được đưa vào, thủ tục chọn từng
bước khác với đưa dần vào ở chỗ biến thứ nhất được xem xét xem có nên loại bỏ nó ra
khỏi phương trình căn cứ theo tiêu chuẩn ra giống như thủ tục loại trừ dần. Các bước
như thế được tiếp tục cho đến khi không còn biến nào thỏa điều kiện ra nữa.
3.1.2.2 Đánh giá mô hình
Để đánh giá mức độ phù hợp của mô hình với bộ dữ liệu thực nghiệm, người ta
dùng các đại lượng sau:
Hệ số xác định (R2): bình phương hệ số tương quan giữa các giá trị yitính tính
theo mô hình hồi qui và các giá trị yi thực nghiệm.
N
i
i
N
i
tính
ii
yy
yy
R
1
2
1
2
2
)(
)(
1 (3.12)
Trong đó: y là giá trị trung bình của các giá trị iy .
Ý nghĩa: R2 cho biết sự phù hợp của mô hình với bộ dữ liệu thực nghiệm.
Nếu giá trị R2 càng gần 1 thì mô hình mô tả tốt các số liệu thực nghiệm, các giá trị yitính
tính toán rất gần các giá trị yi thực nghiệm.
Hệ số 2R hiệu chỉnh ( 2aR ): được sử dụng để phản ánh sát hơn mức độ phù
hợp của mô hình MLR. 2aR không nhất thiết phải tăng lên khi nhiều biến được thêm
vào phương trình.
1
)1( 222
kN
RkRRa (3.13)
Tính tổng quát của mô hình (Q2): Việc xác định tính tổng quát dựa trên
phương pháp tham chiếu chéo (cross validation). Phương pháp này được thực hiện
gồm các bước sau:
Chia ngẫu nhiên tập dữ liệu thành k tập con phân biệt.
Lặp lại k lần, mỗi lần chừa ra một tập con để kiểm tra, phần còn lại để
luyện
Chương 3
22
Tính giá trị Q2 :
N
i
i
N
i
tính
ii
yy
yy
Q
1
2
1
2
2
)(
)(
1 (3.14)
Giá trị Q2 càng gần 1 thì khả năng đoán nhận càng chính xác hay nói cách khác
mô hình có khả năng tổng quát hóa.
Khả năng đoán ngoại của mô hình: phương pháp này được thực hiện
như sau: chia bộ dữ liệu thành 2 nhóm nhỏ, dùng một nhóm luyện (training set) có N
trường hợp để thiết lập mô hình hồi qui và sau đó dùng mô hình ấy để đoán tác
dụng của một nhóm thử (test set) có M trường hợp.
Nếu mô hình tìm được có sự tuyến tính cao giữa các biến phụ thuộc và các biến
độc lập thì phương pháp phân tích MLR có ưu điểm sau:
Những mối quan hệ dữ liệu quan sát được mô tả rõ ràng.
Là phương pháp đơn giản cho việc đoán nhận mẫu mới.
Tuy nhiên phương pháp này sẽ không phù hợp trong những trường hợp mà giữa
các biến độc lập có liên hệ chặt chẽ với nhau hay số biến lớn hơn số mẫu quan sát.
Nếu mô hình không tuyến tính với các biến độc lập, khi đó ta có mô hình hồi
qui phi tuyến.
3.2 PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO (Artificial
Neural Network) 2, 8, 19, 22
Trong thực tế, mối quan hệ giữa biến phụ thuộc và các biến độc lập th
Download miễn phí Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất N-Acylpiperidine
MỤC LỤC
A – MỞ ĐẦU
LỜI MỞ ĐẦU . 1
B –TỔNG QUAN
Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA
CẤU TRÚC VÀ HOẠT TÍNH . 3
1.1. HOẠT TÍNH . . . 4
1.1.1. Hoạt tính sinh học. . 4
1.1.2. Hoạt tính hóa học . . . . 4
1.2. CÁC THAM SỐ CẤU TRÚC . . 5
1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR. 5
Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ. 9
2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG
BORN-OPPENHEIMER . . 9
2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM . 11
2.2.1. Giới thiệu . . . 11
2.2.2. Phương pháp PM3 . . . 13
Chương 3: PHƯƠNG PHÁP XỬ LÝ SỐ LIỆU . . 16
3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH. . 16
3.1.1. Tương quan và hồi qui . . 16
3.1.2. Phân tích hồi qui đa biến tuyến tính . 20
3.1.2.1. Các thủ tục chọn biến . . . 20
3.1.2.1. Đánh giá mô hình . . . 21
3.2. PHƯƠNG PHÁP MẠNG NƠRONNHÂN TẠO . . 22
3.2.1. Nơron sinh học và nơron nhân tạo. 25
.2.2.1. Nơron sinh học . . 23
3.2.2.2. Nơron nhân tạo . . 24
3.2.2. Cấu trúc mạng nơron đa lớp . . 25
3.2.3. Luyện mạng: Kỹ thuật lan truyền ngược . 26
3.2.4. Ngừng tiến trình luyện . . 27
3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng . . 28
Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE . 30
4.1. BỆNH DOMUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔIMUỖI. 30
4.2. N-ACYLPIPERIDINE –CHẤT ĐUỔI MUỖI MỚI. 33
C –PHƯƠNG PHÁP
Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN. 37
5.1. PHẦN MỀM . . . 37
5.1.1. Hyperchem 8.03. . . 37
5.1.2. Stagraphics Centurion XV . . . 37
5.1.3. NeuroSolution 5.07 . . . 37
5.1.4. Microsoft Excel . . . 37
5.2. CÁC BƯỚC THỰC HIỆN. . 37
5.2.1. Tính toán hóa lượng tử . . 38
5.2.2. Phân tích hồi qui đa biến tuyến tính . 38
5.2.3. Tính toán mạng nơron . . 39
D –KẾT QUẢ VÀ BÀN LUẬN
Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH
CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE . 42
6.1. DỮ LIỆU . . . . 42
6.2. KẾT QUẢVÀ BÀN LUẬN . . 44
6.2.1. Phương pháp hồi qui đa biến tuyến tính. 44
6.2.1.1. Tính toán với hoạt tính PT 25 . . 45
6.2.1.2. Tính toán với hoạt tính PT 2.5 . . 47
6.2.2. Phương pháp mạng nơron . . 48
6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN
HOẠT TÍNH . . . 55
E –KẾT LUẬN
KẾT LUẬN . . . 60
TÀI LIỆU THAM KHẢO
PHỤ LỤC
http://cloud.liketly.com/flash/edoc/jh2i1fkjb33wa7b577g9lou48iyvfkz6-swf-2013-10-19-luan_van_khao_sat_moi_quan_he_dinh_luong_giua_cau.R01yEUvLui.swf /tai-lieu/de-tai-ung-dung-tren-liketly-41097/
Để tải bản DOC Đầy Đủ xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Tóm tắt nội dung:
người ta có thể ước tính hay đoán giá trị của y từ một giá trị của x. Đường biểu diễnbiểu thức toán học ấy được gọi là đường hồi qui của y theo x.
i
k
j
ijjiikkiii xxxxy
1
022110 ... (3.2)
i thường được gọi là sai số, là chênh lệch giữa giá trị quan sát được yk và
trung bình của tập con các giá trị của biến y tại điểm xk.
i được xem là biến ngẫu nhiên, độc lập có phân phối chuẩn, có trung bình
bằng 0 và phương sai là 2 .
Các hệ số trong phương trình được ước lượng theo nguyên tắc bình phương tối
thiểu nghĩa là làm sao cho tổng bình phương các phần dư dưới đây là nhỏ nhất.
N
i
k
j
ijji xy
1
2
1
0 (3.3)
Khi thu được các dữ liệu cần thiết (yi, xji) trong đó số bộ dữ liệu N ít nhất phải
lớn hơn số biến độc lập k thì người ta có thể xác định được các hệ số hồi qui theo
chuẩn bình phương cực tiểu như sau:
)min()min(
1
2
2
1
eyyMin
N
i
i
N
i
tính
ii
(3.4)
Điều kiện này đạt được khi đạo hàm của i2 theo các hệ số i triệt tiêu.
Chương 3
19
,0
i
e
với i = 1, 2,..., N. (3.5)
Ta giả thiết rằng hàm f phụ thuộc tuyến tính vào bộ kxxx ,...,, 21 như vậy ta chỉ
cần tìm kiếm các hệ số phù hợp. Trong khảo sát QSAR, biến yi là hoạt tính hoá chất,
biến xi là các tham số hoá lí.
Giá trị thống kê đặc trưng cho mô hình hồi qui là hệ số xác định (coefficient of
determination) hay hệ số R2.
Một số mô hình hồi qui đa biến tuyến tính
Mô hình MLR có dạng tổng quát như sau:
Dạng lý thuyết:
kk xxx ...22110 (3.6)
Dạng ước tính
exbxbxbby kk ...22110 (3.7)
Dạng ước tính với N trường hợp quan sát:
ikikiii exbxbxbby ...22110 (3.8)
Dạng ước tính bằng phương pháp bình phương cực tiểu:
kikiii xbxbxbby ...ˆ 22110 (3.9)
Trong đó: iyˆ là giá trị đoán của y.
ix là biến độc lập.
ib là các hệ số hồi qui.
Mô hình MLR có thể xuất hiện dưới một số dạng đặc biệt như sau:
Dạng tương tác: giả sử hai biến x1 và x2 có hệ tương tác thì mô hình MLR có
thể được viết:
21222110ˆ xxbxbxbbyi (3.10)
Dạng đa thức: mô hình hồi qui dạng đa thức bậc k có thể biểu diễn dưới dạng
Chương 3
20
tổng quát sau:
k
k xbxbxbby ...ˆ
2
210 (3.11)
3.1.2 Phân tích hồi qui đa biến tuyến tính
Các mô hình hồi qui đa biến tuyến tính có thể được thiết lập một cách tự động
bởi các chương trình phân tích thống kê như SPSS, SAS, BMDP, MINITAB,
Stagraphics-Plus, Microsoft EXEL, Stagraphics Centurion XV….
3.1.2.1 Các thủ tục chọn biến
Nhiều mô hình hồi qui có thể được xây dựng từ cùng một tập biến. Muốn sàn
lọc các biến độc lập xi có liên quan tuyến tính với biến phụ thuộc trong một nhóm dữ
liệu có N trường hợp quan sát, người ta có thể dùng nhiều phương pháp. Ba thủ tục
phổ biến mà ta sẽ nghiên cứu là: đưa dần vào (forward selection), loại trừ dần
(backward elimination), và hồi qui từng bước. Sau đây là các thủ tục chọn biến được
thực hiện trong phần mềm Stagraphics Centurion XV.
Phương pháp đưa dần vào: biến đầu tiên được xem xét để đưa vào phương
trình là biến có tương quan thuận hay nghịch lớn nhất với biến phụ thuộc. Có 2 tiêu
chuẩn để đưa biến vào:
F-to-enter: là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được
để được đưa vào.
F-to-remove: là giá trị F tối thiểu mà thống kê F của biến độc lập đó
phải đạt được để ở lại trong phương trình.
Phương pháp loại trừ dần: khởi đầu với tất cả các biến đều ở trong phương
trình, sau đó loại trừ dần bằng tiêu chuẩn loại trừ. Có hai tiêu chuẩn loại trừ:
F-to-enter: là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được
để được đưa vào.
F-to-remove: là giá trị F tối thiểu mà thống kê F của biến độc lập đó
phải đạt được để ở lại trong phương trình.
Phương pháp chọn từng bước: là sự kết hợp của thủ tục đưa dần vào và thủ
tục loại trừ dần, đây là phương pháp phổ biến nhất. Biến thứ nhất được chọn giống
Chương 3
21
như cách chọn dần từng bước. Sau khi biến thứ nhất được đưa vào, thủ tục chọn từng
bước khác với đưa dần vào ở chỗ biến thứ nhất được xem xét xem có nên loại bỏ nó ra
khỏi phương trình căn cứ theo tiêu chuẩn ra giống như thủ tục loại trừ dần. Các bước
như thế được tiếp tục cho đến khi không còn biến nào thỏa điều kiện ra nữa.
3.1.2.2 Đánh giá mô hình
Để đánh giá mức độ phù hợp của mô hình với bộ dữ liệu thực nghiệm, người ta
dùng các đại lượng sau:
Hệ số xác định (R2): bình phương hệ số tương quan giữa các giá trị yitính tính
theo mô hình hồi qui và các giá trị yi thực nghiệm.
N
i
i
N
i
tính
ii
yy
yy
R
1
2
1
2
2
)(
)(
1 (3.12)
Trong đó: y là giá trị trung bình của các giá trị iy .
Ý nghĩa: R2 cho biết sự phù hợp của mô hình với bộ dữ liệu thực nghiệm.
Nếu giá trị R2 càng gần 1 thì mô hình mô tả tốt các số liệu thực nghiệm, các giá trị yitính
tính toán rất gần các giá trị yi thực nghiệm.
Hệ số 2R hiệu chỉnh ( 2aR ): được sử dụng để phản ánh sát hơn mức độ phù
hợp của mô hình MLR. 2aR không nhất thiết phải tăng lên khi nhiều biến được thêm
vào phương trình.
1
)1( 222
kN
RkRRa (3.13)
Tính tổng quát của mô hình (Q2): Việc xác định tính tổng quát dựa trên
phương pháp tham chiếu chéo (cross validation). Phương pháp này được thực hiện
gồm các bước sau:
Chia ngẫu nhiên tập dữ liệu thành k tập con phân biệt.
Lặp lại k lần, mỗi lần chừa ra một tập con để kiểm tra, phần còn lại để
luyện
Chương 3
22
Tính giá trị Q2 :
N
i
i
N
i
tính
ii
yy
yy
Q
1
2
1
2
2
)(
)(
1 (3.14)
Giá trị Q2 càng gần 1 thì khả năng đoán nhận càng chính xác hay nói cách khác
mô hình có khả năng tổng quát hóa.
Khả năng đoán ngoại của mô hình: phương pháp này được thực hiện
như sau: chia bộ dữ liệu thành 2 nhóm nhỏ, dùng một nhóm luyện (training set) có N
trường hợp để thiết lập mô hình hồi qui và sau đó dùng mô hình ấy để đoán tác
dụng của một nhóm thử (test set) có M trường hợp.
Nếu mô hình tìm được có sự tuyến tính cao giữa các biến phụ thuộc và các biến
độc lập thì phương pháp phân tích MLR có ưu điểm sau:
Những mối quan hệ dữ liệu quan sát được mô tả rõ ràng.
Là phương pháp đơn giản cho việc đoán nhận mẫu mới.
Tuy nhiên phương pháp này sẽ không phù hợp trong những trường hợp mà giữa
các biến độc lập có liên hệ chặt chẽ với nhau hay số biến lớn hơn số mẫu quan sát.
Nếu mô hình không tuyến tính với các biến độc lập, khi đó ta có mô hình hồi
qui phi tuyến.
3.2 PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO (Artificial
Neural Network) 2, 8, 19, 22
Trong thực tế, mối quan hệ giữa biến phụ thuộc và các biến độc lập th