hong_nhung
New Member
Download Luận văn Xây dựng hệ thống học linh hoạt với tương tác người dùng cho bài toán so khớp ontology
Mục lục
Mục lục . 1
Danh mục các ký hiệu, các chữviết tắt . 4
Danh mục các bảng . 5
Danh mục các hình vẽ, đồthị. 6
MỞ ĐẦU . 7
Chương 1 ONTOLOGY . 11
1.1 Định nghĩa . 11
1.2 Các thành phần của ontology. 11
1.2.1 Cá thể. 11
1.2.2 Lớp . 12
1.2.3 Thuộc tính . 13
1.2.4 Quan hệ. 14
1.3 Mã hoá các ontology . 16
1.4 Tóm tắt . 20
Chương 2 BÀI TOÁN SO KHỚP ONTOLOGY . 21
2.1 Bài toán Ví dụ. 22
2.2 Phát biểu Bài toán . 23
2.3 Ứng dụng của So khớp ontology . 25
2.4 Các kỹthuật Cơbản . 25
2.4.1 Các kỹthuật dựa trên tên . 26
2.4.2 Các kỹthuật dựa trên cấu trúc . 28
2.4.3 Các kỹthuật mởrộng . 29
2.4.4 Các kỹthuật dựa trên ngữnghĩa . 30
2.5 Các Chiến lược So khớp . 30
2.6 Ontology Alignment Evaluation Innitiative . 31
2.7 Vấn đềTương tác Người dùng trong So khớp Ontology . 33
2.8 Tóm tắt . 36
Chương 3 HỌC MÁY VÀ SO KHỚP ONTOLOGY . 37
3.1 Các phương pháp học máy . 37
3.1.1 Học có giám sát . 37
3.1.2 Học bán giám sát . 40
3.2 Học máy trong So khớp Ontology . 42
3.2.1 Bài toán So khớp Ontology nhưlà một Bài toán học máy . 43
3.2.2 Các nghiên cứu có liên quan . 45
Chương 4 HỆTHỐNG HỌC LINH HOẠT VỚI TƯƠNG TÁC NGƯỜI
DÙNG CHO BÀI TOÁN SO KHỚP ONTOLOGY . 49
4.1 Xây dựng Vector Tương tự. 50
4.1.1 Độtương tựcủa Từ. 52
4.1.2 Độtương tựcủa Danh sách Từ. 57
4.1.3 Độtương tựcủa Phân cấp Khái niệm . 58
4.2 Hệthống Học Linh hoạt cho So khớp Ontology . 59
4.2.1 Bộhọc cơsở. 60
4.2.2 Học Bán giám sát và Học chủ động với Phản hồi Người dùng . 61
Chương 5 THỬNGHIỆM VÀ ĐÁNH GIÁ . 63
5.1 Môi trường Thửnghiệm Chung . 63
5.1.1 Dữliệu Thửnghiệm . 63
5.1.2 Độ đo Đánh giá . 65
5.2 Thửnghiệm 1 (Học có giám sát) . 67
5.3 Thửnghiệm 2 (Học bán giám sát kết hợp học chủ động) . 69
5.4 Thảo luận . 71
5.5 Kết luận và Hướng phát triển . 72
TÀI LIỆU THAM KHẢO . 75
PHỤLỤC A . 78
PHỤLỤC B . 81
http://cloud.liketly.com/flash/edoc/jh2i1fkjb33wa7b577g9lou48iyvfkz6-swf-2013-10-30-luan_van_xay_dung_he_thong_hoc_linh_hoat_voi_tuong.s77DlHlYlK.swf /tai-lieu/de-tai-ung-dung-tren-liketly-42706/
Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí
MỞ ĐẦU
Sự tiến bộ vượt bậc của công nghệ trong thời gian gần đây đã tạo ra một lượng
dữ liệu trực tuyến lớn trên Internet. Lượng dữ liệu lớn này biến
Internet trở thành nguồn thông tin chủ yếu của con người. Người ta dựa vào
Internet để tìm kiếm thông tin cho hầu hết các hoạt động của mình như việc làm,
mua sắm, giải trí, du lịch… Tuy nhiên, chính nguồn dữ liệu lớn này lại
đang làm tiêu tốn nhiều công sức của con người để tìm kiếm thông tin thích hợp.
Con người đang bị chìm ngập trong khối dữ liệu do chính mình tạo ra. Chính vì
thế, người ta đang nghĩ đến việc sử dụng máy tính làm công cụ tự động thu thập
thông tin trên Internet để phục vụ cho nhu cầu của mình. Tuy nhiên hầu hết các
tài liệu trên Internet hiện giờ được lưu trữ theo định dạng mà chỉ có con người
mới hiểu được nội dung. Do đó, ta cần một chuẩn web mới cho phép máy tính có
thể hiểu và xử lý được dữ liệu trên Internet. Web ngữ nghĩa (Semantic Web) hay
Web 2.0 là một định nghĩa về thông tin mà máy tính có thể hiểu được, nhờ đó nó
có thể thực hiện nhiều hơn những công việc buồn tẻ, chẳng hạn như tìm kiếm,
chia sẻ và kết hợp thông tin trên web. Các công nghệ ngữ nghĩa đang thu hút sự
quan tâm đáng kể [17]. Theo Gartner1, các kỹ thuật ngữ nghĩa nằm trong danh
sách mười công nghệ đột phá hàng đầu trong giai đoạn 2008 –2012.
Ontology là phương tiện cung cấp ngữ nghĩa cho dữ liệu trong môi trường
web mới. Các ontology cho phép người sử dụng tổ chức thông tin theo các phân
loại khái niệm, cùng với các thuộc tính của nó và mô tả các mối liên hệ giữa các
khái niệm. Khi dữ liệu được đánh dấu với các ontology, các chương trình tìm
kiếm tự động có thể hiểu được ngữ nghĩa của dữ liệu và do đó có thể định vị và
thu thập dữ liệu một cách thông minh cho nhiều nhiệm vụ khác nhau. Chúng ta
xét một ví dụ sau trích từ [7] để hiểu được viễn cảnh về web ngữ nghĩa.
1
8
Ví dụ: Giả sử giáo sư Henry ở Đại học Washington (Mỹ) muốn tìm hiểu
thêm về một người đã gặp tại một hội nghị. Ông chỉ biết rằng tên của người này
là Cook, dạy tại khoa “Computer Science” của một trường đại học gần đây
nhưng ông không biết đó là trường nào. Giáo sư cũng biết rằng người ấy vừa mới
từ Úc đến Mỹ và ông ta là một “associate professor” tại trường đại học đang
công tác.
Trên web ngày nay chúng ta sẽ gặp rắc rối khi muốn tìm người này. Thông
tin trên không chứa trong một trang web duy nhất, do đó tìm kiếm bằng từ khoá
sẽ không hiệu quả. Ngược lại, trên web ngữ nghĩa, ta có thể nhanh chóng tìm câu
trả lời. Một dịch vụ thư mục đánh dấu sẽ giúp chương trình tìm kiếm tìm ra
những khoa “Computer Science” ở xung quanh trường. Những khoa này cũng có
dữ liệu đánh dấu bằng cách dùng một ontology tương tự như trong Hình 0.1. Ở
đây dữ liệu được tổ chức thành một cấu trúc phân loại bao gồm các “course”,
“people” và “professor”. “Professor” có các thuộc tính như “name”, “degree”,
“degree-grating institution”. Những dữ liệu được đánh dấu như thế làm cho
chương trình tìm kiếm dễ dàng tìm ra một “professor” với tên “Cook”. Sau đó
bằng cách kiểm tra tại thuộc tính “granting institution”, chương trình tìm kiếm
nhanh chóng tìm thấy khoa CS của trường đại học tại Úc. Ở đây, chương trình
tìm kiếm tự động biết được rằng dữ liệu đã được đánh dấu dùng một ontology
riêng của các đại học Úc, ví dụ như trong Hình 1.b và có nhiều thực thể có tên
Cook. Tuy nhiên, biết được rằng “associate professor” tương đương với “senior
lecturer”, chương trình có thể lựa chọn nhánh đúng trong cấu trúc phân loại của
khoa và mở trang chủ cũ của của người ta cần tìm hiểu.
9
Hình 0.1. Ví dụ về các ontology của khoa “Computer Science” [7]
Một trong những thách thức quan trọng đối với việc xây dựng web ngữ nghĩa
là tìm các ánh xạ ngữ nghĩa giữa các ontology. Do bản chất không tập trung của
sự phát triển web ngữ nghĩa, có một số lượng bùng nổ các ontology. Phần nhiều
trong những ontology này cùng biểu diễn một lĩnh vực nhưng với các tên gọi
khác nhau, hay các lĩnh vực khác nhau nhưng có sự chồng lấp về tên gọi. Để
tích hợp dữ liệu từ những ontology không đồng nhất, chúng ta phải biết được
những tương ứng ngữ nghĩa giữa các thành phần của chúng. Ví dụ, trong kịch
bản về người quen tại hội nghị ở trên, để tìm đúng người, chương trình máy tính
phải biết rằng “associate professor” ở Mỹ tương ứng với “senior lecture” ở Áo.
Những tương ứng về ngữ nghĩa giúp liên kết các ontology lại với nhau và cũng
giúp cho web ngữ nghĩa thật sự có “ngữ nghĩa”. Việc đánh dấu thủ công các kết
nối ngữ nghĩa thường tốn nhiều thời gian, chi phí, chứa nhiều lỗi và không khả
thi khi số lượng ontology bùng nổ trên môi trường web. Do đó, việc phát triển
các công cụ trợ giúp việc so khớp ontology có ý nghĩa quyết định cho sự thành
công của Web ngữ nghĩa. [7]
CS Dept US CS Dept Australia
UnderGrad
Courses
Grad
Courses People
Faculty Staff
Assistant
Professor
Associate
Professor Professor - first-name
- last-name
- education
K. Burn
Ph. D
Unv. of Michigan
R. Cook
Ph. D
Unv. of Sydney
Courses Staff
Academic Staff Technical Staff
Lecturer Professor
Senior
Lecturer
(a) (b)
10
Luận văn này giới thiệu một hệ thống học linh hoạt, sử dụng nhiều chiến
lược học để xử lý tương tác người dùng cho bài toán so khớp ontology. Cấu trúc
của luận văn được tổ chức như sau:
• Chương 1 giới thiệu một số kiến thức cơ bản về ontology, các thành phần
của ontolgy, cách mã hoá ontology dựa trên ngôn ngữ web cùng với các ví
dụ.
• Chương 2 trình bày một cách hình thức về bài toán so khớp ontology cùng
ứng dụng, các kỹ thuật cơ bản và chiến lược so khớp ontology. Phần này
cũng giới thiệu thông tin về tổ chức đánh giá các hệ thống ontology và
quan trọng là vấn đề tương tác người dùng trong ontology. Đây là bài toán
mà luận văn đề xuất ra mô hình để giải quyết.
• Chương 3 trình bày một số kiến thức cơ sở về học máy bao gồm hai loại
học có giám sát và học bán giám sát. Phần cuối của chương giới thiệu về
một số nghiên cứu về học máy trong bài toán so khớp ontology. Đây là
những công trình có liên quan đến nghiên cứu của luận văn.
• Chương 4 trình bày về hệ thống học máy được đề xuất. Hệ thống này sử
dụng nhiều chiến lược học khác nhau để đáp ứng với nhiều môi trường
người dùng thực tế. Phần đầu của chương trình bày về việc xây dựng
vector tương tự cho bài toán so khớp. Phần thứ hai mô tả chi tiết hệ thống
học máy.
• Chương 5 trình bày về các thử nghiệm của hệ thống cùng kết quả và
những nhận xét, thảo luận trên kết quả đạt được. Phần cuối của chương
trình bày kết luận và hướng phát triển của luận văn.
...
Download miễn phí Luận văn Xây dựng hệ thống học linh hoạt với tương tác người dùng cho bài toán so khớp ontology
Mục lục
Mục lục . 1
Danh mục các ký hiệu, các chữviết tắt . 4
Danh mục các bảng . 5
Danh mục các hình vẽ, đồthị. 6
MỞ ĐẦU . 7
Chương 1 ONTOLOGY . 11
1.1 Định nghĩa . 11
1.2 Các thành phần của ontology. 11
1.2.1 Cá thể. 11
1.2.2 Lớp . 12
1.2.3 Thuộc tính . 13
1.2.4 Quan hệ. 14
1.3 Mã hoá các ontology . 16
1.4 Tóm tắt . 20
Chương 2 BÀI TOÁN SO KHỚP ONTOLOGY . 21
2.1 Bài toán Ví dụ. 22
2.2 Phát biểu Bài toán . 23
2.3 Ứng dụng của So khớp ontology . 25
2.4 Các kỹthuật Cơbản . 25
2.4.1 Các kỹthuật dựa trên tên . 26
2.4.2 Các kỹthuật dựa trên cấu trúc . 28
2.4.3 Các kỹthuật mởrộng . 29
2.4.4 Các kỹthuật dựa trên ngữnghĩa . 30
2.5 Các Chiến lược So khớp . 30
2.6 Ontology Alignment Evaluation Innitiative . 31
2.7 Vấn đềTương tác Người dùng trong So khớp Ontology . 33
2.8 Tóm tắt . 36
Chương 3 HỌC MÁY VÀ SO KHỚP ONTOLOGY . 37
3.1 Các phương pháp học máy . 37
3.1.1 Học có giám sát . 37
3.1.2 Học bán giám sát . 40
3.2 Học máy trong So khớp Ontology . 42
3.2.1 Bài toán So khớp Ontology nhưlà một Bài toán học máy . 43
3.2.2 Các nghiên cứu có liên quan . 45
Chương 4 HỆTHỐNG HỌC LINH HOẠT VỚI TƯƠNG TÁC NGƯỜI
DÙNG CHO BÀI TOÁN SO KHỚP ONTOLOGY . 49
4.1 Xây dựng Vector Tương tự. 50
4.1.1 Độtương tựcủa Từ. 52
4.1.2 Độtương tựcủa Danh sách Từ. 57
4.1.3 Độtương tựcủa Phân cấp Khái niệm . 58
4.2 Hệthống Học Linh hoạt cho So khớp Ontology . 59
4.2.1 Bộhọc cơsở. 60
4.2.2 Học Bán giám sát và Học chủ động với Phản hồi Người dùng . 61
Chương 5 THỬNGHIỆM VÀ ĐÁNH GIÁ . 63
5.1 Môi trường Thửnghiệm Chung . 63
5.1.1 Dữliệu Thửnghiệm . 63
5.1.2 Độ đo Đánh giá . 65
5.2 Thửnghiệm 1 (Học có giám sát) . 67
5.3 Thửnghiệm 2 (Học bán giám sát kết hợp học chủ động) . 69
5.4 Thảo luận . 71
5.5 Kết luận và Hướng phát triển . 72
TÀI LIỆU THAM KHẢO . 75
PHỤLỤC A . 78
PHỤLỤC B . 81
http://cloud.liketly.com/flash/edoc/jh2i1fkjb33wa7b577g9lou48iyvfkz6-swf-2013-10-30-luan_van_xay_dung_he_thong_hoc_linh_hoat_voi_tuong.s77DlHlYlK.swf /tai-lieu/de-tai-ung-dung-tren-liketly-42706/
Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí
Tóm tắt nội dung tài liệu:
7MỞ ĐẦU
Sự tiến bộ vượt bậc của công nghệ trong thời gian gần đây đã tạo ra một lượng
dữ liệu trực tuyến lớn trên Internet. Lượng dữ liệu lớn này biến
Internet trở thành nguồn thông tin chủ yếu của con người. Người ta dựa vào
Internet để tìm kiếm thông tin cho hầu hết các hoạt động của mình như việc làm,
mua sắm, giải trí, du lịch… Tuy nhiên, chính nguồn dữ liệu lớn này lại
đang làm tiêu tốn nhiều công sức của con người để tìm kiếm thông tin thích hợp.
Con người đang bị chìm ngập trong khối dữ liệu do chính mình tạo ra. Chính vì
thế, người ta đang nghĩ đến việc sử dụng máy tính làm công cụ tự động thu thập
thông tin trên Internet để phục vụ cho nhu cầu của mình. Tuy nhiên hầu hết các
tài liệu trên Internet hiện giờ được lưu trữ theo định dạng mà chỉ có con người
mới hiểu được nội dung. Do đó, ta cần một chuẩn web mới cho phép máy tính có
thể hiểu và xử lý được dữ liệu trên Internet. Web ngữ nghĩa (Semantic Web) hay
Web 2.0 là một định nghĩa về thông tin mà máy tính có thể hiểu được, nhờ đó nó
có thể thực hiện nhiều hơn những công việc buồn tẻ, chẳng hạn như tìm kiếm,
chia sẻ và kết hợp thông tin trên web. Các công nghệ ngữ nghĩa đang thu hút sự
quan tâm đáng kể [17]. Theo Gartner1, các kỹ thuật ngữ nghĩa nằm trong danh
sách mười công nghệ đột phá hàng đầu trong giai đoạn 2008 –2012.
Ontology là phương tiện cung cấp ngữ nghĩa cho dữ liệu trong môi trường
web mới. Các ontology cho phép người sử dụng tổ chức thông tin theo các phân
loại khái niệm, cùng với các thuộc tính của nó và mô tả các mối liên hệ giữa các
khái niệm. Khi dữ liệu được đánh dấu với các ontology, các chương trình tìm
kiếm tự động có thể hiểu được ngữ nghĩa của dữ liệu và do đó có thể định vị và
thu thập dữ liệu một cách thông minh cho nhiều nhiệm vụ khác nhau. Chúng ta
xét một ví dụ sau trích từ [7] để hiểu được viễn cảnh về web ngữ nghĩa.
1
8
Ví dụ: Giả sử giáo sư Henry ở Đại học Washington (Mỹ) muốn tìm hiểu
thêm về một người đã gặp tại một hội nghị. Ông chỉ biết rằng tên của người này
là Cook, dạy tại khoa “Computer Science” của một trường đại học gần đây
nhưng ông không biết đó là trường nào. Giáo sư cũng biết rằng người ấy vừa mới
từ Úc đến Mỹ và ông ta là một “associate professor” tại trường đại học đang
công tác.
Trên web ngày nay chúng ta sẽ gặp rắc rối khi muốn tìm người này. Thông
tin trên không chứa trong một trang web duy nhất, do đó tìm kiếm bằng từ khoá
sẽ không hiệu quả. Ngược lại, trên web ngữ nghĩa, ta có thể nhanh chóng tìm câu
trả lời. Một dịch vụ thư mục đánh dấu sẽ giúp chương trình tìm kiếm tìm ra
những khoa “Computer Science” ở xung quanh trường. Những khoa này cũng có
dữ liệu đánh dấu bằng cách dùng một ontology tương tự như trong Hình 0.1. Ở
đây dữ liệu được tổ chức thành một cấu trúc phân loại bao gồm các “course”,
“people” và “professor”. “Professor” có các thuộc tính như “name”, “degree”,
“degree-grating institution”. Những dữ liệu được đánh dấu như thế làm cho
chương trình tìm kiếm dễ dàng tìm ra một “professor” với tên “Cook”. Sau đó
bằng cách kiểm tra tại thuộc tính “granting institution”, chương trình tìm kiếm
nhanh chóng tìm thấy khoa CS của trường đại học tại Úc. Ở đây, chương trình
tìm kiếm tự động biết được rằng dữ liệu đã được đánh dấu dùng một ontology
riêng của các đại học Úc, ví dụ như trong Hình 1.b và có nhiều thực thể có tên
Cook. Tuy nhiên, biết được rằng “associate professor” tương đương với “senior
lecturer”, chương trình có thể lựa chọn nhánh đúng trong cấu trúc phân loại của
khoa và mở trang chủ cũ của của người ta cần tìm hiểu.
9
Hình 0.1. Ví dụ về các ontology của khoa “Computer Science” [7]
Một trong những thách thức quan trọng đối với việc xây dựng web ngữ nghĩa
là tìm các ánh xạ ngữ nghĩa giữa các ontology. Do bản chất không tập trung của
sự phát triển web ngữ nghĩa, có một số lượng bùng nổ các ontology. Phần nhiều
trong những ontology này cùng biểu diễn một lĩnh vực nhưng với các tên gọi
khác nhau, hay các lĩnh vực khác nhau nhưng có sự chồng lấp về tên gọi. Để
tích hợp dữ liệu từ những ontology không đồng nhất, chúng ta phải biết được
những tương ứng ngữ nghĩa giữa các thành phần của chúng. Ví dụ, trong kịch
bản về người quen tại hội nghị ở trên, để tìm đúng người, chương trình máy tính
phải biết rằng “associate professor” ở Mỹ tương ứng với “senior lecture” ở Áo.
Những tương ứng về ngữ nghĩa giúp liên kết các ontology lại với nhau và cũng
giúp cho web ngữ nghĩa thật sự có “ngữ nghĩa”. Việc đánh dấu thủ công các kết
nối ngữ nghĩa thường tốn nhiều thời gian, chi phí, chứa nhiều lỗi và không khả
thi khi số lượng ontology bùng nổ trên môi trường web. Do đó, việc phát triển
các công cụ trợ giúp việc so khớp ontology có ý nghĩa quyết định cho sự thành
công của Web ngữ nghĩa. [7]
CS Dept US CS Dept Australia
UnderGrad
Courses
Grad
Courses People
Faculty Staff
Assistant
Professor
Associate
Professor Professor - first-name
- last-name
- education
K. Burn
Ph. D
Unv. of Michigan
R. Cook
Ph. D
Unv. of Sydney
Courses Staff
Academic Staff Technical Staff
Lecturer Professor
Senior
Lecturer
(a) (b)
10
Luận văn này giới thiệu một hệ thống học linh hoạt, sử dụng nhiều chiến
lược học để xử lý tương tác người dùng cho bài toán so khớp ontology. Cấu trúc
của luận văn được tổ chức như sau:
• Chương 1 giới thiệu một số kiến thức cơ bản về ontology, các thành phần
của ontolgy, cách mã hoá ontology dựa trên ngôn ngữ web cùng với các ví
dụ.
• Chương 2 trình bày một cách hình thức về bài toán so khớp ontology cùng
ứng dụng, các kỹ thuật cơ bản và chiến lược so khớp ontology. Phần này
cũng giới thiệu thông tin về tổ chức đánh giá các hệ thống ontology và
quan trọng là vấn đề tương tác người dùng trong ontology. Đây là bài toán
mà luận văn đề xuất ra mô hình để giải quyết.
• Chương 3 trình bày một số kiến thức cơ sở về học máy bao gồm hai loại
học có giám sát và học bán giám sát. Phần cuối của chương giới thiệu về
một số nghiên cứu về học máy trong bài toán so khớp ontology. Đây là
những công trình có liên quan đến nghiên cứu của luận văn.
• Chương 4 trình bày về hệ thống học máy được đề xuất. Hệ thống này sử
dụng nhiều chiến lược học khác nhau để đáp ứng với nhiều môi trường
người dùng thực tế. Phần đầu của chương trình bày về việc xây dựng
vector tương tự cho bài toán so khớp. Phần thứ hai mô tả chi tiết hệ thống
học máy.
• Chương 5 trình bày về các thử nghiệm của hệ thống cùng kết quả và
những nhận xét, thảo luận trên kết quả đạt được. Phần cuối của chương
trình bày kết luận và hướng phát triển của luận văn.
...