Download miễn phí Bài giảng Cơ sở dữ liệu nâng cao
MỤC LỤC
Chương 1. Hệ quản trị cơ sở dữ liệu . . . 7
1.1. Quan niệm về CSDL . . . 7
1.2. Các khả năng của một hệ quản trị cơ sở dữ liệu. . . 7
Chương 2. Cơ sở dữ liệu hướng đối tượng . . . 9
2.1. Nhu cầu về hệ thống cơ sở dữ liệu hướng đối tượng . . 9
2.1.1. Các đối tượng phức tạp . . . 9
2.1.2. Quản lý các tri thức . . . 9
2.1.3. Quản trị các dữ liệu phân tán . . . 10
2.1.4. Nhu cầu về hệ thống cơ sở dữ liệu hướng đối tượng. . 10
2.2. Khái niệm về hướng đối tượng. . . 11
2.2.1. Đối tượng. . . . 12
2.2.2. Lớp đối tượng . . . 12
2.2.3. Cá thể. . . . 13
2.2.4. Kế thừa . . . . 13
2.3. Cơ sở dữ liệu hướng đối tượng. . . 13
2.4. Thiết kế cơ sở dữ liệu hướng đối tượng. . 14
2.4.1. Phân lớp . . . . 14
2.4.2. Tổng quát hóa và đặc biệt hóa . . . 14
2.4.3. Gộp . . . . 15
2.5. Xây dựng cơ sở dữ liệu hướng đối tượng . . 15
Chương 3. Cơ sở dữ liệu phân tán. . . 17
3.1. Các phương pháp phân tán dữ liệu . . . 17
3.1.1. Khái niệm về phân tán dữ liệu . . . 17
3.1.1.1. Các lý do phân mảnh . . . 17
3.1.1.2. Các kiểu phân mảnh . . . 17
3.1.1.3. Mức độ phân mảnh . . . 19
3.1.1.4. Quy tắc phân mảnh đúng đắn . . 19
3.1.1.5. Các kiểu cấp phát . . . 19
3.1.1.6. Các yêu cầu thông tin . . . 19
3.1.2. Phân mảnh ngang . . . 20
3.1.2.1. Yêu cầu thông tin của phân mảnh ngang. . . 20
3.1.2.2. Phân mảnh ngang nguyên thủy. . . 21
3.1.2.3. Phân mảnh ngang dẫn xuất . . 23
3.1.3. Phân mảnh dọc. . . . 24
3.1.4. Cấp phát. . . . . 24
3.2. Kiểm soát dữ liệu ngữ nghĩa . . . 26
3.2.1. Quản lý khung nhìn . . . 26
3.2.1.1.Khung nhìn trong quản lý tập trung . . 26
3.2.1.2. Cập nhật qua các khung nhìn . . 26
3.2.1.3. Khung nhìn trong cơ sở dữ liệu phân tán . . 27
3.2.2. An toàn dữ liệu . . . 27
3.2.2.1. Kiểm soát cấp quyền tập trung . . 27
3.2.2.2. Kiểm soát cấp quyền phân tán . . 28
3.3. Quản lý giao dịch và điểu khiền đồng thời phân tán . . 28
3.3.1. Các khái niệm cơ bản về giao dịch . . 28
3.3.1.1. Tính nguyên tử . . . 29
3.3.1.2. Mục dữ liệu . . . 29
3.3.1.3. Khóa . . . . 30
3.3.1.4. Kiểm soát hoạt động đồng thời bằng khóa . . 30
3.3.1.5. Khóa sống (livelock) . . . 31
3.3.1.6. Khóa “cứng” (deadlock) . . . 31
3.3.1.7. Tính khả tuần tự của lịch biểu. . . 32
3.3.1.8. Bộ xếp lịch . . . 33
3.3.1.9. Nghi thức . . . 33
3.3.2. Mô hình giao dịch đơn giản. . . 33
3.3.2.1. Ý nghĩa của giao dịch –hàm đặc trưng. . 33
3.3.2.2. Kiểm tra tính khả tuần tự bằng đồ thị có h ướng. . 35
3.3.3. Nghi thức khóa 2 pha . . . 35
3.3.4. Mô hình khóa đọc và khóa ghi . . . 36
3.3.4.1. Ý nghĩa của giao dịch với khóa đọc và khóa ghi . 36
3.3.4.2. Đồ thị tuần tự hóa trong các giao dịch Rlock v à Wlock . 36
Chương 4. Hệ trợ giúp ra quyết định . . . 38
4.1. Giới thiệu về hệ trợ giúp ra quyết định . . 38
4.2. Thiết kế cơ sở dữ liệu cho hệ trợ giúp ra quyết định . . 39
4.2.1. Thiết kế logic. . . . 39
4.2.2. Thiết kế vật lý . . . 40
4.3. Kho dữ liệu và kho dữ liệu chuyên đề . . 40
4.3.1. Kho dữ liệu . . . 41
4.3.2. Kho dữ liệu chuyên đề. . . . 41
4.3.3. Các lược đồ về chiều. . . . 42
4.4. Xử lý phân tích trực tuyến. . . 43
4.4.1. Giới thiệu. . . . 43
4.4.2. Bảng chéo . . . 43
4.4.3. Cơ sở dữ liệu nhiều chiều . . . 44
4.5. Khai phá dữ liệu. . . 44
http://cloud.liketly.com/flash/edoc/jh2i1fkjb33wa7b577g9lou48iyvfkz6-swf-2014-02-11-bai_giang_co_so_du_lieu_nang_cao.SvPIdUYNHq.swf /tai-lieu/de-tai-ung-dung-tren-liketly-58442/
Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí
Tóm tắt nội dung tài liệu:
ệu ti nằm trong mảnh ri, thì nó sẽ không nằm trong các mảnh Rk với k j. Tiêu chuẩn này đảmbảo rằng các mảnh ngang sẽ tách biệt với nhau. Nếu quan hệ được phân mảnh dọc, các thuộc tính
khóa chính phải được lặp lại trong mỗi mảnh. Vì thế trong trường hợp phân mảnh dọc, tính tách biệt
chỉ được định nghĩa trên các trường không phải là khóa chính của một quan hệ.
3.1.1.5. Các kiểu cấp phát
Giả sử CSDL đã được phân mảnh hợp lý và cần quyết định cấp phát các mảnh cho các vị trí trên
mạng. Khi dữ liệu được cấp phát, nó có thể được nhân bản hay duy trì một bản duy nhất.
Lý do cần nhân bản là nhằm đảm bảo độ tin cậy và hiệu quả cho các câu vấn tin chỉ đọc.
Nếu có nhiều bản sao của một mục dữ liệu thì chúng ta vẫn có cơ hội truy xuất được dữ liệu đố
ngay cả khi hệ thống xẩy ra sự cố. Hơn nữa các câu vấn tin chỉ đọc truy xuất đến cùng một mục dữ
liệu có thể cho thực hiện song song bởi vì các bản sao có mặt tại nhiều vị trí. Ngược lại câu vấn tin
cập nhật có thể gây ra nhiều rắc rối bởi vì hệ thống phải bảo đảm rằng tất cả các bản sao phải được
cập nhật chính xác. Vì vậy quyết định nhân bản cần được cân nhắc và phụ thuộc vào tỷ lệ giữa các
câu vấn tin chỉ đọc và câu vấn tin cập nhật. Quyết định này có ảnh hưởng đến tất cả các thuộc toán
của hệ quản trị CSDL phân tán và các chức năng kiểm soát khác.
3.1.1.6. Các yêu cầu thông tin
Một điều cần lưu ý trong việc thiết kế phân tán là quá nhiều yếu tố có ảnh hưởng đến một thiết
kế tối ưu. Tổ chức logic của CSDL, vị trí các ứng dụng, đặc tính truy xuất của các ứng dụng đến
20
CSDL, và các đặc tính của hệ thống máy tính tại mỗi vị trí đều có ảnh hưởng đến các quyết định
phân tán.
3.1.2. Phân mảnh ngang
Trong phần ngày chúng ta sẽ bàn đến hai chiến lược phân mảnh:
- Phân mảnh ngang nguyên thủy: Phân mảnh ngang nguyên thủy của một quan hệ được thực
hiện dựa trên các vị từ được định nghĩa trên quan hệ đó.
- Phân mảnh ngang dẫn xuất: Là phân mảnh một quan hệ dựa vào các vị từ được định nghĩa trên
một quan hệ khác.
3.1.2.1. Yêu cầu thông tin của phân mảnh ngang.
1. Thông tin về CSDL
Thông tin về CSDL là lược đồ toàn cục và các quan hệ gốc. Trong ngữ cảnh này chúng ta cần
biết được các quan hệ sẽ kết lại với nhau bằng phép kết nối hay phép tính khác. Để thể hiện người
ta thường dụng mô hình thực thể để biểu diễn các quan hệ với các mỗi liên kết giữa chúng.
Thông tin định lượng cần có là lực lượng của mỗi quan hệ R, đó là số bộ có trong R được ký
hiệu là card(R).
2. Thông tin về ứng dụng
Để phân tán ngoài thông tin định lượng Card(R) ta còn cần thông tin định tính cơ bản gồm các
vị từ được dùng trong các câu vấn tin. Lượng thông tin này phụ thuộc vào bài toán cụ thể.
Cho lược đồ quan hệ R(U), U = A1, A2,…, AN trong đó mỗi Ai là một thuộc tính có miền giá trị
dom(Ai). Một vị từ đơn giản P được định nghĩa trên R có dạng:
P: Ai
Trong đó {=, =, >, }, Ai là một thuộc tính, dom(Ai).
Như vậy cho trước một lược đồ R, nếu các miền giá trị dom(Ai) là hữu hạn chúng ta có thể xác
định được tập tất cả các vị từ đơn giản trên R.
Ví dụ: Với hình 3.1. các vị từ đơn giản của quan hệ DuAn:
P1: Ten = “Bảo trì”
P2: KinhPhi <= 200000
Trong các bài toán thức tế các câu vấn tin thường chứa nhiều vị từ phức tạp hơn, là tổ hợp của
các vị từ đơn giản. Ví dụ vị từ hội sơ cấp của các vị từ đơn giản. Bởi một biểu thức boolean luôn có
thê biến đổi được thành dạng chuẩn hội cho nên chúng ta sử dụng hội sơ cấp để biểu diễn các vị từ
phức tạp.
Cho lược đồ quan hệ R(U), U = A1, A2,…, AN trong đó mỗi Ai là một thuộc tính có miền giá trị
dom(Ai). Pr = {p1, p2,…, pt}. Tập các vị từ hội sơ cấp M = {m1, m2,…, mk} được định nghĩa như
sau:
mi = p’j với 1 j t
Trong đó p’j = pj hay p’j = pj
Lưu ý: Phép lấy phủ định một vị từ không phải lúc nào cũng thực hiện được.
Theo những thông tin định tính về các ứng dụng chúng ta cần biết hai tập dữ liệu:
21
1.. Số lượng các bộ có quan hệ sẽ được truy xuất bởi câu vấn tin được đặc tả theo một vị từ
hội sơ cấp đã cho.
3. Tần số truy xuất và trong một số trường hợp là số truy xuất. Nếu Q = {q1, q2,…, qN} là các
câu vấn tin, acc(qi) biểu thị cho số truy xuất của qi trong một khoảng thời gian đã cho hay trong
quan hệ cụ thể.
3.1.2.2. Phân mảnh ngang nguyên thủy.
Phân mảnh ngang nguyên thủy được định nghĩa bằng một phép toán chọn trên các quan hệ chủ
của một lược đồ CSDL. Vì thế cho quan hệ R, các mảnh ngang của R là các Ri với Ri = R(Ei), 1 i
k
Trong đó Ei là công thức chọn (hội sơ cấp) được sử dụng để có thể có được mảnh Ri. Chú ý rằng
nếu Ei có dạng chuẩn hội, nó là một vị từ hội sơ cấp mi. Ri là các bộ của R thỏa mãn Ei.
Ví dụ:
Phân rã quan hệ DuAn thành các mảnh ngang DuAn1, DuAn2 trong hình 3.1. được định nghĩa
như sau:
DuAn1 = DuAn(KinhPhi 200000)
DuAn2 = DuAn(KinhPhi > 200000)
Một mảnh ngang Ri của quan hệ R có chứa tất cả các bộ R thỏa vị từ hội sơ cấp mi. Vì vậy cho
một tập các vị từ hội sơ cấp M, số lượng các mảnh ngang cũng bằng số lượng các vị từ hội sơ cấp
(tất nhiên một mảnh ngang có thể rỗng nếu vị từ không truy xuất đến bộ nào của quan hệ, các mảnh
ngang có thể bằng nhau nếu các vị từ tương đương). Tập các mảnh ngang này cũng thường được
gọi là tập các mảnh hội sơ cấp.
Rõ ràng việc định nghĩa các mảnh ngang phụ thuộc vào cá vị từ hội sơ cấp. Vì thế bước đầu tiên
của mọi thuật toán phân mảnh là phải xác định tập các vị từ đơn giản sẽ tạo ra các vị từ hội sơ cấp.
Tập vi từ này nói chung phụ thuộc vào mục tiêu và yêu cầu của bài toán.
Một số khái niệm quan trọng của các vị từ đơn giản là tính đầy đủ và cực tiểu của tập các vị từ.
Tập các vị từ đơn giản Pr được gọi là đầy đủ nếu và chỉ nếu xác suất của mỗi bộ của R(hay của
các mảnh Ri) được truy xuất bởi các vị từ p Pr đều bằng nhau.
Lý do cần bảo đảm tính đầy đủ là vì các mảnh thu được theo tập vị từ đầy đủ sẽ nhất quán
về mặt logic do tất cả chúng đều thỏa vị từ hội sơ cấp. Chúng cũng đồng nhất và đầy đủ về mặt
thống kê theo cách mà ứng dụng truy xuất chúng.
Đặc tính thứ hai của tập vị từ là tính cực tiểu. Đây là một đặc tính cảm tính. Vị từ đơn giản phái
có liên đới trong việc xác định một phân mảnh. Một vị từ mà không tham gia vào một tập phân
mảnh nào thì có thể coi vị từ đó là thừa. Nếu tất cả các vị từ của Pr đều có liên đới và không có các
vị từ tương đương thì Pr là cựu tiểu.
Chúng ta quy ước:
Thuật toán 3.1. COM-MIN Thuật toán tìm tập vị từ đầy đủ và cực tiểu
Vào: Quan hệ R, tập các vị từ đơn giản Pr
Ra: Pr’ – tập các vị từ đơn giản đầy đủ và cực tiểu
Phương pháp:
22
0. Gọi F tập các mảnh hội sơ cấp
Pr’ = , F =
1. p Pr, nếu p phân hoạch R theo quy tắc 1
- Pr’ = Pr’ {p}
- Pr = Pr – {...