trang_duy

New Member
LINK TẢI LUẬN VĂN MIỄN PHÍ CHO AE KET-NOI

MỤC LỤC

MỞ ĐẦU 4
Chương i -TỔng quan vỀ cơ sỞ dỮ liỆU 5
I.1. Tổ chức và khai thác cơ sở dữ liệu truyền thống: 5
I.2. Bước phát triển mới của việc tổ chức và khai thác các CSDL. 5
I.3. Khai phá dữ liệu và quá trình phát hiện tri thức. 9
I.4 Giới thiệu cơ sở thực tập
Chương ii -Khai phá dỮ liỆu 13
II.1. Khai phá dữ liệu là gì 13
II.1.1. Khái niệm: 13
II.1.2. Các bước của quá trình khai phá dữ liệu: 13
II.1.3. Ví dụ minh hoạ 16
II.2. Nhiệm vụ chính của khai phá dữ liệu: 16
II.3. Các phương pháp khai phá dữ liệu: 19
II.3.1. Các thành phần của giải thuật khai phá dữ liệu: 19
II.3.2. Một số phương pháp khai phá dữ liệu phổ biến 20
II.4. Lợi thế của khai phá dữ liệu so với các phương pháp cơ bản 28
II.4.1. Học máy (Machine Learning) 28
II.4.2. Phương pháp hệ chuyên gia. 29
II.4.3. Phát hiện khoa học 29
II.4.4. Phương pháp thống kê 30
II.5. Lựa chọn phương pháp 30
II.6. Những thách thức trong ứng dụng và nghiên cứu kỹ thuật khai phá dữ liệu 31
II.6.1. Các vấn đề CSDL. 32
II.6.2. Một số vấn đề khác 34
II.7. Tình hình ứng dụng khai phá dữ liệu 35
Chương iii –LuẬt kẾt hỢp mỜ trong khai phá dỮ liỆu 36
III.1.Giới thiệu
III.2 Luật kết hợp 36
III.2.1. Bài toán xuất phát: 36
III.2.2. Mô hình hình thức: 37
III.2.3. Thuật toán: 38
III.2.4. Ký hiệu: 39
III.2.5. Thuật toán Apriori và AprioriTid: 40
III.2.6. Thuật toán AprioriTid: 43
III.2.7. Sinh ra các luật: 44
III.2.8. Ví dụ minh hoạ 45
III.3. Luật kết hợp mờ 46
III.3.1. Tập mờ (Fuzzy Set) 46
III.3.2. Quan hệ mờ 57
III.3.3. Điều khiển mờ 58
III.3.4. Giới thiệu chung về luật kết hợp mờ 62
III.3.5. Luật kết hợp mờ 64
III.3.6. Thuật toán khai thác luật kết hợp mờ 67
Chương iv -Cài đẶt 72
IV.1. Bài toán tìm luật 72
IV.2. Bài toán thực tế 72
Chương V –KẾt luẬn và kiẾn nghỊ 75




















MỞ ĐẦU
Ngày nay, cách mạng khoa học kỹ thuật diễn ra mọi lúc, mọi nơi, trên nhiều lĩnh vực của đời sống. Và Việt Nam cũng không nằm ngoài qui luật chung đó. Trong quá trình phát triển này, chúng ta đã thu thập được một khối lượng lớn dữ liệu. Và trong chính những cơ sở dữ liệu này tiềm ẩn rất nhiều tri thức có ích mà con người chưa khám phá. Ngoài ra, số lượng dữ liệu lớn được thu thập vượt quá khả năng phân tích của chúng ta mà không sử dụng những kỹ thuật phân tích tự động. Do vậy đã có một nhu cầu rất thiết thực là tìm kiếm được những tri thức trong những kho dữ liệu này. Xuất phát từ thực tế nói trên, và với mục đích tìm hiểu liên kết trong cơ sở dữ liệu, em đã quyết định lựa chọn đề tài “Khai Phá Dữ Liệu Sử Dụng Luật Kết Hợp Mờ” . Đề tài gồm 4 chương như sau:
Chương I: Tổng quan về cơ sở dữ liệu
Chương II. Khai phá dữ liệu
Chương III. Luật kết hợp mờ trong khai phá dữ liệu
Chương IV. Cài đặt.
Trong quá trình thực hiện đồ án này, mặc dù đã rất cố gắng, song không thể tránh khỏi những sai sót, em rất mong nhận được sự chỉ bảo và giúp đỡ từ phía thầy giáo và các bạn.



CHƯƠNG I
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
I.1. Tổ chức và khai thác cơ sở dữ liệu truyền thống:
Việc dùng các phương tiện tin học để tổ chức và khai thác các cơ sở dữ liệu (CSDL) đã được phát triển từ những năm 60. Từ đó cho đến nay, rất nhiều CSDL đã được tổ chức, phát triển và khai thác ở mọi quy mô và ở khắp các lĩnh vực hoạt động của con người và xã hội. Theo như đánh giá cho thấy, lượng thông tin trên thế giới cứ sau 20 tháng lại tăng gấp đôi. Kích thước và số lượng cơ sở dữ liệu thậm chí còn thăng nhanh hơn. Năm 1989, tổng số cơ sở dữ liệu trên thế giới vào khoảng 5 triệu, hầu hết đều là các cơ sở dữ liệu cỡ nhỏ được phát triển trên DBaseIII. Với sợ phát triển mạnh mẽ của công nghệ điện tử tạo ra các bộ nhớ có dung lượng lớn, bộ xử lý tốc độ cao cùng với các hệ thống mạng viễn thông, người ta đã xây dựng các hệ thống thông tin nhằm tự động hoá mọi hoạt động kinh doanh của mình. Điều này đã tạo ra một dòng dữ liệu tăng lên không ngừng vì ngay từ các giao dịch đơn giản nhất như một cuộc gọi điện thoại, kiểm tra sức khoẻ, sử dụng thẻ tín dụng… đều được ghi vào trong máy tính. Cho đến nay, con số này đã trở nên lớn bao gồm các cơ sở dữ liệu cực lớn cỡ gigabytes và thậm chí terabytes lưu trữ các dữ liệu kinh doanh ví dụ như dữ liệu thông tin khách hàng, dữ liệu sử dụng các giao dịch, dữ liệu bán hàng, dữ liệu các tài khoản, cáckhoản vay, sử dụng vốn… Nhiều hệ quản trị CSDL mạnh với các công cụ phong phú và thuận tiện đã giúp cho con người khai thác có hiệu quả các nguồn tài nguyên dữ liệu. Mô hình CSDL quan hệ và ngôn ngữ vấn đáp chuẩn (SQL) đã có vai trò hết sức quan trọng trong việc tổ chức và khai thác các CSDL đó. Cho đến nay, không một tổ chức kinh tế tổ chức là không sử dụng các hệ quản trị CSDL và các hệ công cụ báo cáo, ngôn ngữ hỏi đáp nhằm khai thác các CSDL phục vụ cho hoạt động tác nghiệp của mình.
I.2. Bước phát triển mới của việc tổ chức và khai thác các CSDL.
Cùng với việc tăng không ngừng khối lượng dữ liệu, các hệ thống thông tin cũng được chuyên môn hoá, phân chia theo các lĩnh vực ứng dụng như sản xuất, tài chính, buôn bán thị trường… Như vậy, bên cạnh chức năng khai thác dữ liệu có tính chất tác nghiệp, sự thành công trong kinh doanh không còn là năng suất của các hệ thống thông tin nữa mà là tính linh hoạt và sẵn sàng đáp lại những yêu cầu trong thực tế, CSDL cần đem lại những “tri thức” hơn là chính những dữ liệu đó. Các quyết định cần có càng nhanh càng tốt và phải chính xác dựa trên những dữ liệu sẵn có trong khi khối lượng dữ liệu cứ sau 20 tháng lại tăng gấp đôi làm ảnh hưởng đến thời gian ra quyết định cũng như khả năng hiểu hết được nội dung dữ liệu. Lúc này, các mô hình CSDL truyền thông và ngôn ngữ SQL đã cho thấy không có khả năng thực hiện được công việc này. Để lấy được những thông tin có tính “trí thức” trong khối dữ liệu lớn này, người ta đã đi tìm những kỹ thuật có khả năng hợp nhất các dữ liệu từ các hệ thống giao dịch khác nhau, chuyển đổi thành một tập hợp các cơ sở dữ liệu ổn định, có chất lượng được sử dụng chỉ riêng cho một vài mục đích nào đó. Các kỹ thuật đó được gọi chung là kỹ thuật tạo kho dữ liệu (data warehousing) và môi trường các dữ liệu có được gọi là các kho dữ liệu (data warehouse).
Kho dữ liệu là một môi trường có cấu trúc các hệ thống thông tin, cung cấp cho người dùng các thông tin khó có thể truy nhập hay biểu diễn trong các CSDL tác truyền thống, nhằm mục dích hỗ trợ việc ra quyết dịnh mang tính lịch sử hay hiện đại. Theo W.H. Inmon, có thể định nghĩa kho dữ liệu như sau: “Một kho dữ liệu là một tập hợp dữ liệu tích hợp hướng chủ đề có tính ổn định, thay đổi theo thời gian nhằm hỗ trợ cho việc ra quyết định. Nói cách khác, một kho dữ liệu bao gồm:
- Một hay nhiều công cụ để chiết xuất dữ liệu từ bất kỳ dạng cấu trúc dữ liệu nào.
Ý nghĩa
Cơ sở dữ liệu ban đầu.
Tập các thuộc tính trong D.
Tập các bản ghi trong D.
Cơ sở dữ liệu mờ được tính toán từ cơ sở dữ liệu ban đầu thông qua hàm thuộc của các tập mờ tương ứng với từng thuộc tính.
Tập các thuộc tính trong Df, mối thuộc tính đểu được gắn với 1 tập mờ. Mỗi tập mờ f có 1 ngưỡng wf .


Link Download bản DOC
Do Drive thay đổi chính sách, nên một số link cũ yêu cầu duyệt download.
Password giải nén nếu cần: ket-noi.com | Bấm vào Link, đợi vài giây sau đó bấm Get Website để tải:

 
Last edited by a moderator:

Kiến thức bôn ba

Các chủ đề có liên quan khác

Top