Download miễn phí Giáo trình Quản lý dữ liệu trong nghiên cứu môi trường
Kinh nghiệm cho thấy rằng, việc giảm thiểu hay tránh được quá trình chuyển đổi
dữ liệu từ một khuôn dạng này sang khuôn dạng khác có thể tiết kiệm được từ hàng vài
trăm đến hàng vài nghìn giờ làm việc tại các trung tâm dữ liệu, đó là chưa kể đến các
khoản chi phí lớn khác.Vìthế, việc lựa chọn một khuôn dạng chuẩn để trao đổi
thông tin dữ liệu đóng vai trò hết sức quan trọng. Thông thường, các thưmục metadata và
công cụ quản lý chúng được thiết kế và xây dựng dựa trên cơ sở của một trong số các quy
chuẩn trao đổi dữ liệu đã và đang được thế giới công nhận và sử dụng rộng rãi
http://cloud.liketly.com/flash/edoc/jh2i1fkjb33wa7b577g9lou48iyvfkz6-swf-2014-02-11-giao_trinh_quan_ly_du_lieu_trong_nghien_cuu_moi_tr.gtELs9ggLn.swf /tai-lieu/de-tai-ung-dung-tren-liketly-58348/
Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí
Tóm tắt nội dung tài liệu:
hợp sử dụng các dữ liệu dạng ghi chép cũng gây khó khăn trong việc tíchhợp các tập dữ liệu đ−ợc l−u trữ ở dạng này. Các cơ sở dữ liệu tuân thủ một cấu
trúc đã định tr−ớc, là nền tảng cho việc tích hợp các tập dữ liệu khác nhau về các
tập dữ liệu ở phạm vi khu vực hay quốc tế.
• Tốc độ: Các cơ sở dữ liệu cho phép làm việc hiệu quả với một khối l−ợng lớn dữ
liệu, do chúng có các chức năng thiết lập chỉ số và các thuật toán tìm kiếm chuyên
biệt cho phép nhanh chóng tìm kiếm và hiển thị dữ liệu. Một tập dữ liệu dạng ghi
chép không thể có các chức năng này, do vậy sẽ khiến cho ng−ời sử dụng gặp vất
vả khi phải tìm kiếm dữ liệu trong một tập dữ liệu lớn. Phần lớn các cơ sở dữ liệu
hiện đại có thể chứa đ−ợc rất nhiều dữ liệu trong các đĩa của máy tính, trong khi
điều này là hạn chế đối với các dữ liệu dạng ghi chép.
• Kết xuất dữ liệu: Sức mạnh thực sự của một cơ sở dữ liệu là khả năng truy cập dữ
liệu trên cơ sở các tra vấn nhiều khi khá phức tạp. Các cơ sở dữ liệu th−ờng chứa
các ngôn ngữ tra vấn ngầm định và hỗ trợ các cấu trúc, chẳng hạn nh− một cơ sở
dữ liệu quan hệ có thể tạo ra các tra vấn rất phức tạp, nhờ đó tạo ra khả năng truy
Simpo PDF Merge and Split Unregistered phiên bản -
Nguyễn Hồng Ph−ơng – Quản lý dữ liệu trong nghiên cứu môi tr−ờng
Tài liệu giảng dạy môn Tin học môi truờng – Khoa Môi tr−ờng, Tr−ờng đại học khoa học tự nhiên
- 12 -
cập tối đa tới dữ liệu. Các dữ liệu dạng ghi chép th−ờng không có chức năng tra
vấn này.
• Khả năng lập trình: Các cơ sở dữ liệu th−ờng có các ngôn ngữ lập trình ngầm
định, bao gồm cả các ngôn ngữ tra vấn phức tạp. Chúng cũng cho phép tạo ra các
màn hình nhập liệu hay báo biểu và th−ờng kèm theo các đơn thể ch−ơng trình
tính toán thống kê ngầm định. Các chứ năng ngầm định của các dữ liệu dạng ghi
chép th−ờng yếu hơn nhiều.
Simpo PDF Merge and Split Unregistered phiên bản -
Nguyễn Hồng Ph−ơng – Quản lý dữ liệu trong nghiên cứu môi tr−ờng
Tài liệu giảng dạy môn Tin học môi truờng – Khoa Môi tr−ờng, Tr−ờng đại học khoa học tự nhiên
- 13 -
Ch−ơng 3
Thông tin dữ liệu
I. Khái niệm Metadata
Metadata là một thuật ngữ th−ờng đ−ợc sử dụng thay cho cụm từ thông tin dữ liệu.
Đây là một khái niệm hiện đại và khá mới mẻ trong lĩnh vực nghiên cứu cơ sở dữ liệu ở
n−ớc ta. Một cách ngắn gọn nhất, Metadata đ−ợc định nghĩa nh− là dữ liệu về dữ liệu, tức
là sự mô tả các đặc tr−ng của dữ liệu đ−ợc thu thập cho một lĩnh vực chuyên môn nào đó.
Từ đây ta có khái niệm về cơ sở thông tin dữ liệu (Metadatabase). Thông th−ờng, các cơ
sở thông tin dữ liệu trả lời cho câu hỏi “ai có dữ liệu gì, ở đâu?”. Một trong những ví dụ
đơn giản nhất của một cơ sở thông tin dữ liệu có thể kể đến là th− mục danh bạ điện thoại
mà ta còn hay gọi là những trang vàng. Không phải ngẫu nhiên mà các th− mục thông tin
dữ liệu lớn trên thế giới hiện nay th−ờng có tên gọi nh− “Những trang xanh lá cây”,
“Những trang xanh n−ớc biển”, hay thậm chí “Những trang trắng”...
II. Ưu điểm của Metadata
Metadata đang đ−ợc sử dụng rộng rãi trong khu vực và trên thế giới, đặc biệt là
trong lĩnh vực quản lý và trao đổi dữ liệu hải d−ơng học và môi tr−ờng, do có những điểm
mạnh sau đây:
• Metadata là công cụ vô giá để quản lý dữ liệu thông qua việc cung cấp cho ng−ời
sử dụng những thông tin đầy đủ nhất liên quan đến những dữ liệu mà họ quan tâm.
Thông tin trong Cơ sở dữ liệu Metadata và phần mềm quản lý đ−ợc cung cấp trực
tiếp đến tay ng−ời dùng mà không tốn tiền mua nh− đối với một số loại dữ liệu
hay phần mềm khác.
• Thông tin về dữ liệu đ−ợc chuyển đến ng−ời sử dụng thông qua một hệ tham
chiếu, do đó sẽ không gặp phải những rắc rối về bản quyến hay trùng lặp dữ liệu.
• Việc áp dụng hệ thống Metadata sẽ tránh đ−ợc những đòi hỏi về một cơ chế tập
trung đối với việc quản lý các dữ liệu thực, do đó giảm nhẹ đáng kể những chi phí
cho việc tổ chức hay xây dựng những Trung tâm dữ liệu lớn với cấu trúc đồ sộ mà
vẫn đáp ứng đ−ợc các nhu cầu sử dụng dữ liệu của nhiều đối t−ợng khác nhau.
III. Th− mục Metadata
Thông tin về dữ liệu đ−ợc l−u trữ và quản lý trong các Th− mục Metadata. Đây là
th− mục chứa toàn bộ các thông tin mô tả các tập dữ liệu và việc thu thập chúng. Th− mục
cũng cung cấp các thông tin chi tiết về tất cả các tập dữ liệu hiện có và ai là ng−ời cần liên
hệ để có đ−ợc những dữ liệu cần thiết.
Trong số các dữ liệu đã đ−ợc thu thập cho một khu vực nghiên cứu, có nhiều dữ
liệu không đ−ợc công bố do nhiều lý do. Tuy nhiên, điều này không có nghĩa là không thể
Simpo PDF Merge and Split Unregistered phiên bản -
Nguyễn Hồng Ph−ơng – Quản lý dữ liệu trong nghiên cứu môi tr−ờng
Tài liệu giảng dạy môn Tin học môi truờng – Khoa Môi tr−ờng, Tr−ờng đại học khoa học tự nhiên
- 14 -
khai thác các dữ liệu đó bằng cách này hay cách khác. Các th− mục metadata, với các
công cụ tìm kiếm nhanh và hiệu quả luôn luôn có thể giúp ng−ời sử dụng dữ liệu tìm ra và
khai thác các dữ liệu loại này. Thậm chí cả các dữ liệu không gian cũng có thể đ−ợc tìm
kiếm nhờ các công cụ tra vấn không gian, bởi các th− mục metadata th−ờng bao hàm cả
các thông tin về vị trí địa lý của các khu vực nghiên cứu.
Khi làm việc với một th− mục Metadata, ng−ời sử dụng có thể đánh giá đ−ợc
thông tin nào là cần thiết đối với mình và khả năng truy cập tới nguồn dữ liệu mà mình
cần. Một th− mục Metadata cũng có thể đ−ợc sử dụng nh− một ph−ơng tiện quảng bá các
sản phẩm hay dịch vụ liên quan đến dữ liệu.
Quy trình xây dựng Th− mục Meatadata th−ờng bao gồm các b−ớc chính nh− sau:
1) Thu thập thông tin dữ liệu d−ới dạng các phiếu điều tra. Các phiếu điều tra bao gồm
các đề mục để trống đ−ợc phổ biến tới những cơ sở hay cá nhân làm công tác nghiên
cứu, các chuyên gia, các nhà quản lý dữ liệu liên quan tới đối t−ợng hay/và khu vực
nghiên cứu. Tuỳ theo mức độ đầy đủ, metadata đ−ợc điền vào các phiếu điều tra. Các
phiếu điều tra sau khi đã điền đầy đủ sẽ đ−ợc tập hợp lại để chuẩn bị nhập vào máy.
2) Nhập và quản lý dữ liệu. Metadata từ các phiếu điều tra đ−ợc nhập vào máy, sử dụng
các công cụ quản lý thông tin dữ liệu. Thông tin dữ liệu trong th− mục sẽ đ−ợc cập
nhật th−ờng xuyên và cất giữ định kỳ trong khuôn dạng an toàn.
IV. Khuôn dạng chuẩn trao đổi Metadata
Kinh nghiệm cho thấy rằng, việc giảm thiểu hay tránh đ−ợc quá trình chuyển đổi
dữ liệu từ một khuôn dạng này sang khuôn dạng khác có thể tiết kiệm đ−ợc từ hàng vài
trăm đến hàng vài nghìn giờ làm việc tại các trung tâm dữ liệu, đó là ch−a kể đến các
khoản chi phí lớn khác.Vì thế, việc lựa chọn một khuôn dạng chuẩn để trao đổi
thông tin dữ liệu đóng vai trò hết s