Luận văn: | Hệ thống bóc tách giá cả sản phẩm tự động : Luận văn ThS. Công nghệ thông tin: 60 48 10 |
Nhà xuất bản: | ĐHCN |
Ngày: | 2009 |
Chủ đề: | Công nghệ thông tin Cơ sở dữ liệu Phần mềm máy tính Sản phẩm |
Miêu tả: | 71 tr. + CD-ROM Luận văn ThS. Công nghệ phần mềm -- Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội, 2009 Tổng quan về khai phá dữ liệu nói chung và khai thác Web nói riêng: phân loại nguồn dữ liệu Web, phân loại khai phá dữ liệu Web, các bước tiến hành khai phá nội dung Web. Trình bày cơ sở lý thuyết có liên quan đến hệ thống bóc tách giá cả sản phẩm tự động: các vấn đề liên quan đến phân tích ngôn ngữ đánh dấu siêu văn bản HTML; nguyên lí thu thập dữ liệu (Crawler); bài toán bóc tách thông tin; giải thuật bóc tách bản ghi dữ liệu có cấu trúc. Tiến hành xây dựng hệ thống chắt lọc thông tin sản phẩm trên Web: mô tả bài toán chắt lọc thông tin về sản phẩm trên Web; thiết kết kiến trúc hệ thống; thiết kế cơ sở dữ liệu; cài đặt hệ thống Electronic Resources |
Kiểu: | text |
Định dạng: | text/pdf |
You must be registered for see links