Skip to content

Blog Công Nghệ

MENUMENU
  • Trang chủ
  • Giới Thiệu
  • Lập Trình
    • Lập Trình Website
      • Laravel
        • Phân Tích Dự Án
      • PHP
      • SQL
      • HTML
      • CSS
      • Javascipt
      • My Project
      • Wordpress
    • Luyện Skill
    • Lập trình winform
    • CSDL
    • Lập Trình Android
    • Trí tuệ nhân tạo
    • Khai Khoáng Dữ Liệu
    • Arduino
    • Khác
    • Đồ án
  • Phần Mềm
    • Powerpoint
    • Tool
  • Cuộc sống và Giải trí
    • Hợp âm
    • web5ngay - youtube
    • Công Giáo
    • Kỹ Năng Sống
    • Street Workout
  • Danh sách bài viết
  • Guide line
    • Guild line phỏng vấn
    • Guide lines Laravel
    • Guide line Module Frontend
  • Tóm tắt sách
  • Fanpage

Blog Công Nghệ

Nơi chia sẻ kiến thức

Khai khoáng dữ liệu – đại học

24 Tháng Tám, 2020 by admin
Lượt xem: 559

Contents

  • Chương 1: Tổng quan về Data Mining
  • Chương 2:
    • 2.1 Slide bài giảng
    • 2.2 Bài tập
  • 3. Các thuật toán
    • 3.1 Thuật toán Apriori
    • 3.2 Thuật toán FP-Growth
    • 3.3 Thuật toán Agnes và Diana
    • 3.4 Thuật toán K-Mean
    • 3.5 Thuật toán KNN
    • 3.6 Thuật toán Naive Bayes
  • 4. Phần mềm Orange
    • 4.1 Import dữ liệu từ excel vào sql server
  • 5. Các câu hỏi trắc nghiệm

Chương 1: Tổng quan về Data Mining

Chương 2:

2.1 Slide bài giảng

2.2 Bài tập

Đề bài

Cho dữ liệu gồm các giá trị: 5, 7, 9,15, 24, 31, 35, 35, 37, 42,42,42,48,48,50

  • Số giỏ: 4
  • Chia giỏ theo độ rộng
  • Chia giỏ theo độ sâu

Giải

Lưu ý:

      + nếu dãy số chưa sắp xếp phải sắp xếp dãy số tăng dần.

      + ghi chữ nhỏ, màu đỏ ở dưới là giải thích vì sao được như vậy

  • Chia giỏ theo độ rộng:

(Max – Min) / 4 = (50 – 5) / 4 = 11,25 ~ 11

-Các giỏ: 

  + [5, 165+11) : 5, 7, 9, 15 

  + [16, 2716+11) : 24

  + [27, 3827+11) : 31, 35, 35, 37

  + [38, 50] : 42, 42, 42, 48, 48, 50

-Làm trơn theo trung vị:

  + Giỏ (1): 8, 8, 8, 8 ( (7 + 9) / 2 )

  + Giỏ (2): 24

  + Giỏ (3): 35, 35, 35, 35

  + Giỏ (4): 45, 45, 45, 45, 45, 45

-Làm trơn theo biên giỏ:

  + Giỏ (1): 5, 5, 5, 15 (  gần với biên nào thì giá trị biên lấy )

  + Giỏ (2): 24

  + Giỏ (3): 31, 37, 37, 37

  + Giỏ (4): 42, 42, 42, 42, 42, 50

  • Chia giỏ theo độ sâu: (N=4)

-Các giỏ: 

  + Giỏ (1): 5, 7, 9, 15 ( Chia đều số lượng ra các giỏ bằng nhau )

  + Giỏ (2): 24

  + Giỏ (3): 24, 31, 35, 35

  + Giỏ (4): 48, 48, 50

-Làm trơn theo trung vị:

  + Giỏ (1): 8, 8, 8, 8 ( (7 + 9) / 2 )

  + Giỏ (2): 33, 33, 33, 33

  + Giỏ (3): 42, 42, 42, 42

  + Giỏ (4): 48, 48, 48

-Làm trơn theo biên giỏ:

  + Giỏ (1): 5, 5, 5, 15 (  gần với biên nào thì giá trị biên lấy )

  + Giỏ (2): 24, 35, 35, 35

  + Giỏ (3): 37, 42, 42, 42

  + Giỏ (4): 48, 48, 50

3. Các thuật toán

3.1 Thuật toán Apriori

3.2 Thuật toán FP-Growth

3.3 Thuật toán Agnes và Diana

Các định nghĩa Single Link, Complete Link, Average Link được mô tả trong slide sau:

3.4 Thuật toán K-Mean

3.5 Thuật toán KNN

3.6 Thuật toán Naive Bayes

Mình có viết một bài về thuật toán này. Các bạn xem thêm tại đây: https://blogcongnghe.tronghao.site/hieu-thuat-toan-naive-bayes-nhu-the-nao/

4. Phần mềm Orange

  • download: https://orange.biolab.si/download/#windows

4.1 Import dữ liệu từ excel vào sql server

Bước 1: Click phải chuột vào cơ sở dữ liệu => Tasks => Import Data…

Bước 2: Chọn Next và chọn Microsoft Excel tại Data source. Sau đó nhấn Browse để chọn file và nhấn next (3 lần), ở lần next thứ 3 check các sheet cần import, nhấn next thêm 2 lần và nhấn Finish để import dữ liệu.

5. Các câu hỏi trắc nghiệm

Link drive: https://drive.google.com/drive

Related posts:

  1. Thuật toán khai khoáng dữ liệu – Hiểu Thuật Toán Naive Bayes như thế nào?

Post navigation

Previous Post:

Thêm trình chiếu powerpoint vào website wordpress

Next Post:

Tập bụng từ con số 0

Trả lời Hủy

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Ẩn sidebar

Tìm kiếm

Generic selectors
Exact matches only
Search in title
Search in content
Search in posts
Search in pages

Blog Công Nghệ

Bài viết mới

  • Master typescript
  • Sendmail trong Laravel sử dụng dịch vụ SES, SQS của Amazon
  • Install SSL in Nginx Ubuntu
  • Docker study
  • Bảo vệ: Hướng dẫn code bot Telegram easy game

Lượng truy cập

0074497
Visit Today : 93
Visit Yesterday : 178
This Month : 768
Who's Online : 3
© 2025 Blog Công Nghệ | WordPress Theme by Superbthemes