Chủ đề CS2: Học máy và Khoa học dữ liệu

0.0(0)
studied byStudied by 0 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/22

flashcard set

Earn XP

Description and Tags

Ôn thi THPTQG Tin

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

23 Terms

1
New cards

Học máy

  • Lĩnh vực trong AI

  • Nghiên cứu, phát triển algo và model → học từ dữ liệu → Giải quyết vấn đề

  • Học sâu là lĩnh vực của học máy

2
New cards

Các bước học máy

  • Thu thập, chuẩn bị data chứa mẫu cần thiết

  • Algo → Trích xuất đặc trưng → Đầu vào cho model cụ thể

  • Model phân tích, học → dự đoán, dự báo, tích lũy tri thức

  • Triển khai, kiểm tra → điều chỉnh + cung cấp thêm data

3
New cards

Học có giám sát

  • Sử dụng dữ liệu có nhãn

  • Model dự đoán/phân loại đối tượng data mới dựa trên tri thức/dữ liệu đã được học/gán nhãn

4
New cards

Học không giám sát

  • Dữ liệu 0 nhãn

  • Mối quan hệ/tần suất,.. của dữ liệu → phát hiện thông tin ẩn chứa

5
New cards

Vai trò học máy trong ứng dụng

  • Lọc thư rác

  • Chẩn đoán bệnh

  • Nhận dạng giọng nói

  • Dịch tự động

  • Phân tích thị trường

6
New cards

Lọc thư rác

Học, phân loại, nhận dạng email dựa trên đặc trưng

7
New cards

Chẩn đoán bệnh

  • Nhận dạng hình ảnh, video, văn bản hồ sơ bệnh án → phát hiện, phân tích đặc điểm bệnh

8
New cards

Nhận dạng giọng nói

Phân tích dữ liệu → hiểu bối cảnh, nhận dạng phương ngữ/giọng điệu

9
New cards

Dịch tự động

Dữ liệu bản dịch/gốc → phát triển mô hình

10
New cards

Phân tích thị trường

  • Dự đoán xu hướng, hành vi, phản ứng

  • Phân tích hiệu suất chiến lược

11
New cards

Khoa học dữ liệu

Ứng dụng kĩ thuật đa lĩnh vực → khám phá tri thức, trích xuất data hữu ích

12
New cards

Mục tiêu khoa học dữ liệu

  • Khám phá tri thức

  • Phân tích dữ liệu

  • Tối ưu hóa quyết định

  • Trực quan hóa dữ liệu

13
New cards

Khám phá tri thức

Hiểu rõ hơn tính chất, đặc điểm, xu hướng, thông tin ẩn,…

14
New cards

Phân tích dữ liệu

Trích xuất thông tin + hiểu rõ dữ liệu → hành động, quyết định

15
New cards

Tối ưu hóa quyết định

→ Quyết định hiệu quả, tích cực

16
New cards

Trực quan hóa dữ liệu

Biểu diễn thông qua … → Hiểu rõ hơn

17
New cards

Thành tựu khoa học dữ liệu

  • Khám phá tri thức + nâng cao năng lực đưa quyết định

  • Tự động hóa

  • Cá nhân hóa dịch vụ

  • Dự đoán

18
New cards

Vai trò của máy tính với khoa học dữ liệu

  • Lưu trữ + xử lí dữ liệu

  • Tính toán

  • Trực quan hóa

  • Điện toán đám mây

19
New cards

Quy trình khoa học dữ liệu

  • Xác định vấn đề: Đặt câu hỏi/xác định vấn đề

  • Thu thập dữ liệu: Tìm kiếm, thu thập, tự tạo

  • Chuẩn bị dữ liệu: Làm sạch, khám phá tri thức ẩn, trực quan hóa

  • Xây dựng mô hình: Chọn, áp dụng phù hợp

  • Đánh giá: Hiệu suất

  • Triển khai: Sử dụng

20
New cards

5V Big Data

  • Volume: Khối lượng lớn

  • Velocity: Tốc độ tạo nhanh

  • Variety: Đa dạng

  • Veracity: Độ tin cậy

  • Value: Giá trị

21
New cards

Ưu điểm sử dụng máy tính → Xử lí big data

  • Triển khai mô hình học máy

  • Mở rộng: Kết hợp → máy tính mạng → xử lí quy mô lớn

  • Lưu trữ + bảo mật dữ liệu: Từ nhiều nguồn, định dạng → công cụ kiểm soát quyền truy cập

  • Thời gian thực:

    • Xử lí song song: Thuật toán song song → chia nhỏ

    • Tự động hóa

22
New cards

Kĩ thuật mô phỏng

Phiên bản ảo của hệ thống dựa trên dữ liệu đầu vào → nghiên cứu, phân tích,…

23
New cards

Một số phần mềm mô phỏng

  • PhET Interactive Simulations

  • AnSYS

  • Unity

  • SolidWorks

  • Cisco Packet Tracer

  • Flowgorithm