Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

chương 4

logo
by

Thuy Phan

on 14 May 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of chương 4

Thuyết trình :
Chương 4:Những điều cần biết về dữ liệu Định kiến Data mining ="Chỉ để phù hợp với một ý kiến có sẵn" Một số kĩ thuật
thống kê cho khai thác dữ liệu Quan sát và đo
lường dữ liệu Mở đầu Thank you! Nhóm:
Lê Trung Hiếu
Hoàng Văn Lợi
Hoàng Văn Lưu
Trần Văn Hiệp
Nguyễn Thị Lệ Huyền
Lê Thị Hiền
Nguyễn Thị Cẩm Nhung
Trần Thị Hòa Bài học kinh nghiệm Biểu đồ Dòng thời gian :•Bước 1: quyết định một khung thời gian phù hợp với dữ liệu •Bước 2: phác họa chuỗi thời gian Các giá trị tiêu chuẩn
(Z-Score) Thu thập dữ liệu và thống kê Không tính đến sai số trong dữ liệu cơ bản Rất nhiều dữ liệu Dữ liệu phụ thuộc thời gian Khó khăn thí nghiệm Dữ liệu bị kiểm duyệt và cắt ngắn Thống kê và khai thác dữ liệu giải quyết vấn đề giống nhau. Tuy nhiên, vì sự khác biệt về thời gian và sự khác biệt về bản chất của vấn đề. Khai thác dữ liệu thường có rất nhiều dữ liệu với phép đo ít sai số . Các dữ liệu có được từ khai thác dữ liệu phải đặt ra nghi ngờ về tính đúng đắn khi áp dụng vào các dữ liệu của quá trình kinh doanh. Kiểm Định Chi Bình Phương Mục đích : Giới thiệu các phương pháp thống kê hữu ích cho khai phá dữ liệu A. Fisher (1890-1962) Occam's Razor "Khi có nhiều con đường có thể đến được La Mã thì con đường ngắn nhất, giản dị nhất là con đường tốt nhất, đáng tin cậy nhất." "Nếu bạn có 2 lý thuyết cùng lý giải được những thực tế đã được quan sát thì bạn nên chọn cái đơn giản nhất cho đến khi có những bằng chứng mới." Mặt trái của Occam's Razor Bản thân con số đôi khi không quan trọng bằng cách mà chúng ta có con số đó. Tiểu phẫu Đại phẫu Dùng để kiểm định mối liên hệ giữa 2 biến định tính
Cho biết có tồn tại mối
liên hệ giữa 2 biến hay
không ? H0: 2 biến độc lập với nhau
H1: 2 biến phụ thuộc nhau Kết quả:
Sig<=anlpa :Bác bỏ H0
Sig>anlpa: Chấp nhận Ho Định lý giới hạn trung tâm Tổng của các biến ngẫu nhiên độc lập và phân phối đồng nhất theo cùng một phân phối xác suất, sẽ hội tụ về một biến ngẫu nhiên nào đó.
Full transcript