Khoa học

Khai thác dữ liệu là gì? »Định nghĩa và ý nghĩa của nó

Anonim

Khai phá dữ liệu hay khai phá dữ liệuquá trình phân loại thông qua các tập dữ liệu lớn để xác định các mẫu và thiết lập các mối quan hệ để giải quyết vấn đề thông qua phân tích dữ liệu. Các công cụ khai thác dữ liệu cho phép các công ty dự đoán các xu hướng trong tương lai.

Trong khai thác dữ liệu, các quy tắc kết hợp được tạo ra bằng cách phân tích dữ liệu cho các mẫu thường xuyên, sử dụng các tiêu chí hỗ trợ và độ tin cậy để xác định các mối quan hệ quan trọng nhất trong dữ liệu. Hỗ trợ là tần suất các mục xuất hiện trong cơ sở dữ liệu, trong khi độ tin cậy là số lần các câu lệnh là chính xác.

Các tham số khai thác dữ liệu khác bao gồm Phân tích Trình tự hoặc Lộ trình, Phân loại, Phân cụm và Dự báo. Các tham số Phân tích Trình tự hoặc Đường dẫn tìm kiếm các mẫu trong đó một sự kiện dẫn đến một sự kiện tiếp theo khác. Chuỗi là một danh sách có thứ tự gồm các tập hợp mục và là một kiểu cấu trúc dữ liệu phổ biến được tìm thấy trong nhiều cơ sở dữ liệu. Một tham số phân loại tìm kiếm các mẫu mới và có thể dẫn đến thay đổi cách tổ chức dữ liệu. Các thuật toán phân loại dự đoán các biến dựa trên các yếu tố khác trong cơ sở dữ liệu.

Nhóm các tham số tìm trực quan và ghi lại các nhóm dữ liệu chưa biết trước đây. Nhóm các nhóm một tập hợp các đối tượng và tổng hợp chúng dựa trên mức độ tương tự của chúng với nhau.

Có nhiều cách khác nhau mà người dùng có thể triển khai cụm, phân biệt giữa từng mô hình cụm. Khuyến khích các tham số trong khai thác dữ liệu có thể phát hiện ra các mẫu trong dữ liệu có thể dẫn đến các dự đoán hợp lý về tương lai, còn được gọi là phân tích dự đoán.

Các kỹ thuật khai thác dữ liệu được sử dụng trong nhiều lĩnh vực nghiên cứu, bao gồm toán học, điều khiển học, di truyền học và tiếp thị. Mặc dù các kỹ thuật khai thác dữ liệu là một phương tiện thúc đẩy hiệu quả và dự đoán hành vi của khách hàng, nhưng nếu được sử dụng đúng cách, một doanh nghiệp có thể tạo ra sự khác biệt với đối thủ thông qua việc sử dụng phân tích dự đoán.

Khai thác trên web, một loại khai thác dữ liệu được sử dụng trong quản lý quan hệ khách hàng, tích hợp thông tin được thu thập bằng các phương pháp và kỹ thuật khai thác dữ liệu truyền thống trên web. Khai thác web nhằm mục đích hiểu hành vi của khách hàng và đánh giá hiệu quả của một trang web cụ thể.