Postingan

Menampilkan postingan dari Juni, 2024

TUGAS 3 DATA MINING SEMESTER 6

Gambar
Pre-processing data merupakan tahapan krusial dalam analisis data yang bertujuan untuk mempersiapkan data mentah agar siap digunakan dalam proses analisis lebih lanjut. Proses ini melibatkan serangkaian aktivitas untuk membersihkan, mengubah, mengintegrasikan, dan mereduksi data sehingga memastikan data memiliki kualitas yang baik, dapat dipahami, dan sesuai dengan kebutuhan analisis. 1. Data Collection (Pengumpulan Data) Pengumpulan data merupakan langkah pertama dalam pre-processing data. Data dikumpulkan dari berbagai sumber seperti basis data, file teks, sensor, atau data streaming. Pengumpulan data yang baik memastikan data yang cukup untuk analisis dan memenuhi kebutuhan proyek atau penelitian yang sedang dilakukan. 2. Data Cleaning (Pembersihan Data) Pembersihan data melibatkan identifikasi dan penanganan nilai yang hilang, tidak valid, atau tidak lengkap dalam dataset. Hal ini penting karena data yang tidak bersih dapat menghasilkan hasil analisis yang bias atau tidak akurat. C...

TUGAS 4 DATA MINING SEMESTER 6

1. DATA CLEANING Data cleaning merujuk pada proses mendeteksi dan memperbaiki (atau menghapus) data yang tidak akurat, tidak lengkap, atau tidak relevan dalam sebuah dataset. Ini merupakan langkah penting dalam pra-pemrosesan data sebelum analisis atau pemodelan, memastikan bahwa data tersebut akurat, konsisten, dan dapat digunakan untuk tugas-tugas lebih lanjut. Beberapa aspek utama dari data cleaning meliputi: 1. Penanganan Data yang Hilang: Mengatasi nilai-nilai yang hilang dengan cara menghapusnya, mengisi nilai (misalnya, rata-rata, median, modus), atau menggunakan teknik-teknik lanjutan seperti pemodelan prediktif. 2. Menghapus Duplikat: Mengidentifikasi dan menghapus catatan ganda untuk memastikan setiap titik data adalah unik dan representatif. 3. Normalisasi dan Standarisasi: Penskalaan data numerik ke rentang standar atau normalisasi untuk memfasilitasi perbandingan yang adil antara fitur-fitur yang berbeda. 4. Deteksi dan Penanganan Pencilan: Mengidentifikasi pencilan yang d...

TUGAS 2 DATA MINING SEMESTER 6

Gambar
 1. Data Preparation Data Preparation adalah tahapan penting dalam proses analisis data yang mencakup semua aktivitas yang diperlukan untuk mempersiapkan data mentah sehingga siap digunakan dalam analisis lebih lanjut. Tujuannya adalah untuk memastikan bahwa data yang digunakan dalam analisis atau pemodelan memiliki kualitas yang baik, bebas dari kesalahan, dan sesuai dengan kebutuhan analisis yang akan dilakukan. Beberapa aktivitas umum dalam Data Preparation meliputi: 1. Cleaning Data (Pembersihan Data):    - Menghapus atau menangani data yang hilang, tidak lengkap, atau tidak valid.    - Mendeteksi dan memperbaiki nilai-nilai yang tidak masuk akal atau outlier. 2. Transforming Data (Transformasi Data):    - Mengubah format atau representasi data untuk membuatnya lebih sesuai dengan kebutuhan analisis.    - Contohnya termasuk normalisasi data, pengkodean kategori menjadi variabel numerik, atau mengubah skala data. 3. Integrating Data (...

TUGAS 1 DATA MINING SEMESTER 6

  1. Proses atau Tahapan Data Mining Proses atau tahapan data mining biasanya melibatkan beberapa langkah sistematis untuk mengekstraksi informasi yang berguna dari data mentah. Berikut adalah tahapan umum dalam proses data mining: a. Pemahaman Bisnis (Business Understanding)    - Identifikasi tujuan bisnis.    - Menentukan masalah yang ingin dipecahkan dengan data mining.    - Mendefinisikan tujuan data mining berdasarkan kebutuhan bisnis. b. Pemahaman Data (Data Understanding)    - Mengumpulkan data yang relevan.    - Memeriksa kualitas data dan memahami struktur data.    - Mengeksplorasi data untuk menemukan pola awal dan anomali. c. Persiapan Data (Data Preparation)    - Membersihkan data dari kesalahan dan inkonsistensi.    - Mengatasi data yang hilang atau tidak lengkap.    - Mengubah dan menyatukan data dari berbagai sumber.    - Memilih fitur atau atribut yang relevan un...