Dari kursus: Mempelajari Analitik Data: Dasar-Dasar 1

Membersihkan data dengan Power Query

Dari kursus: Mempelajari Analitik Data: Dasar-Dasar 1

Membersihkan data dengan Power Query

- [Instruktur] Ketika Anda mulai mempelajari Power Query, tidak mungkin untuk tidak menggunakannya bahkan untuk hal-hal dasar yang Anda lakukan sepanjang waktu untuk membersihkan data. Ini jauh lebih mudah daripada merekam makro, dan sama kuatnya. Ini terhubung ke data secara alami karena itulah yang dibuat untuk dilakukan, dan jauh lebih mudah untuk dikerjakan setelah Anda mempelajarinya sedikit. Mari kita buka CleanSpending di folder bab kita. Kami akan terhubung ke data Tren Pengeluaran di folder yang sama. Dengan cara ini ketika kita memiliki data baru, kita dapat mengganti file itu atau mengubah koneksi ke data baru. Oke. Jadi saya akan menavigasi ke Data. Saya akan memilih Dapatkan Data Dari File. Dan karena sumber file saya adalah Excel, saya akan memilih Dari Buku Kerja. Dan saya akan memilih Survei Tren Pengeluaran. Oke, saya akan memilih Data Asli saya. Dan kemudian saya memiliki dua pilihan. Saya dapat melanjutkan dan memuatnya ke spreadsheet sehingga saya dapat melihatnya, atau saya dapat langsung pergi ke Transform Data. Karena kita akan fokus pada pembersihan, kita akan langsung ke Transform Data. Kita bisa memuatnya nanti. Anda akan melihat Pengaturan Kueri di sisi kanan. Dan yang akan Anda perhatikan adalah di Langkah Terapan, setiap perubahan yang Anda buat akan ditangkap. Beberapa di antaranya sudah dilakukan untuk kami. Oke, jadi hal pertama yang akan saya lakukan adalah menghapus kolom yang tidak perlu. Ada beberapa cara untuk melakukan ini, tetapi saat ini saya hanya akan mengklik kanan ID Kolektor dan memilih Hapus. Karena saya tidak melakukan perbandingan tanggal mulai dan tanggal akhir, saya akan melanjutkan dan menghapus Tanggal Akhir. Dan kemudian saya juga ingin menyingkirkan alamat IP, alamat email, dan nama depan. Izinkan saya menunjukkan kepada Anda cara lain untuk melakukannya. Saya dapat pergi ke Pilih Kolom, dan kemudian saya dapat menghapus centang pada opsi yang tidak saya inginkan. Baiklah, saya akan melanjutkan dan mengklik Oke di sini. Dan kemudian Anda melihat langkah saya, bukan? Saya melihat Kolom yang Dihapus, jadi jika saya memilihnya, itu kembali ke langkah itu, dan itu memungkinkan saya melihat apa yang sebenarnya saya hapus. Jika saya memilih Kolom Lain yang Dihapus, itu menunjukkan kepada saya apa yang saya hapus, tetapi saya juga dapat memilih bentuk roda gigi kecil di sini jika saya perlu menambahkan satu kembali atau menghapus yang lain. Saya siap untuk melanjutkan dan mengklik Oke. Oke, jadi bidang Tanggal Mulai memiliki tanggal dan waktu, dan saya benar-benar hanya membutuhkan tanggal karena saya tidak melakukan perhitungan sensitif waktu. Jadi saya akan melanjutkan dan menekan tipe data kecil itu, dan mengubahnya menjadi Date. Dan sekali lagi, itu memberi saya Changed Type. Karena saya sudah memiliki satu Changed Type dan sekarang saya telah mengubahnya lagi, saya sebenarnya ingin mengganti nama langkah ini. Saya akan melanjutkan dan klik kanan dan mengganti namanya menjadi ChangedDateRemovedTime. Saya suka menggunakan nama yang bermakna karena orang akan melihat file saya setelah fakta. Tapi sekali lagi, itu adalah tebakan siapa pun tentang apa yang akan Anda lihat atau bagaimana Anda akan menamai file Anda sendiri. Oke, jadi salah satu hal yang saya perhatikan adalah bahwa judulnya dinamai dalam format pertanyaan. Jadi, saya akan melanjutkan dan mengklik dua kali, Berapa usia Anda? Dan ubah itu menjadi Age. Saya akan melanjutkan dan mengubah, Apa jenis kelamin Anda? Oh, izinkan saya menggulir sedikit saja karena kami memiliki opsi untuk SelfDescribe. Oke, jadi yang akan saya lakukan di sana adalah mengubahnya menjadi Gender, ubah yang berikutnya menjadi SelfDescribe. Saya akan melanjutkan dan mengubah, Apa tingkat pendidikan tertinggi, ke tingkat pendidikan. Dan sekali lagi, setiap kali saya melakukan ini, itu mengikuti kolom yang telah saya ganti namanya. Dan jika saya ingin melihatnya, saya dapat memperluasnya. Apa yang disebut ini adalah Kode M, dan saya dapat menyesuaikan Kode M ini secara manual jika saya mau. Salah satu fitur paling kuat di kotak alat kami sebagai analis data, adalah kemampuan untuk mengikat data bersama-sama. Di Excel, kita melakukan ini dengan concatenate atau concat. Saya ingin melakukan ini di Power Query, dan saya akan menggunakan Gabungkan. Jadi saya akan menyorot Gender, saya akan menahan tombol kontrol saya dan menyorot SelfDescribe. Saya akan mengklik kanan bidang ini dan memilih Merge Columns. Ini memungkinkan saya untuk memilih pemisah tertentu, dan memungkinkan saya untuk memberi mereka nama baru. Izinkan saya melanjutkan dan melakukan GenderInfo, dan klik Oke. Sekarang kedua kolom itu telah digabungkan bersama untuk membuat satu kolom. Dan sekali lagi, saya memiliki bentuk roda gigi saya di kolom gabungan yang memungkinkan saya untuk mengubah opsi saya jika saya mau. Saya akan memilih Batal. Dan saya akan melanjutkan dan membuat nama untuk ini sebagai GenderCombined. Oke, jadi karena ini adalah tanggapan survei, itu memberi saya dua tingkat judul. Judul pertama adalah semua pertanyaan, dan kemudian beberapa informasi tambahan datang dengan file. Saya harus selalu menyaring baris satu, jadi saya akan menyoroti ini, dan di mana ada (null), saya akan menghapus centangnya, dan itu akan menghapus baris ekstra itu di sana. Oke, saya akan mengklik kanan dan mengganti namanya menjadi RemoveSecondHeader. Setelah saya melakukan semua langkah yang saya butuhkan untuk data saya, saya kemudian dapat memilih Close & Load. Ini benar-benar akan memuat data ke spreadsheet. Saya melihat 262 baris saya dimuat, dan sekarang saya melihat informasi saya yang bagus dan bersih. Ini adalah salah satu alat paling ampuh di ujung jari setiap orang yang menggunakan versi Excel modern. Sudah ada selama beberapa tahun. Kemungkinan akan menyakiti perasaan Anda untuk mengetahui berapa lama Anda bisa menggunakannya. Tapi tidak ada waktu seperti saat ini. Penting juga untuk diketahui bahwa jika Anda mempelajari Power Query di Excel, maka Anda sudah mengetahuinya di Power BI. Anda dapat mempelajari lebih lanjut tentang Power Query, lihat kursus Oz du Soleil tentang Dapatkan dan Transformasi di perpustakaan.

Konten