Dari kursus: Mempelajari Analitik Data: Dasar-Dasar 1
Membersihkan data menggunakan macro Excel
- Anda mungkin menemukan di sebuah organisasi, mereka menggunakan metode pembersihan data yang lebih lama. Mereka mungkin menggunakan Makro Excel. Bisa jadi vokal itu sudah lama tidak disentuh, atau mereka belum mengadopsi alat seperti Power Query. Penting untuk mengetahui kapan Anda mewarisi file, Anda mewarisi pengetahuan, dan gaya orang yang bertanggung jawab atas file itu. Namun, makro adalah cara yang bagus untuk menentukan apa yang perlu dibersihkan, dan juga peluang besar untuk perbaikan proses. Oke. Izinkan saya menunjukkan kepada Anda cara merekam beberapa makro, dan menunjukkan kepada Anda cara melihat ke dalam makro. Oke. Saya berada dalam survei tren pengeluaran saya, dan setiap kali saya mengunduh data ini, saya melihat jenis informasi yang sama terstruktur persis sama. Satu-satunya perbedaan adalah ada data baru setiap saat. Oke. Jadi saya mengaktifkan tab pengembang saya di pita saya. Anda dapat menyesuaikan pita Anda untuk menyalakannya jika tidak ada. Saya akan memilih rekam makro. Ini akan menjadi langkah pertama. Langkah pertama ini akan menyalin lembar. Oke, saya akan melanjutkan dan klik kanan lembar. Saya akan memilih pindah atau salin. Saya akan membuat salinannya. Saya akan memindahkannya ke akhir dan saya akan mengklik OK. Saya akan melanjutkan dan mengklik kembali pada lembar dan berhenti merekam. Sekali lagi, saya ingin menyimpan salinan lembar itu, sehingga saya dapat merujuknya kembali untuk menguji makro saya nanti. Sekarang saya siap untuk memulai proses pembersihan. Hal pertama yang akan saya lakukan adalah menghapus kolom yang tidak saya butuhkan. Saya akan mulai dengan merekam makro. Saya akan menyebut yang satu, langkah kedua. Saya akan menyebutnya hapus kolom atau delcal dan membuatnya jamak. Oke, saya tidak perlu mengumpulkan ID-nya untuk pelaporan saya. Saya juga tidak membutuhkan tanggal akhir. Saya akan melanjutkan dan menyorot alamat IP, sampai ke data kustom di G. Saya akan mengklik kanan dan menghapusnya. Oke, bagus. Ini membuat saya siap untuk apa yang saya butuhkan. Saya akan melanjutkan dan berhenti merekam. Saya akan merekam langkah saya selanjutnya. Sebut ini satu langkah ketiga, data SAS. Oke, saya akan melanjutkan dan menekan pilih semua dan klik dua kali judul kolom saya. Dan itu akan mengukur data saya. Saya akan mengklik kembali satu. Saya akan berhenti merekam. Oke. Sekali lagi, setiap kali saya mengunduh data ini, data ini memiliki baris dua. Baris kedua adalah informasi tambahan tentang header. Jadi saya harus melanjutkan dan mengatasinya dalam pembersihan saya. Oke. Biarkan saya melanjutkan dan merekam makro. Saya akan menyebutnya satu langkah empat, header bersih. Saya akan mengklik OK. Baiklah, saya akan melanjutkan dan menyalin ini, mendeskripsikan diri dan menempelkannya di sana ke E1. Saya akan melanjutkan dan menghapus baris kedua karena saya tidak lagi membutuhkannya. Saya akan melanjutkan dan membahas tajuk ini. Saya akan menyebutkan mereka, usia, jenis kelamin, pendidikan. Sempurna. Baiklah, saya akan kembali ke A1 dan kemudian saya akan berhenti merekam. Sekarang, saya siap untuk menguji makro saya, tetapi pada saat yang sama, saya benar-benar ingin merekam diri saya menjalankan langkah saya. Jadi saya akan melanjutkan dan menghapus lembar saya. Saya akan melanjutkan dan menamai ini kembali ke lembar karena itulah yang akan dicari adalah nama lembar bernama lembar. Saya akan merekam makro saya. Ini disebut run all. Saya akan mengklik OK. Saya akan pergi ke makro. Saya akan menjalankan langkah pertama. Anda lihat saya akan memiliki lembar dua di bawah. Saya akan pergi ke makro lagi. Saya akan menjalankan langkah kedua. Apakah Anda melihat bagaimana itu menghapus kolom saya? Saya akan pergi ke makro. Saya akan melakukan langkah ketiga. Itu mengukur data saya. Sempurna. Saya akan pergi ke makro untuk terakhir kalinya dan membersihkan header saya. Saya akan memilih lari. Keren. Kemudian saya bisa berhenti merekam. Sekarang ke depan, jika saya ingin menjalankan makro itu, saya bisa menjalankan run. Izinkan saya menunjukkan kepada Anda. Oke. Saya akan mengubah nama lembar kembali menjadi lembar. Sekali lagi, karena ketika saya mengunduhnya dari alat survei saya, itulah namanya. Saya akan pergi ke makro. Run all dipilih dan saya akan memilih run. Dan begitu saja, saya memiliki data yang bersih. Jadi Anda dapat melihat mengapa perusahaan mengadopsi makro. Namun, dengan munculnya kueri daya, opsi ini dibuat jauh lebih sederhana. Izinkan saya menunjukkan kepada Anda bagaimana Anda dapat melihat bagian dalam makro sehingga Anda dapat menentukan langkah-langkah pembersihan apa yang telah terjadi. Jadi saya akan pergi ke visual basic. Saya akan memperluas modul dan saya akan mengatakan modul satu. Ketika saya mengklik dua kali modul satu, itu menunjukkan kepada saya semua kolom, lembar, informasi yang saya ubah. Ini jauh lebih mudah dibaca ketika Anda benar-benar melakukan langkah-langkah itu, tetapi Anda akan melihat itu memberi tahu Anda, apa yang dipilih jika disalin, dan apakah itu ditempelkan dan ke mana perginya? Anda dapat mengatakan di mana kita mengubah nama benda. Sekali lagi, ini adalah informasi yang bagus untuk dimiliki karena Anda dapat menerapkannya nanti. Atau jika Anda perlu mengubah makro, Anda cukup memasukkannya ke dalam kode. Setelah 20 tahun menggunakan Excel, dan dengan data, saya tahu Anda akan menemukan file dengan makro hanya dengan mengetahui cara melihat ke dalam kode akan memberi tahu Anda rutinitas pembersihan apa yang dilakukan, cara memperluasnya, atau cara menggantinya.
Konten
-
-
-
-
-
-
-
-
Memahami ETL dalam data1m 56d
-
Membersihkan data menggunakan macro Excel6m 15d
-
Membersihkan data dengan Power Query6m 30d
-
Bekerja dengan data yang dapat digunakan kembali4m 47d
-
Pemodelan data dengan kueri7m 32d
-
Pemodelan data di Power Query8m 34d
-
Tantangan: Mengubah nama header di Power Query47d
-
Solusi: Mengubah nama header di Power Query4m 11d
-
-
-