Dari kursus: Mempelajari Analitik Data: Dasar-Dasar 1
Pemodelan data di Power Query
- [Instruktur] Anda tidak selalu memiliki akses backend ke database dan alat kueri untuk digunakan untuk memodelkan data. Jadi apa yang Anda lakukan ketika Anda tidak melakukannya? Anda dapat menggunakan Power Query. Ini dibangun tepat di dalam Excel dan kita dapat membawa data kita, dan melalui penggunaan kueri gabungan, memodelkannya seperti yang kita butuhkan. Saya ingin melihat data upah kami dan beberapa data yang dapat digunakan kembali dari informasi kode pos yang kami dapatkan dari geonames.org. Jadi hal pertama yang akan kita lakukan adalah pergi ke Power Query melalui tab Data. Saya akan pergi ke Data, Dapatkan Data, Dari File, dan Dari Buku Kerja. Saya akan menavigasi ke File Latihan saya. Dan hal pertama yang ingin saya lakukan adalah menarik PostalCodeData saya. Dan saya akan memilih PostalCode. Segera, saya melihat sesuatu yang sedikit tidak beres dengan kode pos saya. Pertama, kode pos tidak panjang tiga digit. Mari kita lanjutkan dan pilih Tranform Data dan lihat apakah kita dapat menemukan masalahnya. Saya melihat header disebut TextPostalCode, tetapi apa yang sebenarnya dilakukannya adalah mengubah jenisnya. Power Query mencoba memahami tipe data dan akan secara otomatis membuatnya untuk Anda. Saya akan benar-benar menghapus langkah ini. Dan ketika saya melakukan itu, saya melihat TextPostalCode saya dan semua nol di depan saya kembali. Ingin melanjutkan dan mengubahnya menjadi tipe data Teks, dengan begitu ia mempertahankan nol di depan tersebut. Saya tidak perlu khawatir tentang itu lagi. Saya sebenarnya tidak membutuhkan kode pos lagi. Saya dapat mengklik kanan dan menghapusnya. Data ini hanya mewakili Amerika Serikat. Itu masih banyak data. Mari kita lanjutkan dan lakukan Close & Load. Dan ini akan membawa data kode pos ini langsung ke spreadsheet. Dan perhatikan bahwa itu mempertahankan nol depan saya, yang biasanya dijatuhkan oleh Excel. Baiklah, mari kita ambil dataset kita berikutnya. Saya akan pergi ke Data. Saya akan memilih Dapatkan Data. Saya akan pergi Dari File, Dari Buku Kerja, dan saya akan memilih data WageSurvey saya, dan saya akan memilih Impor. Saya akan memilih Survey dan saya akan melanjutkan dan mengubah data. Saya memiliki 343 tanggapan dari sebuah survei. Salah satu hal pertama yang ingin saya periksa adalah kode pos. Dan saya akan menggulir. Hal pertama yang akan saya lakukan adalah klik kanan dan pindahkan ke awal. Lebih nyaman ketika saya bersiap-siap untuk menggabungkannya. Saya juga memperhatikan bahwa itu adalah satu, dua, tiga atau sejumlah tipe data. Dan sungguh, untuk bergabung atau bergabung, mereka harus memiliki tipe data yang sama. Jadi saya akan melanjutkan dan mengubahnya menjadi Teks. Oke, bagus. Izinkan saya memperluas pertanyaan saya di sana. Jadi saya memiliki data kode pos saya dan saya memiliki data survei saya. Oke, sekarang saya memiliki dua kumpulan data saya yang siap untuk digabungkan. Pada tab Beranda pita saya di Power Query, saya akan pergi ke Gabungkan Kueri. Jika saya memilih Merge Queries di sini, maka itu hanya akan menggabungkan kedua dataset ini menjadi satu. Saya suka memisahkan milik saya sehingga saya akan menekan dropdown dan menyuruhnya untuk menggabungkan kueri sebagai baru. Sekarang meminta saya untuk memilih tabel. Saya akan melanjutkan dan memilih PostalCode saya di bawah ini, dan seperti kueri di mana kita harus menggabungkan dua bidang, di sini kita memilih bidang yang harus cocok. Sekarang, saya memiliki data survei saya di bagian atas dan saya memiliki data kode pos saya di bagian bawah. Saya telah memilih kedua kode pos dan saya melihat jenis gabungan saya, Left Outer, semuanya dari yang pertama dan cocok dari yang kedua. Jadi itu akan menunjukkan kepada saya semua data survei saya dan di mana ada kode pos yang cocok. Ini memberi tahu saya bahwa itu cocok dengan 337 dari 343 baris saya. Itu berarti saya memiliki kode pos yang salah kunci atau ada kode pos yang hilang. Saya akan melanjutkan dan mengklik OK. Dan sekarang saya memiliki kueri gabungan baru saya. Oke, yang akan saya lakukan sekarang adalah klik kanan Merge 1 dan pilih Rename. Dan saya akan menyebutnya SurveyPostalCodes. Oke, saya akan membuat kueri lain karena saya hanya ingin menganalisis hasil survei orang-orang di negara bagian Alabama dan 67 kabupaten. Jadi saya akan melanjutkan dan memilih Merge Queries. Saya akan melakukan Merge Queries as New. Dan saya akan melakukan gabungan yang sama. Saya akan memilih Survei. Saya akan memilih PostalCode. Power Query tidak menawarkan kiri dan kanan di layar, menawarkan bagian atas dan bawah, tetapi bagian luar masih berfungsi sama. Jadi saya tidak terlalu peduli tentang kiri atau kanan dan lebih peduli tentang luar dan menggunakan petunjuk layar tersebut. Di Power Query, atas adalah kiri dan bawah adalah kanan. Baiklah, jadi saya akan memilih Left Outer. Saya akan memilih kode pos saya, lalu saya akan mengklik OK. Mari kita lanjutkan dan sebut yang ini AlabamaSurveyResults. Oke. Jadi saya akan melanjutkan dan menutup pengaturan kueri saya, dan saya akan menggulir. Jadi di sini saya melihat tabel PostalCodes saya. Dalam kueri, kita menyeret dan melepas atau mengklik dua kali bidang. Dalam kueri penggabungan, kita hanya memperluas. Dan di sini kita bisa memberitahunya apa yang ingin kita bawa. Saya ingin kota, negara bagian, dan kabupaten. Saya dapat mengklik OK. Sekarang, saya akan melaporkan ini di peta sehingga saya mungkin memerlukan garis lintang dan bujur itu. Izinkan saya kembali ke pengaturan kueri saya yang saya tutup sebelumnya dan menekan bentuk roda gigi itu. Mari kita lanjutkan dan tambahkan garis lintang dan garis bujur, dan kemudian saya akan mengklik OK. Saya akan melanjutkan dan kembali ke SurveyPostalCodes. Saya akan menggulir ke sini untuk penggabungan. Dan di sini saya menginginkan segalanya kecuali TextPostalCode itu. Tidak perlu zona waktu untuk pelaporan saya juga. Saya akan melanjutkan dan mengklik OK. Perhatikan bahwa itu menambahkan nama kode pos. Jika saya tidak benar-benar ingin nama judul di sana, saya juga dapat mengatasinya. Anda melihat awalan nama kolom default ini? Saya bisa menghapusnya. Dan saya dapat mengklik OK. Dan kemudian saya hanya mendapatkan kota dan negara bagian utama itu. Kami melakukan hal yang sama untuk AlabamaSurveyResults saya. Sekali lagi, itu hanya tergantung pada apa yang Anda inginkan dalam pelaporan Anda. Sempurna. Oke. Saya akan melanjutkan dan menyimpan pekerjaan saya. Oke. Jadi saya memiliki satu langkah terakhir dan itu adalah benar-benar menyaring negara bagian Alabama. Jadi izinkan saya menggulir kembali. Saya akan menekan dropdown itu berdasarkan negara bagian saya. Saya akan memilih Alabama dan klik OK. Baiklah, dan kemudian saya siap untuk memuat semua ini ke spreadsheet. Oke, dan pada AlabamaSurveyResults saya, saya akan pergi ke Sheet4, dan perhatikan bahwa itu memberi tahu saya bahwa saya berada di SurveyPostalCodes. Saya akan kembali ke Sheet5. Sehingga Query & Connections di layar dapat membantu Anda. Jadi saya akan melanjutkan dan menamai ini AlabamaOnly. Saya akan pergi ke Sheet4, beri nama ini Semua Survei dengan Pos. Data asli. Dan data Kode Pos saya. Ulangi, saya akan melanjutkan dan menghapus Sheet1. Saya tidak membutuhkannya. Oke, jika saya mengklik kembali AlabamaSurveyResults, perhatikan bahwa itu membawa saya langsung ke lembar Alabama. Pemodelan data menjadi jauh lebih mudah selama bertahun-tahun. Kami memodelkan data untuk menyiapkannya untuk pembersihan lebih lanjut, untuk pelaporan yang lebih baik, tetapi ingatlah, sedikit pengetahuan akan membawa Anda jauh.
Konten
-
-
-
-
-
-
-
-
Memahami ETL dalam data1m 56d
-
Membersihkan data menggunakan macro Excel6m 15d
-
Membersihkan data dengan Power Query6m 30d
-
Bekerja dengan data yang dapat digunakan kembali4m 47d
-
Pemodelan data dengan kueri7m 32d
-
Pemodelan data di Power Query8m 34d
-
Tantangan: Mengubah nama header di Power Query47d
-
Solusi: Mengubah nama header di Power Query4m 11d
-
-
-