back to blog

5 Library Python yang Wajib Dikenal Pemula Data Analyst

Read Time 5 mins | 01 Jul 2025 | Written by: Hastin Lia

2150062008

Python saat ini menjadi bahasa pemrograman yang sangat populer di kalangan praktisi data. Alasannya cukup sederhana: sintaks yang mudah dipahami, komunitas besar, dan dukungan library yang sangat kuat untuk berbagai kebutuhan analisis data. Jika Anda baru memulai perjalanan sebagai data analyst, mengenal dan memahami beberapa library Python dasar adalah langkah penting agar proses belajar menjadi lebih efisien, terstruktur, dan relevan dengan praktik industri.

Pandas: Library untuk Mengolah Data Tabel

Pandas bisa dibilang merupakan library pertama yang perlu Anda kuasai sebagai seorang data analyst. Library ini dirancang khusus untuk memudahkan manipulasi dan analisis data berbentuk tabel — misalnya data dari file Excel, CSV, atau database.

Struktur data utama dalam Pandas adalah DataFrame, yaitu struktur dua dimensi seperti spreadsheet atau tabel SQL. Anda dapat melakukan berbagai operasi dasar seperti membaca data (read_csv()), menyaring baris berdasarkan kondisi tertentu, mengelompokkan data berdasarkan kategori, hingga merangkum informasi statistik secara cepat.

Contoh penggunaan:

import pandas as pd

df = pd.read_csv('data_penjualan.csv')

print(df.head())

Dengan Pandas, Anda bisa membersihkan data yang kotor, mengisi data yang hilang, mengubah format tanggal, dan masih banyak lagi. Library ini akan menjadi tulang punggung dalam hampir setiap proyek analisis data Anda.

Baca juga: Model AI DeepSeek Rilis Versi Terbaru, Apa Kelebihannya?

NumPy: Dasar dari Perhitungan Numerik

Jika Pandas unggul dalam mengelola data tabular, maka NumPy adalah andalan dalam perhitungan numerik. NumPy (Numerical Python) menyediakan struktur array multidimensi dan berbagai fungsi matematis untuk melakukan operasi secara efisien.

Array NumPy jauh lebih cepat dan hemat memori dibandingkan list bawaan Python, terutama saat bekerja dengan data berukuran besar. Selain itu, banyak library populer lainnya seperti Pandas, SciPy, hingga Scikit-Learn, dibangun di atas NumPy. Dengan kata lain, memahami NumPy akan memudahkan Anda menguasai ekosistem data science Python secara menyeluruh.

Contoh penggunaan:

import numpy as np

data = np.array([10, 20, 30, 40])

print(data.mean())  # menghitung rata-rata

NumPy juga sangat berguna dalam komputasi statistik dasar, manipulasi matriks, serta persiapan data untuk keperluan machine learning.

Matplotlib: Visualisasi Data Sederhana

Visualisasi adalah bagian tak terpisahkan dari pekerjaan seorang data analyst. Salah satu cara paling umum untuk memahami data adalah dengan melihat grafiknya. Di sinilah peran Matplotlib, library visualisasi data paling dasar dan fleksibel di Python.

Dengan Matplotlib, Anda bisa membuat berbagai jenis grafik seperti line chart, bar chart, pie chart, dan histogram. Meski tampilannya cukup sederhana secara default, Anda memiliki kontrol penuh terhadap elemen-elemen grafis seperti warna, label, legenda, hingga ukuran.

Contoh membuat grafik garis:

import matplotlib.pyplot as plt

bulan = ['Jan', 'Feb', 'Mar', 'Apr']

penjualan = [200, 250, 300, 280]

plt.plot(bulan, penjualan)

plt.title('Tren Penjualan per Bulan')

plt.xlabel('Bulan')

plt.ylabel('Penjualan')

plt.show()

Matplotlib sangat ideal untuk presentasi atau laporan data yang memerlukan visualisasi cepat dan fleksibel.

Seaborn: Visualisasi Data yang Lebih Elegan

Jika Matplotlib adalah alat visualisasi dasar, maka Seaborn bisa dibilang sebagai versi yang lebih modern dan elegan. Seaborn dibangun di atas Matplotlib, namun menyederhanakan pembuatan grafik dan secara otomatis menghasilkan visualisasi yang menarik secara estetika.

Seaborn sangat cocok untuk eksplorasi data (exploratory data analysis) karena mendukung banyak jenis visualisasi statistik seperti heatmap, boxplot, violin plot, dan scatterplot matrix. Anda juga bisa dengan mudah membuat grafik berdasarkan data kategorikal dan numerik sekaligus.

Contoh membuat heatmap:

import seaborn as sns

import pandas as pd

df = pd.read_csv('data_korelasi.csv')

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

plt.title('Matriks Korelasi')

plt.show()

Seaborn juga sangat efisien saat dipasangkan dengan DataFrame dari Pandas. Anda bisa langsung memasukkan data dan kolom yang ingin divisualisasikan tanpa harus memproses ulang datanya terlebih dahulu.

Scikit-Learn: Langkah Awal ke Machine Learning

Setelah memahami data dan bisa memvisualisasikannya, langkah selanjutnya adalah membuat prediksi. Scikit-Learn (atau sklearn) adalah library Python yang dirancang untuk pembelajaran mesin (machine learning). Library ini menyediakan berbagai algoritma siap pakai untuk klasifikasi, regresi, klastering, pengolahan data, dan evaluasi model.

Meski fokusnya adalah machine learning, banyak data analyst yang memanfaatkan Scikit-Learn untuk membuat model prediktif sederhana berdasarkan data historis. Anda tidak perlu membangun model dari nol — cukup dengan memanggil fungsi tertentu dan memasukkan data Anda.

Contoh membuat model regresi linier:

from sklearn.linear_model import LinearRegression

from sklearn.model_selection import train_test_split

X = df[['luas_rumah']]

y = df['harga']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

model = LinearRegression()

model.fit(X_train, y_train)

prediksi = model.predict(X_test)

Selain itu, Scikit-Learn juga menyediakan fungsi untuk preprocessing data, seperti normalisasi, encoding variabel kategorikal, dan validasi silang. Dengan kata lain, library ini sangat cocok digunakan sebagai jembatan bagi data analyst yang ingin menjelajahi dunia data science lebih dalam.

Baca juga: Ingin Memulai Bisnis dari Nol dengan Bantuan AI? Ini Caranya

Kesimpulan

Menguasai lima library Python ini — Pandas, NumPy, Matplotlib, Seaborn, dan Scikit-Learn — akan memberikan fondasi kuat bagi Anda yang ingin meniti karier sebagai data analyst. Masing-masing memiliki fungsi unik yang saling melengkapi, mulai dari manipulasi data hingga visualisasi dan prediksi. Anda tidak perlu menguasai semuanya sekaligus, tapi mengenal dasar-dasarnya dan sering berlatih dengan proyek kecil akan membantu mempercepat proses belajar Anda dan membuat Anda lebih siap menghadapi tantangan data di dunia nyata.

Temukan Lowongan Pekerjaan Di MSBU!

 
 
 
Hastin Lia

Passionate di dunia IT, sering berbagi tentang teknologi, keamanan data, dan solusi digital.

Floating WhatsApp Button - Final Code (Text Box Smaller All)
WhatsApp Icon Buna