Untuk melakukan export Pandas DataFrame ke file csv, Pandas menyediakan fungsi to_csv. Sebagaimana diketahui Pandas merupakan paket python yang memberikan kemudahan dalam memproses dan menganalisa data. Biasanya data-data yang telah diolah disimpan dalam file, dan yang paling umum adalah file dengan format csv atau comma separated value.
Artikel berikut merupakan tutorial pandas singkat mengenai penggunaan fungsi to_csv beserta opsi-opsi yang sering digunakan untuk melakukan export Pandas DataFrame ke file csv. Yuk langsung saja kita KODING !
Dataset
Sebelum kita koding, kita akan membuat dataset sederhana yang terdiri dari 2 field, yaitu Name, Python Score dan Average Score.
import pandas as pd
dataset = {
'Name': ['Andi','Budi','Candil','Dudung'],
'Python Score': [75, 84, 95, 64],
'Average Score': [80.67, 75.5, 89.3, 72.45]
}
df = pd.DataFrame(dataset)
print (df)

Export Pandas DataFrame ke File csv
Secara sederhana fungsi to_csv dapat langsung digunakan untuk melakukan export Pandas DataFrame ke file csv. Dengan memberikan nama file pada opsi pertama.
df.to_csv('filename.csv')

Untuk menghilangkan index sehingga tidak ikut ke dalam file csv yang kita export, gunakan opsi opsi index yang diset False
df.to_csv('filename.csv', index=False)

Opsi sep
Opsi sep digunakan untuk merubah delimeter sesuai yang diharapkan. Delimiter default adalah koma ','
df.to_csv('filename.csv',sep='\t')

Opsi header
Jika ada kebutuhan untuk melalukan export Pandas DataFrame ke file csv tanpa menyertakan header atau nama kolom, dapat menggunaka opsi header yang diset False
df.to_csv('filename.csv',header=False)

Opsi columns
Seringkali kita memiliki dataset yang banyak memiliki kolom atau field, dan tidak semua field diperlukan untuk dieksport kedalam file. Cara termudah untuk melakukan hal tersebut adalah dengan menggunakan opsi columns
df.to_csv('filename.csv',columns=['Name', 'Average Score'])

Opsi float_format
Opsi float_format dapat digunakan untuk memformat data dengan tipe float
df.to_csv('filename.csv', sep='\t', float_format='%.2f')

Opsi na_rep
Untuk memberikan nilai tertentu pada kolom atau field yang memiliki nilai null dapat dilakukan langsung menggunakan opsi na_rep. Contoh dibawah akan mengisi nilai null dengan 'Unknown'
df.to_csv('filename.csv',na_rep='Unkown')
Yuk Terus Saling Terhubung
Demikian artikel singkat mengenai penggunaan fungsi to_csv untuk melakukan export Pandas DataFrame ke file csv. 7 opsi yang mungkin sering digunakan yaitu
- filename
- index
- sep
- header
- columns
- float_format
- na_rep
Untuk opsi lebih detail bisa mengunjungi site resmi dokumentasi pandas.
Untuk tutorial pandas
Enjoy learning and have fun with data !