Pages

Wednesday, July 18, 2012

Sedikit Pengenalan Dengan Apatar (ETL Tool)


"Dahulu kala 4 negara (negara Air, Udara, Api, dan Bumi) hidup dengan tentram, sampai akhirnya negara api menyerang untuk berkuasa. Apatar yang menguasai ke 4 elemen yang bisa mendamaikan malah menghilang". Itu Avatar Kali...!!!, yang akan kita bicarakan di sini adalah Apatar ETL, bukan Avatar Enk...hehehehehe.

Baiklah langsung saja apa itu Apatar?, Apatar merupakan Opensource ETL Tool yang digunakan untuk membuat Data Warehouse (Artikel Sebelumnya). Untuk sekelas opensource ETL tool Apatar memiliki fungsi dan fitur yang komplek. Seperti yang dikatakan dalam situsnya (http://www.apatar.com), Apatar memiliki kapabilitas untuk koneksi ke banyak vendor database, Flat File, File Delimited, dan Web Service seperti Oracle, MS SQL Server, MySQL, Sybase, DB2, MS Access, Postgresql, XML InstanDB, Paradox, BorlandJDataStore, CSV, MS Excel, Qed, HSQL, Compiere ERP, SalesForge.com, SugarCRM, GoldMine, Koneksi melalui JDBC, dan lain-lain.


Apatar memiliki GUI yang simple untuk me-manage project yang anda buat. selain itu Fungsi untuk mengolah data juga cukup komplek mulai dari Fungsi Matematika, Fungsi String, Operator, dan Fungsi Date. Selain konektor disebutkan di atas pada Apatar yang saya pakai versi 1.12.23 juga memiliki konekter untuk FTP, File System, HTTP, Email, RSS, dan LDAP.

Baiklah, untuk lebih seru alangkah baiknya kita mencoba menggunakan Apatar untuk pengolahan data yang sederhana. Sebelum mencoba Install terlebih dahulu Apatar-nya (Ya iya lah...gimana mau coba kalo Apatar-nya ga diinstall..hehehe lagi)
  • Download Apatar di Official Apatar Site atau di http://sourceforge.net/projects/apatar/
  • Instal Apatar, langkah-langkah nya bisa dibaca di Apatar Documentations
  • Download beberapa kebutuhan di SINI
  • Lalu Extract pengenalan_apatar.zip, di dalam ada file customer_detail.xls, customers_demo5mn.csv, dan lat_etl_customer.sql. Import lat_etl_customer.sql menggunakan phpMyAdmin atau Mysql Database Manager kesayangan anda.
Ok kita lanjutkan, setelah sukses menginstall Apatar, maka jalankan Apatarnya. Selanjutnya akan terlhihat GUI Apatar sebagai berikut.


Bisa dilihat pada gambar di atas terdapat 3 bagian pada Apatar, bagian atas adalah Main menu, bagian Bawah kiri terdapat Connectors, Data Quality Services, dan Operations. Bagian bawah kanan adalah work area. Untuk selanjutnya klik Create new DataMap.

Selanjutnya drag pada bagian Connectors untuk TextFIle, MySQL, MS Excel ke Work Area dan drag pada bagian Operations untuk Join ke Work Area. Terus atur pada bagian Work Area sehingga terlihat seperti pada gambar berikut.


Lalu double click pada konektor TextFile untuk memulai kofigurasi. Pilih Choose File dan browse file customers_demo5mn.csv, terus pada bagian sparator pilih bagian semicolon(;). Selanjutnya click Next dan Finish. Untuk lebih jelasnya bisa dilihat pada gambar berikut.


Untuk melihat apakah customers_demo5mn.csv sudah terkonfigurasi sebagai sumber data yang akan di olah, bisa dilakukan dengan click kanan pada Konektor TextFile yang sudah berubah nama menjadi customers_demo5mn.csv, lalu pilih Run and Preview Results. Setelah anda melihat Preview-nya, close jendela-jendela Preview Results-nya.

Langkah selanjutnya double click pada konektor MySQL untuk memulai konfigurasi. Masukan username, password, port, dan database. database diisi denganlat_etl_customer sesuai pada bagian awal yang di-import melalui phpMyAdmin. selanjutnya click next, pada bagian Record Source pilih us_state, terus klik next dan finish. untuk lebih jelasnya bisa dilihat pada gambar berikut.


Untuk melihat konfigurasi berhasil, click kanan pada konektor MySQL yg sudah berubah nama menjadi us_state lalu pilih Run and Preview Results.

Langkah selanjutnya adalah melakukan konfigurasi pada konektor MS Excel, double klik konektor nya. Pada bagian file browse dan pilih customer_detail.xls dan pada bagian lastFilePosition diisi 6, terus click next, pada Record Source pilih Sheet, click next dan finish. Untuk lebih jelasnya bisa dilihat pada gambar berikut.


Baiklah kita sudah berhasil mengkonfigurasi masing-masing konektor. Selanjutnya adalah menghubungkan antara konektor customers_demo5mn.csv, konektor us_state, operation Join dan konektor sheet1 (customer_detail.xls). Drag bagian merah di konektor customers_demo5mn.csv ke bagian hijau pertama di operation Join, drag bagian merah dari konektor us_state ke bagian hijau ke dua dari operation join dan terakhir drag bagian merah dari opeation Join ke bagian hijau di konektor Sheet1. Untuk lebih jelas bisa dilihat pada gambar berikut.


Langkah selajutnya adalah memetakan antara sumber (customers_demo5mn dan us_state) dengan output (customer_detail.xls). baiklah langsung saja double click pada operation Join untuk mulai memetakan. Setelah muncul jendela konfigurasi Join, pilih join type : left, dan pada tab join click pada tanda plus (+) untuk menambahkan parameter join nya. Pada bagian customers_demo5mn.csv pilih field States dan pada bagian us_state pilih field StateCode. Untuk lebih jelas bisa dilihat pada gambar berikut.


Masih pada jendela konfigurasi Join tapi di Tab Work. Drag semua field di bagian output ke bagian Work Area. Dari Input Table1 drag field fistname, lastname, adress, dan states ke Work Area. Dari Input Table2 drag field StateName, Capital, dan MostPopulousCity ke Work Area. Dari Funtions, pilih bagian String, drag Append dan Concatenate ke Work Area. Double klik Append di work area lalu pada Field Value isi spasi. Langkah terakhir adalah menghubungkan antara field di Work Area. Untuk lebih jelasnya bisa dilihat pada gambar berikut.


Langkah terakhir klik ok pada jendela konfigurasi Join. lalu Save project pada menu File->Save As, isi File Name misal Lathian1.aptr. Untuk menjalankannya bisa dilakukan pada Menu File->Run. Setelah proses Run selesai, anda bisa membuka file customer_detail.xls dan bisa dilihat isinya.

Cukup sekian untuk Artikel Pengenalan Apatar (ETL Tool), Mohon maaf jika ada penulisan istilah dan definisi dan saya harapkan koreksinya dari teman-teman. Semoga Bermanfaat.

2 comments:

  1. TERIMAKASIH GAN INFONYA,,,,, SANGAT MEMBANTU SEKALI

    ReplyDelete
  2. kak bahas etl untuk rapidminer dong

    ReplyDelete