Kamis, 02 Desember 2010

Implementasi Regex (Regular Expression) Menggunakan Java


Apa itu regex??
Regular Expression atau yang lebih sering disebut RegEx merupakan sebuah teknik yang digunakan untuk mencocokan string teks berdasarkan karakter-karakter tertentu.
Untuk lebih jelas mengenai definisi regex, silahkan baca di http://dhafiq-san.blogspot.com/2010/11/pengenalan-regular-expression-regex.html

Belajar Regex memang susah diawal, tapi kalo sudah bisa akan sangat menyenangkan dan membantu pekerjaan kita sehari-hari. Tidak hanya programmer saja perlu mengenal Regex, orang awam juga perlu karena manfaatnya bakalan besar sekali misalnya mencari file .doc, .pdf atau yang lainnya pada sistem operasi windows.

Penerapan regex ini cakupannya memang sangat luas, untuk penerapan kali ini kita coba untuk pencocokan string email aja ya.....

Pertama-tama yang perlu diperhatikan dari aturan penulisan email adalah sebuah karakter utama yaitu "@". Sehingga jika pada string yang tidak terdapat karakter tersebut, maka akan dianggap salah.

Berikut code regex di java:


import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class regex_sagara {
public static void main(String[] args) {
Pattern p = Pattern.compile("^[a-zA-Z0-9_.]+@[a-zA-Z0-9]+.[a-zA-Z0-9]+$");
Matcher m = p.matcher("mudafiq.riyan@yahoo.com");
String hasil = "";
int I = 0;
while (m.find(I)) {
hasil = hasil + m.group() + "\n";
I = m.start() + 1;
}
if (I == 0) {
System.out.println("--- Susunan email salah ---");
} else {
System.out.println("Hasil : \n" + hasil);
}

}
}


Untuk hasilnya adalah:
Hasil :
mudafiq.riyan@yahoo.com
Susunan regex di atur pada fungsi Pattern yaitu ^[a-zA-Z0-9_.]+@[a-zA-Z0-9]+.[a-zA-Z0-9]+$ dengan penjelasan:

  • aturan pertama adalah tanda ^ yaitu tanda pembuka
  • aturan kedua adalah [a-zA-Z0-9_.] merupakan aturan nama email yang bisa dituliskan mulai a-z dengan huruf kecil ataupun kapital serta angka 0-9 dan juga bisa dituliskan dengan menggabungkan karakter "_" dan karakter titik "."
  • aturan ketiga adalah karakter "@" merupakan aturan utama dari penulisan email, sehingga setelah penulisan nama email harus diikuti oleh karakter "@"
  • aturan keempat adalah [a-zA-Z0-9] merupakan nama provider yang dapat dituliskan mulai a-z dengan huruf kecil ataupun huruf kapital serta angka 0-9
  • aturan kelima adalah tanda titik "." yang merupakan tanda setelah nama provider yang dituliskan sebelum aturan keenam.
  • aturan keenam adalah [a-zA-Z0-9] merupakan aturan untuk penulisan akhiran dari provider, biasanya .com, .net dan lain-lain.
  • aturan ketujuh adalah karakter "$" adalah tanda penutup dari aturan regex pada java.

Adanya tanda "^" di awal dan "$" di akhir itu merupakan tanda untuk perulangan pengecekan yang dilakukan oleh java sehingga menghasilkan karakter yang sesuai.

Sehingga jika pada syntax Matcher m = p.matcher("mudafiq.riyan@yahoo.com"); maka aturan tersebut sesuai dengan aturan email, sehingga muncul keterangan kebenaran penulisan tersebut. Jika pada syntax Matcher tersebut diganti dengan menghilangkan tanda "@" yaitu Matcher m = p.matcher("mudafiq.riyanyahoo.com"); maka hasilnya adalah: --- Susunan email salah ---

Seperti itulah penerapan fungsi regex pada java. Itu merupakan contoh sederhana dari regex di java.










Sumber : http://dhafiq-san.blogspot.com/2010/11/code-regex-di-java.html

2 komentar:

Mudafiq Riyan Pratama mengatakan...

tolong sertakan sumbernya mas. itu artikel yg anda comot dari blog saya. sertakan sumbernya merupakan bentuk anda menghargai karya/tulisan orang lain

Unknown mengatakan...

sory gan ane gak nyantumin sumbernya. maklum dulu masih newbie. hehee sory ya sebelumnya

Posting Komentar

Twitter Delicious Facebook Digg Stumbleupon Favorites More