본문 바로가기

Java 길찾기/이것이 자바다

[Java] 기본 API 클래스 - StringTokenizer

문자열이 특정 구분자(delimiter)로 연결되어 있을 경우, 구분자를 기준으로 부분 문자열을 분리하기 위해서는 String의 split() 메소드를 이용하거나, java.util 패키지의 StringTokenizer 클래스를 이용할 수 있다. split()은 정규 표현식으로 구분하고, StringTokenizer는 문자로 구분한다는 차이점이 있다.

 

split() 메소드

String 클래스의 split() 메소드는 다음과 같이 호출되는데, 정규 표현식을 구분자로 해서 문자열을 분리한 후, 배열에 저장하고 리턴한다.

String[] result = "문자열".split("정규표현식");

 

예를 들어 다음과 같은 문자열이 있다고 가정해보자. &, 쉼표( , ), - 를 제외하고 사람 이름만 따로 뽑아내고 싶을경우,

홍길동&김자바, 박스트링, 최배열-이변수

&, 쉼표( , ), - 를 파이프( | ) 기호로 연결한 정규 표현식을 매개값으로 제공하면 split() 메소드는 이 기호들을 구분자로 해서 부분 문자열을 추출한다.

String names = text.split("&|,|-");

 

// StringSplitExample.java -- 문자열 분리
public class StringSplitExample {
    public static void main(String[] args) {
        String text = "홍길동&김자바, 박스트링, 최배열-이변수"
        
        String[] names = text.split("&|,|-");
        
        for(String name : names) {
            System.out.println(name);
        }
    }
}

 

StringTokenizer 클래스

문자열이 한 종류의 구분자로 연결되어 있을 경우, StringTokenizer 클래스를 사용하면 손쇱게 문자열(토큰: token)을 분리해 낼 수 있다. StringTokenizer 객체를 생성할 때 첫 번째 매개값으로 전체 문자열을 주고, 두 번째 매개값으로 구분자를 주면 된다.

StringTokenizer st = new StringTokenizer("문자열", "구분자");

만약 구분자를 생략하면 공백(space)이 기본 구분자가 된다. 예를 들어 문자열이 "/"로 구분되어 있을 경우, 다음과 같이 StringTokenizer 객체를 생성할 수 있다.

String text = "홍길동/김자바/이변수";
StringTokenizer st = new StringTokenizer(text, "/");

 

StringTokenizer 객체가 생성되면 부분 문자열을 분리해 낼 수 있는데, 다음 메소드들을 이용해서 전체 토큰 수, 남아 있는 토큰 여부를 확인한 다음, 토큰을 읽으면 된다.

 

메소드 설명
int countTokens() 꺼내지 않고 남아있는 토큰의 수
boolean hasMoreTokens() 남아 있는 토큰이 있는지 여부
String nextToken() 토큰을 하나씩 꺼내옴

 

nextToken() 메소드로 토큰을 하나 꺼내오면 StringTokenizer 객체에는 해당 토큰이 없어진다. 만약 StringTokenizer 객체에서 더 이상 가져올 토큰이 없다면 nextToken() 메소드는 java.util.NoSuchElementException 예외를 발생시킨다. 그래서 nextToken() 메소드를 사용하기 전에 hasMoreTokens() 메소드로 꺼내올 토큰이 있는지 조사한 후 nextToken() 메소드를 호출하는 것이 좋은 코딩 방법이다. 다음은 두 가지 방법으로 토큰을 추출하는 방법을 보여준다.

// StringTokenizerExample.java -- StringTokenizer로 토큰 분리하기
public class StringTokenizerExample {
    public static void main(String[] args) {
        String text = "홍길동/김자바/이변수";
        
        // 방법1: 전체 토큰 수를 얻어 for문으로 루핑
        StringTokenizer st = new StringTokenizer(text, "/");
        int countTokens = st.countTokens();
        for(int i=0; i<countTokens; i++) {
            String token = st.nextToken();
            System.out.println(token);
        }
        
        System.out.println();
        
        // 방법2: 남아 있는 토큰을 확인하고 while문으로 루핑
        st = new StringTokenizer(text, "/");
        while(st.hasMoreTokens()) {
            String token = st.nextToken();
            System.out.println(token);
        }
    }
}