ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 객체 생성과 파괴 - 아이템 6. 불필요한 객체 생성을 피하라
    Study/Effective Java 2022. 12. 12. 16:49

    불필요한 객체 생성을 피하라

    1. 객체를 매번 생성하기보다는 재사용하는 편이 좋다.

    똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용하는 편이 좋을 때가 많다. 특히, 불변 객체는 언제든지 재사용이 가능하다.

     

    만약, 무거운 객체라면 매번 생성할 때마다 많은 자원이 들어갈 것이고, 인스턴스를 자주 생성하게 되면 GC가 동작하게 될 확률이 높아지고 이는 애플리케이션의 성능을 저하시키는 요인 중 하나이다.

     

    Java에서 String을 생성하는 방식을 통해 그 이유를 알아보자.

     

    String string01 = new String("hello");   // new 연산자를 이용한 방식
    String string02 = "hello";   // 리터럴을 이용한 방식

    첫 번째 코드는 실행될 때마다 String 인스턴스를 새로 만든다. 인스턴스를 새로 만들 때마다 heap 영역에 String 인스턴스가 저장된다. 두 번째 코드는 새로운 인스턴스를 매번 만드는 대신 하나의  String 인스턴스를 재사용한다. 문자열 리터럴을 통해서 heap 영역의 String Constant Pool에 저장되어 인스턴스가 재사용된다.

     

    String Constant Pool

     

    String은 왜 불변 클래스로 만들어졌을까?

    만약, String이 가변(mutable)이라면 같은 참조를 가지는 객체의 값을 변경할 수 있게 된다. 이는 같은 참조 & 다른 값이라는 상황을 만들 수 있기 때문에 재사용이 불가능하다. 따라서, 객체 공유를 통한 재사용이 목적인 String Pool을 사용할 수 없게 된다.

     

    또한, 가변 상태의 객체는 같은 문자열 리터럴을 가지더라고 객체를 매번 생성해야 한다. String이 빈번하게 사용되는 메서드나 반복문에서 쓸데없는 인스턴스가 수백만 개 만들어질 수도 있다는 것이다. 이는 애플리케이션의 성능에 안 좋은 영향을 미칠 수 있다.

     

    따라서, String을 불변으로 만들어 위와 같은 단점들을 제거하고 성능을 개선할 수 있다.

     

    정리하자면, 같은 가상 머신 안에서 똑같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함으로써 무의미한 객체를 생성할 필요가 없게 된다.

     

    2. 정적 팩토리 메서드를 이용하여 불필요한 객체 생성을 방지하라.

    생성자 대신 정적 팩토리 메서드를 제공하는 불변 클래스는 정적 팩토리 메서드를 사용해 불필요한 객체 생성을 피할 수 있다.

    생성자는 호출할 때마다 새로운 객체를 만들지만, 팩토리 메서드는 전혀 그렇지 않다. 불변 객체만이 아니라 가변 객체라 해도 사용 중에 변경되지 않을 것임을 안다면 재사용이 가능하다.

     

    Java에서 사용되는 Boolean 객체를 통해 어떻게 불필요한 객체 생성을 방지하는지 알아보자.

     

    public final class Boolean implements java.io.Serializable, Comparable<Boolean> {
        
        public static final Boolean TRUE = new Boolean(true);
        
        public static final Boolean FALSE = new Boolean(false);
        
        ...
        
        public static boolean parseBoolean(String s) {
            return "true".equalsIgnoreCase(s);
        }
        
        ...
        
        public static Boolean valueOf(String s) {
            return parseBoolean(s) ? TRUE : FALSE;
        }
    }

    위 코드를 보면 Boolean.valueOf(String) 정적 팩토리 메서드를 사용하여 미리 생성된 TRUE, FALSE를 반환하는 것을 확인할 수 있다.

     

    3. 객체 생성이 비싼 경우 캐싱을 통해 객체 생성을 방지하라.

    생성 비용이 아주 비싼 객체도 있다. 이런 비싼 객체가 반복해서 필요한 경우 캐싱해서 재사용하는 것을 권한다. 비싼 객체란 말은 인스턴스를 생성하는데 드는 비용이 크다는 것을 의미한다.

     

    static boolean isRomanNumeral(String s) {
        return s.matches("^(?=.)M*(C[MD]|D?C{0,3})(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
    }

    대표적으로, 문자열이 유효한 로마 숫자인지를 확인하는 위 메서드를 예로 들 수 있다.

     

    String.matches() 메서드는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만, 성능이 중요한 상황에서 반복해 사용하기엔 적합하지 않다.

     

    그 이유는, 내부적으로 Pattern 인스턴스를 만들어 사용하는데 Pattern 인스턴스는 입력받은 정규표현식의 유한 상태 머신을 만들기 때문에 생성 비용이 높다. 이런 생성 비용이 높은 Pattern 인스턴스는 한 번 쓰고 버리는 구조로 만들어 곧바로 GC의 대상이 된다.

     

    public clas RomanNumber {
        private static final Pattern ROMAN = Pattern.compile("^(?=.)M*(C[MD]|D?C{0,3})(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
        
        static boolean isRomanNumeral(String s) {
            return ROMAN.matcher(s).matches();
        }
    }

    위에서 언급한 문제를 개선하기 위해서는 Pattern 객체를 만들어 컴파일하고 재사용하는 것이 좋다.

     

    4. 오토 방식을 사용할 때 주의하라.

    오토 박싱은 기본 타입과 박싱 된 기본 타입을 자동으로 변환해주는 기술이다. 하지만, 이를 잘못 사용하게 되면, 불필요한 메모리 할당과 재할당을 반복하여 성능이 느려질 수 있다.

     

    @DisplayName("오토박싱을 하는 경우")
    @Test
    public void autoBoxingTest() {
        Long sum = 0L;
        for (long i = 0; i <= Integer.MAX_VALUE; i++) {
            sum += i;
        }
    }
    
    @DisplayName("오토박싱을 하지 않는 경우")
    @Test
    public void noneBoxingTest() {
        long sum = 0L;
        for (long i = 0; i <= Integer.MAX_VALUE; i++) {
            sum += i;
        }
    }

    위와 같이 오토 박싱을 사용해서 연산을 하는 경우와 오토 박싱을 사용하지 않고 연산을 하는 경우의 메서드를 작성해 각각의 시간을 확인해 보았다.

     

     

    Long 타입에서 long 타입으로 변경해주는 것만으로도 엄청난 성능 차이가 나는 것을 확인할 수 있다.

     

    정리하자면, 형 변환이 꼭 필요한 경우가 아니라면 기본 타입을 사용하고, 의도치 않은 오토 박싱이 숨어들지 않게 주의하는 것이 좋다.

     

    최종 정리

    이번 게시글의 내용을 객체 생성은 비싸니 무조건 피해야 한다라고 오해하면 안 된다.

    최근 JVM에서는 별다른 일을 하지 않는 작은 객체를 생성하고 회수하는 일은 크게 부담되지 않는다. 프로그램의 명확성, 간결성, 기능을 위해서 객체를 생성하는 것이라면 일반적으로 더 권장되는 일이다.

    다만, 정말 아주 무거운 객체가 아닌 이상, 단순히 객체 생성을 피하고자 본인만의 객체 풀을 만들어서는 안 된다. JVM의 GC는 최적화가 잘 되어 있기 때문에, 가벼운 객체를 다룰 때는 본인이 만든 객체 풀보다 훨씬 더 빠를 것이다.

    추가적으로, 방어적인 복사가 필요한 상황에서 객체를 재사용했을 때의 피해가, 필요 없는 객체를 반복 생성했을 때의 피해보다 훨씬 크다는 사실을 기억하고 있어야 한다.

    방어적 복사에 실패하면 언제 터져 나올지 모르는 버그와 보안 구멍으로 이어지지만, 불필요한 객체 생성은 그저 코드 형태와 성능에만 영향을 준다.


    출처

     이펙티브 자바 Effective Java 3/E. 조슈아 블로크 저자(글) · 개앞맵시(이복연) 번역

    https://github.com/woowacourse-study/2022-effective-java/blob/main/02%EC%9E%A5/%EC%95%84%EC%9D%B4%ED%85%9C_06/%EB%B6%88%ED%95%84%EC%9A%94%ED%95%9C%20%EA%B0%9D%EC%B2%B4%20%EC%83%9D%EC%84%B1%EC%9D%84%20%ED%94%BC%ED%95%98%EB%9D%BC.md

     

    728x90

    댓글

Designed by Tistory.