JVM (Java Virtual Machine)


해석하자면 자바를 실행하기 위한 가상 기계(컴퓨터) 이다.

자바 컴파일 과정 이미지 출처:https://kunhee.kim/programming/basic-java-0/

기존의 C/C++의 프로그래밍 언어는 컴파일 플랫폼과 타겟 플랫폼이 다를 경우 프로그램이 동작하지 않았다.

예를들어 Mac에서 컴파일하고 Mac에서 프로그램을 실행을 하면 돌아가지만 windows에서 실행하면 실행이 되지 않는...

자바는 OS에 종속적이지 않다. 이 OS에 종속받지 않고 실행하기 위해 OS 위에서 JVM이 필요하다.

JVM이 있으므로 인해서 OS별로 컴파일을 할 필요가 없지만 운영체제에 맞는 JVM이 설치가 되어 있어야 한다.

 

컴파일 과정


Java 소스코드 : 우리가 인텔리제이나 이클립스등에서 작성하는 코드들 확장자가 (클래스이름.java)로 되어 있다.

이 소스코드는 CPU가 인식을 하지 못하므로 기계어로 컴파일을 해줘야 한다.

컴파일러 : JDK 폴더 - bin - javac.exe 가 우리가 작성한 소스코드를 컴퓨터가 이해할 수 있는 바이트코드로 바꿔준다. 

Java 클래스 파일(바이트코드) : 컴파일이 된 소스코드는 (클래스이름.class)로 클래스 파일이 생성이 되게 된다.

Java 소스코드 이미지
자바 컴파일 명령어 javac

터미널에서 소스코드가 있는 경로로 이동한 후에 javac Hello.java 를 입력후 Enter를 누르면

컴파일 후 클래스 파일 생성

다시 해당 경로를 ls 명령어를 통해 확인 해보면 이전에는 없던 Hello.class가 생성이 된 걸 볼 수 있다.

터미널에 java Hello를 입력하면 "Hello!!"가 출력이 된다.

 

바이트 코드


가상 컴퓨터에서 돌아가는 실행 프로그램을 위한 이진 표현법

자바 바이트 코드는 JVM이 이해할 수 있는 언어로 변환된 자바 소스코드를 의미
컴파일러에 의해 변환된 코드 명령어 크기가 1바이트 여서 자바 바이트 코드라고 불린다.

바이트 코드는 실시간 번역기나 JIT 컴파일러에 의해 바이너리 코드로 변환이 된다.

💡 바이너리 코드란?
바이너리 코드 또는 이진 코드라고 함
컴퓨터가 인식할 수 있는 0과 1로 구성된 이진코드
💡 기계어란?

0과 1로 이루어진 바이너리 코드이다.기계어가 이진코드로 이루어졌을 뿐 모든 이진코드가 기계어인 것은 아니다.기계어는 특정한 언어가 아니라 CPU가 이해하는 명령어 집합이며, CPU 제조사마다 기계어가 다를 수 있다.

 

JIT 컴파일러(Just-in-time compliation)


JIT 컴파일러는 프로그램을 실제 실행하는 시점에 기계어로 번역하는 컴파일러다.

Java 소스 코드에서 컴파일된 바이트 코드는 기계가 바로 읽을 수 있는 형태가 아니기 때문에 실행 될 때 기계가 읽을 수 있는 Native Code로 컴파일을 하게 되는데 JIT Compiler가 이 역할을 하게 된다.
JIT 컴파일링은 실행될 때 최초 실행되기 때문에, 최초 실행에서는 조금 느릴 수 있다.

 

JVM 구성요소


JVM 구성 요소

JVM 구성 요소는 크게 아래와 같이 이루어져 있다.

  • 클래스 로더(Class Loader)
  • 런타임 데이터 영역(Runtime Data Area)
  • 실행 엔진(Execution Engine)
    • 인터프리터
    • JIT 컴파일러
    • 가비지 콜렉터
클래스 로더(Class Loader)

바이트 코드들을 불러와서 자바의 런타임 데이터 영역(자바의 메모리)에 넣는다. 
런 타임시 동적으로 클래스를 로드하고 jar 파일 내 저장된 클래스들을 런타임 데이터 영역에 넣는다.
클래스를 처음으로 참조할 때, 해당 클래스를 로드하고 링크하는 역할

실행 엔진(Execution Engine)

클래스를 실행 시키는 역할
클래스 로더가 JVM 내의 런타임 데이터 영역에 바이트 코드를 배치되고, 실행 엔진에 의해 실행이 된다.
바이트 코드는 기계가 실행할 수 있는 형태가 아니기 때문에 JVM 내부에서 기계가 실행할 수 있는 형태로 변환한다.

  • 인터프리터
    - 실행 엔진은 바이트 코드를 명령어 단위로 읽어서 실행, 한 줄씩 수행하기 때문에 느리다.
  • JIT 컴파일러(Just-In-Time)
    - 인터프리터 방식으로 실행하다 적절한 시점에 바이트 코드 전체를 컴파일하여 기계어로 변경
    - 이후에는 더 이상 인터프리팅 하지 않고 기계어로 직접 실행하는 방식
  • 가비지 콜렉터
    - 사용되지 않는 인스턴스를 찾아 메모리에서 해제 시킨다.
런타임 데이터 영역(Runtime Data Area)

프로그램을 수행하기 위해 OS에서 할당 받은 메모리 공간

Runtime Data Area

  • PC Register
    - 쓰레드 실행 시에 생성, 쓰레드마다 하나씩 존재
    - 쓰레드가 어떤 어떤 부분을 어떤 명령으로 실행해야할 지에 대한 기록을 하는 부분
    - 현재 수행중인 JVM 명령 주소를 갖는다.
💡 프로세스(process)란?
단순히 실행 중인 프로그램(program)

즉, 사용자가 작성한 프로그램이 운영체제에 의해 메모리 공간을 할당받아 실행 중인 것을 말한다.

이러한 프로세스는 프로그램에 사용되는 데이터와 메모리 등의 자원 그리고 스레드로 구성된다.
💡 스레드(thread)란?

스레드(thread)란 프로세스(process) 내에서 실제로 작업을 수행하는 주체를 의미

모든 프로세스에는 한 개 이상의 스레드가 존재하여 작업을 수행한다.

또한, 두 개 이상의 스레드를 가지는 프로세스를 멀티스레드 프로세스(multi-threaded process)라고 한다.

JVM Stack

프로그램 실행과정에서 임시로 할당되었다가 메소드를 빠져나가면 바로 소멸되는 특성의 데이터를 저장하기 위한 영역이다.
각종 형태의 변수나 임시 데이터, 스레드나 메소드의 정보를 저장한다.
메소드 호출 시마다 각각의 스택 프레임(그 메서드만을 위한 공간)이 생성된다. 메서드 수행이 끝나면 프레임 별로 삭제를 한다.
메소드 안에서 사용되는 값들을 저장한다. 또 호출된 메소드의 매개변수, 지역변수, 리턴 값 및 연산 시 일어나는 값들을 임시로 저장한다.

Native method stack

자바 프로그램이 컴파일되어 생성되는 바이트 코드가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역.
JAVA가 아닌 다른 언어로 작성된 코드를 위한 공간.
Java Native Interface를 통해 바이트 코드로 전환하여 저장하게 된다.
일반 프로그램처럼 커널이 스택을 잡아 독자적으로 프로그램을 실행시키는 영역

Method Area (= Class Area = Static area)

클래스 정보를 처음 메모리 공간에 올릴 때 초기화되는 대상을 저장하기 위한 메모리 공간

Runtime Constant Pool

스태틱 영역에 존재하는 별도의 관리영역.
상수 자료형을 저장하여 참조하고 중복을 막는 역할을 수행한다.
💡 스태틱 영역에 저장되는 데이터

Field Information (멤버 변수!)
멤버변수의 이름, 데이터 타입, 접근 제어자에 대한 정보

Method Information (메소드!)
메소드의 이름, 리턴타입, 매개변수, 접근 제어자에 대한 정보

Type Information (타입!)
class인지 interface인지의 여부 저장. Type의 속성, 전체 이름, super 클래스의 전체 이름. (interface이거나 object인 경우 제외된다. 이건 Heap에서 관리함)

 Heap 영역

Heap 영역

Permanent Generation

직역하면 영구적인 세대이다.
생성된 객체들의 정보의 주소값이 저장된 공간이다. 클래스 로더에 의해 load되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이고 JVM에 의해 사용된다.Reflection을 사용하여 동적으로 클래스가 로딩되는 경우에 사용된다.
💡 Reflection이란?
객체를 통해 클래스의 정보를 분석해 내는 프로그래밍 기법
구체적인 클래스 타입을 알지 못해도, 컴파일된 바이트 코드를 통해
역으로 클래스의 정보를 알아내어 사용할 수 있다는 뜻이다.

New/Young 영역

이곳의 인스턴스들은 추후 가비지 콜렉터에 의해 사라진다.
생명 주기가 짧은 “젊은 객체”를 GC 대상으로 하는 영역이다.
여기서 일어나는 가비지 콜렉트를 Minor GC라고 한다.

 Eden: 객체들이 최초로 생성되는 공간
Survivor 0, 1: Eden에서 참조되는 객체들이 저장되는 공간
Eden 영역에 객체가 가득차게되면 첫번째 가비지 콜렉트가 발생한다.
Eden 영역에 있는 값 들을  Survivor 1 영역에 복사하고 이 영역을 제외한 나머지 객체를 삭제한다.

Old 영역

이곳의 인스턴스들은 추후 가비지 콜렉터에 의해 사라진다.생명 주기가 긴 “오래된 객체”를 GC 대상으로 하는 영역이다.여기서 일어나는 가비지 콜렉트를 Major GC 라고 한다. Minor GC에 비해 속도가 느리다.
New/Young Area에서 일정시간 참조되고 있는, 살아남은 객체들이 저장되는 공간이다.

 

 

+ Recent posts