CS/운영체제

[운영체제] 메모리 관리, 페이징 & 세그멘테이션

ummchicken 2023. 2. 4. 22:21

운영체제의 대표적인 할일 중 하나가 메모리 관리이다.

(CPU 관리, 메모리 관리, I/O  장치 관리)

 

컴퓨터 내의 한정된 메모리를 극한으로 활용해야 하는 것이다.

 

※ 메모리란?

더보기
프로그램과 프로그램 수행에 필요한 데이터 및 코드를 저장하는 장치이다.
즉, 작업을 위해 사용되는 공간이다.

컴퓨터 메모리의 내용은 보조기억장치로 전송할 수 있는데,
이는 가상 메모리라 불리는 메모리 관리 기법을 통해 가능하다.

 

운영체제의 역할

더보기
실행파일이 로더에 의해 메모리에 올라오고,
운영체제는 이 실행 파일을 메모리에 어느 부분에 올릴지 결정한다.

※ 자바는 OS 메모리 영역에 직접적으로 접근하지 않고, JVM이라는 가상 머신을 이용해서 간접적으로 접근한다.

 

 

 

✔️ 메모리 관리가 필요한 이유는?

  • 프로그램의 실행(프로세스)를 위해서는 메모리를 할당해야 한다.
  • 메모리는 한정된 자원이기 때문에 멀티 프로그래밍 시스템에서는 여러 프로세스들이 메모리를 효율적으로 이용할 수 있도록 관리가 필요하다.
  • 효율적인 메모리 참조(논리-물리 주소 변환) - 프로세스가 메모리 주소를 직접 참조하는 것이 아니라 프로세스의 주소 공간이라는 것과 메모리 주소 공간이라는 것을 구분하고 있기 때문에, 좀 더 빠르게 메모리 주소를 참조할 수 있는 방법도 추가적으로 필요하다.

 

※ 논리 주소 & 물리 주소

더보기
✔️ 논리 주소 (Logical == Virtual Address, 가상 주소)
: 논리 주소는 CPU에 의해 프로그램이 실행되고 있을 때 만들어진다. (CPU가 만들어내는 주소)
물리적으로 존재하는 주소가 아니라 개념적으로 존재하는 주소이므로 가상 주소(Virtual Addr)라고도 부른다.
논리 주소(가상 주소)는 CPU에 위치한 메모리의 물리적 주소를 가르킨다.

Logical Address Space라는 용어는 프로그램에 의해서 만들어진 모든 논리 주소의 집합이다.
Memory-Management Unit, MMU라는 하드웨어 장치는 논리 주소와 대응되는 물리 주소를 연결(mapping)한다.


✔️ 물리 주소 (Physical Address)
: 물리 주소는 메모리 상의 물리적인 주소를 의미한다.
사용자들은 직접적으로 물리 주소로 접근하지 못하고, 대신 대응되는 논리 주소로 접근한다.

프로그램들은 논리 주소를 생성하고, 해당 프로그램이 이 논리 주소에서 실행되고 있다고 상정한다.
하지만 프로그램이 실행되기 위해서는 물리 주소가 필요하다.

그러므로 MMU가 논리 주소가 사용되기 전에, 논리 주소와 물리 주소를 대응(mapping)시킨다.
Physical Address Space라는 용어는 Logical Address Space와 대응되는 물리 주소의 집합이다.

 

 

 프로세스가 실행되려면 반드시 메모리에 올라가야 한다.

 

 


 

✔️ 가상 메모리 (Virtual Memory)

가상 메모리는 메모리 관리 기법의 하나로,
컴퓨터가 실제로 이용 가능한 메모리 자원을 추상화하여
이를 사용하는 사용자들에게 매우 큰 메모리로 보이게 만드는 것이다.

 

가상 메모리

  • 가상 주소(local address) : 가상적으로 주어진 주소
  • 실제 주소(physical address) : 실제 메모리상에 있는 주소
  • 메모리관리장치(MMU) : 가상 주소는 MMU에 의해 실제 주소로 변환된다.
    • 덕분에 사용자는 실제 주소를 의식할 필요 없이 프로그램을 구축할 수 있다.

 

※ MMU (Memory Managemanet Unit, 메모리 관리 장치)

더보기
- 논리 주소를 물리 주소로 변환해 준다.
- 메모리 보호나 캐시 관리 등 CPU가 메모리에 접근하는 것을 총 관리해주는 하드웨어.

<추가 설명>
메모리의 공간이 한정적이기 때문에, 사용자에게 더 많은 메모리를 제공하기 위해 '가상 주소'라는 개념이 등장한다. (가상 주소는 프로그램 상에서 사용자가 보는 주소공간이라고 보면 됨)

이 가상 주소에서 실제 데이터가 담겨 있는 곳에 접근하기 위해선 빠른 주소 변환이 필요한데, 이를 MMU가 도와주는 것이다.

 

 

 

가상 메모리는 가상 주소와 실제 주소가 매핑되어있고,

프로세스의 주소 정보가 들어 있는 '페이지 테이블'로 관리된다.

💡 이때 속도 향상을 위해 TLB를 쓴다.

 

 

✔️ TLB (Transfer Lookaside Buffer, 페이지 정보 캐시)

메모리와 CPU 사이에 있는 주소 변환을 위한 캐시이다.
  • 페이지 테이블에 있는 리스트를 보관한다.
  • CPU가 페이지 테이블까지 가지 않도록 해, 속도를 향상시킬 수 있는 캐시 계층이다.
  • TLB는 MMU에 포함되어 있는 작은 캐시로, 일종의 주소 변환 캐시라고 할 수 있다.

 

 

프로세스가 실행되려면 반드시 메모리에 올라가야 한다.

 

✔️ 스와핑 (Swapping)

주기억장치에 적재한 하나의 프로세스를 보조기억장치에 잠시 적재했다가, 
필요할 때 다시 꺼내서 사용하는 메모리를 교체하는 기법이다.

 

만약 가상 메모리에는 존재하지만 실제 메모리인 RAM에는 현재 없는 데이터나 코드에 접근할 경우 페이지 폴트가 발생한다.

이때 메모리에서 사용하지 않는 영역(CPU 할당 시간이 끝난)을 하드디스크로 옮기고, 

하드디스크의 일부분을 마치 메모리처럼(다른 프로세스의 메모리) 불러와 쓰는 것을 스와핑(Swapping)이라고 한다.

 

이를 통해 마치 페이지 폴트가 일어나지 않는 것처럼 만든다.

 

  • 스와핑 발생 구분
    • 페이지 적중 (Page Hit) : 참조 주소가 실제 주기억장치에 있을 때
    • 페이지 부재 (Page Fault) : 참조 주소가 보조기억장치에 있을 때

 

 

 

✔️ 페이지 폴트 (Page Fault)

페이지 폴트란 프로세스 주소 공간에는 존재하지만,
지금 이 컴퓨터의 RAM에는 없는 데이터에 접근했을 경우에 발생한다.

※ 가상 메모리는 대게 페이지로 관리된다.

 

페이지 폴트와 그로 인한 스와핑은 다음 과정으로 이루어진다.

 

  1. CPU는 물리 메모리를 확인하여 해당 페이지가 없으면 트랩(Trap)을 발생해서 운영체제에 알린다.
  2. 운영체제는 CPU의 동작을 잠시 멈춘다.
  3. 운영체제는 페이지 테이블을 확인하여 가상 메모리에 페이지가 존재하는지 확인하고, 없으면 프로세스를 중단하고 현재 물리 메모리에 비어 있는 프레임이 있는지 찾는다. 물리 메모리에도 없다면 스와핑이 발동된다.
  4. 비어 있는 프레임에 해당 페이지를 로드하고, 페이지 테이블을 최신화 한다.
  5. 중단되었던 CPU를 다시 시작한다.

※ 페이지 (Page)

더보기
가상 메모리를 사용하는 최소 크기 단위.

논리 메모리(프로세스가 점유하는)는 페이지라 불리는 고정 크기의 블록으로 분리된다.

 

※ 프레임 (Frame)

더보기
실제 메모리를 사용하는 최소 크기 단위.

물리 메모리는 Frame이라는 고정 크기로 분리되어 있다.

 

 

 

✔️ 디멘드(요구) 페이징 (Demand Paging)

위와 같은 스와핑 개념을 가지고, 디멘드 페이징에서는 자주 사용하는 페이지만 물리적 메모리에 적재해서 사용한다.

즉, CPU가 요청할 때 프로세스의 데이터를 메모리에 올리는 것을 의미한다.
→ 처음부터 모든 데이터를 메모리를 적재하지는 않음.

 

 

 

 

✔️ 스레싱 (Thrashing)

프로세스가 집중적으로 사용하는 페이지들의 집합이 메모리에 한꺼번에 적재되지 못하여 
페이지 부재율(page fault)이 높아지고, CPU 이용율이 급격히 떨어지는 현상이다.

 

스레싱

 

  • 스레싱은 메모리에 너무 많은 프로세스가 동시에 올라가게 되면, 스와핑이 많이 일어나서 발생한다.
  • 페이지 폴트가 일어나면, CPU 이용률이 낮아진다. → 이용률이 낮아지면, 운영체제는 가용성(사용 가능한 정도)을 더 높이기 위해 더 많은 프로세스를 메모리에 올리게 된다. → 이와 같은 악순환이 반복되며 스레싱이 일어난다.

 

이를 해결하기 위한 방법으로는 

메모리를 늘리거나, HDD를 사용한다면 HDD를 SSD로 바꾸는 방법이 있다.

 

이외에 운영체제에서 이를 해결할 수 있는 방법은 작업 세트와 PFF가 있다.

 

※ 작업 세트 (Working Set)

더보기
작업 세트는 프로세스의 과거 사용 이력인 지역성(locality)을 통해 
결정된 페이지 집합을 만들어서 미리 메모리에 로드하는 것이다.

미리 메모리에 로드하면, 탐색에 드는 비용을 줄일 수 있고 스와핑 또한 줄일 수 있다.

 

PFF (Page Fault Frequency)

더보기
PFF는 페이지 폴트 빈도를 조절하는 방법으로, 
상한선과 하한선을 만드는 방법이다.

만약 상한선에 도달한다면 프레임을 늘리고,
하한선에 도달한다면 프레임을 줄이는 것이다.

 

 

 


 

✔️ 메모리 할당

메모리에 프로그램을 할당할 때는 시작 메모리 위치, 메모리의 할당 크기를 기반으로 할당하는데, 

연속 할당불연속 할당으로 나뉜다.

 

 


 

✔️ 연속 할당

프로세스를 메모리에 올릴 때, 주소 공간을 메모리의 한 곳에 '연속적으로' 적재하는 방식이다.

 

연속 할당 방식에서는 물리적 메모리를 다수의 분할로 나누어 

하나의 분할에 하나의 프로세스가 적재되도록 한다.

 

연속할당 기법은 크게 고정 분할 방식가변 분할 방식이 있다.

 

연속 할당

→ 프로세스 A, 프로세스 B, 프로세스 C가 순차적으로 공간에 할당한다.

→ 이는 메모리를 미리 나누어 관리하는 고정 분할 방식과 

→ 매 시점 프로그램의 크기에 맞게 메모리를 분할하여 사용하는 가변 분할 방식이 있다.

 

 

 

💡 고정 분할 방식 (Fixed Partition Allocation)

고정 분할 방식은 물리적 메모리를 정해진 개수만큼 미리 나누어 두고, 
각 분할에 하나의 프로세스를 적재하는 방식이다.

 

  • 메모리가 미리 나뉘어 있기 때문에 가변 분할 방식에 비해 융통성이 없다.
  • 동시에 메모리에 올릴 수 있는 프로그램의 수가 고정되어 있다.
  • 수행 가능한 프로그램의 최대 크기 또한 제한된다.
  • 🚨 또한, 내부 단편화가 발생한다. (밑에 설명 있음)

 

 

 

💡 가변 분할 방식 (Variable Partition Allocation)

가변 분할 방식은 매 시점 메모리에 적재되는 프로그램의 크리에 따라
분할의 크기, 갯수를 동적으로 나눠 사용하는 방식이다.

 

  • 프로세스에 딱 맞게 메모리 공간을 사용하기에, 내부 단편화 는 발생하지 않는다.
  • 🚨 그러나 사용 중인 프로세스가 종료되어 메모리에 새로운 프로세스를 올리 메모리 공간이 충분하지 않을 경우 외부 단편화가 발생한다. (밑에 설명 있음)

 

가변 분할 방식은 어디 메모리 공간에 프로세스를 올려야 할지 결정하는 문제가 있다.

이를 해결하기 위한 기술적 방법으로는 다음과 같이 3가지가 있다.

 

 

▶ 가변 분할 방식 종류

이름 설명
최초적합 (First fit) 가장 먼저 나오는 가용 가능한 메모리 공간(홀)을 찾으면 바로 프로세스를 할당한다.
최적적합 (Best fit) 프로세스 크기 이상인 공간 중 가장 작은 홀부터 할당한다.
최악적합 (Worst fit) 프로세스 크기과 가장 많이 차이가 나는 공간(홀)에 프로세스를 할당한다.

※ 홀(hole) : 할당할 수 있는 비어 있는 메모리 공간.

 

※ 컴팩션 (Compaction, 압축)

더보기
가변분할 방식에서 발생하는 외부 단편화 문제를 해결하기 위한 방법으로 컴팩션 방법이 있다.

물리적 메모리 중에서 사용 중인 메모리 공간을 한쪽으로 몰고, 가용공간을 확보하는 것이다.

메모리를 효율적으로 사용할 수 있는 측면에서는 좋은 선택이지만,
수행 중인 프로세스의 메모리 주소 공간을 이동시켜야 하므로 비용이 매우 많이 든다.

 

 

 

💡 내부 단편화 & 외부 단편화

 

  • 내부 단편화 (Internal Fragmentation)
    • 메모리를 나눈 크기보다 프로그램이 작아서, 들어가지 못하는 공간이 많이 발생하는 현상

 

  • 외부 단편화 (External Fragmentation)
    • 메모리를 나눈 크기보다 프로그램이 커서, 들어가지 못하는 공간이 많이 발생하는 현상.
    • Ex) 100MB를 55MB, 45MB로 나눴지만 프로그램의 크기는 70MB일 때 들어가지 못한다.

 

 


 

✔️ 불연속 할당

메모리를 연속적으로 할당하지 않는 것.

즉, 프로그램의 일부가 서로 다른 주소 공간에 할당될 수 있는 기법이다.

 

  • 현대 운영체제가 쓰는 방법이다.
  • 불연속 할당인 페이징 기법이 있다.
  • 메모리를 동일한 크기의 페이지(보통 4KB)로 나누고, 프로그램마다 페이지 테이블을 두어 이를 통해 메모리에 프로그램을 할당한다.
  • 페이징 기법 말고도 세그멘테이션, 페이지드 세그멘테이션이 있다.

 

 

 

💡 페이징 (Paging)

페이징은 동일한 크기의 페이지(page) 단위로 나누어 
메모리의 서로 다른 위치에 프로세스를 할당(적재)한다.

🚨 홀의 크기가 균일하지 않은 문제가 없어지지만, 주소 변환이 복잡해진다.

 

 

  • fragmentation(단편화) 문제를 해결하기 위해 등장
  • 각 프로세스를 동일한 사이즈의 page로 나누어 분할 관리하는 기법(= 고정 분할)
  • 논리적 메모리를 동일한 크기의 page로 나누고, 물리적 메모리를 논리적 메모리의 page와 동일한 크기의 Frame으로 나눈다.
  • 외부 단편화가 발생하지 않는다. (이부분 이해 잘 안감.)
  • 논리적 메모리와 물리적 메모리 사이에 page table을 두어, 논리적 주소를 물리적 주소로 변환
  • 내부 단편화 발생 가능

 

※ page: logical memory를 일정한 크기로 자른 것

frame: physical memory를 일정한 크기로 자른 것

 

 

 

 

💡 세그멘테이션 (Segmentation)

페이징에서처럼 논리 메모리와 물리 메모리를 같은 크기의 블록이 아닌, 
서로 다른 크기논리적 단위인 세그먼트(Segment)로 분할하는 방식이다.

 

  • 작게는, 프로그램 안의 함수, 클래스 등을 하나의 세그먼트로 정의
  • 크기는, 프로그램 하나를 하나의 세그먼트라고 정의 가능

 

 

프로세스를 이루는 메모리는 코드 영역, 데이터 영역, 스택 영역, 힙 영역으로 이루어지는데,

코드와 데이터로 나누거나, 코드 내의 작은 함수를 세그먼트로 놓고 나눌 수도 있다.

🚨 이는 공유와 보안 측면에서 장점을 가지지만, 홀 크기가 균일하지 않은 단점이 있다.

 

 

 

💡 페이지드 세그멘테이션 (Paged Segmentation)

페이지드 세그멘테이션은 프로그램을 의미 단위인 세그먼트로 나눠 공유나 보안 측면에서 강점을 두고,
임의의 길이가 아닌 동일한 크기의 페이지 단위로 나누는 것이다.

 

  • segment + paging
  • 세그먼트를 여러 개의 페이지로 구성하는 방법
  • 세그멘테이션에서 발생했던, 단편화 문제 해결 가능 (이해 잘 안감)
    • 세그먼트를 페이지 단위로 잘라서 실제 메모리에는 페이지 단위로 올리기 때문에, 세그먼트 사이에 hole이 생길 수가 없다. (이해 잘 안감)

 

 


 

✔️ 전체적인 표

분할 \ 할당 연속 불연속
고정 고정 분할 기법 페이징 기법
가변 가변 분할 기법 세그멘테이션 기법

 

 

 

 

 


출처