본문 바로가기
KNOU/요약정리

[데이터베이스시스템] 회복 시스템

by bottlesun 2024. 5. 25.
728x90

회복시스템의 개념

회복의 역할

  1. 예상치 못한 HW 고장 및 SW 오류가 발생

→ 사용자의 작업에 대한 안정적 디스크 반영 여부 보장이 불가능

  1. 오류 발생 이전의 일관된 상태로 데이터베이스를 복원시키는 기법이 요구

→ 시스템 내의 고장 원인 검출, DBMS의 안전성 및 신뢰성을 보장

  1. 데이터베이스는 데이터 복원 절차 내재화

시스템 실패(ststem failure)의 유형

  1. 트랜잭션 실패

→ 논리적 : 잘못된 데이터 입력 , 부재 , 버퍼 오버플로, 자원 초과 이용

→ 시스템적 : 운용 시스템의 교착상태

  1. 시스템 장애

→ 시스템의 하드웨어 고장, 소프트웨어의 오류

→ 주기억장치와 같은 휘발성 저장장치의 내용 손실

  1. 디스크 실패

→ 비휘발성 디스크 저장장치의 손상 및 고장으로 인한 데이터 손실

회복 데이터의 구성

  1. 백업(Backup)

→ 데이터베이스의 일부 또는 전체를 주기적으로 복제하는 방식

  1. 로그(log)

→ 데이터 변경 이전과 이후의 값을 별도의 파일에 기록하는 형식

데이터 저장 구조

  1. 데이터는 디스크와 같은 비휘발성 저장장치에 저장되며, 전체 데이터의 일부만 주기억장치에 상주
  2. 데이터베이스는 데이터를 블럭 단위로 전송하고 블럭단위로 기억장소를 분할
  3. 트랜잭션은 디스크로부터 주 기억장치로 데이터를 가져오며, 변경된 데이터는 다시 디스크에 반영

→ 가져오기, 내보내기 연산은 블럭단위로 실행

→ 물리적 블록 : 디스크 상의 블럭

→ 버퍼 블록 : 주기억장치에 임시적으로 상주하는 블럭

데이터베이스 연산

  1. 메인 메모리와 디스크 사이의 연산

Input(X) : 물리적 블록 X를 메인 메모리에 적재

Output(X) : 버퍼 블록 X를 디스크에 저장

로그 기반 회복

로그 기반 회복의 개념

  1. 데이터베이스가 수행한 모든 수정 작업을 기록한 여러 종류의 로그를 사용하여 회복하는 시스템
  2. 로그레코드

데이터 항목 변경 과정

  1. WAL(Write-Ahead Log)

→ 트랜잭션은 데이터베이스 수정 전, 로그 레코드를 생성하여 기록

  1. 데이터 항목 변경 과정

→ 트랜잭션이 메인 메모리의 개인 영역에서 여러 연산을 수행

→ 트랜잭션이 데이터 항목이 존재하는 메인 메모리에 위치한 버퍼블럭의 데이터를 변경

→ Output 명령을 실행하여 버퍼블럭을 디스크에 기록

Redo 와 Undo 연산

  1. 회복 기법은 로그에 대해 두 연산을 사용

→ Redo(Ti) : Ti에 의하여 수정된 새로운 값으로 데이터 베이스의 데이터 항목 값을 수정

→ Undo(Ti) : Ti에 의해 수정된 모든 데이터 항목을 이전 값으로 복귀, 완료 후 <Ti , abourt> 기록

  1. 시스템 장애 발생 시

→ 로그에 <Ti, start> 가 있지만 <Ti, commit> 또는 <Ti,abort> 를 포함하지 않는 경우 Ti 는 Undo

→ 로그에 <Ti,start> 가 있지만 <Ti,commit> 또는 <Ti,abort> 를 포함하는 경우 Ti를 Redo

데이터베이스 변경과 커밋

  1. 데이터베이스 변경 시 복구 알고리즘의 고려사항

→트랜잭션의 일부 변경 사항이 버퍼블록에만 반영되고 물리블럭에 기록되지 않은 상태에서 트랜잭션이 커밋되는 상황

→ 트랜잭션이 동작 상태에서 데이터베이스를 수정했으나 추후에 발생한 실패로 취소기 필요한 상황

  1. 트랜잭션 커밋 상황

→ <Ti,commit> 로그 레코드가 안정된 저장장치에 기록 완료 시 트랜잭션 커밋으로 간주

→ <Ti,commit> 로그 레코드가 기록되기 전에 장애가 발생하면 롤백

회복의 유형

  1. 회복은 트랜잭션에 의해 요청된 갱신 작업이 디스크에 반영되는 시점에 따라 구분
  2. 지연 갱신 회복(deferred update restore)

→ 부분 커밋까지 디스크 반영을 지연시키고 로그에만 기록

→ 실패 시, 별도의 회복 작업 필요 없이

  1. 즉시 갱신 회복(immediate update restore)

→ 갱신 요청을 곧바로 디스크에 반영

→ 실패 시, 디스크에 반영된 갱신 내용을 로그를 바탕으로 회복

체크포인트의 필요

  • 로그 기반 회복 시스템의 한계

→ 로그의 크기는 시간이 지남에 따라 계속 증가하므로 대용량 로그의 탐색 비용이 매우 커짐

→ Redo 를 해야 하는 트랜잭션 중 대부분은 이미 데이터베이스에 반영

→ 반영된 트랜잭션의 잭실행은 시스템 자원의 낭비

체크포인트 기법

  1. 현재 시점에 메인 메모리의 버퍼 블럭에 존재하는 모든 로그 레코드를 안정 저장장치로 기록
  2. 수정된 모든 버퍼 블럭을 디스크에 반영
  3. 로그 레코드 <chekpoint ListT> 를 안정한 저장장치에 기록

→ List T는 체크포인트 시점에 실행 중인 트랜잭션 목록

체크포인트를 이용한 회복

  • 체크포인트 기법을 이용한 회복 과정

→ 로그의 마지막부터 역방향으로 탐색하여 <checkpoint ListT> 레코드를 찾음

→ ListT에 존재하는 <checkpoint ListT> 이후에 실행된 트랜잭션에 대하여 Redo 와 Undo 연산만 수행

  • 로그에 <Ti , commit > 또는 <Ti , abort> 가 없는 ListT안에 모든 트랜잭션을 Undo
  • 로그에 <Ti , commit > 또는 <Ti , abort> 가 있는 ListT안의 모든 트랜잭션을 Redo

회복 알고리즘

트랜잭션 Ti의 롤백 알고리즘

1단계 : 로그를 역방향으로 탐색

2단계 : Ti의 로그 레코드 <Ti, Xj,V1,V2> 에 대하여

→ 데이터 항목 Xj에 V1기록

→ 로그 레코드 <Ti, Xj, V1> 을 로그에 기록

3단계 : <Ti , start> 를 찾은 이후

→ 역방향 탐색을 중단

→ 로그 레코드 < Ti, abort> 를 로그에 기록

시스템 장애 후 회복 알고리즘

  1. 시스템 장애 이후 재시작 시 다음 두 단계를 거침

→ Redo, Undo 단계

  1. Redo 단계

→ 최근의 체크포인트에서 부터 순방향 로그 탐색

→ 롤백 대상할 트랜잭션의 Undo 리스트인 Listofundo를 ListT로 초기화

→ <Ti, Xj, V1, V2> , <Ti, Xj, V1> 형태의 모든 레코드를 재실행

→ <Ti, about> , <Ti, coomit> 발견 시 Ti를 Undo 리스트에서 제거

  1. Undo단계 (역방향 로그 탐색)

→ ListofUndo의 트랜잭션의 로그레코드를 찾으면 트랜잭션 롤백 알고리즘 1단계 수행

→ ListofUndo의 트랜잭션Ti에 대해 <Ti,start>를 만나 로그에 <Ti, abort>를 기록하고 ListofUndo에서 제거

→ ListofUndo에 트랜잭션이 존재하지 않는 상태가 되면 Undo 단계를 종료

728x90

댓글