시스템 최적화 – 동시사용자 늘리기 위한 커널 조정(ulimit)

 이 글은 http://wiki.kldp.org/KoreanDoc/Ulimit-KLDP (문태준님 작성, 2000년 2월 24일(목))을 토대로 필자가 나름 내용을 추가하여 작성하는 글이다.

 최대한 원글의 내용을 그대로 유지하되, 이미 10년이란 세월이 흘렀으므로 많은 변화가 있었다. 워낙 중요하고 좋은 글이라 그냥 그대로 가져다 쓰려고 했으나, 뭔가 아쉬운 느낌이 들어 없는 실력이지만 약간의 보충을 덧붙여보기로 했다.

  * 이 글은 실제로 제가 대형서버를 운영하고 있는 상황에서 나온 글은 절대 아니며, 그냥 여기저기서 주워들은 이야기들과 자료들을 토대로 해서 작성한 것입니다. 동시접속이 몇백명에서 몇천명되는 서비스를 하려면 단순하게 커널 컴파일 한번 하고 끝나는 것이 아니라 여러가지 조정을 해주어야 할 것이 많습니다. 또한 하드웨어와 OS 제한이 있으므로 로드밸런싱(부하분산), 트래픽 분산 등을 하는 스위칭 장비, 클러스터링 시스템 구성이 필요할 수 있습니다. 그만큼 설계를 잘해야합니다. 여기에 언급한 것은 단지 쉽게 할 수 있는 맛보기 정도이지요. 이로 인해서 생기는 손해에 대해서는 본인이 절대 책임을 지지 않습니다. 또한 내용 중 틀린 부분도 많이 있을 것입니다.

  * 들어가며

 대규모 서비스를 준비하는 경우 운영체제의 제한사항을 먼저 확인해야 한다. 동시에 열수 있는 총파일 수, 한 프로세스가 열수 있는 파일 수 등등.

 예를 들어 대형 웹서버를 아파치로 서비스하는 경우를 생각해보자. 아파치는 기본적으로 프로세스 방식으로 서비스를 처리한다. 이건 사용자의 요구가 올때마다 하나의 프로세스를 띄우므로 만약 동시에 10명의 사용자가 접속을 하면 10개의 프로세스가 떠야한다는 것이다. 최근의 아파치 서버는 MaxClients 150 이라고 설정되어 있다. 이건 동시에 150 개의 프로세스를 띄울 수 있으며 결국 동시에 150명을 받아 들일 수 있다는 것이다(실제로 이정도만 하더라도 절대로 작은 규모는 아니다). 그런데 만약 nobody가 만들어낼 수 있는 최대 프로세스 개수가 그 이하라면? 당연히 문제가 생길 것이다. 물론 최근 레드햇 6.0 이상 버전은 그 이상으로 맞추어져 있어서 문제가 생기지는 않겠지만.

 문제는 프로세스가 많이 뜨면 프로세스뿐만 아니라 열 수 있는 파일 수에서도 문제가 된다.

 그러면 먼저 프로세스의 자원 한도에 대해서 알아보자.

 -주
 이 글을 작성하는 현재(2010.07.08) 많은 것이 바뀌어졌다. 현재 필자가 운용하는 아파치의 버전은 2.2.14 버전을 사용중이고, (원 글님이 글을 작성하셨을 10년전에는 아마 1.7.X 버전으로 사용되었으리라 생각한다) 아파치의 구동 방식도 하나의 요청마다 하나의 프로세스를 띄우는 방식이 아닌 메소드 및 기타 방식을 사용하는 형식으로 바뀌었다. 그리고 아울러 MaxClient의 수도 증가했음은 물론이다.

 * 프로세스의 자원한도

 프로세스의 자원한도를 리눅스에서는 ulimit 를 통해서 알 수 있다.

 ulimit 옵션

 -a 모든 제한 사항을 보여준다.
 -c 최대 코어 파일 사이즈
 -d 프로세스 데이터 세그먼트의 최대 크기
 -f shell에 의해 만들어질 수 있는 파일의 최대 크기
 -s 최대 스택 크기
 -p 파이프 크기
 -n 오픈 파일의 최대 수
 -u 프로세스 최대 수
 -v 최대 가상 메모리의 량

 # ulimit -a (또는 ulimit -Sa) —> soft 한도

jonathan@jonathan-laptop:~$ ulimit -a
core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 20
file size               (blocks, -f) unlimited
pending signals                 (-i) 16382
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited
max user processes              (-u) unlimited
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

 # ulimit -Ha —-> Hard 한도

jonathan@jonathan-laptop:~$ ulimit -Ha
core file size          (blocks, -c) unlimited
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 20
file size               (blocks, -f) unlimited
pending signals                 (-i) 16382
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) unlimited
cpu time               (seconds, -t) unlimited
max user processes              (-u) unlimited
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

 소프트 한도(soft)는 새로운 프로세스가 만들어졌을 때 디폴트로 적용되는 자원의 한도이다. 이것을 하드한도까지 등가시킬 수 있다. 그렇지만 이 한도를 넘어서 확장하는 것은 슈퍼유저만이 가능하다.

 즉, 하드한도는 절대적인 선이다.

 그렇다면 하드한도는 슈퍼유저라고 무한대로 늘릴 수 있는가?
-> 절대 아니다. 이건 커널차원에서 지정을 해야 한다.

 위에서의 각 항목을 살펴보자면…

core file size          -> 코어파일의 최대크기
data seg size           -> 프로세스의 데이터 세그먼트 최대크기
scheduling priority
file size               (blocks, -f) unlimited  -> 쉘에서 생성되는 파일의 최대 크기
pending signals                 (-i) 16382
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited  -> resident set size의 최대 크기(메모리 최대크기)
open files                      (-n) 1024    -> 한 프로세스에서 열 수 있는 open file descriptor의 최대 숫자(열수 있는 최대 파일 수)
pipe size            (512 bytes, -p) 8    -> 512-바이트 블럭의 파이프 크기
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited     -> 총 누적된 CPU 시간(초)
max user processes              (-u) unlimited   -> 단일 유저가 사용가능한 프로세스의 최대 갯수
virtual memory          (kbytes, -v) unlimited   -> 쉘에서 사용가능 한 가상 메모리의 최대 용량
file locks                      (-x) unlimited

 의 뜻을 가지고 있다.

 위의 내용 중 주의깊게 살펴볼 부분이 바로 한 프로세스에서 열 수 있는 file descriptor 의 갯수를 표시한 open files 항목과 한 유저가 생성 가능한 프로세스의 갯수 부분이다.

 사실 이미 한 유저가 생성 가능한 프로세스의 갯수가 무한정으로 되어 있으므로 file descriptor 의 갯수는 그다지 큰 의미가 없다. 하지만 file descriptor의 갯수를 늘리고 싶다면 다음의 방법으로 가능하다.

 1. 소스파일을 수정한 후, 커널 재컴파일을 하는 방법.

 2. /proc 를 이용하여 변경하는 방법.

 3. /etc/security/limits.conf 파일을 수정하는 방법

 사실 ulimit 명령으로 조절이 가능하나, 단지 보여주기만 할 뿐 실제적인 수정이 되지 않는다고 원글에는 나와있었다. 그래서 ulimit 관련 부분은 패스.

 그러나, 프로그래밍의 경우는 ulimit 함수를 통해서 수정이 가능하다.

NAME
       ulimit – get and set user limits

SYNOPSIS
       #include <ulimit.h>

       long ulimit(int cmd, long newlimit);

DESCRIPTION
       Warning: This routine is obsolete.  Use getrlimit(2), setrlimit(2), and
       sysconf(3) instead.  For the shell command ulimit(), see bash(1).

       The ulimit() call will get or set some limit for the  calling  process.
       The cmd argument can have one of the following values.

       UL_GETFSIZE
              Return the limit on the size of a file, in units of 512 bytes.

       UL_SETFSIZE
              Set the limit on the size of a file.

       3      (Not  implemented  for  Linux.)   Return  the  maximum  possible
              address of the data segment.

       4      (Implemented but no symbolic  constant  provided.)   Return  the
              maximum number of files that the calling process can open.

RETURN VALUE
       On  success,  ulimit()  returns  a non-negative value.  On error, -1 is
       returned, and errno is set appropriately.

ERRORS
       EPERM  A non-root process tried to increase a limit.

CONFORMING TO
       SVr4, POSIX.1-2001.  POSIX.1-2008 marks ulimit() as obsolete.

SEE ALSO
       bash(1), getrlimit(2), setrlimit(2), sysconf(3)

 2. proc를 이용한 방법

 proc를 이용하여 간단히 변경하는 방법이 있다.

pchero@MyNote:~$ cat /proc/sys/fs/file-max
6553600
pchero@MyNote:~$ sudo echo 7000000 > /proc/sys/fs/file-max

 하지만 /proc 를 사용하여 시스템 설정을 변경할 경우, 매 부팅시 설정을 다시 해주어야 한다는 단점이 있다.
 /etc/rc.local 파일을 이용하여 명령어를 설정하던가 아니면 다음에 나오는 limits.conf 파일을 이용하도록 한다.

 3. 사용자에 따른 자원 한도 설정 파일
/etc/security/limits.conf

# /etc/security/limits.conf
#
#Each line describes a limit for a user in the form:
#
#<domain>        <type>  <item>  <value>
#
#Where:
#<domain> can be:
#        – an user name
#        – a group name, with @group syntax
#        – the wildcard *, for default entry
#        – the wildcard %, can be also used with %group syntax,
#                 for maxlogin limit
#        – NOTE: group and wildcard limits are not applied to root.
#          To apply a limit to the root user, <domain> must be
#          the literal username root.
#
#<type> can have the two values:
#        – “soft” for enforcing the soft limits
#        – “hard” for enforcing hard limits
#
#<item> can be one of the following:
#        – core – limits the core file size (KB)
#        – data – max data size (KB)
#        – fsize – maximum filesize (KB)
#        – memlock – max locked-in-memory address space (KB)
#        – nofile – max number of open files
#        – rss – max resident set size (KB)
#        – stack – max stack size (KB)
#        – cpu – max CPU time (MIN)
#        – nproc – max number of processes
#        – as – address space limit (KB)
#        – maxlogins – max number of logins for this user
#        – maxsyslogins – max number of logins on the system
#        – priority – the priority to run user process with
#        – locks – max number of file locks the user can hold
#        – sigpending – max number of pending signals
#        – msgqueue – max memory used by POSIX message queues (bytes)
#        – nice – max nice priority allowed to raise to values: [-20, 19]
#        – rtprio – max realtime priority
#        – chroot – change root to directory (Debian-specific)
#
#<domain>      <type>  <item>         <value>
#

#*               soft    core            0
#root            hard    core            100000
#*               hard    rss             10000
#@student        hard    nproc           20
#@faculty        soft    nproc           20
#@faculty        hard    nproc           50
#ftp             hard    nproc           0
#ftp             –       chroot          /ftp
#@student        –       maxlogins       4

# End of file

# Setting for oracle
oracle          soft    nproc           2047
oracle          hard    nproc           16383
oracle          soft    nofile          1023
oracle          hard    nofile          6553

  제일 아래 ‘oracle’ 과 같이 따로 설정된 부분과 같이 변경하면 된다. 이렇게 설정할 경우, 매 부팅시 자동 적용되어 별도로 적용하지 않아도 된다. 또한, 각각의 유저마다 다른 설정을 적용할 수 있으므로 보안 및 관리에도 용이하다.

 # 마지막으로 프로세스에서 열어놓은 파일을 확인하는 방법에 대해 알아보자.

 결론적으로 lsof 프로그램을 이용하면 된다.

 lsof는 ‘List Open File’의 약자로 해당 System에서 구동되고 있는 프로세스들에 의해서 열려진 파일들을 확인 할 수
있는 툴이다. 시스템의 의심스러운 프로세스에 대한 확인이 용이하고, 설치가 비교적 쉬워 많이 이용되고 있다.

 lsof에 관한 내용은 워낙 방대하여 아래에 해당 프로그램 사용에 대한 매뉴얼을 링크해둔다. 또한 man lsof를 이용하여 사용해도 무방하다.

http://www.superuser.co.kr/security/certcc/secu_certcc_15.htm

 

고전적 디버거인 로그

 멀티 스레드를 이용한 프로그램을 작성한다든지 하면 디버거로도 버그를 찾기가 힘든 경우도 많다. 이러한 경우에도 고전적 디버거인 cout – 또는 printf() – 문은 큰 힘을 발휘한다. 즉 문제가 될 만한 곳에 계속해서 cout을 사용하는 것이다.

 결론적으로 디버거의 사용법을 잘 익혀두는 것은 정말 큰 힘이 되지만, 그 이전에 적절한 곳에 로그를 남기도록 하는 것은 꼭 필요한 작업이다. cout 이나 printf() 의 경우 손으로 직접 타이핑해서 디버깅을 한다고 해서 손버깅이라고 부르기도 했다.

디폴트로 호출되는 메모리 예외 핸들러를 변경해 보자.

 디폴트로 호출되는 핸들러는 비정상적인 종료가 발생한다는 메시지만을 남기고 시스템을 종료시키는 역할을 수행한다. 이때 아무런 메시지를 남기지 않고 시스템이 종료되기를 원한다면 메모리 핸들러가 호출되지 않도록 만들면 된다. 그러려면 다음과 같이 set_new_handler 메소드를 NULL 파라미터와 함께 호출하여 핸들러의 실행을 막으면 된다.

 set_new_handler(NULL);

 set_new_handler 는 new.h 파일을 include 해야 사용할 수 있다. 만일 디폴트 핸들러가 아닌 개발자가 지정한 함수로 대체시킬 필요가 있다면, 이때에도 set_new_handler 함수를 이용하면 된다. 예를 들어 메모리를 동적으로 할당하는데 문제가 발생할 때 newErrorHandle() 메소드가 호출되도록 만들고 싶으면 다음과 같이 하도록 한다.

set_new_handler(newErrorHnadle);

메모리 동적 할당과 메모리 해제

 메모리를 동적으로 할당한 뒤에 메모리를 해제시키지 않으면 생성된 메모리는 계속해서 시스템에 남게 된다. 따라서 해당 메모리의 사용이 끝나면 delete나 free를 통하여 메모리를 해제시켜야 한다. 예를 들어 다음 메소드의 경우 메소드가 실행될 때마다 메모리를 새오 할당하게 된다.

void allocateMem(void)
{
  AClass *aClass = new AClass();
  aClass->aMethod();
}

 메소드의 실행이 끝나도 aClass 객체는 메모리에 남게 되는데, aClass 객체를 접근할 길은 끊어지기 때문에 이는 향후 메모리상에 쓰레기가 된다. 따라서 객체의 해제를 확실하게 하거나, 새롭게 생성한 객체를 리턴하여 생성된 객체에 대해 접근할 수 있는 길이 없어지지 않도록 하는 것이 좋다. 예를 들면 다음과 같다.

AClass* allocateMem(void)
{
  AClass *aClass = new AClass();
  aClass->aMethod();
  return aClass;
}

GCC 컴파일러에서 라이브러리 파일을 사용하는 법

 라이브러리 파일을 이용하여 실행파일을 만들 때 컴파일러의 옵션을 이용하는 방법이 있다. 이때 사용되는 옵션이 ‘-L’과 ‘-l’ 인데, -L 의 경우에는 사용하고자 하는 라이브러리가 포함된 디렉토리 명을 명시하는 옵션이고, -l 은 라이브러리의 이름을 적어주는 옵션이다. 이때 라이브러리의 이름은 lib 라는 말과 확장자 ‘.a’ 를 생략하여 사용할 수 있다. 즉, libMsg.a 의 경우 그냥 Msg 라고 쓰면 된다.

 실제 예를 보자. 임의의 컴파일 ‘% c++ -o useMsg UseMsg.cpp libMsg.a’ 의 명령을 아래와 같이 대체할 수 있다.

 % c++ -o useMsg UseMsg.cpp -L. -lMsg

 이때 만일 라이브러리 파일이 /home/pchero 디렉토리 밑에 있다면 -L 옵션을 다음과 같이 주면된다.

 -L/home/pchero