LAMP 시스템 조율 시리즈의 마지막인 Part 3, MySQL 조율에 관한 문서를 소개합니다.
공개 DataBase 중에서 가장 (최소한 한국에서는...) 다양한 사용자층을 확보한 MySQL은 UNIX/Linux 환경에서 사용할 수 있는 대표적인 DataBase중의 하나입니다. 특히나 오픈소스 제품이기에 무료로 사용할 수 있지만, 그 덕에 정교한 튜닝을 하지 않고 사용하는 적당히 설치해서 적당히 사용하는 제품이기도 하죠... 물론 상용 제품들도 벤더사에서 설치해준 상태 그대로 사용하는게 대부분의 DB서버가 처한 우울한 현실이기도 하죠.

자... 이제 IBM DeveloperWorks에서 소개하는  "LAMP 시스템 조율, Part 3: MySQL 조율"을 소개합니다. 아~ 한글이라서 더욱더 맘에 듭니다. (이 놈의 영어 울렁증은...)

원문 : LAMP 시스템 조율, Part 3: MySQL 조율


LAMP(Linux®, Apache, MySQL, PHP/Perl) 아키텍처를 활용하는 응용 프로그램은 끊임없이 개발되고 배포되고 있습니다. 하지만 때로 서버 관리자는 다른 사람이 작성했다는 이유만으로 응용 프로그램 자체에 대한 통제권이 거의 없습니다. 기사 셋으로 이뤄진 이번 연재물은 응용 프로그램 성능을 향상시킬 서버 환경 설정 항목을 다룹니다. 연재 마지막인 세 번째 기사에서는 최대 성능을 발휘하도록 데이터베이스 계층을 조율하는 데 초점을 맞춥니다.

MySQL 조율에 대해

MySQL 서버를 빠르게 하기 위한 방법은 세 가지가 있는데, 효율이 낮은 쪽에서 높아지는 쪽으로 나열하면 다음과 같다.

  1. 하드웨어로 문제를 푼다.
  2. MySQL 프로세스 설정을 조율한다.
  3. 질의를 최적화한다.
DB2®로 이주
MySQL에서 IBM® DB2®로 이주하는 명쾌하고 비용이 들지 않는 방법을 찾고 싶은가? "MySQL 또는 PostgreSQL에서 DB2 Express-C로의 마이그레이션 (영문)" 기사에서는 이주 도구를 활용해 쉽게 이전하는 방법을 보여준다. 공짜 DB2 Express-C를 내려받아 지금 바로 시도해보자.

하드웨어로 문제를 푸는 방법이 가장 먼저 떠오른다. 특히 데이터베이스가 자원을 잡아먹는 괴물이라는 사실을 감안하면 말이다. 하지만 이 해법에는 한계가 있다. 현실을 고려할 때 CPU나 디스크 속력은 두 배로, 메모리 용량은 네 배에서 여덟 배 정도만 늘일 수 있다.

두 번째로 좋은 방법은 mysqld라는 MySQL 서버 조율이다. 이 프로세스 조율은 올바른 위치에 메모리를 할당하고 어떤 부하가 걸릴지 mysqld에 알려주는 조정 기법을 의미한다. 디스크 속력을 좀 더 빠르게 만드는 대신, 필요한 디스크 접근 횟수를 줄이는 편이 유리하다. 비슷하게, MySQL 프로세스가 올바르게 동작하도록 만드는 조율은 개발자가 임시 디스크 테이블과 파일 여닫기 같은 배경 작업에 신경을 쓰는 대신 질의에 대한 서비스에 좀 더 많은 시간을 보낼 수 있음을 의미한다. mysqld 조율은 이번 기사에서 주로 다룰 내용이다.

최고로 좋은 방법은 질의 최적화다. 이는 적절한 색인을 테이블에 만들어 놓고, MySQL의 장점을 최대로 활용하는 방향으로 질의를 작성하는 조율 기법을 의미한다. 이번 기사에서 질의 조율을 다루지는 않지만(이 주제로 책을 써도 되겠다), mysqld 환경 설정을 변경해 조율이 필요한 질의를 보고하도록 만든다.

중요한 조율 순서를 제시하긴 했지만, 그렇다고 해서 적절히 조율을 마친 질의를 위해 하드웨어나 mysqld 설정을 무시하라는 말은 아니다. 느린 기계는 느린 기계일 뿐이며, 제대로 작성한 질의를 돌리더라도 부하가 걸려 실패하는 경우를 목격했는데, mysqld가 질의를 서비스하는 대신 바쁘게 움직이느라 시간을 소모하고 있었기 때문이었다.

 지난번에 소개한 LAMP 시스템 조율의 두번째 문서를 소개하려합니다. 이번에는 아파치 웹서버와 PHP의 최적화에 관한 내용을 소개하고 있네요.
 아파치의 MPM 환경 설정, PHP 중간 코드 캐싱 등의 내용을 설명하고 있습니다.

원문 : LAMP 시스템 조율, Part 2 : 아파치와 PHP 최적화



LAMP(Linux®, Apache, MySQL, PHP/Perl) 아키텍처를 활용하는 응용 프로그램은 끊임없이 개발되고 배포되고 있습니다. 하지만 때로 서버 관리자는 다른 사람이 작성했다는 이유만으로 응용 프로그램 자체에 대한 통제권이 거의 없습니다. 기사 셋으로 이뤄진 이번 연재물은 응용 프로그램 성능을 향상시킬 서버 환경 설정 항목을 다룹니다. 첫 번째 기사는 LAMP 아키텍처, 성능 기법, 기본적인 리눅스 커널, 디스크, 파일 시스템 미조정을 다뤘습니다. 두 번째 기사에서는 아파치와 PHP 컴포넌트를 최적화하는 방법에 초점을 맞춥니다.

리눅스, 아파치, MySQL, PHP(또는 펄)은 일정 목록부터 블로그와 전자 상거래 사이트에 이르기까지 많은 웹 응용 프로그램의 토대가 된다. LAMP 컴포넌트에 의존하는 많은 오픈 소스 패키지는 다양한 문제를 해결한다. 응용 프로그램 부하가 증가할수록, 기반 구조에서 병목 현상이 발생해 사용자 요청에 대한 반응이 느려지는 형태로 나타난다. 직전 기사에서는 리눅스 시스템 조율 방법과 LAMP 기초, 성능 측정 방법에 대한 기초를 다뤘다. 이번 기사에서는 아파치와 PHP로 대표되는 웹 서버 구성 요소에 초점을 맞춘다




 
 dW Interview에서 간만에 얼굴을 아는 분의 인터뷰 기사가 있어서 소개를 하려고합니다. KLDP[각주:1] 운영자이시며 NHN 개방형 기술TF TF장이신 권순선님입니다.
예전에 2005년도 Codefest[각주:2] 준비를 하면서 한번 뵌적이 있어서 그런지 인터뷰 기사가 유난히 반갑네요.(물론 권순선님은 저를 기억하지 못 하실겁니다. 제가 그리 비중있는 역할을 하지는 않았었거든요. ^^;)

원문 : dW Interview “오픈 소스로 재미 이상의 가치를 전달하기”


리눅스는 리누스 토발즈의 골방(?)에서 시작되어 전 세계 수많은 개발자를 몰입의 즐거움에 빠뜨리고 이제는 산업을 이끄는 한 축이 될 정도로 성장했습니다. 이번 인터뷰에서는 그 역동적인 역사를 지켜보며 국내의 대표적인 오픈 소스 커뮤니티인 KLDP(http://kldp.org)를 10년 넘게 운영중인 권순선 님을 만나 보았습니다.


  1. kldp.org는 리눅스 문서화 프로젝트로 시작하여 현재는 오픈 소스 커뮤니티를 지향하는 온라인 커뮤니티입니다. [본문으로]
  2. 코드페스트는 자유 소프트웨어(FreeSoftware) 및 오픈 소스(OpenSource) 개발자와 사용자들이 한 자리에 모여 함께 프로그래밍을 비롯한 소프트웨어 개발을 하거나 번역, 토론 등의 관련 작업을 진행하기도 하는 즐거운 오프라인 F/OSS 행사입니다. 2004년 7월에 시작해 대략 5개월에 한 번 꼴로 꾸준히 열리고 있습니다.
    http://wiki.kldp.org/wiki.php/CodeFest [본문으로]
 Linux System이 영역을 넓혀가는데 큰 역할을 한 LAMP 아키텍쳐에 대한 문서입니다.
Open source 운영체제인 Linux, Apache 웹 서버, MySQL, PHP를 조합해 웹 서비스를 제공하는 LAMP 아키텍쳐는 저렴한 비용으로 웹 서비스를 제공하게 해주는 가장 대중적인 조합이 되었죠.



원문 : LAMP 시스템 조율, Part 1: LAMP 아키텍처 이해 (한글)

아래는 "LAMP 시스템 조율, Part 1"의 서문을 발췌한 내용입니다.


LAMP(Linux®, Apache, MySQL, PHP/Perl) 아키텍처를 활용하는 응용 프로그램은 끊임없이 개발되고 배포되고 있습니다. 하지만 때로 다른 사람이 작성했다는 이유만으로 응용 프로그램 자체에 대한 통제권이 서버 관리자에게는 없습니다. 기사 셋으로 이뤄진 이번 연재물은 응용 프로그램 성능을 향상시킬 서버 환경 설정 항목을 다룹니다. 첫 번째 기사는 LAMP 아키텍처, 성능 기법, 기본적인 리눅스 커널, 디스크, 파일 시스템 미조정을 다룹니다. 이어지는 기사에서는 아파치, MySQL, PHP 컴포넌트를 조율하는 방법을 다룹니다.

리눅스, 아파치, MySQL, PHP(또는 펄)은 일정 목록부터 블로그와 전자 상거래 사이트에 이르기까지 많은 웹 응용 프로그램의 토대가 된다. 워드프레스와 플리그(Pligg)는 강력한 고성능 웹 사이트를 유지하는 공통 소프트웨어 패키지다. 이런 아키텍처는 LAMP라고 알려졌다. 거의 모든 리눅스 배포판에는 리눅스, 아파치, MySQL, PHP와 펄이 포함되어 있으므로 LAMP 소프트웨어 설치는 식은 죽먹기다.

설치가 쉽기 때문에 소프트웨어 실행까지 쉬워보일지도 모르겠지만, 이는 사실이 아니다. 궁극적으로 응용 프로그램 부하는 백엔드 서버에 포함된 설정값을 무력화하며, 결국 응용 프로그램 성능 저하가 일어난다. LAMP 설치는 지속적인 감시와 조율과 평가를 요구한다.

시스템을 조율하는 작업은 사람마다 의미가 달라진다. 이번 연재에서는 리눅스, 아파치, MySQL, PHP라는 LAMP 컴포넌트 조율에 초점을 맞춘다. 응용 프로그램 자체 조율은 또 다른 복잡한 문제다. 응용 프로그램과 백엔드 서버 사이에는 공생 관계가 있다. 잘못 조율된 서버는 최상의 응용 프로그램조차도 부하가 걸릴 경우 실패하도록 만들며, 잘못된 응용 프로그램을 앞에 놓고 서버 조율을 해봤자 굼벵이를 달팽이로 만들 뿐이다. 다행스럽게도 적절한 시스템 조율과 감시는 응용 프로그램에 존재하는 문제점을 찾아내준다.





 오랫만에 IBM DW에 올라온 글을 소개하려합니다. ^^
이번엔 리눅스 커널에 관한 내용을 소개한 글입니다. "리눅스 커널 해부"라는 제목의 한글로 번역된 팀 존슨(Emulex corp.)의 글입니다.

600만 행이 넘는다는 리눅스 커널을 하나의 문서에서 다 분석한다는 것은 무리가 있죠. ^^  이 문서도 커널을 한방에 끝장낼 수 있는 내용이 나오는건 아닙니다.
한번 읽어보고, 저자가 소개한 참고 문서들도 읽어보면 어느정도 윤곽이 잡힐것 같네요. 음...
근데, 늘상 느끼는 문제이지만 부족한 영어 실력이 원망스럽습니다.

원문 : 리눅스 커널 해부 (한글)

리눅스(Linux®) 커널은 거대하고 복잡한 운영체제의 핵심이며, 커다란 몸집에도 불구하고 하위 시스템과 계층 구조를 사용해서 조직화되어 있습니다. 이 기사에서는 리눅스 커널의 일반적인 구조를 살펴보고 주요 하위 시스템과 핵심 인터페이스를 파악합니다. 좀더 깊이 파고 들고 싶다면 다른 IBM 기사를 읽어보세요.

이 기사의 목표는 리눅스 커널을 소개하고 아키텍처와 주요 컴포넌트를 살펴보는 데 있다. 우선 리눅스 커널 역사부터 간략하게 짚어보기 시작해 다음으로 3만 피트 상공에서 리눅스 커널 아키텍처를 살펴보고, 마지막으로 주요 하위 시스템을 검토하겠다. 리눅스 커널은 코드가 600만 행이 넘으므로 소개글을 너무 장황하지 않게 줄였다. 좀더 깊이 파고 들고 싶다면 참고자료를 살펴보자.



  MS가 OOXML 명세를 표준안으로 제안한 뒤로 많은 논란이 있었습니다. 정치적, 기술적 이유를 들어서 찬반이 갈려있지만, 직업이 직업인지라 기술적인 이유가 먼저 눈에 들어옵니다.

 MS만이 구현 가능한 표준이기에 우리는 OOXML을 거부해야한다는 아주 간단한 말이외에 어떤 말이 필요할지 모르겠습니다.
 이번에 IBM의 DeveloperWorks에 올라온 글 중에서 OOXML에 대한 글이 있어서 소개하려합니다.

원문 : OOXML: 뭐가 그리 대단한가? (한글)

OOXML 명세를 놓고 상당한 비평과 찬사가 동시에 쏟아졌습니다. 덕택에 많은 사람이 무슨 영문인지 의아해 하고 있습니다. 이 기사는 (정치적인 입장이 아니라) 기술적인 측면에서 OOXML을 표준으로 취급해서 안 되는 이유를 밝힙니다.


 그리고 OOXML안의 철저한 검증을 요구하는 서명 운동을 하고 있습니다. 한번 가셔서 글도 읽어보시고, 동의하시면 서명 운동에도 참가해주세요.
서명하러가기

Office Open XML(OOXML)의 ISO 최종 투표에 즈음하여

한국 대표단에게 보내는 글

본 서명은 Microsoft가 제안하여 ECMA 376 표준이 된 Office Open XML(OOXML)ISO JTC-1 최종 투표를 앞두고 한국 대표단이 OOXML의 보완 사항을 신중히 검토하여 투표해 줄 것을 촉구 합니다.

앞서 2007년 9월 ISO JTC-1 위원회 1차 투표 시 아래와 같은 이유로 한국 대표단에게 1,000여명의 서명을 받아 OOXML 표준안에 대해 반대 투표를 해 줄 것을 촉구한 바 있습니다.

  • OOXML안은 대체할만한 다른 표준안이 존재 한다.
  • OOXML안은 불완전 하며 플랫폼 종속적이다.
  • OOXML안은 모호한 특허 문제 때문에 제 3자 구현이 제한된다.
  • OOXML안은 국내 다양한 S/W 개발 환경을 제한할 것이다.

이에 한국 대표단은 1차 투표에 반대표를 행사하면서 총 23가지의 수정 요청 사항을 제출 하였으며, 이제 마지막 투표를 앞두고 있습니다. 이에 아래 서명을 한 한국 소프트웨어 개발자 일동은 아래의 사항에 동의 합니다.

1. 한국 대표단이 제기한 수정 요청 사항에 동의 한다.

한국 대표단의 수정 요구 사항을 요약 하면 크게 아래 4가지 사항과 같습니다.

  1. OOXML 표준안이 기존 ODF와 플러그인이 아니라 표준 스펙 그 자체로 호환성을 유지하도록 수정해야 한다.
  2. OOXML 표준안의 IE 기반 기술 규격이 리눅스나 Firefox, Safari, Opera 등의 브라우저도 지원 해야 한다.
  3. OOXML 표준안 중 12개의 MS Office 레거시 스펙을 좀 더 자세하게 설명해야 한다.
  4. OOXML 표준안 중 VML 및 DrawingML 등 기존 표준이 있는 부분을 삭제해야 한다.

2. 한국 대표단의 신중한 기술적 검토를 요청 한다.

한국 대표단이 1차 투표 이후 수정 보완된 OOXML 표준안이 당시 요청한 수정 요청 사항과 부합 하는 지 정확하게 검토해 주실 것을 요청 드립니다.

  1. OOXML 표준안에 대한 기술적 검토가 충분히 이루어 지길 기대한다.
  2. OOXML 표준안에 대한 수정 요청 사항이 충분히 받아들여졌는지 검토해주길 기대한다.
  3. OOXML 표준안에 대한 수정 요청 사항이 100% 받아들여지지 않았을 경우 최종 투표에서도 반대 투표를 해주길 촉구한다.

 유닉스/리눅스를 사용하다보면 다양한 작업을 시간대 별로 실행 시켜야 할 때가 있습니다. 사용자들이 적은 시간대에 해야할 작업, 특정 시각에 해야 할 작업, 특정 작업이 종료된 다음에 할 작업... 등등 작업은 아주 많습니다.
유닉스/리눅스에서는 cron이라는 프로그램을 이용해서 배치작업을 처리하죠. 이번에는 cron과 at을 이용한 작업 일정 관리에 관한 문서를 소개하려 합니다.

원문 : 리눅스 팁: cron과 at를 사용한 작업 일정 관리 (한글)


아래는 서문을 발췌한 것입니다.

2008 년 3 월 25 일

시스템 사용량이 적어진 한밤중에 작업을 실행할 필요가 있거나 일일이나 주간 단위로 작업을 수행할 필요가 있지만, 잠도 자야겠고 다른 활동도 하면서 삶을 즐기고 싶습니다. 작업 일정 관리가 필요한 또 다른 좋은 이유는 반복적인 과업을 자동으로 수행하도록 만들거나 매번 동일한 방식으로 과업을 수행하도록 만들고 싶기 때문입니다. 여기서 소개하는 팁은 주기적으로나 일회성으로 미래 작업 일정을 관리하는 cronat 기능을 활용하도록 도와줍니다.

리눅스(Linux®)와 유닉스(UNIX®) 시스템은 일회성이거나 반복적인 미래 작업 일정을 관리하도록 만들어준다. LPI exam 102 prep: Administrative tasks에서 발췌한 이번 기사에서는 주기적으로 작업 일정을 관리하는 방법과 미래에 작업을 수행하는 방법을 보여준다.

많 은 시스템 관리 작업은 리눅스 시스템에서 종종 주기적으로 수행해야만 한다. 이런 작업에는 로그 파일을 회전시켜서 파일 시스템이 가득 차지 않도록 만들기, 자료 백업하기, 시스템 시각을 동기화하기 위한 서버 연결과 같은 작업을 포함한다. 이런 관리 작업에 대한 세부 사항은 위에서 언급한 튜토리얼을 참조하기 바란다. 이번 팁에서는 리눅스에서 사용 가능한 작업 일정 관리 패키지인 cron, crontab, anacron, at 명령을 다룬다. 시스템이 잠들거나 꺼져 있더라도, anancron은 다음 번에 깨어날 때 작업을 따라잡도록 도와준다.




이직을 할때 어느 정도 예상은 했었지만, 팀내에서 저의 역활이 DBA로서 DBMS 관리, 튜닝 등의 업무 못지 않게 장비(O/S, 운영, H/W 등등)쪽 일도 많은 자리라는 걸 느끼면서... 장애 처리를 어느정도 하고나니 이젠 장비 대/교체 준비라는걸 하게 되었습니다. 물론 신규 장비가 들어오고 DB Migration을 해야하므로 제가 할 일이 많아지는 거죠. 어쩌면 OS 버전이 더 올라갈 수도 있고, DBMS 버전도 덩달아 올라갈 수도 있으니 이것저것 준비할게 많습니다. 그래도 마음씨 좋은 사수님이 옆 자리에 있어서 대책없이 믿음으로 충만한 회사 생활을 하고 있습니다. ^^

어제까지 했던 작업이 tpmC 계산이었습니다. 사실 수 많은 어려움이 있었죠. 월요일에 마신 술이 깨질 않아서 오후 세시정도까지는 몇번이나 오타때문에 다시 계산을 하는 삽질을 했었죠.

기본적으로 동시 로그인 유저수에 분당 트랜잭션수를 곱하면 tpmC가 나오더군요. 물론 각종 보정치를 적용시켜야 실제로 사용할 수치가 나오긴 하지만요.

tpmC = 동시 로그인 유저수 * 분당 트랜잭션 수 * 보정치


이제 보정치를 적용해야 하는데, 보정치가 참 다양합니다. 실제로 서비스를 하려면 여러가지 문제에 부딪치게 되는데 이때를 위한 보정치 없이 tpmC를 계산해서 서버 용량을 결정하면 난감한 문제에 맞닥뜨리게 되겠죠. 구매한지 반년도 안된 서버가 성능 부족에 시달린다던지하는 그런 문제죠. ㅋㅋ

기본 tpmC 보정치
네트워크 보정치
클러스터 보정치
어플리케이션 복잡도 보정치
피크 타임 보정
여유율


첨부한 파일들은 Google로 검색해서 찾은 tpmC관련 문서들입니다.
혹시 이 문서관련해서 문제가 있으면 알려주세요. 삭제하도록 하겠습니다.
메일 주소는 miho77 _AT_ gmail.com 입니다.

 이번엔 지난번에 소개했던 이클립스 유로파로 웹 개발하기 시리즈의 세번째, 루비 개발 도구와 RadRails입니다. 개발자에게 재미난 유희로 혹은 실제 업무에 사용할 유용한 개발 도구로서 루비는 그 영역을 넓혀가고 있습니다. 이클립스가 루비 개발 환경을 지원하는 것은 어찌보면 당연한 결과라고 생각합니다. Aptana studio라는 루비 IDE도 나와있는 상태죠. 이번에 소개할 문서는 이클립스 유로파에 루비 개발 도구를 설치해서 사용하는 법을 알려줍니다. 저도 따라서 해보고 있는데 재미있네요. ^^ 실제 업무에 써 볼 일이 생길지는 모르겠지만요.

 원문 : 이클립스 유로파로 웹 개발하기, Part 3: 루비 개발 도구와 RadRails (한글)

아래는 문서의 서론 부분입니다.

Java™, PHP, 루비로 웹 개발을 할 때 이클립스(Eclipse)를 사용하는 방법에 관한 3부로 이루어진 "이클립스 유로파로 웹 개발하기" 의 Part 1에서는 이클립스 최신 버전인 유로파를 이용해 어떻게 자바 웹 애플리케이션을 신속하게 개발할 수 있는지에 대해, Part 2에서는 PHP 애플리케이션을 PDT(PHP Development Toolkit) 플러그인을 이용하여 얼마나 쉽게 개발할 수 있는지를 다루었습니다. 이번 Part 3에서는 RDT와 RadRails 이클립스 플러그인들에 대해 다룰 것이며 이 플러그인들을 설치하는 방법과 사용하는 방법에 대해 살펴보겠습니다. 앞으로 많은 루비 온 레일스(Ruby on Rails) 개발 작업들을 RadRails를 통해 하는 방법을 배울 것입니다.

이 튜토리얼 내에서

Part 2에 서는 PHP를 개발함에 있어 IDE를 이용하여 얻을 수 있는 이점에 대해 이야기해 보았다. 대부분의 것들은 루비에도 똑같이 적용되며 루비 개발 툴킷(RDT)을 이용할 때 얻게 될 것이다. RDT는 구문 강조(syntax highlighting), 컬러링(coloring), 문법 검사, 코드 자동 완성, 포맷화(formatting) 그리고 프로젝트 구성 등 IDE의 기본적인 모든 기능을 제공한다. 또한 큰 프로젝트에 필수적인 루비 디버거(debugger)를 제공하고 있다. 그 외에도 정규표현식(regex) 편집기/테스터 같은 기능과 Test::Unit와 통합을 통한 단위 테스트 환경도 있다.

이번 튜토리얼에서는 RDT와 RadRails 플러그인을 소개할 것이다. 그리고 이것들을 설치하는 방법과 사용하는 방법에 대해 보여줄 것이다. 루비 온 레일스 개발 작업들을 RadRails를 통해 어떻게 하는지를 배우게 될 것이며 RadRails를 통해 레일스 애플리케이션 테스트와 디버그를 더 쉽게 하는 방법을 알게 될 것이다.


선수조건

이번 튜토리얼은 루비를 통한 웹 개발이다. 루비 온 레일스로 웹 개발을 한다는 말이나 다름 없다. 그래서 루비 온 레일스에 대해 약간의 경험이 있다고 가정한다. 이클립스에 익숙하다면 도움이 되겠지만 필수적이진 않다. 이번 튜토리얼은 처음 두 튜토리얼에서 자바와 PHP로 개발된 애플리케이션 위에서 개발된다. 자바와 루비 프로그래밍의 배경지식은 필수다. 이클립스 IDE에 익숙하다면 도움이 되겠지만 필수적이진 않다.

자~ 루비, 한번 해볼까요?
 최근에 IBM DeveloperWorks에 올라온 글중에서 PHP 관련 글을 소개하려합니다.
"PHP에서 풀(pull) 방식으로 XML 구문을 분석하는 방법 (한글)  스트리밍 방식으로 메모리 효율을 높인다"라는 제목의 글은 PHP 5에서 추가된 XMLReader 라이브러리를 이용하여 글의 제목처럼 메모리 효율을 올리는 방법에 대한 글입니다.

PHP가 5 버전에 이르러서 많은 변화가 있었는데 실무에서 PHP 개발을 하지 않은지가 오래되서 그런지(요 2년사이에는 기능 수정하는 정도만 했었습니다.) XMLReader라는 라이브러리는 좀 생소하군요.

원문 : PHP에서 풀(pull) 방식으로 XML 구문을 분석하는 방법 (한글)  (부제 : 스트리밍 방식으로 메모리 효율을 높인다)

 아래는 문서의 앞부분을 발췌한 것입니다.

PHP 5는 XML(eXtensible Markup Language)을 읽는 클래스인 XMLReader를 새롭게 지원한다. SimpleXML이나 DOM(Document Object Model)과는 달리 XMLReader는 스트리밍 모드에서 동작한다. 즉, 문서를 처음부터 끝까지 읽어들인다는 뜻이다. 또한 문서를 끝까지 읽기 전에 이미 읽어들인 부분만으로도 작업이 가능하다. 따라서 속력이 매우 빠르고, 효율성이 높으며, 메모리가 크게 절약된다. 처리할 문서가 클수록 메모리 효율과 속력은 더욱 중요한 요인이다.

libxml

여기서 소개하는 XMLReader API는 Gnome 프로젝트의 C/C++용 libxml 라이브러리를 사용한다. 구체적으로 보면 libxml의 XmlTextReader API를 호출하는 PHP 레이어일 뿐이다. XmlTextReader는 .NET의 XmlTextReaderXmlReader 클래스를 모델로 삼았다(코드를 공유하지는 않는다).

푸시(push) 모델을 사용하는 SAX(Simple API for XML)와는 달리, XMLReader는 풀(pull) 모델을 사용하는 구문분석기다. 즉, 여러분이 만든 프로그램에 통제권이 있다는 뜻이다. 구체적으로 설명하자면, 구문분석기가 프로그램으로 이벤트를 밀어주는 방식이 아니라, 프로그램에서 다음 이벤트를 명시적으로 가져오는 방식이다. 프로그램이 발생하는 이벤트에 반응하기보다 프로그램에서 내용을 요청한다고 보면 된다. 디자인 패턴 관점에서 보면, XMLReader는 Observer 패턴이 아니라 Iterator 패턴을 구현한 클래스라고 하겠다.




+ Recent posts