DAS
서버와 스토리지에 직접적으로 연결
장점: 전용라인을 사용하기때문에 성능과 안정성에서 뛰어남
단점: 파일공유가 안됨
NAS
렌으로 스토리지 서버와 연결, 프로토콜로는 nsf cifs 가 있음
장점: 어플리케이션 서버 사이에 파일 공유 가능
단점: lan과 채널로 접속 단계가 많아 장애가 일어날 수 있음
SAN
서버와 스토리지 사이에 파이버 채널 스위치를 넣음
장점: 서버와 관계없이 저장 장치 사이에 데이터를 공유
사용자 네트워크와 별도의 네트워크를 이용하여 데이터 서비스 제공 -> 사용자부하를 줄임
단점: 비용, 구성 복잡
2차 스토리지, 정보시스템 주연으로 떠올라
시장조사 전문업체인 IDC는 오는 2006년까지 스토리지 수요의 연평균 성장률이 46%에 달할 전망이며, 2006년에는 60%까지 치솟을 것으로 전망했다. 그러나 기업들의 평균 스토리지 예산은 연간 한 자리 수의 증가율을 보인다고 예상했다. 결론적으로 많은 기업들이 높은 용량을 최저의 가격에 구현하기 위한 방법을 고안하고 있는 셈이다. 저렴한 비용으로 대용량의 데이터를 저장할 수 있으면서, 직접 접근까지 가능한 2차 스토리지의 등장에 많은 기업들이 촉각을 곤두세우고 있는 이유도 바로 여기에 있다.
본지는 4회에 걸쳐 2차 스토리지의 기술적 배경과 적용 방안에 대해 살펴 보고자 한다.
인터넷 사용의 증가와 더불어 저장할 데이터의 양도 폭발적으로 늘어나면서 그동안 서버에 밀려 조연에 머물렀던 스토리지가 점차 서버를 따돌리고 정보산업의 주역으로 부상하고 있다.
전산시스템을 구축하는 기업들이 전사적자원관리(ERP)나 데이터웨어하우징(DW), 그리고 고객관계관리(CRM) 등 대규모 데이터처리가 필요한 시스템을 잇달아 도입하고 있다. 인터넷 서비스 제공업체나 애플리케이션 소프트웨어 제공업체들이 경쟁력 있는 서비스를 제공하기 위해 스토리지 도입을 최우선의 과제로 삼고 있다.
DW나 ERP의 경우 도입 초기에는 용량이 얼마되지 않는다. 하지만 구축이 완료된 후 운용 과정에서는 처리해야 할 데이터의 양이 2~3배로 급증하게 된다. 기업 입장에서는 업무 효율성을 위해 스토리지 도입을 최우선의 과제로 서두르게 된다.
급부상하는 2차 스토리지
또한 인터넷 사용의 폭발적인 증가로 인터넷 서비스 제공업체나 애플리케이션 소프트웨어 제공업체 또한 급증하고 있다. 이들 업체들은 보다 경쟁력이 있는 인터넷 사업을 전개하기 위해 고객드르이 정보를 효율적으로 저장하고자 한다. 하지만 다양하고 차별화된 서비스를 제공하려면 이를 충분히 감당할 수 있는 대용량의 스토리지가 절실하게 필요하다.
한편 PC와 인터넷 기반의 멀티미디어 서비스의 확대로 개인이 보유하고 있는 데이터의 양도 급증하고 있다.
최근에는 기업의 저장용량의 확대에 대한 요구가 급속히 늘어나면서 페타바이트를 넘어 엑사바이트라는 용어를 사용할 정도로 대용량 데이터가 일반화 되어 가고 있다.
양키 그룹의 한 조사 연구에 따르면, 2001년을 기준으로 1년 동안 1테라바이트의 스토리지 용량을 사용했던 기업이 2002년에 1테라바이트를 사용하는데 걸린 시간은 고작 30일, 2003년에는 하루, 2004년에는 불과 2시간만에 1테라바이트를 사용할 것으로 전망했다.
왜 모든 데이터를 같은 디스크에 보관하는가
스토리지는 데이터의 온라인 백업과 대용량 데이터의 저장 등에 효율적으로 사용할 수 있다. 그러나 데이터 센터의 규모가 커짐에 따라 그리고 회사들이 멀티미디어를 기반한 애플리케이션에 점점 더 많이 의존함에 따라 전통적인 스토리지 모델들은 더 이상 효과적이지 않게 되었다.
스토리지 분야에는 다양한 제품이 나와 있다. 하지만 기본적인 개념을 이해하고 스토리지 특성을 파악한 다음 스토리지를 구입하여 사용한다면 기업환경에 최적의 가용성, 확작성, 신뢰성을 보장하여 투자대비 높은 효율을 얻을 것이다. 데이터의 급증은 기업들의 스토리지, 특히 디스크의 용량 확장으로 이어지고 있다. 하지만 기업의 입장에서는 무작정 디스크 용량만 늘릴 수도 없는 노릇이다.
최근 SCSI 디스크 어레이 가겨이 크게 내려갔다고는 해도 여전히 1테라당 1억원을 호가하는 고가 장비이다. 그렇다고 값싼 테이프 라이브러리에 모든 데이터를 저장하고 필요할 때마다 꺼내서 돌린다는 것은 상상조차 하기 힘들다.
시장조사 전문업체인 IDC는 오는 2006년까지 스토리지 수요의 연평균 성장률은 46%에 달할 전망이며, 2006년에는 60%까지 치솟을 것으로 전망했다. 그러나 기업들의 평균 스토리지 예산은 연간 한자리 수의 증가율을 보인다고 예상했다. 결론적으로 많은 기업들이 높은 용량을 최저의 가격에 구현하기 위한 방법을 고안하고 있는 셈이다. 저렴한 비용으로 대용량의 데이터를 저장할 수 있으면서, 직접 접근까지 가능한 2차 스토리지의 등장에 많은 기업들이 촉각을 곤두세우고 있는 이유도 바로 여기에 있다.
현재 기업들이 디스크에 저장하는 데이터의 90%는 가끔, 혹은 거의 사용하지 않는 데이터다. 데이터 생성 후 처음 1~2일 내에는 데이터 접근 발생이 빈번하게 일어나지만, 일주일 후에는 데이터 접근빈도가 현저히 저하되고, 90일이 지나면 사실상 데이터 접근 빈도가 거의 없는 게 사실이다. 그럼에도 불구하고 대부분의 기업들이 이와같은 불필요한 데이터를 고가의 디스크에 저장하고 있는 상황이다.
즉 2차 스토리지는 데이터 생명주기에 따라 탄력적으로 정보생명주기관리(ILM)를 수행할 수 있는 바탕을 제공하는 셈이다.
애플리케이션 특성에 따른 스토리지의 계층 변화
*무작위 접근
무작위 접근을 특성으로 하는 대표적인 애플리케이션 유형은 트랜젝션 시스템, ERP 시스템, MRP 시스템, 인터넷 전자 상거래, 고객 서비스 및 지원, 멀티유저 데이터베이스 애플리케이션 등이 있다.
*순차적인 접근
순차적인 접근이 필요한 애플리케이션은 영화, 음악, 비디오, 그래픽 이미지 등이다. 이러한 유형의 애플이케이션에서는 전체의 데이터가 읽혀지지만 대다수의 데이터는 프로세스에 위해 변경되지 않으므로 캐시에 데이터를 보유할 필요가 거의 없다.
한번 생성된 후 거의 수저오디지 않고 사용되는 특성을 가진 순차적인 데이터-동영상(영화, 비디오), 이밎, 그래픽 처리 등의 경우 대부분 디스크 어레이에 보관되고 있는 실정이다. 데이터 특성상 직접 접근을 필요로 하는 만큼 테잎 라이브러리에 저장하는 경우는 극히 드물다. 하지만 이러한 데이터의 경우 대용량 캐시가 필요하지 앟기 때문에 고가의 디스크에 저장하는 방법도 효율적이라고 볼 수 없다.
2차 스토리지는 저렴한 비용으로 직접 접근이 가능하기 때문에 순차적인 데이터 저장에 가장 적합한 시스템이다. 최신 테잎 드라이브보다 2~3배 이상 빠른 백업 및 복구가 가능하다. 베용 대비 효육적인 데이터 복제 기능을 제공함으로써 ㅗ가도한 비용이 소요되던 기존 시스템에 새로운 대안을 제시한다. 또한 백업 및 복구와 재해복구시스템에서도 많은 이점을 제공한다.
스토리지 접속 방법
스토리지 접속 방법으로는 전통적인 스토리지 접속 방법인
DAS(Direct Attahced Stroage)와 LAN을 통해 스토리지를 접속하는
NAS(Network Attached Storage) 그리고 중앙집중형의
SAN(Storage Area Network)등이 있다.
*DAS
DAS는 서버와 외장형 스토리지 사이를 전용의 케이블로 직접 접속하는 전통적인 접속방법이다. 현재도 가장 많이 사용되고 있는 방법이다.
만약 서버가 유닉스 혹은 NT 서버와 같은 오픈시스템이면 SCSI또는 파이버 채널 방식으로 접속한다. 메인 프레임을 외장형 스토리지에 접속하고자 한다면 ESCON 또는 패러럴 버스 방식을 사용하여 접속하면 된다.
DAS 방식에서는 스토리지에 따라 지원되는 접속 방식과 접속 포트의 개수가 다르며 접속 지원되는 서버 종류도 다르다. 스토리지에 따라 다양한 오픈 시스템과 메인 프레임을 동시에 접속 지원하는 스토리지가 있는 반명 한 가지 종류의 서버밖에 접속하지 못하는 스토리지도 있다.
그리고 SCSI, 파이버 채널, ESCON 등 다양한 접속 방법을 지원하는 스토리지도 있는 반명 SCSI 또는 파이버 채널 한 가지만을 지원하는 스토리지도 있다. 또한 접속 포트수가 많아서 여러대의 서버를 동시에 접속할 수 있는 스토리지가 있는 반명 접속 포트수가 접속 서버의 1~2개 정도로 제한되는 스토리지도 있다.
이처럼 스토리지의 종류는 다양하고 기술도 천차만별이므로 도입하려는 환경과 향후 계획에 따라 적합한 스토리지를 충분히 비교 검토하여야 한다. 외장형 스토리지는 접속된 서버에 스토리지내의 모든 저장 영역을 사용할 수 있게 한다. 그러나 이 경우 서버가 다른 서버에 할당된 영역에 침범하여 보안 문제가 발생 할 수 있다.
이를 방지하기 위해 DAS 방식에서는 스토리지의 설정시 접속된 서버들이 스토리지에 각자 자신들에게 할당된 영역을 가지며 다른 서버에 할당된 영역을 쓰지 못하도록 스토리지를 설정한다. 물론 여러 대의 서버가 같은 스토리지 영역을 공유하도록 할 수는 있다.
그러나 여러 대의 서버가 동일 파일 시스템을 문제없이 공유하도록 보장해주는 록킹(locking), 및 컨시스턴시(Consistency) 기술이 없는 현재의 상태로는 같은 스토리지 영역을 여러 대의 서버가 공유하도록 하는 것은 아무 이득이 없다. 뿐만 아니라 보아느이 문제가 발생할 소지가 있기 때문에 현재로는 쓰이지 않는 방법이다.
DAS 방식의 장점은 전용의 라인을 사용하기 때문에 주어진 성능이 보장되며 안정성도 뛰어나다. 단점은 파일 시스템을 공유하도록 하는 기술이 없기때문에 파일 공유가 안된다는 단점이 있다. 구성의 확장성 및 유연성도 상대적으로 떨어지고 대량의 서버 구축시 관리 비용이 증가한다는 단점이 있다.
*NAS
NAS 방식은 서버가 LAN을 통하여 전용 파일 서버의 스토리지에 접속한다는 개념이다. 즉 서버와 파일 서버사이는 TCP/IP를 기반으로 한 LAN으로 접속이 된다. 파일 서버와 스토리지 사이는 SCSI 프로토콜을 기반으로 한 SCSI 또는 파이버 채널로 이용한다.
업체에 따라 전용 파일 서버와 스토리지가 한 캐비닛에 구성된 경우도 있으며, 전용 파일 서버와 스토리지가 별도의 장치로 구성되는 경우도 있다. 일반적으로 중소 규모의 캐비닛으로 구서오디는 경우가 많으며, 대용량의 NAS 장비는 전용 파일 서버와 스토리지가 별도로 구성된다. 한 캐비닛의 NAS는 설치가 용이하고 간편한 장점이 있는 반면 스토리지 용량의 확장이 제한되고 스토리지 사용 용도가 NAS로 한정되는 단점이 있다.
한편, 전용파일 서버와 스토리지가 별도로 구성되는 경우 설치가 복잡해지는 대신 스토리지 용량의 확장성이 좋으며 스토리지가 DAS, NAS,SAN 등의 용도로 동시에 자유자재로 사용할 수 있는 장점이 있다.
NAS 방식에서 사용하는 프로토콜은 서버의 NFS와 CIFS를 사용하여 파일을 공유한다. 즉 파일서버는 NFS(Network File System: 유닉스의 파일 공유 프로토콜) 서버 프로세서가 탑재된 유닉스 머신 또는 CIFS(Common Internet File System: 윈도우의 파일 공유 프로토콜) 서버 프로토콜이 탑재된 윈도 NT 또는 윈도 2000 서버와 같은 역할을 한다.
다만 범용 서버와 전용 파일 서버의 차이점은 유닉스나 윈도 NT와 같은 범용 운영체제를 사용하지 않고 NFS, CIFS와 같은 파일 서비스에 특화된 전용 운영체제를 사용하여 파일 서비스의 성능이 뛰어나다는 점과 일 서버로서의 가용성을 확보하고 있다는 점이다.
또한 NFS 프로토콜과 CIFS 프로토콜이 커널의 동등한 계층에 위치하여 같은 파일 시스템을 사용하여 유닉스 머신과 윈도 NT 머신 사이에 파일공유를 할 수 있다는 점이다.
NAS의 장점은 파일 공유이다. NAS의 파일 서버가 NFS와 CIFS 프로토콜을 통해 여러 애플리케이션 서버들 사이에 파일을 공유할 수 있게 해주는 것이다.
NAS는 현재 존재하는 파일 공유 솔루션 중 가장 안정적인 솔루션이다. NAS의 파일 서버가 파일 시스템을 한 곳에서 관리하여 DAS 에서 여러 서버들이 파일을 공유하려 했을 때 나타났던 록킹과 컨시스턴스 문제는 생기지 않는다.
NAS의 단점은 NAS가 파일 서비스에 특화되어 있기 때문에 데이터베이스를 사용하는 온라인 트랜젝션 환경에서는 DAS만큼 성능이 나지 않는다는 점이다. 또한 LAN 과 채널로 접속 단계가 많아서 장애가 일어날 수 있는 포인트가 많아진다. LAN이 불안정할 경우 많은 문제점이 나타날 수 있다. 그리고 사용빈도가 높아질수록 하용자의 네트워크에도 문제를 야기할 수 있다.
그러나 현재 LAN은 기술이 상당히 성숙되어 있고 기가비트 이더넷의 성능도 많이 향상되어 있다. 최근 최신 기술로 LAN을 구성한 곳이라면 LAN이 문제가 되어 NAS를 쓰지 못하는 곳은 없으리라 생각된다.
NAS의 장단점을 종합해 보았을 때 NAS는 웹 호스팅 및 CAD/CAM 과 같은 파일 공유가 필요한 파일서비스에 가장 적합한 솔루션이라고 생각된다.
* SAN
SAN 방식은 서버와 스토리지 사이에 파이버 채널 스위치를 넣은 구성으로 스토리지에 대한 고속 액세스와 일원적인 관리, 그리고 확장성과 내장애성을 높이는 것이 목적이다.
SNIA(Storage Networking Industry Association)의 용어 정의에 따르면
"대용량의 데이터를 연결된 서버에 관계없이 원거리에 분산된 저장 장치 사이에 주고받을 수 있도록 해주는 초고속 통신망" 이라고 한다.
SAN 환경에서 저장장치는 호스트 서버와의 주종 관계에서 벗어나 여러 개의 서버와 공유되며 호스트 서버에 의존하지 않고 저장 장치간(Any-to-any)에 운영이 가능하도록 연결되어 디스크나 테이프 장비의 공동사용, 복제 기능과 고가용성을 위한 클러스터링을 가능하게 한다.
SAN 방식의 장점은 DAS에서 스토리지당 접속 서비스의 증가, 서버당 접속 스토리지 수의 증가, 관리 비용의 절감 등을 목적으로 채널 접속에 네트워크의 개념을 도입한 것이다.
사용자 네트워크와는 별도의 네트워크를 이용하여 데이터 서비스를 제공하므로 사용자 네트워크 부하를 줄여준다. 구성의 유연성, 확작성, 가용서이 뛰어나며, 스토리지 장비를 한곳에 모아둘 수 있고, 모든 서버들을 백업하기 위해 공동의 자동화된 테잎 라이브러리를 사용할 수 있다.
또한 관리 자원을 통합할 수 있어 스토리지 통합에 따른 관리비용절감 효과가 크다. SAN은 현재 세간의 관심사로 향후 스토리지의 구축방향이 통합 관리되어지는 형태로 구성될 것으로 보인다.
SAN 방식의 단점은 별도의 백엔드 네트워크 구축을 위한 비용이 증가하여 고가라는 점과 구성이 복잡하다는 것이다.
SCSI에 견줄 만큼 막강해진 'ATA'
현재 2차 스토리지라고 불리는 모든 제품들은 공통적으로 ATA(Advanced Technology Attachment) 드라이브를 탑재하고 있다. ATA 는 흔히 IDE(Integrated Drive Electronics)라 부르던 것을 ANSI(American National Standards Institute)의 X2T10 그룹이 공식으로 명명한 명칭이다.
컴퓨터 마더보드의 데이터 경로, 즉 버스(Bus)와 디스크스토리지간의 전기적인 표준 인터페이스를 말한다. 오늘날 대부분의 컴퓨터는 개선된 버전인 EIDE(Enhanced IDE)를 사용하고 있고, 마더보드 내에 IDE/EIDE 컨트롤러를 장착하고 있는 경우가 많다.
이 기술을 지금까지 PC에 주로 적용돼 온 탓에 스토리지 장비용으로는 신뢰할 수 없는 인터페이스라는 게 일반적인 평가여쓰나 ATA 드라이브의 품질이 크게 개선되면서 상황이 달라지고 있다.
ATA는 여전히 SCSI나 파이버 채널보다 느리긴 하지만, 그 차이는 지난 몇해 동안 크게 좁혀졌다. 최근 드디어 상용화 단계에 접어든 시리얼 ATA(SATA)는 기존 병렬 ATA(PATA) 방식(130Mbps)과 달리 150Mbps의 속도를 지원하고 있다. 2세대에 이르면 300Mbps, 3세대 방식은 600Mbps까지 속도를 높일 수 있을 것으로 예상된다.
SCSI와 파이버 채널 드라이브에게는 힘겨운 경쟁상대가 등장한 것이다.
이와 같이 저가형 대용량 ATA 드라이브는 오늘날의 D2D(Disk to Disk) 닝라인 백업 장비 개발과 NAS 업체들에게 폭발적인 호응을 얻고 있다. 특히 D2D 업체들은 SAN 이나 SCSI에 파이버 채널이 직접 연결되도록 어레이에 인터페이스를 포함시키고 있다. ATA 는 데이터센터에서도 사용할 수 있는 방법을 제시하고 있다.
시장조사 전문업체인 가트너의 존 몬로 사장은 "시리언 ATA는 비교적 저렴한 비용으로 사용할 수 있는 인터페이스로, 기업용 스토리지 애플리케이션에서 매우 중요한 역할을 할 것으로 기대된다. 최근 대기업들은 스토리지 시스템에서 다양한 멀티플 인터페이스를 신중히 받아들이기 시작했다. 이에 따라 서버 및 스토리지 시장 환경에서 2007년까지 모든 하드디스크드라이브의 30% 이상이 기업용 시리얼 ATA 인터페이스를 사용할 전망이다" 라고 말했다.
ATA 기수르이 눈부신 발전과 고객들의 요구가 맞물리면서 2차 스토리지 시장은 본격적인 개화를 맞이하고 있다. 그 가운데 현재 가장 먼저 반응을 보이고 있는 고객층은 순차적인 접근을 특성으로 하는 애플리케이션 데이터, 즉 고정 콘텐츠를 저장하기 위해 그 동안 값지싼 온라인 디스크를 사용하던 기업들이다.
지금까지 주요 스토리지 제조업체들은 물론 기업들조차 멀티유저 데이터베이스 애플리케이션에서 생성되는 가변 데이터에 더 많은 관심을 뒀던 것이 사실이다. 하지만 디지털 콘텐츠의 75%가 고정 콘텐츠라는 조사 결과를 감안한다면, 이제 고정 콘텐츠 관리에 더 많은 노력을 기울여야 한다는 계산이 나온다. 최근 고정 콘텐츠 관리를 위한 확장성, 관리의 편의성, 데이터 보호 및 보안성을 보장하는 저렴한 솔루션이등장하여 고객들이 관심을 보이기 시작했다.
고정 콘텐츠 만을 저장하기 위한 용도가 아니라 온라인 디스크와 마찬가지로 직접 접근이 필요한 모든 데이터를 저장하는 1차 스토리지 용도로 2차 스토리지를 구매하는 기업들도 늘고 있다. 주로 중소기업들이 여기에 속하는데, 이들은 ATA 디스크의 에러율이 SCSI의 80%까지 쫒아온 마당에 굳이 10배 이상 가격 차이가 나는 디스크 어레이를 고집할 이유가 없다고 주자한다. 이들의 주장에 일부 금융권까지 동조하고 나서면서, 2차 스토리지가 급성장을 예고하고 있다.
SMB 시장에서도 적지 않은 인터넷 업체들이 1차 스토리지 용도로 ATA 디스크를 채택했으며, 일부 시중은행도 ATA디스크를 1차 스토리지 용도로 사용중이다.