Infrastructure/Networking

[논문 리뷰] 전반적으로 Cloud Computing 관련 (abstract만)

EddyLee 2024. 3. 22. 23:03

<클라우드 컴퓨팅 관련 선행 연구에서 찾아야 하는 것>

1) Cloud Computing 개념

2) 한계점 (특히 IoT 환경에서)

 

#1. The Characteristics of Cloud Computing [2010]

Abstract

클라우드 컴퓨팅은 정보 기술 분야에서 가장 뜨거운 화두 중 하나로 떠오르고 있습니다. 

클라우드 컴퓨팅은 HPC, 가상화, 유틸리티 컴퓨팅 및 그리드 컴퓨팅과 같은 여러 다른 컴퓨팅 연구 분야를 기반으로 합니다. 

클라우드 컴퓨팅의 본질을 명확히 하기 위해 클라우드 컴퓨팅을 클라우드 컴퓨팅으로 만드는 이 영역의 특징을 제시하고 다른 연구 분야와 구별합니다. 

클라우드 컴퓨팅은 고유의 개념적, 기술적, 경제적, 사용자 경험적 특성을 가지고 있습니다. 

서비스 지향, 느슨한 결합, 강력한 내결함성, 비즈니스 모델 및 사용 편의성은 클라우드 컴퓨팅의 주요 특징입니다. 

클라우드 컴퓨팅에 대한 명확한 인사이트는 학계와 업계 모두에서 이 진화하는 기술을 개발하고 채택하는 데 도움이 될 것입니다. 

 

Conclusion and Future work

클라우드 컴퓨팅처럼 복잡한 기술 영역을 이해하는 것은 쉽지 않으며, 그 근본적인 특성을 파악해야 합니다. 

클라우드 컴퓨팅에 대한 명확한 개념과 용어는 클라우드 컴퓨팅 시스템을 설계, 개발 및 도입하는 방법에 대한 문제를 완전히 해결해 주지는 못하지만 도움이 됩니다. 

HPC, 가상화, 유틸리티 컴퓨팅 및 그리드 컴퓨팅에 대한 이전 연구를 기반으로 하지만 클라우드 컴퓨팅은 여전히 클라우드 컴퓨팅을 다른 어떤 것도 아닌 클라우드 컴퓨팅으로 만드는 고유한 특성을 가지고 있습니다.

이 백서에서는 클라우드 컴퓨팅의 특성에 대해 설명합니다.

서비스 지향적이라는 개념적 특성은 클라우드 컴퓨팅 구현의 세부 사항을 추상화합니다.

느슨한 결합과 강력한 내결함성은 주요 기술적 특성을 나타냅니다.

비즈니스 모델을 소유하는 것은 다른 학술 연구와 비교하여 핵심적인 차별화이며 클라우드 컴퓨팅이 번성하는 데 도움이 됩니다.

사용하기 쉬운 사용자 경험 특성은 컴퓨터 전문가가 아닌 사람들도 클라우드 컴퓨팅을 널리 받아들이는 데 도움이 됩니다.

이러한 특성은 클라우드 컴퓨팅의 본질을 드러내며, 진화하는 이 기술의 개발과 도입이 우리의 연구를 통해 혜택을 받을 수 있을 것으로 믿습니다.

 

향후 작업의 일환으로 첫째, 각 특성, 특히 내부 기술에 대해 자세히 알아보고자 합니다.

둘째, 우리는 HPC 분야에서 10년 이상의 경험을 가지고 있으며 HPC를 클라우드 컴퓨팅에 통합하고자 합니다.

셋째, 클라우드 서비스 평가는 흥미롭고 가치 있는 연구 주제입니다.

 

=> Too old

 

 

#2. The rise of“big data” on cloud computing: Review and open research issues [2014]

Abstract

클라우드 컴퓨팅은 대규모의 복잡한 컴퓨팅을 수행할 수 있는 강력한 기술입니다. 고가의 컴퓨팅 하드웨어, 전용 공간, 소프트웨어를 유지할 필요가 없습니다. 클라우드 컴퓨팅을 통해 생성되는 데이터 또는 빅 데이터의 규모가 엄청나게 증가하고 있습니다. 빅데이터를 처리하는 것은 성공적인 데이터 처리와 분석을 위해 대규모 컴퓨팅 인프라가 필요한 까다롭고 시간이 많이 소요되는 작업입니다. 이 연구에서는 클라우드 컴퓨팅에서 빅데이터의 부상에 대해 살펴봅니다. 

빅데이터의 정의, 특성, 분류와 함께 클라우드 컴퓨팅에 대한 몇 가지 논의가 소개됩니다. 빅데이터와 클라우드 컴퓨팅, 빅데이터 저장 시스템, 하둡 기술의 관계에 대해서도 논의합니다. 또한 확장성, 가용성, 데이터 무결성, 데이터 변환, 데이터 품질, 데이터 이질성, 개인정보 보호, 법률 및 규제 문제, 거버넌스에 중점을 두고 연구 과제를 조사합니다. 마지막으로 상당한 연구 노력이 필요한 미해결 연구 과제가 요약되어 있습니다.

Conclusion

현재 데이터의 규모는 방대하며 매일 계속 증가하고 있습니다. 생성되는 데이터의 종류도 다양해지고 있습니다. 인터넷에 연결된 모바일 디바이스 및 기타 디바이스 센서의 확산으로 인해 데이터 생성 및 증가 속도가 빨라지고 있습니다. 이러한 데이터는 모든 산업 분야의 비즈니스에 실시간 비즈니스 인사이트를 얻을 수 있는 기회를 제공합니다. 데이터를 저장, 처리, 분석하는 데 클라우드 서비스를 사용하는 것은 이미 오래전부터 가능했으며, 이는 정보 기술의 맥락을 바꾸고 온디맨드 서비스 모델의 약속을 현실로 바꾸어 놓았습니다. 

이 연구에서는 클라우드 컴퓨팅에서 빅데이터의 부상에 대한 리뷰를 발표했습니다. 빅데이터에 대한 분류, 빅데이터의 개념적 관점, 클라우드 서비스 모델을 제안했습니다. 이 모델을 몇 가지 대표적인 빅데이터 클라우드 플랫폼과 비교했습니다. 하둡 기술의 배경과 핵심 구성 요소인 맵리듀스와 HDFS에 대해 설명했습니다. 현재 진행 중인 MapReduce 프로젝트와 관련 소프트웨어를 소개했습니다. 또한 빅데이터 처리의 몇 가지 과제를 검토했습니다. 빅데이터의 양, 확장성, 가용성, 데이터 무결성, 데이터 보호, 데이터 변환, 데이터 품질/이질성, 개인정보 보호 및 법적/규제 문제, 데이터 액세스, 거버넌스 등을 검토했습니다. 또한 클라우드 내 빅데이터의 주요 이슈가 강조되었습니다. 앞으로 학계와 산업계가 해결해야 할 중요한 과제와 이슈들이 있습니다. 연구자, 실무자, 사회과학 학자들이 협력하여 클라우드 컴퓨팅 환경에서 데이터 관리의 장기적인 성공을 보장하고 새로운 영역을 함께 개척해 나가야 합니다.

 

#3. Big Data with Cloud Computing: Discussions and Challenges [2021]

Abstract

최근 컴퓨터 기술이 발전함에 따라 사용 가능한 데이터의 양은 나날이 증가하고 있습니다.

하지만 과도한 데이터 양은 사용자에게 큰 문제를 야기합니다. 한편 클라우드 컴퓨팅 서비스는 대용량의 데이터를 저장할 수 있는 강력한 환경을 제공합니다. 전용 공간과 고가의 컴퓨터 하드웨어 및 소프트웨어 유지보수 등 다양한 요구사항이 필요하지 않습니다.

빅데이터 처리는 시간이 많이 소요되는 작업으로, 성공적인 데이터 저장과 처리를 위해서는 대규모 컴퓨팅 클러스터가 필요합니다. 이 글에서는 빅데이터의 정의, 분류, 특징과 함께 마이크로소프트 애저, 구글 클라우드, 아마존 웹 서비스, 인터내셔널 비즈니스 머신 클라우드, 호튼웍스, 맵알 등 다양한 클라우드 서비스에 대해 설명합니다.

다양한 클라우드 기반 빅데이터 프레임워크에 대한 비교 분석도 수행됩니다. 분산 데이터베이스 저장, 데이터 보안, 이질성, 데이터 시각화 측면에서 다양한 연구 과제를 정의합니다.

 

(Cloud Computing) Research Issues in Big Data (찾았다!)

데이터가 기하급수적으로 증가함에 따라 빅데이터를 처리하고 저장하는 과정에서 여러 가지 문제와 이슈가 발생하고 있습니다. 클라우드 환경에서는 이러한 문제와 이슈를 해결할 수 있는 도구가 거의 없습니다. PigLatin, Dryad, MongoDB, Cassandra, MapR과 같은 기술로는 빅데이터 처리에서 이러한 문제를 해결할 수 없습니다. Hadoop과 MapR의 도움을 받아도 사용자는 데이터베이스에서 쿼리를 실행할 수 없으며, 데이터 처리 및 관리를 위한 낮은 수준의 인프라를 가지고 있습니다. 빅데이터의 몇 가지 이슈와 문제점은 다음과 같이 요약할 수 있습니다[47]:

(1) 분산형 데이터베이스 저장 시스템(Distributed Database Storage System):
방대한 양의 데이터를 저장하고 검색하기 위해 수많은 기술이 사용됩니다. 클라우드 컴퓨팅은 빅데이터의 중요한 측면입니다. 빅 데이터는 매일 여러 디바이스에서 생성됩니다. 현재 분산 프레임워크의 주요 이슈는 간단한 방식으로 데이터를 저장하고 분산 서버 간에 데이터를 처리 및 마이그레이션하는 것입니다. 
(2) 데이터 보안(Data Security): 
보안 위협은 클라우드 컴퓨팅 환경에서 중요한 문제입니다. 클라우드 컴퓨팅은 최신 정보통신 기술로 변화해 왔으며, 빅데이터에는 해결되지 않은 여러 유형의 보안 위협이 존재합니다. 데이터 보안 위협은 빅데이터의 다양성, 속도, 양으로 인해 더욱 확대되고 있습니다. 한편, 클라우드 컴퓨팅 프레임워크와 함께 사용되는 빅데이터에는 데이터의 가용성, 기밀성, 실시간 모니터링, 신원 및 접근 권한 제어, 무결성, 개인정보 보호 등 다양한 문제와 위협이 존재합니다. 따라서 클라우드 서비스 제공업체에 데이터를 아웃소싱하는 경우 데이터 보안을 측정해야 합니다[48].
(3) 이질성 (Heterogeneity): 
빅데이터는 이미지, 비디오, 오디오, 텍스트 등 다양한 형식의 데이터가 여러 장치에서 수집되기 때문에 본질적으로 이질적입니다. 데이터를 웨어하우스에 로드하기 전에 데이터를 변환하고 정리해야 하며, 이러한 프로세스는 빅 데이터에서 어려움을 야기합니다[49]. 모든 비정형 데이터를 결합하고 보고서 작성에 사용하기 위해 조정하는 작업은 실시간으로 수행하기가 매우 어렵습니다.
(4) 데이터 처리 및 정리(Data Processing and Clearing): 
데이터 저장 및 수집에는 데이터 병합, 데이터 필터링, 데이터 일관성 및 데이터 최적화를 포함하는 전처리 및 정리가 필요합니다. 따라서 데이터 소스가 다양하기 때문에 데이터 처리 및 정리가 어렵습니다[50]. 게다가 데이터 소스에는 노이즈와 오류가 포함되어 있거나 불완전할 수 있습니다. 문제는 대량의 데이터를 정리하는 방법과 그러한 데이터가 신뢰할 수 있는 데이터인지 판단하는 방법입니다.
(5) 데이터 시각화(Data Visualization): 
데이터 시각화는 복잡한 데이터를 이해하기 쉽도록 그래픽 형태로 표현하는 기법입니다. 데이터가 구조화된 데이터라면 기존의 그래픽 방식으로 쉽게 표현할 수 있습니다. 데이터가 비정형 또는 반정형 데이터인 경우 다양성이 높아 실시간으로 시각화하기 어렵습니다.

6 Conclusion
지난 수십 년 동안 데이터의 규모는 증가해 왔으며, 그 규모는 나날이 커지고 있습니다. 데이터는 여러 소스에서 다양한 형식으로 생성됩니다. 따라서 데이터의 종류도 다양해지고 있습니다. 연결된 모바일 디바이스와 센서 네트워크는 매우 빠른 속도(속도)로 데이터를 생성합니다. 클라우드 컴퓨팅 서비스는 전용 공간과 고가의 컴퓨터 하드웨어 및 소프트웨어의 유지보수 없이도 데이터를 처리, 분석, 저장하는 데 사용됩니다. 이 연구에서는 빅데이터와 클라우드 컴퓨팅의 관계를 살펴봅니다. 또한 빅데이터와 클라우드 서비스에 대한 비교 분석을 수행합니다. 빅데이터는 분산 데이터베이스 저장, 데이터 프라이버시/보안, 이질성/데이터 형식 등 다양한 이슈와 문제를 수반합니다.

 


(1) Cloud Computer의 개념

(2) Cloud Computer의 한계 in big data era (= IoT era = smart city = ...)

(3) Hadoop (tool로 쓸 수 있을듯? - 이 tool usage method는 북마크에 저장했음)