Spark Intro
Spark Intro Before spark Hadoop Spark는 Hadoop ecosystem의 일부이다. 보통적으로 Hadoop은 연산속도가 Spark에 비해 느리다고 알려져있다. *하지만 이부분에 대해서는 Hadoop과 Spark의 연산기법의 차이와 구조의 차이를 다뤄야 함으로 추후에 설명하도록 하겠습니다. 기본적으로 고용량의 데이터를 저장하고 이를 분석하기 위한 툴로 널리 알려져있다. NoSQL Non (relationship) 혹은 Not only SQL의 약자 불린다 RDBMS와 달리 Schema가 존재하지 않는다 -> 데이터 간의 관계가 불분명하다. Schema가 존재하지 않기 때문에 각 NoSQL 주체마다 다른 저장 방식이 존재. Key/Value store 하나의 Key 값에 모든 d..
Hadoop/Spark
2020. 5. 8. 22:48