1. InfluxDB란? - 시계열 데이터를 처리하는 소프트웨어 플랫폼 (TSDB) • 시간과 값을 쌍으로 시계열을 저장하고 서비스하는데 최적화된 소프트웨어 시스템 • 초기 시절엔 데이터 히스토리언 이라고도 함. - 운영 모니터링, 애플리케이션 매트릭스, 사물인터넷 센서 데이터, 실시간 분석 등 분야에서 시계열 데이터의 고속의 고가용성(HA)의 저장 및 검색에 최적화됨 - 모든 Row가 Time이라고불리는고유한시간값을가짐
2. 시계열 데이터의 특성 - 시간이 기록된 모든 데이터 - 규칙적 (Metric) and 불규칙적 (Event)시간 간격에 따라 생성 - 거대한 데이터 량 - 실시간이며 시간이 중요
3. RDB와 Influx 용어 비교
4.measurement 구성 - 태그 키, 태그 값 = 합해서 테그셋
- 필드키, 필드 값 : 필드값은 항상 float형, 문자열 안됨.
5. Rest API 제공
6. Down Sampling - 과거의데이터를일정주기마다처리해새롭게저장하는역할 - ex> 30분단위로a테이블에평균값을b테이블에저장
8. 단점 - Insert, Select 쿼리성능을위하다보니, Delete, Update는고려하지않음 : Timeseries 데이터들은한번 Write 되면수정될일은없다고봐야하기때문에 Update는발생하지않음 : 데이터또한삭제될일이없다보니 Retention Policy가아닌이상데이터를삭제하는일은거의없다고봐도무방 : InfluxDB Docs는 InfluxDB가 CRUD 가아닌 CR-ud 를지원한다고말하고있음 - Timestamp가오름차순으로정렬되어저장되다보니, 랜덤읽기에서는성능이떨어짐 : 애초에데이터를 Write할때오름차순으로 Time을정렬하기때문에랜덤 R/W 에서는성능이떨어짐 : 근데 Time Series에서랜덤 W/R를할일이없을거라봄. - RDBMS와 다르게, 데이터의 일관성(트랜젝션)은 보장하지 않음 : 일관된(consistent) 데이터를 갖는 것은 그다지 중요하지 않음 : 많은 클라이언트들이 연결해 읽기, 쓰기 작업을 하는 것에 초점을 맞추고 있음 : 따라서 많은 부하가 걸릴 때에는 일관된 반환값을 갖지 않을 수 있음.