인덱스 형태가 2가지인데 lsm 트리와 b 트리 형태가 있다.
lsm 트리 읽을 때 블룸 필터 쓴다
규모가 큰 데이터의 이벤트를 처리할 때 강하다고 한다. 큰 스토리지가 필요.
성능을 잡고 정확성이 완벽하지는 않은 Bit Vector로 구성된 필터다. 닉네임이 기존에 존재하는 지를 확률적으로 판단하는데, 또는 url 차단기에 들어가는데 100% 정확한 건 아니다.
성능적 이점이 매우 커서 많이 쓰인다고 알고 있음.
예) jinvicky라는 닉네임은 없어! (아마도…..? 없을거야~)
https://llimllib.github.io/bloomfilter-tutorial/
스프링에서 H2로 인메모리 DB로 테스트해봤을 때만 들어봤다. 애플리케이션이 올라갔을 때 올라가는 DB고 재시작하면 리셋되어 다시 시작되는 DB