Post

Nori 분석기 사용(7)

Nori 분석기 사용(7)

이전에는 검색을 할때 기본적인 설정을 이용해서 검색을 했다 따라서 검색을 한다면 딱 정확히 검색해야 원하는 결과를 찾을 수 있었다 검색엔진은 기본적으로 관련이 있는 정보들까지 보여준다 이 기능을 nori를 적용시켜서 해결해본다

 

기존 검색 방법과 nori의 차이

먼저 기본적인 인덱스를 생성한다 + mapping

nori를 분석기로 사용하기 위해서 노리를 설치한다 엘라스틱 서치를 다운 받은 폴더의 경로에서 ` bin/elasticsearch-plugin install analysis-nori` 이후 엘라스틱 서치를 재실행

각각 인덱스를 생성했으니 데이터를 넣어야한다

기본 인덱스에 데이터 넣기

노리를 사용한 인덱스에 데이터 넣기

마지막으로 엘라스틱 서치에서 데이터들을 어떻게 분석하는지 확인해본다

왼쪽 기본 분석기 / 오른쪽 노리 분석기

위 사진에서 보이다시피 기본 인덱스를 사용한다면 기존 text에서 띄어쓰기 단위로 토큰을 분해하기 때문에 검색할 때 정확히 학생들이를 검색해야 한다 하지만 nori 분석기 결과를 본다면 학생들이가 아니라 학생 이렇게 토큰으로 분해했기 때문에 학생이라고 검색해도 결과가 나온다

 

위 결과만 본다면 nori를 사용하는 것이 좋은것 같지만 형태소를 분해하면서 이상해질수 있고 검색이 오히려 안될 수 도 있기 때문에 적절히 조절하는 것이 필요하다 필터를 세분화해서 적용하는 방법을 이용해야한다

This post is licensed under CC BY 4.0 by the author.