본문 바로가기

Dev.../alfresco

Alfresco의 Lucene 검색엔진으로 등록된 MS-word문서와 Powerpoint문서의 한글 형태소 검색도 가능

오늘 저녁에도 Alfresco의 내부구성을 살펴보고 있는데... 데이터형태소의 분석부분에 한글영역이 존재하는 것을 확인하고서는.. 기존의 버전에서 Lucene의 강력한 기능이 있지만, 한글 검색이 안된다는 이야기가 있었는데...

이런 설정자료가 있다니!!!

그래서, 이번 NIPA에서 운영한 소프트웨어아키텍트 포럼의 자료를 정리하려고 샘플자료를 만들고 있는 Site의 정보를 검색해보았다.

현재 등록되어진 MS-word와 Powerpoint의 내부에 현재 꿈꾸는자가 소속되어진 '헬스허브'라는 단어를 검색해보니...

짜잔...

MS-word와 파워포인트 문서내부의 문장중에서 '헬스허브'라는 단어를 모두 검색하여 찾아준다.. ~.~

오호~~~ Lucene의 강력한 기능을 Alfresco에서 느껴보시기를...

DICOM화일의 내용들도 CommandMap을 지정하기만 하면, 필요한 자료들을 대부분 찾아준다니...

이거.. 내부를 들여다 보면 볼수록, 물건이로세~~~

~.~

새롭게 알게된것은 Lucene기반으로 개발되어진 Solr를 사용하여 구성되었다는 점...