관리 메뉴

세상 모든 잡동사니 집합소 스레TV

[HANA] Preprocessor server 본문

기술/HANA DB

[HANA] Preprocessor server

스레TV 2025. 6. 17. 14:52
728x90
반응형

SAP HANA에서 Preprocessor Server는 주로 텍스트 분석과 관련된 작업을 처리하는 백엔드 서비스입니다. 자연어 처리(NLP), 텍스트 마이닝, 언어 감지 등과 같은 고급 텍스트 기능이 필요할 때 사용되며, 특히 Full-Text Search, Fuzzy Search, Smart Data Integration(SDI) 등에서 중요한 역할을 합니다.


📌 핵심 요약

항목내용

 

서비스 이름 Preprocessor Server (preprocessor)
목적 SAP HANA에서 텍스트 처리, 분석, 인덱싱 지원
주요 기능 텍스트 분석, 언어 감지, 형태소 분석, SDI 변환
위치 SYSTEMDB와 Tenant DB 모두에서 동작 가능
프로세스 이름 hdbpreprocessor
활성화 여부 기본 비활성화 (필요 시 활성화)
 

🔧 주요 기능

1. Full-Text Search 지원

  • SAP HANA의 FULLTEXT INDEX 기능을 사용하면 텍스트 내용을 기반으로 고속 검색이 가능함
  • Preprocessor는 텍스트를 인덱싱할 때 언어 감지 및 형태소 분석을 수행함

2. Fuzzy Search / Linguistic Search

  • 오타 검색, 유사어 처리 등에서 핵심 역할
  • Preprocessor가 텍스트를 정규화(Normalization)하고 비교

3. SDI (Smart Data Integration)

  • 데이터 변환 작업 (Transformations, Text Extraction)에 필요
  • 특히 파일 어댑터를 통한 비정형 데이터 처리 시 사용됨

4. 텍스트 분석 및 분류

  • 감정 분석(Sentiment Analysis), 키워드 추출 등 고급 NLP 기능에서 사용

🏗️ 시스템 내 위치

  • HANA의 여러 구성 요소 중 하나이며, 보통 XS Engine, Index Server와 함께 배포
  • 시스템 DB와 Tenant DB 양쪽에 존재 가능
  • 필요 시 활성화 (기본 설치 시 자동 활성화되지 않을 수 있음)

🛠️ 활성화 및 상태 확인

서비스 확인:

SELECT * FROM SYS.M_SERVICES WHERE SERVICE_NAME = 'preprocessor';

활성화 (필요 시):

  • sapcontrol 또는 HANA Cockpit에서 Preprocessor 활성화 가능
  • 또는 HDB start 시 구성된 모든 서비스가 함께 올라감

🔒 보안 및 리소스 고려사항

  • 보통 리소스를 많이 사용하지는 않지만, 대용량 텍스트 분석 시 메모리 증가 가능
  • SAP HANA Memory limit과 CPU 리소스 제어 정책에 따라 조정 필요

🧪 관련 예시: Fulltext Index 생성

CREATE FULLTEXT INDEX idx_text ON my_table (description)
LANGUAGE DETECTION ('EN') TEXT ANALYSIS ON;
  • 이 때 Preprocessor가 description 컬럼의 텍스트를 분석, 인덱싱

🧩 유사 서비스와의 차이

서비스역할
Index Server 메인 DB 엔진, SQL 처리
XS Engine HTTP 기반 서비스 (SAPUI5 등)
Preprocessor Server 텍스트 분석 및 인덱싱
Compile Server SQL 스크립트 등 코드 컴파일
Name Server 시스템 정보 및 분산 구조 관리
 

✅ 요약

  • Preprocessor Server는 SAP HANA의 NLP·텍스트 분석 백엔드 엔진
  • Fulltext Index, SDI, Fuzzy Search에 필수
  • 기본적으로는 잘 사용되지 않지만, 고급 검색/분석 기능을 사용 시 반드시 필요
300x250
반응형

'기술 > HANA DB' 카테고리의 다른 글

[DB] Dynamic Tiering  (1) 2025.06.15
[HANA] SAP HANA Data Snapshot  (0) 2025.06.13
[HANA] Secondary Time Travel  (0) 2025.06.11
[HANA] Smart Data Integration  (0) 2025.06.10
[DB] 증분백업 vs 차등 백업  (0) 2025.06.07
[HANA DB] Cloud Foundry  (0) 2025.06.06
[HANA DB] Kernel Profiler  (2) 2025.06.05
Comments