반응형
Notice
Recent Posts
Recent Comments
세상 모든 잡동사니 집합소 스레TV
[HANA] Preprocessor server 본문
728x90
반응형
SAP HANA에서 Preprocessor Server는 주로 텍스트 분석과 관련된 작업을 처리하는 백엔드 서비스입니다. 자연어 처리(NLP), 텍스트 마이닝, 언어 감지 등과 같은 고급 텍스트 기능이 필요할 때 사용되며, 특히 Full-Text Search, Fuzzy Search, Smart Data Integration(SDI) 등에서 중요한 역할을 합니다.
📌 핵심 요약
항목내용
서비스 이름 | Preprocessor Server (preprocessor) |
목적 | SAP HANA에서 텍스트 처리, 분석, 인덱싱 지원 |
주요 기능 | 텍스트 분석, 언어 감지, 형태소 분석, SDI 변환 |
위치 | SYSTEMDB와 Tenant DB 모두에서 동작 가능 |
프로세스 이름 | hdbpreprocessor |
활성화 여부 | 기본 비활성화 (필요 시 활성화) |
🔧 주요 기능
1. Full-Text Search 지원
- SAP HANA의 FULLTEXT INDEX 기능을 사용하면 텍스트 내용을 기반으로 고속 검색이 가능함
- Preprocessor는 텍스트를 인덱싱할 때 언어 감지 및 형태소 분석을 수행함
2. Fuzzy Search / Linguistic Search
- 오타 검색, 유사어 처리 등에서 핵심 역할
- Preprocessor가 텍스트를 정규화(Normalization)하고 비교
3. SDI (Smart Data Integration)
- 데이터 변환 작업 (Transformations, Text Extraction)에 필요
- 특히 파일 어댑터를 통한 비정형 데이터 처리 시 사용됨
4. 텍스트 분석 및 분류
- 감정 분석(Sentiment Analysis), 키워드 추출 등 고급 NLP 기능에서 사용
🏗️ 시스템 내 위치
- HANA의 여러 구성 요소 중 하나이며, 보통 XS Engine, Index Server와 함께 배포
- 시스템 DB와 Tenant DB 양쪽에 존재 가능
- 필요 시 활성화 (기본 설치 시 자동 활성화되지 않을 수 있음)
🛠️ 활성화 및 상태 확인
서비스 확인:
SELECT * FROM SYS.M_SERVICES WHERE SERVICE_NAME = 'preprocessor';
활성화 (필요 시):
- sapcontrol 또는 HANA Cockpit에서 Preprocessor 활성화 가능
- 또는 HDB start 시 구성된 모든 서비스가 함께 올라감
🔒 보안 및 리소스 고려사항
- 보통 리소스를 많이 사용하지는 않지만, 대용량 텍스트 분석 시 메모리 증가 가능
- SAP HANA Memory limit과 CPU 리소스 제어 정책에 따라 조정 필요
🧪 관련 예시: Fulltext Index 생성
CREATE FULLTEXT INDEX idx_text ON my_table (description)
LANGUAGE DETECTION ('EN') TEXT ANALYSIS ON;
LANGUAGE DETECTION ('EN') TEXT ANALYSIS ON;
- 이 때 Preprocessor가 description 컬럼의 텍스트를 분석, 인덱싱
🧩 유사 서비스와의 차이
서비스역할
Index Server | 메인 DB 엔진, SQL 처리 |
XS Engine | HTTP 기반 서비스 (SAPUI5 등) |
Preprocessor Server | 텍스트 분석 및 인덱싱 |
Compile Server | SQL 스크립트 등 코드 컴파일 |
Name Server | 시스템 정보 및 분산 구조 관리 |
✅ 요약
- Preprocessor Server는 SAP HANA의 NLP·텍스트 분석 백엔드 엔진
- Fulltext Index, SDI, Fuzzy Search에 필수
- 기본적으로는 잘 사용되지 않지만, 고급 검색/분석 기능을 사용 시 반드시 필요
300x250
반응형
'기술 > HANA DB' 카테고리의 다른 글
[DB] Dynamic Tiering (1) | 2025.06.15 |
---|---|
[HANA] SAP HANA Data Snapshot (0) | 2025.06.13 |
[HANA] Secondary Time Travel (0) | 2025.06.11 |
[HANA] Smart Data Integration (0) | 2025.06.10 |
[DB] 증분백업 vs 차등 백업 (0) | 2025.06.07 |
[HANA DB] Cloud Foundry (0) | 2025.06.06 |
[HANA DB] Kernel Profiler (2) | 2025.06.05 |
Comments