시맨틱 데이터베이스
DH 교육용 위키
김현
한국학중앙연구원 인문정보학 교수
시맨틱 데이터베이스란?
시맨틱 데이터베이스(Semantic Database)란‘시맨틱 웹(Semantic Web)[1] 개념의 데이터베이스’ 또는 ‘시맨틱 웹의 구성 요소가 될 수 있는 데이터베이스’이다. 단순히 데이터를 저장하고 저장된 텍스트에 대한 문자열 검색 서비스를 제공하는 종래의 문헌정보 데이터베이스의 수준을 넘어서서, 텍스트 속의 문맥 요소를 식별하고, 이 요소와 유관하다고 정의된 정보를 함께 찾아서 그것들 사이의 연관 관계를 보여주는 기능의 발전된 데이터베이스를 ‘시맨틱 데이터베이스’라고 한다.
시맨틱 데이터베이스 구현 방법
이러한 시맨틱 데이터베이스는 데이터 속에 포함되어 있는 의미 요소(Semantic Elements) [2]를 추출하고, 그 요소들 사이의 의미론적 연관관계를 기계가독형 텍스트의 표준 문법이라고 할 수 있는 RDF(Resource Description Framework) 문으로 기술하는 방법으로 구현할 수 있다.
- ↑ 시맨틱 웹이란 컴퓨터가 인식할 수 있도록 명확한 의미를 부가한 데이터의 웹이다. 컴퓨터가 인식할 수 있는 데이터 기술 규칙을 만드는 것은 정보기술의 영역에서 추구할 과제이지만, 그 규칙을 응용하고 확장하여 미래의 사이버 공간에서 인문지식이 소통될 수 있도록 만드는 것은 디지털 인문학자들의 과제이다. (김현 외, 『디지털 인문학 입문』 , HUBOOKs, 2016. p. 147.)
- ↑ 의미 요소(Semantic Elements) 또는 문맥 요소Contextual Elements): 텍스트의 문맥을 구성하는 키워드. ‘인명’, ‘지명’, ‘역사적·사상적 개념어’, ‘문헌 전거’ 등의 정보 요소를 말한다.