시맨틱 데이터베이스

my9univ
이동: 둘러보기, 검색

김현
한국학중앙연구원 인문정보학 교수

시맨틱 데이터베이스(Semantic Database)란?

개체에 대한 개별적 정보뿐 아니라 그것들 사이의 의미적 연관관계에 대한 정보를 담고 있는 데이터베이스를 ‘시맨틱 데이터베이스’(Semantic Database)라고 한다. 단순히 데이터를 저장하고 저장된 텍스트에 대한 문자열 검색 서비스를 제공하는 종래의 문헌정보 데이터베이스의 수준을 넘어서서, 텍스트 속의 문맥 요소를 식별하고, 이 요소와 유관하다고 정의된 정보를 함께 찾아서 그것들 사이의 연관 관계를 보여주는 기능의 발전된 데이터베이스이다.

시맨틱 데이터베이스(Semantic Database)라는 표현은‘시맨틱 웹(Semantic Web)[1] 개념의 데이터베이스’ 또는 ‘시맨틱 웹의 구성 요소가 될 수 있는 데이터베이스’라는 의미로 이해할 수도 있다. 시맨틱 데이터베이스는 온톨로지 설계에 의해서 구현될 수 있는 것이므로 '온톨로지 기반 데이터베이스'라고도 하며, 또 검색된 결과물이 2차원 테이블 뿐 아니라 네트워크 그래프 형태로 표현될 수 있으므로 '네트워크 데이터베이스'라고 부르기도 한다.

시맨틱 데이터베이스 구현 방법

시맨틱 데이터베이스 구현을 위해서는 온톨로지 설계가 필수적으로 선행되어야 한다. 정의된 온톨로지에 따라 데이터 속에 포함되어 있는 의미 요소(Semantic Elements) [2]를 추출하고, 그 요소들 사이의 의미론적 연관관계를 기계가독형 텍스트의 표준 문법이라고 할 수 있는 RDF(Resource Description Framework) 문으로 기술하는 방법으로 시맨틱 데이터베이스를 구현할 수 있다.



  1. 시맨틱 웹이란 컴퓨터가 인식할 수 있도록 명확한 의미를 부가한 데이터의 웹이다. 컴퓨터가 인식할 수 있는 데이터 기술 규칙을 만드는 것은 정보기술의 영역에서 추구할 과제이지만, 그 규칙을 응용하고 확장하여 미래의 사이버 공간에서 인문지식이 소통될 수 있도록 만드는 것은 디지털 인문학자들의 과제이다. (김현 외, 『디지털 인문학 입문』 , HUBOOKs, 2016. p. 147.)
  2. 의미 요소(Semantic Elements) 또는 문맥 요소Contextual Elements): 텍스트의 문맥을 구성하는 키워드. ‘인명’, ‘지명’, ‘역사적·사상적 개념어’, ‘문헌 전거’ 등의 정보 요소를 말한다.