인문정보학 온톨로지 설계 가이드라인

DH 교육용 위키
이동: 둘러보기, 검색

김현
한국학중앙연구원 인문정보학 교수

최종 수정: 2023. 2. 24.

온톨로지란? What is Ontology

  • ‘온톨로지’란 정보화의 대상이 되는 세계를 전자적으로 표현할 수 있도록 구성한 데이터 기술 체계이다. 원래 온톨로지라는 말은 철학에서 ‘존재론’이라고 번역되는 용어로서 ‘존재에 대한 이해를 추구하는 학문’의 의미를 갖는 말이었다. 그러한 용어가 정보과학 분야에서 중요한 개념으로 등장하게 된 것은 인간이 세계를 이해하는 틀과 컴퓨터가 정보화 대상(콘텐츠)을 이해하는 틀 사이에 유사성이 있다고 보았기 때문이다. 그 틀은 바로 대상을 구성하는 요소들에 대응하는 개념들과 그 개념들 간의 연관 관계이다.[1] 넓은 의미에서는 모든 정보화의 틀이 다 온톨로지일 수 있겠지만, 대상 자원을 ‘클래스’(class)로 범주화하고, 각각의 클래스에 속하는 개체(individuals)들이 공통의 ‘속성’(attribute)을 갖도록 하고, 그 개체들이 다른 개체들과 맺는 ‘관계’(relation)를 명시적으로 기술하는 것이 가장 일반적인 온톨로지 설계 방법이라고 할 수 있다. (김현, 『디지털 인문학 입문』(HUEBOOKS, 2016) p. 164)
  • 정보기술 분야에서 말하는 ‘온톨로지(ontology)’에 대한 가장 일반적인 정의는 그루버(Gruber, Thomas. 1959~ )가 말한 ‘명시적 명세화의 방법에 의한 개념화’(explicit specification of a conceptualization)이다.[2] 여기서 ‘개념화’(conceptualization)라는 것은 정보화하고자 하는 대상 세계를 일정한 체계 속에서 파악하는 것, 예를 들면 그 세계에 무엇이 있고, 그것은 어떤 속성을 품고 있으며, 그것들 사이의 관계는 무엇인가 하는 일정한 질문의 틀 속에서 대상 세계를 이해하는 방식이라고 할 수 있다. ‘명세화’(specification)란 대상 세계에 존재하는 개체, 속성, 관계 등을 일목요연한 목록으로 정리하는 것, 그리고 ‘명시적’(explicit)이라는 것은 그 정리된 목록을 사람뿐 아니라 ‘컴퓨터가 읽을 수 있도록’(machine readable) 한다는 것이다. (같은 책 p. 164)

온톨로지 설계 용어 Terms for Ontology Design

온톨로지 구성 요소

(권장 용어)

용도[3] Web Ontology Language

(OWL)

Class, 클래스 공동의 속성을 가진 개체들을 묶는 범주

a group of individuals that belong together because they share some properties.

owl:Class
Individual, 개체 클래스에 속하는 개체

Instances of classes

owl:NamedIndividual
Relation, 관계 (같거나 다른 클래스에 속하는) 개체들 사이의 관계

relationships between pairs of individuals

owl:ObjectProperty
Attribute, 속성 개체가 속성으로 갖는 데이터 값

relationships from individuals to data values

owl:DatatypeProperty
Relation Attribute, 관계 속성 관계 정보에 부수되는 속성

attributes related to relations

N/A in OWL

Can be used when you implement Graph Database with Cypher Query Language.

Domain, 정의역 특정 ObjectProperty 또는 DatatypeProperty의 주어가 될 수 있는 클래스를 한정

A domain of a property which limits the individuals to which the property can be applied

rdfs:domain
Range, 치역 특정 ObjectProperty의 목적어가 될 수 있는 클래스를 한정

The range of a property limits the individuals that the property may have as its value

rdfs:range

이름 공간(Namespace)

※ 온톨로지의 모든 구성 요소에는 그것을 유일하게 식별할 수 있는 식별자가 부여된다. 식별자의 형식: '이름 공간 접두어:'+'이름 공간 안에서의 식별자' ※ 이름공간(namespace)이란 하나의 이름이 단 하나의 개체만을 가리키는 범위를 추상적으로 상정한 것이다. 이름 공간에도 이름이 부여되는데 인터넷 상에서 유일성을 보장하기 위해서 URI 형식을 취한다. 이름 공간(namespace)의 URI는 그저 이름일 뿐이며, 그 주소에 해당하는 사이트가 인터넷 상에 꼭 있어야 하는 것은 아니다.

온톨로지 설계 요소(클래스, 관계, 속성 등의 정의) 이름 공간

개체(Individual)의 이름 공간

※ 개체 일반의 이름 공간

※ 특정 큐레이션 프로젝트의 개체를 위한 이름공간 (학생들의 연구 프로젝트에 적용)

※ 분야별 한국학 용어(Classified Korean Studies Terms, 한국학중앙연구원 디지털인문학연구소에서 고유한 식별자를 부여한 한국학 학술용어)의 이름공간.

인물: 인물/기관

공간: 지명/장소/시설명

사건: 사건/행사

시간: 시대/시간범위/시점

문헌: 고도서/고문서/고기록

사물: 물품/도구/동식물

개념: 개념/용어

문화유산: 지정문화재/등록문화재

참고문헌: 현대 문헌

특정 데이터 모델의 이름 공간

Data Model Name Prefix Namespace Contributor
한국학 데이터 일반 ksdm: xmlns:ksdm="http://dh.aks.ac.kr/ontologies/ekc#" 한국학중앙연구원 인문정보학교실
한국 바로 알리기 지식 정보
Understanding Korea Project
ukdm: xmlns:ukdm="http://dh.aks.ac.kr/ontologies/ukdm#" 김현, 한국학중앙연구원 한국바로알리기사업실
한글 문화 유산 hhdm: xmlns:hhdm="http://digerati.aks.ac.kr/terms/hhdm#" 김현, 국립한글박물관
한국 기독교 선교 문화 유산 chdm: xmlns:chdm="http://digerati.aks.ac.kr/terms/chdm#" 김현, 백종구, 김바로
문중 고문서 아카이브 fddm: xmlns:hddm="http://digerati.aks.ac.kr/terms/fddm#" 김현, 김하영, 류인태

  1. 김현, 「한국 고전적 전산화의 발전 방향 - 고전 문집 지식 정보 시스템 개발 전략 -」, 『민족문화』 28, 민족문화추진회, 2005
  2. Gruber, ‘A Translation Approach to Portable Ontology Specifications’, Knowledge Systems Laboratory Technical Report KSL 92-71, Stanford University, 1992
  3. OWL Web Ontology Language Overview, W3C Recommendation