인문정보학 온톨로지 설계 가이드라인

DH 교육용 위키
이동: 둘러보기, 검색

김현
한국학중앙연구원 인문정보학 교수

온톨로지란? What is Ontology

  • ‘온톨로지’란 정보화의 대상이 되는 세계를 전자적으로 표현할 수 있도록 구성한 데이터 기술 체계이다. 원래 온톨로지라는 말은 철학에서 ‘존재론’이라고 번역되는 용어로서 ‘존재에 대한 이해를 추구하는 학문’의 의미를 갖는 말이었다. 그러한 용어가 정보과학 분야에서 중요한 개념으로 등장하게 된 것은 인간이 세계를 이해하는 틀과 컴퓨터가 정보화 대상(콘텐츠)을 이해하는 틀 사이에 유사성이 있다고 보았기 때문이다. 그 틀은 바로 대상을 구성하는 요소들에 대응하는 개념들과 그 개념들 간의 연관 관계이다.[1] 넓은 의미에서는 모든 정보화의 틀이 다 온톨로지일 수 있겠지만, 대상 자원을 ‘클래스’(class)로 범주화하고, 각각의 클래스에 속하는 개체(individuals)들이 공통의 ‘속성’(attribute)을 갖도록 하고, 그 개체들이 다른 개체들과 맺는 ‘관계’(relation)를 명시적으로 기술하는 것이 가장 일반적인 온톨로지 설계 방법이라고 할 수 있다. (김현, 『디지털 인문학 입문』(HUEBOOKS, 2016) p. 164)
  • 정보기술 분야에서 말하는 ‘온톨로지(ontology)’에 대한 가장 일반적인 정의는 그루버(Gruber, Thomas. 1959~ )가 말한 ‘명시적 명세화의 방법에 의한 개념화’(explicit specification of a conceptualization)이다.[2] 여기서 ‘개념화’(conceptualization)라는 것은 정보화하고자 하는 대상 세계를 일정한 체계 속에서 파악하는 것, 예를 들면 그 세계에 무엇이 있고, 그것은 어떤 속성을 품고 있으며, 그것들 사이의 관계는 무엇인가 하는 일정한 질문의 틀 속에서 대상 세계를 이해하는 방식이라고 할 수 있다. ‘명세화’(specification)란 대상 세계에 존재하는 개체, 속성, 관계 등을 일목요연한 목록으로 정리하는 것, 그리고 ‘명시적’(explicit)이라는 것은 그 정리된 목록을 사람뿐 아니라 ‘컴퓨터가 읽을 수 있도록’(machine readable) 한다는 것이다. (같은 책 p. 164)

온톨로지 설계 용어 Terms for Ontology Design

온톨로지 구성 요소

(권장 용어)

용도[3] Web Ontology Language

(OWL)

Class, 클래스 공동의 속성을 가진 개체들을 묶는 범주

a group of individuals that belong together because they share some properties.

owl:Class
Individual, 개체 클래스에 속하는 개체

Instances of classes

owl:NamedIndividual
Relation, 관계 (같거나 다른 클래스에 속하는) 개체들 사이의 관계

relationships between pairs of individuals

owl:ObjectProperty
Attribute, 속성 개체가 속성으로 갖는 데이터 값

relationships from individuals to data values

owl:DatatypeProperty
Relation Attribute, 관계 속성 관계 정보에 부수되는 속성

attributes related to relations

N/A in OWL

Can be used when you implement Graph Database with Cypher Query Language.

Domain, 정의역 특정 ObjectProperty 또는 DatatypeProperty의 주어가 될 수 있는 클래스를 한정

A domain of a property which limits the individuals to which the property can be applied

rdfs:domain
Range, 치역 특정 ObjectProperty의 목적어가 될 수 있는 클래스를 한정

The range of a property limits the individuals that the property may have as its value

rdfs:range

IRIs for Named Individuals

분류 한국학 용어 Classified Korean Studies Terms

인물: 인물/기관

공간: 지명/장소/시설명

사건: 사건/행사

시간: 시대/시간범위/시점

문헌: 고도서/고문서/고기록

문화유산: 지정문화재/등록문화재/비지정문화재

개념: 개념/용어

참고문헌: 현대 문헌

인명: 현대 인물

미분류 한국학 용어 Korean Studies Terms Candidates

클래스, 관계, 속성 이름 IRIs for Class, Relation, Property Names

※ 데이터 모델 설계 과정에서 새로운 이름을 부여하였을 때 사용

Prefix for the Specified Data Model

Data Model Name Prefix Namespace Contributor
한국학 데이터 일반 ksdm: xmlns:ksdm="http://digerati.aks.ac.kr/terms/ksdm#" 한국학중앙연구원 인문정보학교실
한글 문화 유산 hhdm: xmlns:hhdm="http://digerati.aks.ac.kr/terms/hhdm#" 김현, 국립한글박물관
한국 기독교 선교 문화 유산 chdm: xmlns:chdm="http://digerati.aks.ac.kr/terms/chdm#" 김현, 백종구, 김바로
서원 문화 유산 cadm: xmlns:cadm="http://digerati.aks.ac.kr/terms/cadm#" 김현, 김바로
불교 문화 유산 bhdm: xmlns:bhdm="http://digerati.aks.ac.kr/terms/bhdm#" 서소리
도자유물 가상 박물관 phdm: xmlns:phdm="http://digerati.aks.ac.kr/terms/phdm#" 호정
한국 전통 복식 tcdm: xmlns:tcdm="http://digerati.aks.ac.kr/terms/tcdm#" 김아람, 차서연, 편나영, 김현승, 김미정
화기 문화 유산 fadm: xmlns:fadm="http://digerati.aks.ac.kr/terms/fadm#" 조연수
문중 고문서 아카이브 hddm: xmlns:hddm="http://digerati.aks.ac.kr/terms/hddm#" 김현, 김하영, 류인태
문화유적 안내 정보 hsdm: xmlns:hsdm="http://digerati.aks.ac.kr/terms/hsdm#" 김사현
한국 바로 알리기 지식 정보
Understanding Korea Project
ukdm: xmlns:ukdm="http://digerati.aks.ac.kr/terms/ukdm#" 김현, 한국학중앙연구원 한국바로알리기사업실

  1. 김현, 「한국 고전적 전산화의 발전 방향 - 고전 문집 지식 정보 시스템 개발 전략 -」, 『민족문화』 28, 민족문화추진회, 2005
  2. Gruber, ‘A Translation Approach to Portable Ontology Specifications’, Knowledge Systems Laboratory Technical Report KSL 92-71, Stanford University, 1992
  3. OWL Web Ontology Language Overview, W3C Recommendation