20180208 회의록

khw
Haewonk (토론 | 기여) 사용자의 2018년 2월 8일 (목) 12:04 판 (온톨로지 및 데이터 정제)

이동: 둘러보기, 검색
← Previous 회의록
20180206 회의록 20180208 회의록


온톨로지 및 데이터 정제

온톨로지

  1. Class는 상위 7개만 유지. (Heritage, Actor, Place, Event, Object, Concept, Text)
  2. 기존의 클래스는 ekc:hasType을 통해서 데이터타입처리
    • 예) 현재=각성 hasClass 승려
      ==> 변경 = 각성 hasClass 인물 / 각성 hasType 승려
  3. 프로퍼티는 서브프로퍼티 허용
    • dcterms:creator 하위에 3가지 - ekc:writer / ekc:calligrapher /ekc:inscriber
  4. 기본 prefix에 ekci http://dh.aks.ac.kr/iri/ekc 추가
  5. 네임스페이스 목록
Prefix Value
ekc http://dh.aks.ac.kr/ontologies/ekc
ekci http://dh.aks.ac.kr/iri/ekci
foaf http://xmlns.com/foaf/0.1
dc http://purl.org/dc/elements/1.1
dcterms http://purl.org/dc/terms
edm http://www.europeana.eu/schemas/edm
owl http://www.w3.org/2002/07/owl
geo http://www.w3.org/2003/01/geo/wgs84_pos

RDF

ID의 class 정의

select distinct '<http://dh.aks.ac.kr/iri/ekc#'+a.node_id+'>'+' '+
            '<http://www.w3.org/1999/02/22-rdf-syntax-ns#type>'+' '+
            '<http://dh.aks.ac.kr/iri/ekc#'+b.class+'>'+' .'
from u_nodelist as a, nodelist as b
where a.node_id=b.node_id

ID의 type 정의

select distinct '<http://dh.aks.ac.kr/iri/ekc#'+a.node_id+'>'+' '+
            '<http://dh.aks.ac.kr/ontologies/ekc#hasType>'+' '+
            '"'+b.type+'"@ko .'
from u_nodelist as a, nodelist as b
where a.node_id=b.node_id

ID의 label 정의

select distinct '<http://dh.aks.ac.kr/iri/ekc#'+a.node_id+'>'+' '+
            '<http://www.w3.org/2000/01/rdf-schema#label>'+' '+
            '"'+b.node_label+'"@ko .'
from u_nodelist as a, nodelist as b
where a.node_id=b.node_id

ID와 ID 관계 정의

select '<http://dh.aks.ac.kr/iri/ekc#'+source+'>'+' '+
      '<'+b.fullname+'#'+ b.relationname+ '> '+
      '<http://dh.aks.ac.kr/iri/ekc#'+target+'>'+' .'
from u_linklist as a, name_space_full as b
where a.relation = b.relation

추가 논의 사항

  1. gephi 분석 중 발견된 degree=0 노드들
    • 실제로는 링크 데이터 있음. LST 파일 대상으로 수작업으로 추가할 필요 있음.
  2. 한국문화정보원 데이터
    • 데이터 내용 검토해보고 우리 데이터 형태로 전환할 방안에 대해 논의해봅시다.