"20180404 회의록"의 두 판 사이의 차이

khw
이동: 둘러보기, 검색
(국립문화재연구소 금석문 신도비/묘지명/묘비/묘갈 데이터)
(국립문화재연구소 신도비 데이터)
72번째 줄: 72번째 줄:
 
**writer : ~의 서자이다
 
**writer : ~의 서자이다
 
**inscriber : ~의 각자이다
 
**inscriber : ~의 각자이다
*역대인물UCI를 이용해 인물 식별 중
+
*역대인물UCI를 이용해 인물 식별 중 : 현재 비 312건과 관련된 링크 식별 진행
 
*식별 과정에서 판단되는 비의 주인공와 찬자, 각자, 서자의 혈연 관계 입력 중(~의 사위이다. ~아들이다. ~딸이다, ~후손이다 등)
 
*식별 과정에서 판단되는 비의 주인공와 찬자, 각자, 서자의 혈연 관계 입력 중(~의 사위이다. ~아들이다. ~딸이다, ~후손이다 등)
 +
===역대인물에 존재하지 않는 인물===

2018년 4월 4일 (수) 13:46 판

← Previous 회의록 Next →
20180328 회의록 20180304 회의록 [[]]


역대서화가 데이터

원자료

  • 국립문화재연구소, 한국역대서화가사전, 2011. 상, 하 2권.

자료 분석

클래스

  • 4개의 클래스. 1. 서화가, 2. 작품, 3. 소장처, 4. 문헌
    • 서화가는 사전에 표제어
    • 작품은 서화가가 만든 작품(회화, 불화, 서첩, 비석(신도비, 묘비 등), 병풍 등)
    • 소장처는 국/내외 박물관, 미술관 등 문화기관, 사찰, 장소(비석 등)
    • 문헌은 일부 서화가의 경우 현전 작품이 없으나, 특정 문헌에 언급됨. 이 기록을 바탕으로 서화가로 등록되어 있음.

관계

항목A 항목B 관계 비고
서화가 작품 dcterms:creator
작품 소장처 edm:currentLocation
서화가 문헌 ekc:isMentionedIn 서화가가 문헌에 언급된 경우(단 전하는 작품이 없는 경우 필히 작성)
서화가 문헌 dcterms:creator 작품 외에 저술한 문헌(문집 등)

입력시 어려움

  1. 서화가 사전에 입력된 작품의 소장처가 명기되지 않거나, 오류가 많음
    • 실 소장처를 찾기 위한 시간 소요.
  2. 작품 명의 경우 반복 될 소지가 높음
    • 작품명에 대한 유니크 아이디 부여가 필요
    • 현재 역대 서화가 사전의 범위 내에서 id 부여중
      1. ex) 서화가 (ARTIST_0000), 작품(ART_0000) 등


독립운동 및 국가수호 사적지 데이터

현황

  • 1666건의 사적지와 관련 속성 데이터(종류, 상태, 주소, 위경도좌표, url) 확보 + 각각의 사적지와 관련한 인물·사건·조직 등을 nodelist에 추가하여 약 8,225건의 노드 확보.
  • nodelist에 따라 Place(사적지), Actor(인물), Group(조직), 사건(Event)로 class 분류.
  • 원자료에 기재된 정보에 따라 [사적지 -> 인물, 사적지 -> 사건, 사적지 -> 조직] 세 가지 유형의 relation을 대략적으로 연결하여 linklist에 추가. 약 9,184건의 링크 확보.

앞으로 해야할 일

  • 현재 만든 nodelist와 linklist는 잠정적인 것. 중복값을 제거하고 많은 가외노드를 삭제해야한다.
  • 향후 작업방향: 사적지 데이터로 접근. 1666건의 데이터를 차례로 살펴보면서 관련 노드(인물·사건·조직)가 유효한지 확인, 인물의 경우 동명이인 여부 확인 -> 이를 바탕으로 unique한 nodelist와 linklist 생성.
  • 마지막으로 확보된 nodelist와 매핑할 수 있는 다른 자료('근현대인물자료', '전쟁·전투정보' 등)를 찾아 연결하기.

고민해야할 부분들

  • 사건, 조직, 인물에 관한 데이터 중 실제 유효한 노드로서 nodelist에 포함시킬 수 있는 수준(범위)를 어느정도로 잡을 것인가.
    • 예1) '1927.12.5·7.9 청주공립고등보통학교 동맹휴학'은 '동맹휴학' 노드로 합쳐버릴 수 있지만 일어난 시간과 장소의 특수성을 반영해 새로운 노드로 생성할 수도 있다.
    • 예2) 6.25전쟁 관련 사적지의 경우 '국군 제3사단'처럼 특정 군 단위가 관련한 조직으로 사적지와 연결되어있는데 이러한 개별 단위들을 모두 포함할 것인가. 아니라면 어느정도 수준에서 통합할 것인가/제외할 것인가.
  • 네이밍이 외부 위키나 민백 등에서 기재된 네이밍과 다른 경우 어떻게 쓸 것인가.
    • 예1) 을사의병/중기의병, 정미의병/후기의병, 금호문사건/송학선의거 -> 민백 네이밍을 따라야하는지.
  • 독립운동사와 6.25전쟁사에 등장하는 외국 인물의 경우 노드로 추가할 것인가.
  • relation의 경우 아직 어떤 유형들이 나오게 될지 가늠할 수가 없다.(사적지와 인물, 사건, 조직 등이 관계를 맺고있는 '방식'이 다양하기 때문)

국립문화재연구소 신도비 데이터

현황

  • 국립문화재연구소의 한국금석문 중 신도비/묘비/묘갈/묘지명 1614건 추출
  • 주인공, 찬자, 각자, 서자 관계 추출 4215건
    • isEpitaphOf : ~의 묘지명이다
    • isSteleOf : ~의 비이다
    • calligrapher : ~의 각자이다
    • writer : ~의 서자이다
    • inscriber : ~의 각자이다
  • 역대인물UCI를 이용해 인물 식별 중 : 현재 비 312건과 관련된 링크 식별 진행
  • 식별 과정에서 판단되는 비의 주인공와 찬자, 각자, 서자의 혈연 관계 입력 중(~의 사위이다. ~아들이다. ~딸이다, ~후손이다 등)

역대인물에 존재하지 않는 인물