"20180404 회의록"의 두 판 사이의 차이

khw
이동: 둘러보기, 검색
잔글 (Haewonk(토론)의 편집을 103의 마지막 판으로 되돌림)
 
(사용자 4명의 중간 판 8개는 보이지 않습니다)
3번째 줄: 3번째 줄:
 
|서명=[[전통문화 융복합 자원 시맨틱 데이터 개발 연구 회의록|회의록]]
 
|서명=[[전통문화 융복합 자원 시맨틱 데이터 개발 연구 회의록|회의록]]
 
|이전=[[20180328 회의록]]
 
|이전=[[20180328 회의록]]
|현재=[[20180304 회의록]]
+
|현재=[[20180404 회의록]]
|다음=[[]]
+
|다음=[[20180411 회의록]]
 
}}
 
}}
 +
==회의내용==
 +
*서화가 리스트부터 만든 뒤에 server에 업로드할 것.(계속해서 리뉴얼)
 +
  
  
81번째 줄: 84번째 줄:
  
 
==서원==
 
==서원==
 +
===현황===
 +
*출처: [http://www.seowonstay.com/ 서원연합회] 데이터 참조
 +
*노드
 +
**서원: 652건
 +
**인물: 약 1660건 +
 +
**서원 속성 정보: 한글명칭, 한자명칭, 문화재지정, 서원시작연도, 서원시작왕대, 주소, 경도, 위도
 +
**인물 속성 정보: 한글명칭, 한자명칭, 생년, 몰년
 +
*링크
 +
**서원-인물 관계: isEnshrinedIn(약 2200건)
 +
**인물-인물 관계: hasDescendant, isLineageKinOf, hasSon, hasBrother, hasDisciple, knows 등 예상됨
 +
**확인할 수 있는 주향/배향 관계는 일단 속성 정보로 입력해 둘 예정

2018년 5월 23일 (수) 04:08 기준 최신판

← Previous 회의록 Next →
20180328 회의록 20180404 회의록 20180411 회의록

회의내용

  • 서화가 리스트부터 만든 뒤에 server에 업로드할 것.(계속해서 리뉴얼)


역대서화가 데이터

원자료

  • 국립문화재연구소, 한국역대서화가사전, 2011. 상, 하 2권.

자료 분석

클래스

  • 4개의 클래스. 1. 서화가, 2. 작품, 3. 소장처, 4. 문헌
    • 서화가는 사전에 표제어
    • 작품은 서화가가 만든 작품(회화, 불화, 서첩, 비석(신도비, 묘비 등), 병풍 등)
    • 소장처는 국/내외 박물관, 미술관 등 문화기관, 사찰, 장소(비석 등)
    • 문헌은 일부 서화가의 경우 현전 작품이 없으나, 특정 문헌에 언급됨. 이 기록을 바탕으로 서화가로 등록되어 있음.

관계

항목A 항목B 관계 비고
서화가 작품 dcterms:creator
작품 소장처 edm:currentLocation
서화가 문헌 ekc:isMentionedIn 서화가가 문헌에 언급된 경우(단 전하는 작품이 없는 경우 필히 작성)
서화가 문헌 dcterms:creator 작품 외에 저술한 문헌(문집 등)

입력시 어려움

  1. 서화가 사전에 입력된 작품의 소장처가 명기되지 않거나, 오류가 많음
    • 실 소장처를 찾기 위한 시간 소요.
  2. 작품 명의 경우 반복 될 소지가 높음
    • 작품명에 대한 유니크 아이디 부여가 필요
    • 현재 역대 서화가 사전의 범위 내에서 id 부여중
      1. ex) 서화가 (ARTIST_0000), 작품(ART_0000) 등


독립운동 및 국가수호 사적지 데이터

현황

  • 1666건의 사적지와 관련 속성 데이터(종류, 상태, 주소, 위경도좌표, url) 확보 + 각각의 사적지와 관련한 인물·사건·조직 등을 nodelist에 추가하여 약 8,225건의 노드 확보.
  • nodelist에 따라 Place(사적지), Actor(인물), Group(조직), 사건(Event)로 class 분류.
  • 원자료에 기재된 정보에 따라 [사적지 -> 인물, 사적지 -> 사건, 사적지 -> 조직] 세 가지 유형의 relation을 대략적으로 연결하여 linklist에 추가. 약 9,184건의 링크 확보.

앞으로 해야할 일

  • 현재 만든 nodelist와 linklist는 잠정적인 것. 중복값을 제거하고 많은 가외노드를 삭제해야한다.
  • 향후 작업방향: 사적지 데이터로 접근. 1666건의 데이터를 차례로 살펴보면서 관련 노드(인물·사건·조직)가 유효한지 확인, 인물의 경우 동명이인 여부 확인 -> 이를 바탕으로 unique한 nodelist와 linklist 생성.
  • 마지막으로 확보된 nodelist와 매핑할 수 있는 다른 자료('근현대인물자료', '전쟁·전투정보' 등)를 찾아 연결하기.

고민해야할 부분들

  • 사건, 조직, 인물에 관한 데이터 중 실제 유효한 노드로서 nodelist에 포함시킬 수 있는 수준(범위)를 어느정도로 잡을 것인가.
    • 예1) '1927.12.5·7.9 청주공립고등보통학교 동맹휴학'은 '동맹휴학' 노드로 합쳐버릴 수 있지만 일어난 시간과 장소의 특수성을 반영해 새로운 노드로 생성할 수도 있다.
    • 예2) 6.25전쟁 관련 사적지의 경우 '국군 제3사단'처럼 특정 군 단위가 관련한 조직으로 사적지와 연결되어있는데 이러한 개별 단위들을 모두 포함할 것인가. 아니라면 어느정도 수준에서 통합할 것인가/제외할 것인가.
  • 네이밍이 외부 위키나 민백 등에서 기재된 네이밍과 다른 경우 어떻게 쓸 것인가.
    • 예1) 을사의병/중기의병, 정미의병/후기의병, 금호문사건/송학선의거 -> 민백 네이밍을 따라야하는지.
  • 독립운동사와 6.25전쟁사에 등장하는 외국 인물의 경우 노드로 추가할 것인가.
  • relation의 경우 아직 어떤 유형들이 나오게 될지 가늠할 수가 없다.(사적지와 인물, 사건, 조직 등이 관계를 맺고있는 '방식'이 다양하기 때문)

국립문화재연구소 신도비 데이터

현황

  • 국립문화재연구소의 한국금석문 중 신도비/묘비/묘갈/묘지명 1614건 추출
  • 주인공, 찬자, 각자, 서자 관계 추출 4215건
    • isEpitaphOf : ~의 묘지명이다
    • isSteleOf : ~의 비이다
    • calligrapher : ~의 각자이다
    • writer : ~의 서자이다
    • inscriber : ~의 각자이다
  • 역대인물UCI를 이용해 인물 식별 중 : 현재 비 312건과 관련된 링크 식별 진행
  • 식별 과정에서 판단되는 비의 주인공와 찬자, 각자, 서자의 혈연 관계 입력 중(~의 사위이다. ~아들이다. ~딸이다, ~후손이다 등)

해결사항

  • 동명이인 및 역대인물에 나와있지 않은 인물의 식별문제.
  • 비의 이름이 식별이 불가하여 ㅁ로 처리된 경우
  • 비가 재건된 경우
  • 인물관계 기술의 정도. 역대인물에 기술이 되어 있는지 확인?

서원

현황

  • 출처: 서원연합회 데이터 참조
  • 노드
    • 서원: 652건
    • 인물: 약 1660건 +
    • 서원 속성 정보: 한글명칭, 한자명칭, 문화재지정, 서원시작연도, 서원시작왕대, 주소, 경도, 위도
    • 인물 속성 정보: 한글명칭, 한자명칭, 생년, 몰년
  • 링크
    • 서원-인물 관계: isEnshrinedIn(약 2200건)
    • 인물-인물 관계: hasDescendant, isLineageKinOf, hasSon, hasBrother, hasDisciple, knows 등 예상됨
    • 확인할 수 있는 주향/배향 관계는 일단 속성 정보로 입력해 둘 예정