"20180404 회의록"의 두 판 사이의 차이

khw
이동: 둘러보기, 검색
(새 문서: {{Navbox |프로젝트명= |서명=회의록 |이전=20180328 회의록 |현재=[[20180304 회의록]...)
 
41번째 줄: 41번째 줄:
 
#* 현재 역대 서화가 사전의 범위 내에서 id 부여중
 
#* 현재 역대 서화가 사전의 범위 내에서 id 부여중
 
#*# ex) 서화가 (ARTIST_0000), 작품(ART_0000) 등
 
#*# ex) 서화가 (ARTIST_0000), 작품(ART_0000) 등
 +
 +
 +
=='''독립운동 및 국가수호 사적지 데이터'''==
 +
====현황====
 +
* 1666건의 사적지와 관련 속성 데이터(종류, 상태, 주소, 위경도좌표, url) 확보 + 각각의 사적지와 관련한 인물·사건·조직 등을 nodelist에 추가하여 약 8225건의 노드 확보.
 +
* nodelist에 따라 Place(사적지), Actor(인물), Group(조직), 사건(Event)로 class 분류.
 +
* 원자료에 기재된 정보에 따라 [사적지 -> 인물, 사적지 -> 사건, 사적지 -> 조직] 세 가지 유형의 relation을 대략적으로 linklist에 추가. 약 9184건의 링크 확보.
 +
 +
===앞으로 해야할 일===
 +
* 현재 만든 nodelist와 linklist는 잠정적인 것. 중복값을 제거하고 많은 가외노드를 삭제해야한다.
 +
* 향후 작업방향: 사적지 데이터로 접근. 1666건의 데이터를 차례로 살펴보면서 관련 노드(인물·사건·조직)가 유효한지 확인, 인물의 경우 동명이인 여부 확인 -> 이를 바탕으로 unique한 nodelist와 linklist 생성.
 +
* 마지막으로 확보된 nodelist와 매핑할 수 있는 다른 자료('근현대인물자료', '전쟁·전투정보' 등)를 찾아 연결하기.
 +
 +
===고민해야할 부분들===
 +
* 사건, 조직, 인물에 관한 데이터 중 실제 유효한 노드로서 nodelist에 포함시킬 수 있는 수준(범위)를 어느정도로 잡을 것인가.
 +
** 예1) '1927.12.5·7.9 청주공립고등보통학교 동맹휴학'은 '동맹휴학' 노드로 합쳐버릴 수 있지만 일어난 시간과 장소의 특수성을 반영해 새로운 노드로 생성할 수도 있다.
 +
** 예2) 6.25전쟁 관련 사적지의 경우 '국군 제3사단'처럼 특정 군 단위가 관련한 조직으로 사적지와 연결되어있는데 이러한 개별 단위들을 모두 포함할 것인가. 아니라면 어느정도 수준에서 통합할 것인가/제외할 것인가.
 +
* 네이밍이 외부 위키나 민백 등에서 기재된 네이밍과 다른 경우 어떻게 쓸 것인가.
 +
** 예1) '을사의병'이 '중기의병'으로 되어있고 '정미의병'이 '후기의병'으로 되어있다. 금호문사건/송학선의거 -> 민백 네이밍을 따라야하는지.
 +
* 독립운동사와 6.25전쟁사에 등장하는 외국 인물의 경우 노드로 추가할 것인가.

2018년 4월 3일 (화) 23:36 판

← Previous 회의록 Next →
20180328 회의록 20180304 회의록 [[]]


역대서화가 데이터

원자료

  • 국립문화재연구소, 한국역대서화가사전, 2011. 상, 하 2권.

자료 분석

클래스

  • 4개의 클래스. 1. 서화가, 2. 작품, 3. 소장처, 4. 문헌
    • 서화가는 사전에 표제어
    • 작품은 서화가가 만든 작품(회화, 불화, 서첩, 비석(신도비, 묘비 등), 병풍 등)
    • 소장처는 국/내외 박물관, 미술관 등 문화기관, 사찰, 장소(비석 등)
    • 문헌은 일부 서화가의 경우 현전 작품이 없으나, 특정 문헌에 언급됨. 이 기록을 바탕으로 서화가로 등록되어 있음.

관계

항목A 항목B 관계 비고
서화가 작품 dcterms:creator
작품 소장처 edm:currentLocation
서화가 문헌 ekc:isMentionedIn 서화가가 문헌에 언급된 경우(단 전하는 작품이 없는 경우 필히 작성)
서화가 문헌 dcterms:creator 작품 외에 저술한 문헌(문집 등)

입력시 어려움

  1. 서화가 사전에 입력된 작품의 소장처가 명기되지 않거나, 오류가 많음
    • 실 소장처를 찾기 위한 시간 소요.
  2. 작품 명의 경우 반복 될 소지가 높음
    • 작품명에 대한 유니크 아이디 부여가 필요
    • 현재 역대 서화가 사전의 범위 내에서 id 부여중
      1. ex) 서화가 (ARTIST_0000), 작품(ART_0000) 등


독립운동 및 국가수호 사적지 데이터

현황

  • 1666건의 사적지와 관련 속성 데이터(종류, 상태, 주소, 위경도좌표, url) 확보 + 각각의 사적지와 관련한 인물·사건·조직 등을 nodelist에 추가하여 약 8225건의 노드 확보.
  • nodelist에 따라 Place(사적지), Actor(인물), Group(조직), 사건(Event)로 class 분류.
  • 원자료에 기재된 정보에 따라 [사적지 -> 인물, 사적지 -> 사건, 사적지 -> 조직] 세 가지 유형의 relation을 대략적으로 linklist에 추가. 약 9184건의 링크 확보.

앞으로 해야할 일

  • 현재 만든 nodelist와 linklist는 잠정적인 것. 중복값을 제거하고 많은 가외노드를 삭제해야한다.
  • 향후 작업방향: 사적지 데이터로 접근. 1666건의 데이터를 차례로 살펴보면서 관련 노드(인물·사건·조직)가 유효한지 확인, 인물의 경우 동명이인 여부 확인 -> 이를 바탕으로 unique한 nodelist와 linklist 생성.
  • 마지막으로 확보된 nodelist와 매핑할 수 있는 다른 자료('근현대인물자료', '전쟁·전투정보' 등)를 찾아 연결하기.

고민해야할 부분들

  • 사건, 조직, 인물에 관한 데이터 중 실제 유효한 노드로서 nodelist에 포함시킬 수 있는 수준(범위)를 어느정도로 잡을 것인가.
    • 예1) '1927.12.5·7.9 청주공립고등보통학교 동맹휴학'은 '동맹휴학' 노드로 합쳐버릴 수 있지만 일어난 시간과 장소의 특수성을 반영해 새로운 노드로 생성할 수도 있다.
    • 예2) 6.25전쟁 관련 사적지의 경우 '국군 제3사단'처럼 특정 군 단위가 관련한 조직으로 사적지와 연결되어있는데 이러한 개별 단위들을 모두 포함할 것인가. 아니라면 어느정도 수준에서 통합할 것인가/제외할 것인가.
  • 네이밍이 외부 위키나 민백 등에서 기재된 네이밍과 다른 경우 어떻게 쓸 것인가.
    • 예1) '을사의병'이 '중기의병'으로 되어있고 '정미의병'이 '후기의병'으로 되어있다. 금호문사건/송학선의거 -> 민백 네이밍을 따라야하는지.
  • 독립운동사와 6.25전쟁사에 등장하는 외국 인물의 경우 노드로 추가할 것인가.