"20180404 회의록"의 두 판 사이의 차이
khw
(→역대인물에 존재하지 않는 인물) |
|||
| (사용자 4명의 중간 판 10개는 보이지 않습니다) | |||
| 3번째 줄: | 3번째 줄: | ||
|서명=[[전통문화 융복합 자원 시맨틱 데이터 개발 연구 회의록|회의록]] | |서명=[[전통문화 융복합 자원 시맨틱 데이터 개발 연구 회의록|회의록]] | ||
|이전=[[20180328 회의록]] | |이전=[[20180328 회의록]] | ||
| − | |현재=[[ | + | |현재=[[20180404 회의록]] |
| − | |다음=[[]] | + | |다음=[[20180411 회의록]] |
}} | }} | ||
| + | ==회의내용== | ||
| + | *서화가 리스트부터 만든 뒤에 server에 업로드할 것.(계속해서 리뉴얼) | ||
| + | |||
| 75번째 줄: | 78번째 줄: | ||
*식별 과정에서 판단되는 비의 주인공와 찬자, 각자, 서자의 혈연 관계 입력 중(~의 사위이다. ~아들이다. ~딸이다, ~후손이다 등) | *식별 과정에서 판단되는 비의 주인공와 찬자, 각자, 서자의 혈연 관계 입력 중(~의 사위이다. ~아들이다. ~딸이다, ~후손이다 등) | ||
===해결사항=== | ===해결사항=== | ||
| − | *동명이인 식별문제. | + | *동명이인 및 역대인물에 나와있지 않은 인물의 식별문제. |
| + | *비의 이름이 식별이 불가하여 ㅁ로 처리된 경우 | ||
*비가 재건된 경우 | *비가 재건된 경우 | ||
*인물관계 기술의 정도. 역대인물에 기술이 되어 있는지 확인? | *인물관계 기술의 정도. 역대인물에 기술이 되어 있는지 확인? | ||
| + | |||
| + | ==서원== | ||
| + | ===현황=== | ||
| + | *출처: [http://www.seowonstay.com/ 서원연합회] 데이터 참조 | ||
| + | *노드 | ||
| + | **서원: 652건 | ||
| + | **인물: 약 1660건 + | ||
| + | **서원 속성 정보: 한글명칭, 한자명칭, 문화재지정, 서원시작연도, 서원시작왕대, 주소, 경도, 위도 | ||
| + | **인물 속성 정보: 한글명칭, 한자명칭, 생년, 몰년 | ||
| + | *링크 | ||
| + | **서원-인물 관계: isEnshrinedIn(약 2200건) | ||
| + | **인물-인물 관계: hasDescendant, isLineageKinOf, hasSon, hasBrother, hasDisciple, knows 등 예상됨 | ||
| + | **확인할 수 있는 주향/배향 관계는 일단 속성 정보로 입력해 둘 예정 | ||
2018년 5월 23일 (수) 04:08 기준 최신판
| ← Previous | 회의록 | Next → |
| 20180328 회의록 | 20180404 회의록 | 20180411 회의록 |
목차
회의내용
- 서화가 리스트부터 만든 뒤에 server에 업로드할 것.(계속해서 리뉴얼)
역대서화가 데이터
원자료
자료 분석
클래스
- 4개의 클래스. 1. 서화가, 2. 작품, 3. 소장처, 4. 문헌
- 서화가는 사전에 표제어
- 작품은 서화가가 만든 작품(회화, 불화, 서첩, 비석(신도비, 묘비 등), 병풍 등)
- 소장처는 국/내외 박물관, 미술관 등 문화기관, 사찰, 장소(비석 등)
- 문헌은 일부 서화가의 경우 현전 작품이 없으나, 특정 문헌에 언급됨. 이 기록을 바탕으로 서화가로 등록되어 있음.
관계
| 항목A | 항목B | 관계 | 비고 |
|---|---|---|---|
| 서화가 | 작품 | dcterms:creator | |
| 작품 | 소장처 | edm:currentLocation | |
| 서화가 | 문헌 | ekc:isMentionedIn | 서화가가 문헌에 언급된 경우(단 전하는 작품이 없는 경우 필히 작성) |
| 서화가 | 문헌 | dcterms:creator | 작품 외에 저술한 문헌(문집 등) |
입력시 어려움
- 서화가 사전에 입력된 작품의 소장처가 명기되지 않거나, 오류가 많음
- 실 소장처를 찾기 위한 시간 소요.
- 작품 명의 경우 반복 될 소지가 높음
- 작품명에 대한 유니크 아이디 부여가 필요
- 현재 역대 서화가 사전의 범위 내에서 id 부여중
- ex) 서화가 (ARTIST_0000), 작품(ART_0000) 등
독립운동 및 국가수호 사적지 데이터
현황
- 1666건의 사적지와 관련 속성 데이터(종류, 상태, 주소, 위경도좌표, url) 확보 + 각각의 사적지와 관련한 인물·사건·조직 등을 nodelist에 추가하여 약 8,225건의 노드 확보.
- nodelist에 따라 Place(사적지), Actor(인물), Group(조직), 사건(Event)로 class 분류.
- 원자료에 기재된 정보에 따라 [사적지 -> 인물, 사적지 -> 사건, 사적지 -> 조직] 세 가지 유형의 relation을 대략적으로 연결하여 linklist에 추가. 약 9,184건의 링크 확보.
앞으로 해야할 일
- 현재 만든 nodelist와 linklist는 잠정적인 것. 중복값을 제거하고 많은 가외노드를 삭제해야한다.
- 향후 작업방향: 사적지 데이터로 접근. 1666건의 데이터를 차례로 살펴보면서 관련 노드(인물·사건·조직)가 유효한지 확인, 인물의 경우 동명이인 여부 확인 -> 이를 바탕으로 unique한 nodelist와 linklist 생성.
- 마지막으로 확보된 nodelist와 매핑할 수 있는 다른 자료('근현대인물자료', '전쟁·전투정보' 등)를 찾아 연결하기.
고민해야할 부분들
- 사건, 조직, 인물에 관한 데이터 중 실제 유효한 노드로서 nodelist에 포함시킬 수 있는 수준(범위)를 어느정도로 잡을 것인가.
- 예1) '1927.12.5·7.9 청주공립고등보통학교 동맹휴학'은 '동맹휴학' 노드로 합쳐버릴 수 있지만 일어난 시간과 장소의 특수성을 반영해 새로운 노드로 생성할 수도 있다.
- 예2) 6.25전쟁 관련 사적지의 경우 '국군 제3사단'처럼 특정 군 단위가 관련한 조직으로 사적지와 연결되어있는데 이러한 개별 단위들을 모두 포함할 것인가. 아니라면 어느정도 수준에서 통합할 것인가/제외할 것인가.
- 네이밍이 외부 위키나 민백 등에서 기재된 네이밍과 다른 경우 어떻게 쓸 것인가.
- 예1) 을사의병/중기의병, 정미의병/후기의병, 금호문사건/송학선의거 -> 민백 네이밍을 따라야하는지.
- 독립운동사와 6.25전쟁사에 등장하는 외국 인물의 경우 노드로 추가할 것인가.
- relation의 경우 아직 어떤 유형들이 나오게 될지 가늠할 수가 없다.(사적지와 인물, 사건, 조직 등이 관계를 맺고있는 '방식'이 다양하기 때문)
국립문화재연구소 신도비 데이터
현황
- 국립문화재연구소의 한국금석문 중 신도비/묘비/묘갈/묘지명 1614건 추출
- 주인공, 찬자, 각자, 서자 관계 추출 4215건
- isEpitaphOf : ~의 묘지명이다
- isSteleOf : ~의 비이다
- calligrapher : ~의 각자이다
- writer : ~의 서자이다
- inscriber : ~의 각자이다
- 역대인물UCI를 이용해 인물 식별 중 : 현재 비 312건과 관련된 링크 식별 진행
- 식별 과정에서 판단되는 비의 주인공와 찬자, 각자, 서자의 혈연 관계 입력 중(~의 사위이다. ~아들이다. ~딸이다, ~후손이다 등)
해결사항
- 동명이인 및 역대인물에 나와있지 않은 인물의 식별문제.
- 비의 이름이 식별이 불가하여 ㅁ로 처리된 경우
- 비가 재건된 경우
- 인물관계 기술의 정도. 역대인물에 기술이 되어 있는지 확인?
서원
현황
- 출처: 서원연합회 데이터 참조
- 노드
- 서원: 652건
- 인물: 약 1660건 +
- 서원 속성 정보: 한글명칭, 한자명칭, 문화재지정, 서원시작연도, 서원시작왕대, 주소, 경도, 위도
- 인물 속성 정보: 한글명칭, 한자명칭, 생년, 몰년
- 링크
- 서원-인물 관계: isEnshrinedIn(약 2200건)
- 인물-인물 관계: hasDescendant, isLineageKinOf, hasSon, hasBrother, hasDisciple, knows 등 예상됨
- 확인할 수 있는 주향/배향 관계는 일단 속성 정보로 입력해 둘 예정