"WorkSheet Manual(2021)"의 두 판 사이의 차이
(→Actor) |
(→Node ID 정의를 위한 지침) |
||
1번째 줄: | 1번째 줄: | ||
− | =='''Node | + | =='''Node 관련 지침'''== |
===Actor=== | ===Actor=== | ||
*인물 ID는 본명, 정식 명칭을 기준으로 정의 | *인물 ID는 본명, 정식 명칭을 기준으로 정의 | ||
**도산 안창호 -> 안창호 | **도산 안창호 -> 안창호 | ||
**언더우드 -> 호러스_그랜트_언더우드 | **언더우드 -> 호러스_그랜트_언더우드 | ||
+ | * 인물의 Label은 다음과 같이 기재 | ||
+ | ** 한글명(한문) | ||
+ | ** 한글 한문 생~몰년 | ||
+ | ** 영문이름 풀네임 (한글발음) | ||
* remark 에는 Definition 기재 | * remark 에는 Definition 기재 | ||
− | ** 【생(시작)~몰년(끝)】 이후 설명. (끝에 . 붙일 것) | + | ** 【생(시작)~몰년(끝)】. 이후 설명. (끝에 . 붙일 것) |
** 날짜표기법: 2021-07-22 (연도 4자리-월 2자리-일2자리) / 음력: 2021-02-10(음) / 연도 혹은 년월만 제시되었을 경우: 1876년(고종 10)~1876-02월(음) | ** 날짜표기법: 2021-07-22 (연도 4자리-월 2자리-일2자리) / 음력: 2021-02-10(음) / 연도 혹은 년월만 제시되었을 경우: 1876년(고종 10)~1876-02월(음) | ||
+ | * 이칭은 모든 이칭(호 등)을 다 쓰지 말고 유의미한 것만을 적으며, isSameAs로 연결할 수 있는 것. | ||
+ | ** 즉, 조선 태조-이성계, 왕비-대비가 되어 이름이 바뀌는 경우에만 기재 | ||
+ | ** 여러 개의 경우: ,_ 로 표현) | ||
+ | |||
+ | ===Event=== | ||
+ | * Label은 _제외한 id 일자(기간)를 기재 | ||
+ | ** 13도 창의군 1907~1910, 가쓰라-태프트 비밀협약 1905, 경성고등연예관 설립 1910 | ||
+ | * remark에는 시작연도와 종료연도 기재 | ||
+ | ** 날짜 표현은 Actor와 동일 -> 【생(시작)~몰년(끝)】. 이후 설명이 있으면 설명 기재. (끝에 . 붙일 것) | ||
+ | * 이칭은 많이 쓰이는 이칭을 기재 (ex.강화도조약-조일수호조규) | ||
+ | |||
+ | ===Place=== | ||
+ | * groupName: 객관, 교회, 궁궐, 극장, 능묘, 병원, 사당, 사찰, 서원, 서울시문화재표석, 시장, 외국공관, 장소, 제단, 주택, 진전, 호텔 등 | ||
+ | * partName은 서울시문화재표석인 경우 기재 | ||
+ | ** 표석-고지명, 표석-관아, 표석-근대유산, 표석-서원/향교, 표석-왕실유적, 표석-인물유적 | ||
+ | * 주소는 현대적 주소가 있는 경우 기재 | ||
+ | * 경도와 위도는 확인하여 기재하고, 고도와 이칭은 필요한 경우 기재 | ||
+ | |||
+ | ===Architecture=== | ||
+ | * Architecture는 3D모델의 대상이 되는 것이며 이외에는 Place 임 | ||
+ | * groupName: 건축, 조형 | ||
+ | * partName은 건축중 궁궐과 왕실인 경우 기재 : 건축-궁궐건축, 건축-왕실건축 | ||
+ | |||
+ | ===object=== | ||
+ | * label: 기록화는 이름 《한자》(이름 뒤에 공백 한칸)로 기재 | ||
+ | ** 강희언-인왕산도 《仁王山圖》 | ||
+ | * 한자: 기록화는 《한자》로 기재 | ||
+ | * remark에는 제작일자, 크기와 재료 기재. | ||
+ | ** 크기와 재료는 박물관 도록에 목록화되는 크기와 재료를 기재 | ||
+ | ** 1600년, 지본담채, 32.3×49.5㎝, 한국학중앙연구원 장서각 | ||
+ | ** 1583년경, 견본수묵, 93.0×60.0㎝, 개인소장 | ||
===Record=== | ===Record=== | ||
− | ==== | + | * groupName: 그림, 금석문, 기록, 기사, 문헌, 뮤지컬, 사진, 사진첩, 삽도, 신문, 엽서, 외국도서, 외국신문, 음악, 의궤, 의장, 일기, 천문도 |
+ | * 저작년과 간행년(확인될 경우 기재) | ||
+ | * 외국서인 경우 간행국과 언어를 기재 | ||
+ | * 이칭은 번역서가 따로 만들어져 있지 않으며 이름이 다를 경우 기재 | ||
+ | |||
+ | ===Concept=== | ||
+ | * 모든 역사적 사실을 노드화할 필요는 없으며, 개념어의 뜻 풀이 시 필요 | ||
+ | |||
+ | ===Multimedia=== | ||
+ | * 3D지도, 3D인 경우 (그림은 Record) | ||
+ | * 노드의 접두어: 표석은 vmap-, 이외에는 3d- | ||
+ | ** 3d-앨버트_테일러_가옥, vmap-관상감_터 | ||
===Story=== | ===Story=== | ||
− | *Story의 주제별 번호 | + | * Story 구성의 기준: 반드시 다른 Fact 노드들과 적어도 3개, 보통 5~6개는 Relation이 있어야 함 |
− | **E1: | + | * Story의 주제별 번호 |
− | **E2: | + | **E1: 덕수궁 |
− | **E3: | + | **E2: 정동 |
− | **E4: | + | **E3: 환구단 |
− | **E5: | + | **E4: 남대문 |
− | **E6: | + | **E5: 독립문 |
+ | **E6: 서울역 | ||
+ | * groupName: 보통의 경우에는 Episode, Storyline은 4~5개의 Episode를 포함 | ||
=='''☑️Data Cleansing을 위한 체크 리스트☑️'''== | =='''☑️Data Cleansing을 위한 체크 리스트☑️'''== |
2021년 7월 29일 (목) 10:41 판
목차
Node 관련 지침
Actor
- 인물 ID는 본명, 정식 명칭을 기준으로 정의
- 도산 안창호 -> 안창호
- 언더우드 -> 호러스_그랜트_언더우드
- 인물의 Label은 다음과 같이 기재
- 한글명(한문)
- 한글 한문 생~몰년
- 영문이름 풀네임 (한글발음)
- remark 에는 Definition 기재
- 【생(시작)~몰년(끝)】. 이후 설명. (끝에 . 붙일 것)
- 날짜표기법: 2021-07-22 (연도 4자리-월 2자리-일2자리) / 음력: 2021-02-10(음) / 연도 혹은 년월만 제시되었을 경우: 1876년(고종 10)~1876-02월(음)
- 이칭은 모든 이칭(호 등)을 다 쓰지 말고 유의미한 것만을 적으며, isSameAs로 연결할 수 있는 것.
- 즉, 조선 태조-이성계, 왕비-대비가 되어 이름이 바뀌는 경우에만 기재
- 여러 개의 경우: ,_ 로 표현)
Event
- Label은 _제외한 id 일자(기간)를 기재
- 13도 창의군 1907~1910, 가쓰라-태프트 비밀협약 1905, 경성고등연예관 설립 1910
- remark에는 시작연도와 종료연도 기재
- 날짜 표현은 Actor와 동일 -> 【생(시작)~몰년(끝)】. 이후 설명이 있으면 설명 기재. (끝에 . 붙일 것)
- 이칭은 많이 쓰이는 이칭을 기재 (ex.강화도조약-조일수호조규)
Place
- groupName: 객관, 교회, 궁궐, 극장, 능묘, 병원, 사당, 사찰, 서원, 서울시문화재표석, 시장, 외국공관, 장소, 제단, 주택, 진전, 호텔 등
- partName은 서울시문화재표석인 경우 기재
- 표석-고지명, 표석-관아, 표석-근대유산, 표석-서원/향교, 표석-왕실유적, 표석-인물유적
- 주소는 현대적 주소가 있는 경우 기재
- 경도와 위도는 확인하여 기재하고, 고도와 이칭은 필요한 경우 기재
Architecture
- Architecture는 3D모델의 대상이 되는 것이며 이외에는 Place 임
- groupName: 건축, 조형
- partName은 건축중 궁궐과 왕실인 경우 기재 : 건축-궁궐건축, 건축-왕실건축
object
- label: 기록화는 이름 《한자》(이름 뒤에 공백 한칸)로 기재
- 강희언-인왕산도 《仁王山圖》
- 한자: 기록화는 《한자》로 기재
- remark에는 제작일자, 크기와 재료 기재.
- 크기와 재료는 박물관 도록에 목록화되는 크기와 재료를 기재
- 1600년, 지본담채, 32.3×49.5㎝, 한국학중앙연구원 장서각
- 1583년경, 견본수묵, 93.0×60.0㎝, 개인소장
Record
- groupName: 그림, 금석문, 기록, 기사, 문헌, 뮤지컬, 사진, 사진첩, 삽도, 신문, 엽서, 외국도서, 외국신문, 음악, 의궤, 의장, 일기, 천문도
- 저작년과 간행년(확인될 경우 기재)
- 외국서인 경우 간행국과 언어를 기재
- 이칭은 번역서가 따로 만들어져 있지 않으며 이름이 다를 경우 기재
Concept
- 모든 역사적 사실을 노드화할 필요는 없으며, 개념어의 뜻 풀이 시 필요
Multimedia
- 3D지도, 3D인 경우 (그림은 Record)
- 노드의 접두어: 표석은 vmap-, 이외에는 3d-
- 3d-앨버트_테일러_가옥, vmap-관상감_터
Story
- Story 구성의 기준: 반드시 다른 Fact 노드들과 적어도 3개, 보통 5~6개는 Relation이 있어야 함
- Story의 주제별 번호
- E1: 덕수궁
- E2: 정동
- E3: 환구단
- E4: 남대문
- E5: 독립문
- E6: 서울역
- groupName: 보통의 경우에는 Episode, Storyline은 4~5개의 Episode를 포함
☑️Data Cleansing을 위한 체크 리스트☑️
1단계
- WorkSheet 표준 양식 준수
- Ontology 어휘 준수
2단계
- 문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation
- 문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인.
- id 문자열 중간 공백의 언더바(_) 처리.
3단계
- 노드의 중복 확인
- 1차(기계적 체크): 문자열 일치 확인. '조건부 서식-중복 값' 활용
- 2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
- Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인. 'VLOOKUP 함수' 활용
그밖에 놓치기 쉬운 것들
- 마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인
- 외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인