WorkSheet Manual(2021)

hanyang2
My9univ (토론 | 기여)님의 2021년 8월 6일 (금) 15:01 판
이동: 둘러보기, 검색

편찬 항목 목록 한양도성 2020 EncyKorea

WorkSheet 전반적 지침

id

  • 중요한 것: id=label이 아님을 명심할 것!! (정확한 이름은 label로 보여줌)
  • id의 특수문자는 -과 _와 : 와 ′이외에는 불가능함
    •  :는 앞은 안뛰고 뒤만 뜀. (블라:_블라)
    • .와 ()와 ,와 ·(가운데점)과 & 도 불가능합니다!!!
    • .은 3.1이나 8.15와 같은 고유명사만 가능함.
    • single quotation은 ㄹ+한자를 눌러서 ′ 쓸 것.
    • 라틴문자: 움나우트 제외하고 씀 -> ä는 a로 기재
  • 책표지, 전시명에 있다고 id에 그대로 가져오면 절대 안됨.
    • 키워드2글자_저자이름_연도 정도로 축약할 것.
    • 전시명: 전시-, 도록:도록-, 사진:사진-. 도면:도면- 이런 식으로 접두사로 붙일 것
    • 온라인 전시: 전시-어쩌구_온라인
    • 책이 다른 연도에 쓰여져서 2개인 것: 책이름_1, 책이름_2 로 기재
  • 결코 40자 이상의 id는 안됨 (label은 456자.) 그러니 축약할 것.
  • 한글자 짜리 id: 의미를 알 수 없으므로 반드시 한자 병기

infoURL

  • InfoUrl은 다양한 노드를 묶은 집합node가 아닌 이상 빈칸일 수 없음.
    • 없는 경우: 다양한 data를 묶어준 집합node - 정해년진찬 물품 등 (집합node 관련하여 하기에 자세히 기재)
  • hanyang2 위키는 만들만한 가치가 있는 것 중 정말 위키페이지를 만들 것만 쓸 것!
    • hanyang2의 위키주소 쓰면 본인이 만들어야 함. 본인이 만들 것 아니면 Resource 찾을 것
  • 이외에는 온라인 상의 Resource(민백, 장서각, 실록위키 등)를 지시할 것
  • 작년도 위키페이지: 작년 DATA를 그대로 쓸거면 작년도 위키URL을 쓰고, 한 개 글자라도 바꿀꺼면 올해 위키로 복붙 (양식은 올해에 맞게 변형하여 올리기)
    • 작년도 노드에 있다고 위키페이지가 모두 있는 것은 아니니 반드시 확인할 것

note

  • 작업자 이름
  • 기초: 제안 때 만들었던 data
  • 2020: 2020년에 만들었던 data
    • 2020년 노드에 본인 이름 X (2020만 기재)


사진 등 참고자료의 출처

  • 도서사진의 출처: 원 도서명으로 기재하며, 온라인으로 퍼블리싱한 곳의 이름은 쓰지 않음. data에는 label에 입력
  • 신문사의 보도사진: 위키에도 WebResource 로, Data에도 WebResource 로 들어감!
    • label(표제,출처,날짜)과 Remark(기타 내용)에다 나누어서 넣음
    • groupname: (text) 해설, 참고, 원문, / (multimedia) 사진, 동영상, 도면, 그림, 지도, 3D_지도, 3D_모델
  • 참고자료의 Relation: isShowIn (텍스트로 보여줌), isShownBy(사진, 영상 등 멀티미디어를 통해서 보여줌)


Node 관련 지침

이칭의 노드화

  • 노드화할 가치가 있는 것만 노드화할 것
    • 사투리,약간의 표기차이 등 노드화할 가치가 없는 것은 좀더 비중이 있는 항목만 노드화하고, Label을 A/B로 할 것

집합node 신설

  • 집합node란: 다양한 data를 묶어준 node로 공node라고도 불림
    • 정해년진찬_물품, 환구단_정비_계획1
    • 사진이 많은 경우 집합node 생성할 것
  • 주요node와 집합node를 연결하고, 집합node 내 개별자료는 집합node랑만 연결 (중요node와 연결 X)
    • 건물(환구단) isRelatedTo 집합노드(label: 환구단 정비 기본계획 2007) hasPart 개별사진
    • 건물(환구단) isRelatedTo 집합노드(label: 환구단 정비 기본계획 2007) hasPart 집합노드(도면) includes 개별도면
  • Class: 하위노드의 Class를 동일하게 기재
  • InfoUrl: 빈칸 가능하나, 해당 위키페이지에서 다양한 시각자료를 한번에 보여줄 수 있으면 더 좋음.
    • 도면일 경우, 위키페이지에 모든 도면을 언제, 무슨 프로젝트에서 쓰인 도면인지 설명 등을 기재
  • iconUrl: groupName별 아이콘이 배포될 예정
    • Url 먼저 배포 가능한지 확인 필요

Actor

  • 인물 ID는 본명, 정식 명칭을 기준으로 정의
    • 도산 안창호 -> 안창호
    • 언더우드 -> 호러스_그랜트_언더우드
  • 인물의 Label은 반드시 다음과 같이 기재
    • 한글명(한자, 생~몰년)
    • 영문이름 풀네임 (한글발음)
  • remark 에는 Definition 기재
    • 【생(시작)~몰년(끝)】. 이후 설명. (끝에 . 붙일 것)
    • 날짜표기법: 2021-07-22 (연도 4자리-월 2자리-일2자리) / 음력: 2021-02-10(음) / 연도 혹은 년월만 제시되었을 경우: 1876년(고종 10)~1876-02월(음)
  • 이칭은 모든 이칭(호 등)을 다 쓰지 말고 유의미한 것만을 적으며, isSameAs로 연결할 수 있는 것.
    • 즉, 조선 태조-이성계, 왕비-대비가 되어 이름이 바뀌는 경우에만 기재
    • 여러 개의 경우: ,_ 로 표현)

Event

  • Label은 _제외한 id 일자(기간)를 기재
    • 13도 창의군 1907~1910, 가쓰라-태프트 비밀협약 1905, 경성고등연예관 설립 1910
  • remark에는 시작연도와 종료연도 기재
    • 날짜 표현은 Actor와 동일 -> 【생(시작)~몰년(끝)】. 이후 설명이 있으면 설명 기재. (끝에 . 붙일 것)
  • 이칭은 많이 쓰이는 이칭을 기재 (ex.강화도조약-조일수호조규)

Place

  • groupName: 객관, 교회, 궁궐, 극장, 능묘, 병원, 사당, 사찰, 서원, 서울시문화재표석, 시장, 외국공관, 장소, 제단, 주택, 진전, 호텔 등
  • partName은 서울시문화재표석인 경우 기재
    • 표석-고지명, 표석-관아, 표석-근대유산, 표석-서원/향교, 표석-왕실유적, 표석-인물유적
  • 주소는 현대적 주소가 있는 경우 기재
  • 경도와 위도는 확인하여 기재하고, 고도와 이칭은 필요한 경우 기재

Architecture

  • Architecture는 3D모델의 대상이 되는 것이며 이외에는 Place 임
  • groupName: 건축, 조형
  • partName은 건축중 궁궐과 왕실인 경우 기재 : 건축-궁궐건축, 건축-왕실건축

Object

  • label: 기록화는 이름 《한자》(이름 뒤에 공백 한칸)로 기재
    • 강희언-인왕산도 《仁王山圖》
  • 한자: 기록화는 《한자》로 기재
  • remark에는 제작일자, 크기와 재료 기재.
    • 크기와 재료는 박물관 도록에 목록화되는 크기와 재료를 기재
    • 1600년, 지본담채, 32.3×49.5㎝, 한국학중앙연구원 장서각
    • 1583년경, 견본수묵, 93.0×60.0㎝, 개인소장

Record

  • groupName: 그림, 금석문, 기록, 기사, 문헌, 뮤지컬, 사진, 사진첩, 삽도, 신문, 엽서, 외국도서, 외국신문, 음악, 의궤, 의장, 일기, 천문도, 도면
  • 저작년과 간행년(확인될 경우 기재)
  • 외국서인 경우 간행국과 언어를 기재
  • 이칭은 번역서가 따로 만들어져 있지 않으며 이름이 다를 경우 기재

Record vs Object=

  • 사진 Record , 유리원판도 Record
    • 기념사진 isDerivativeOf (~의 파생물이다) 유리원판 및 기념일
  • 도면 Record

Concept

  • 모든 역사적 사실을 노드화할 필요는 없으며, 개념어의 뜻 풀이 시 필요

Multimedia

  • 3D지도, 3D인 경우 (그림은 Record)
  • 노드의 접두어: 표석은 vmap-, 이외에는 3d-
    • 3d-앨버트_테일러_가옥, vmap-관상감_터

Story

  • Story 구성의 기준: 반드시 다른 Fact 노드들과 적어도 3개, 보통 5~6개는 Relation이 있어야 함
  • groupName: 보통의 경우에는 Episode, Storyline은 4~5개의 Episode를 포함
  • Story의 주제별 번호
    • E1: 덕수궁
    • E2: 정동
    • E3: 환구단
    • E4: 남대문
    • E5: 독립문
    • E6: 서울역
  • 권역 이외 Story: E0-000
  • 구역과 상관없이 주제에 따른 스토리의 ID는 작업자에 따른 2자리 숫자를 개별 부여하므로 요청
    • 구역과 상관없는 주제를 만든 이효림의 Episode ID: E33-001 / Story ID: S33-001
  • 영어 Story는 500번대, 중국어 Story는 300번대
  • Story 중복 여부 재검토 필요. note에 담당자 이름 표시.
    • 예) E1-012 Story Episode 고종황제 즉위 40주년 기념행사와 기념비각
    • E1-026 Story Episode 고종황제 즉위 40주년과 망육 축하 진연
    • E1-027 Story Episode 고종황제의 오순 축하 진연
  • 인문정보학도 본인의 작업물을 포괄하거나 성격을 보여줄 수 있는 최소 1건의 StoryLine을 만들어야 함.
    • 이것도 외국어 Story로 번역 예정

Link 관련 지침

  • 순접과 역접은 본인의 DATA에 따라 진행하면 됨. 둘다 맞다면 모두 유지할 예정
    • 그림A-사건B: 본인의 data에 그림A와 연결된 노드가 많으면 A depices B, 사건B와 연결된 노드가 많으면 B isDepictedIn A
  • 추상적으로 설명하면 isRelratedTo / 구체적으로 설명하게 되면 depicts과 같은 다른 relation이 되는 것
    • ex. A라는 문헌은 B라는 인물과 isRelratedTo / A라는 문헌에 C라는 사건을 depicts, C라는 사건은 B라는 인물이 participatesIn
  • 주의할 것: depicts: 문헌 등에 시각적으로 묘사한 것! (글은 mentions)

☑️Data Cleansing을 위한 체크 리스트☑️

1단계

  • WorkSheet 표준 양식 준수
  • Ontology 어휘 준수

2단계

  • 문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation
  • 문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인.
  • id 문자열 중간 공백의 언더바(_) 처리.

3단계

  • 노드의 중복 확인
    • 1차(기계적 체크): 문자열 일치 확인. '조건부 서식-중복 값' 활용
    • 2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
  • Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인. 'VLOOKUP 함수' 활용

그밖에 놓치기 쉬운 것들

  • 마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인
  • 외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인