"WorkSheet Manual(2021)"의 두 판 사이의 차이
(→Web Resource) |
잔글 (My9univ님이 WorkSheet Manual 문서를 WorkSheet Manual(2021) 문서로 이동했습니다) |
||
(같은 사용자의 중간 판 22개는 보이지 않습니다) | |||
1번째 줄: | 1번째 줄: | ||
{{clickable button|[[편찬 항목 목록]]}} {{clickable button|[[한양도성 2020]]}} {{clickable button|[[EncyKorea]]}} | {{clickable button|[[편찬 항목 목록]]}} {{clickable button|[[한양도성 2020]]}} {{clickable button|[[EncyKorea]]}} | ||
− | + | ='''WorkSheet 전반적 지침'''= | |
− | + | =='''id'''== | |
− | + | ===규칙=== | |
* '''중요한 것: id=label이 아님을 명심할 것!!''' | * '''중요한 것: id=label이 아님을 명심할 것!!''' | ||
** 정확한 이름은 label로 보여주므로 ID는 '''식별되는 정도로 축약'''할 것 (20자 이상 불가) | ** 정확한 이름은 label로 보여주므로 ID는 '''식별되는 정도로 축약'''할 것 (20자 이상 불가) | ||
13번째 줄: | 13번째 줄: | ||
** 라틴문자: 움나우트 제외하고 씀 -> ä는 a로 기재 | ** 라틴문자: 움나우트 제외하고 씀 -> ä는 a로 기재 | ||
* 한글자 짜리 id: 반드시 한자 병기 | * 한글자 짜리 id: 반드시 한자 병기 | ||
+ | * '''기 등록된 Node (2020, 기초, 다른 사람들의 2021 Node)의 ID를 반드시 확인'''하여 일치시킬 것. | ||
+ | * 작년도 ID의 변경이 필요하다고 생각되는 경우에는 이야기할 것. | ||
− | + | ===분류별 ID=== | |
* 자료 유형에 따라 id 부여 방식 통일 | * 자료 유형에 따라 id 부여 방식 통일 | ||
**전시, 도록, 사진, 도면 → prefix 로 사용, 키워드 부가 가능 | **전시, 도록, 사진, 도면 → prefix 로 사용, 키워드 부가 가능 | ||
30번째 줄: | 32번째 줄: | ||
** 경복궁_근정전, 경복궁_광화문, 사직단_제기고, 사직단_삼문 | ** 경복궁_근정전, 경복궁_광화문, 사직단_제기고, 사직단_삼문 | ||
− | ==='''Label''' | + | * 주련 현판은 ID, Label 모두 중간에 띄어쓰기. (석어당_주련) |
+ | ** 석어당_주련(Label은 주련: 주련에 적혀져있는 Text / Class는 Object)- 곤륜산, 서왕무(Info는 isRelatedTo ) | ||
+ | ** 석어당_현판(Label은 현판: 석어당) | ||
+ | |||
+ | === DBA에서 ID 변경하는 법 === | ||
+ | # ID검색 후 Node ID Manager 클릭 | ||
+ | # 첫번째의 Change Node Id에 변경하고자하는 ID 기재 후 옆 icon 누름 | ||
+ | # 두 번째의 Change Source and Target Id In Relation Links에 변경하고자 하는 ID기재 후 옆 icon 누름 | ||
+ | |||
+ | =='''Label'''== | ||
* label은 256자 이상 불가 | * label은 256자 이상 불가 | ||
** 엑셀에서 len 함수 이용하여 글자 수 확인할 것 | ** 엑셀에서 len 함수 이용하여 글자 수 확인할 것 | ||
36번째 줄: | 47번째 줄: | ||
** 이외의 이모티콘은 가능 | ** 이외의 이모티콘은 가능 | ||
− | + | =='''infoURL'''== | |
* InfoUrl은 다양한 노드를 묶은 집합node가 아닌 이상 빈칸일 수 없음. | * InfoUrl은 다양한 노드를 묶은 집합node가 아닌 이상 빈칸일 수 없음. | ||
** 없는 경우: 다양한 data를 묶어준 집합node - 정해년진찬 물품 등 (집합node 관련하여 하기에 자세히 기재) | ** 없는 경우: 다양한 data를 묶어준 집합node - 정해년진찬 물품 등 (집합node 관련하여 하기에 자세히 기재) | ||
45번째 줄: | 56번째 줄: | ||
** '''작년도 노드에 있다고 위키페이지가 모두 있는 것은 아니니 반드시 확인할 것''' | ** '''작년도 노드에 있다고 위키페이지가 모두 있는 것은 아니니 반드시 확인할 것''' | ||
− | + | =='''note'''== | |
* 작업자 이름 혹은 기초(제안 때 만들었던 data), 2020(작년도 한양도성 data) | * 작업자 이름 혹은 기초(제안 때 만들었던 data), 2020(작년도 한양도성 data) | ||
* 2020년 노드에 본인 이름 X (2020만 기재) | * 2020년 노드에 본인 이름 X (2020만 기재) | ||
− | + | =='''사진 등 참고자료의 출처'''== | |
* 도서 스캔 등 옛 사진의 출처: Label에 원 도서명 기재 | * 도서 스캔 등 옛 사진의 출처: Label에 원 도서명 기재 | ||
** 온라인으로 퍼블리싱한 곳은 쓰지 않음 | ** 온라인으로 퍼블리싱한 곳은 쓰지 않음 | ||
55번째 줄: | 66번째 줄: | ||
** label(표제,출처,날짜)과 Remark(기타 내용)에다 나누어서 넣음 | ** label(표제,출처,날짜)과 Remark(기타 내용)에다 나누어서 넣음 | ||
− | + | ==이미지 관련== | |
* '''사진은 방향 반드시 확인하고, 맞는 방향으로 업로드할 것''' | * '''사진은 방향 반드시 확인하고, 맞는 방향으로 업로드할 것''' | ||
* 이미지는 Data 제출 후 모두 업로드하여 Data Review가 가능하도록 할 것 | * 이미지는 Data 제출 후 모두 업로드하여 Data Review가 가능하도록 할 것 | ||
− | + | ==Web Resource== | |
* WebResource: C Text, 장서각, 네이버 지식사전, 위키 등 | * WebResource: C Text, 장서각, 네이버 지식사전, 위키 등 | ||
− | ** 대표 Node와 연결하고, Relation은 | + | ** 대표 Node와 연결하고, Relation은 isShownAt 텍스트, isShownBy 사진 및 영상 등 멀티미디어 |
** 사진 및 영상 등이 많다면, 요즘 찍은 사진 및 동영상은 WebResource, 옛날 것은 시멘틱 데이터로 보여줌 | ** 사진 및 영상 등이 많다면, 요즘 찍은 사진 및 동영상은 WebResource, 옛날 것은 시멘틱 데이터로 보여줌 | ||
− | + | ===groupName=== | |
* Web Resource의 groupName: (text) 해설, 참고, 원문, / (multimedia) 사진, 동영상, 도면, 그림, 지도, 3D_지도, 3D_모델 | * Web Resource의 groupName: (text) 해설, 참고, 원문, / (multimedia) 사진, 동영상, 도면, 그림, 지도, 3D_지도, 3D_모델 | ||
* 해설: 사전적 성격의 웹자원 (민백, 두산백과, 실록사전과 위키피디아 등 위키, 한국민속대백과, 바이두 등) | * 해설: 사전적 성격의 웹자원 (민백, 두산백과, 실록사전과 위키피디아 등 위키, 한국민속대백과, 바이두 등) | ||
** Naver로 검색된 결과가 아닌 실제 URL로 기재(민백, 두산백과, 위키 등) | ** Naver로 검색된 결과가 아닌 실제 URL로 기재(민백, 두산백과, 위키 등) | ||
− | * 참고: 네이버 지식백과, 문화재청 등 | + | * 참고: 네이버 지식백과, 문화재청 등 원문, 해설이 아닌 모든 것 |
** 위키의 resource 칸에 3가지 Category 기재: 네이버 지식백과 > 문화원형백과, 네이버캐스트 등 > 하위 Category | ** 위키의 resource 칸에 3가지 Category 기재: 네이버 지식백과 > 문화원형백과, 네이버캐스트 등 > 하위 Category | ||
** Data의 Label: 3가지 Category ☞ 항목 | ** Data의 Label: 3가지 Category ☞ 항목 | ||
*** 네이버 지식백과 > 네이버캐스트 > 인물한국사 ☞ 명성황후 | *** 네이버 지식백과 > 네이버캐스트 > 인물한국사 ☞ 명성황후 | ||
− | + | =='''Link 관련 지침'''== | |
* 순접과 역접은 본인의 DATA에 따라 진행하면 됨. 둘다 맞다면 모두 유지할 예정 | * 순접과 역접은 본인의 DATA에 따라 진행하면 됨. 둘다 맞다면 모두 유지할 예정 | ||
** 그림A-사건B: 본인의 data에 그림A와 연결된 노드가 많으면 A depices B, 사건B와 연결된 노드가 많으면 B isDepictedIn A | ** 그림A-사건B: 본인의 data에 그림A와 연결된 노드가 많으면 A depices B, 사건B와 연결된 노드가 많으면 B isDepictedIn A | ||
80번째 줄: | 91번째 줄: | ||
* 주의할 것: depicts: 문헌 등에 시각적으로 묘사한 것! (글은 mentions) | * 주의할 것: depicts: 문헌 등에 시각적으로 묘사한 것! (글은 mentions) | ||
− | + | =='''이칭의 노드화'''== | |
− | * | + | * 조선_태조 - 이성계(고려의 장군)처럼 이칭이 반드시 필요한 경우만 별도 노드로 생성 |
** 사투리,약간의 표기차이 등 노드화할 가치가 없는 것은 좀더 비중이 있는 항목만 노드화하고, Label을 A/B로 할 것 | ** 사투리,약간의 표기차이 등 노드화할 가치가 없는 것은 좀더 비중이 있는 항목만 노드화하고, Label을 A/B로 할 것 | ||
− | + | =='''집합node 신설'''== | |
* 집합node란: 다양한 data를 묶어준 node로 공node라고도 불림 | * 집합node란: 다양한 data를 묶어준 node로 공node라고도 불림 | ||
** 정해년진찬_물품, 환구단_정비_계획1 | ** 정해년진찬_물품, 환구단_정비_계획1 | ||
95번째 줄: | 106번째 줄: | ||
** 도면일 경우, 위키페이지에 모든 도면을 언제, 무슨 프로젝트에서 쓰인 도면인지 설명 등을 기재 | ** 도면일 경우, 위키페이지에 모든 도면을 언제, 무슨 프로젝트에서 쓰인 도면인지 설명 등을 기재 | ||
* iconUrl: groupName별 아이콘이 배포될 예정 | * iconUrl: groupName별 아이콘이 배포될 예정 | ||
− | ** 도면 등 공node의 아이콘은 listing.png 이용 | + | ** 도면 등 공node의 아이콘은 listing.png 이용 (http://digerati.aks.ac.kr/DhLab/2021/hanyang/icon/listing.png) |
− | =='''Node 관련 지침'''== | + | == 인물의 관직, 관청 관련 사항 == |
− | ==='''Actor''' | + | === 관직 id === |
+ | * 관직과 관청을 묶어서 id생성(의정부영의정 O, 영의정 X -> 관직명만 쓰는거 X) | ||
+ | * 2020 db에 둘다 있는 경우가 있는데, 관청 안붙은 id에 연결된 데이터가 있는 경우 따로 체크하여 이야기 주세요 (2021에는 관청명 붙은 id로 생성) | ||
+ | * 2020 db의 id 관직 앞에 증, 겸, 행, 수 붙어있는 것은 떼고 생각하시면 됩니다 (증: 죽고나서 붙는것, 겸: 겸직하는것, 행: 품계보다 낮은 관직 받는 것, 수: 품계보다 높은 관직 받는 것 / 2020: 증 영의정 -> 2021: 의정부영의정) | ||
+ | |||
+ | === 관청관직 === | ||
+ | * 인물의 관직은 민백에 있는 관직만 데이터화하면 되며, 관직과 관청정보는 네이버지식백과에서 찾으면 믿을만한 정보가 바로 나옵니다 (https://terms.naver.com/search.naver?query=%EB%8C%80%EC%A0%9C%ED%95%99&searchType=&dicType=&subject=) / ex. 대제학: 홍문관대제학, 예문관대제학 2가지가 있음! | ||
+ | * 관직에 대한 관청이 여러가지라 찾기 어려울 경우, 조선왕조실록사이트(http://sillok.history.go.kr/main/main.do)에서 인물 관직으로 치면 관련자료가 나옵니다(ex. 정사룡 대제학) | ||
+ | |||
+ | ===관직관청 관련 relation=== | ||
+ | * 인물 servedAs 관직 (ex. 인물 servedAs 의정부좌의정) | ||
+ | * 관직 isOfficialPositionOf 관청 (ex. 의정부좌의정 isOfficialPositionOf 의정부) | ||
+ | |||
+ | ='''Node 관련 지침'''= | ||
+ | ==개요== | ||
+ | * 노드: 모든 개념을 노드화하는 것이 아님. 그래프 가독성을 고려하여 대상에 대한 해설은 해설문으로 설명하고, 굵직한 관계 혹은 '''유형화하여 다른 네트워크를 만들 것만 노드화'''할 것. | ||
+ | * 내가 이것을 유형화하여 그래프를 만들 것인가를 고려하여 노드화. | ||
+ | ** 덕수궁_중화전(Architecture) - type 정전(Concept) - type 경복궁_근정전(Architecture) | ||
+ | *** 위처럼 정전을 유형화하여 각 궁궐의 정전을 연결할 예정: 노드화 가능 | ||
+ | ** 덕수궁_중화전(Architecture) - type 정전(Concept) | ||
+ | *** 위처럼 정전을 유형화하였으나 각 궁궐의 정절을 연결할 예정이 없으면: 노드화 불가능 | ||
+ | |||
+ | === 이름, 용도, 사용자가 바뀐 경우 === | ||
+ | * 별도 노드화 가능한 경우: 당시의 사진 및 자료가 있는 경우 노드화 가능 | ||
+ | * ID는 현재의 권역_전각의 예전이름 | ||
+ | ** 덕수궁_태극전 (O) | ||
+ | *** 경운궁_태극전 (X): 태극전은 덕수궁 이전의 경운궁 시절 중화전의 이름이나 ID 관리를 위하여 경운궁으로 명명하지 않음 | ||
+ | |||
+ | =='''Actor'''== | ||
*인물 ID는 본명, 정식 명칭을 기준으로 정의 | *인물 ID는 본명, 정식 명칭을 기준으로 정의 | ||
**도산 안창호 -> 안창호 | **도산 안창호 -> 안창호 | ||
112번째 줄: | 151번째 줄: | ||
** 여러 개의 경우: ,_ 로 표현) | ** 여러 개의 경우: ,_ 로 표현) | ||
− | + | =='''Event'''== | |
* Label은 _제외한 id + 일자(기간)를 기재 | * Label은 _제외한 id + 일자(기간)를 기재 | ||
** 13도 창의군 1907~1910, 가쓰라-태프트 비밀협약 1905, 경성고등연예관 설립 1910 | ** 13도 창의군 1907~1910, 가쓰라-태프트 비밀협약 1905, 경성고등연예관 설립 1910 | ||
119번째 줄: | 158번째 줄: | ||
* 이칭은 많이 쓰이는 이칭을 기재 (ex.강화도조약-조일수호조규) | * 이칭은 많이 쓰이는 이칭을 기재 (ex.강화도조약-조일수호조규) | ||
− | + | =='''Place'''== | |
* ID: 궁궐의 경우 큰건물 및 권역_부속건물 | * ID: 궁궐의 경우 큰건물 및 권역_부속건물 | ||
** 경복궁_근정전, 경복궁_광화문, 사직단_제기고, 사직단_삼문 | ** 경복궁_근정전, 경복궁_광화문, 사직단_제기고, 사직단_삼문 | ||
127번째 줄: | 166번째 줄: | ||
* 주소는 현대적 주소가 있는 경우 기재 | * 주소는 현대적 주소가 있는 경우 기재 | ||
* 경도와 위도는 확인하여 기재하고, 고도와 이칭은 필요한 경우 기재 | * 경도와 위도는 확인하여 기재하고, 고도와 이칭은 필요한 경우 기재 | ||
+ | * 지역구 이름은 해당 시 이름_Place 로 함 (Label은 시 이름 빼고) | ||
+ | ** 서울_정동 (label은 정동), 서울_남산 (label은 남산) | ||
− | + | =='''Architecture'''== | |
* Architecture는 3D모델, 3D지도의 대상이 되는 것이며 이외에는 Place 임 | * Architecture는 3D모델, 3D지도의 대상이 되는 것이며 이외에는 Place 임 | ||
* groupName: 건축, 조형 | * groupName: 건축, 조형 | ||
* partName은 건축중 궁궐과 왕실인 경우 기재 : 건축-궁궐건축, 건축-왕실건축 | * partName은 건축중 궁궐과 왕실인 경우 기재 : 건축-궁궐건축, 건축-왕실건축 | ||
− | + | =='''Object'''== | |
− | * | + | * 기록화: 라벨에는 작품명 《한자》(작품명 뒤에 공백 한칸)로 기재, 한자 부분에는 《한자》 |
** 강희언-인왕산도 《仁王山圖》 | ** 강희언-인왕산도 《仁王山圖》 | ||
− | + | * remark에는 【제작일자】. 재료, 크기, 소장처 기재. (마침표 유의) | |
− | * remark에는 | + | ** 크기와 재료는 박물관 도록에 목록화되는 크기와 재료 |
− | ** 크기와 재료는 박물관 도록에 목록화되는 크기와 | + | ** 【1600년】. 지본담채, 32.3×49.5㎝, 한국학중앙연구원 장서각. |
− | ** | + | ** 【1583년경】. 견본수묵, 93.0×60.0㎝, 개인소장. |
− | ** | ||
− | + | =='''Record'''== | |
* groupName: 그림, 금석문, 기록, 기사, 문헌, 뮤지컬, 사진, 사진첩, 신문, 엽서, 외국도서, 외국신문, 음악, 의궤, 의장, 일기, 천문도, 도면 | * groupName: 그림, 금석문, 기록, 기사, 문헌, 뮤지컬, 사진, 사진첩, 신문, 엽서, 외국도서, 외국신문, 음악, 의궤, 의장, 일기, 천문도, 도면 | ||
* 저작년과 간행년(확인될 경우 기재) | * 저작년과 간행년(확인될 경우 기재) | ||
148번째 줄: | 188번째 줄: | ||
* 이칭은 번역서가 따로 만들어져 있지 않으며 이름이 다를 경우 기재 | * 이칭은 번역서가 따로 만들어져 있지 않으며 이름이 다를 경우 기재 | ||
− | * 옛사진 스캔한 자료 - FTP 업로드한 url, 출처는 label에 표시 (예: 조선고적도보) | + | * 옛사진 스캔한 자료 - remark에는 FTP 업로드한 url, 출처는 label에 표시 (예: 조선고적도보) |
* 현재 사진(예: 일간지 보도에 실린 사진) - 실제 url 그대로 infoUrl 에 사용 / 출처는 label, 추가적인 캡션 내용은 remarks | * 현재 사진(예: 일간지 보도에 실린 사진) - 실제 url 그대로 infoUrl 에 사용 / 출처는 label, 추가적인 캡션 내용은 remarks | ||
* 도면도 모두 Record로 취급 | * 도면도 모두 Record로 취급 | ||
− | + | ===Record vs Object=== | |
* 사진 Record , 유리원판도 Record | * 사진 Record , 유리원판도 Record | ||
** 기념사진 isDerivativeOf (~의 파생물이다) 유리원판 및 기념일 | ** 기념사진 isDerivativeOf (~의 파생물이다) 유리원판 및 기념일 | ||
− | + | =='''Concept'''== | |
* 모든 역사적 사실을 노드화할 필요는 없으며, 개념어의 뜻 풀이 시 필요 | * 모든 역사적 사실을 노드화할 필요는 없으며, 개념어의 뜻 풀이 시 필요 | ||
− | + | =='''Multimedia'''== | |
* '''3D지도, 3D모델인 경우만!! (이외에는 Record)''' | * '''3D지도, 3D모델인 경우만!! (이외에는 Record)''' | ||
* 노드의 접두어: 표석은 vmap-, 이외에는 3d- | * 노드의 접두어: 표석은 vmap-, 이외에는 3d- | ||
** 3d-앨버트_테일러_가옥, vmap-관상감_터 | ** 3d-앨버트_테일러_가옥, vmap-관상감_터 | ||
− | + | =='''Story'''== | |
* Story 구성의 기준: 반드시 다른 Fact 노드들과 적어도 3개, 보통 5~6개는 Relation이 있어야 함 | * Story 구성의 기준: 반드시 다른 Fact 노드들과 적어도 3개, 보통 5~6개는 Relation이 있어야 함 | ||
* groupName: 보통의 경우에는 Episode, Storyline은 4~5개의 Episode를 포함 | * groupName: 보통의 경우에는 Episode, Storyline은 4~5개의 Episode를 포함 | ||
175번째 줄: | 215번째 줄: | ||
**E6: 서울역 | **E6: 서울역 | ||
* 권역 이외 Story: E0-000 | * 권역 이외 Story: E0-000 | ||
− | + | ||
− | + | * 영어 Story는 500번대, 중국어 Story는 700번대 | |
− | * 영어 Story는 500번대, 중국어 Story는 | ||
* Story 중복 여부 재검토 필요. note에 담당자 이름 표시. | * Story 중복 여부 재검토 필요. note에 담당자 이름 표시. | ||
184번째 줄: | 223번째 줄: | ||
**E1-027 Story Episode 고종황제의 오순 축하 진연 | **E1-027 Story Episode 고종황제의 오순 축하 진연 | ||
− | + | ===인문정보학과 필수 Story=== | |
* '''인문정보학도 본인의 작업물을 포괄하거나 성격을 보여줄 수 있는 최소 1건의 StoryLine을 만들어야 함.''' | * '''인문정보학도 본인의 작업물을 포괄하거나 성격을 보여줄 수 있는 최소 1건의 StoryLine을 만들어야 함.''' | ||
** 이것도 외국어 Story로 번역할 예정 | ** 이것도 외국어 Story로 번역할 예정 | ||
− | + | ='''☑️Data Cleansing을 위한 체크 리스트☑️'''= | |
− | + | ==1단계== | |
− | |||
*WorkSheet 표준 양식 준수 | *WorkSheet 표준 양식 준수 | ||
*Ontology 어휘 준수 | *Ontology 어휘 준수 | ||
− | + | ==2단계== | |
*문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation | *문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation | ||
*문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인. | *문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인. | ||
*id 문자열 중간 공백의 언더바(_) 처리. | *id 문자열 중간 공백의 언더바(_) 처리. | ||
− | + | ==3단계== | |
*노드의 중복 확인 | *노드의 중복 확인 | ||
**1차(기계적 체크): 문자열 일치 확인. '[https://excelyouth.tistory.com/34 조건부 서식-중복 값]' 활용 | **1차(기계적 체크): 문자열 일치 확인. '[https://excelyouth.tistory.com/34 조건부 서식-중복 값]' 활용 | ||
205번째 줄: | 243번째 줄: | ||
*Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인. '[https://xlworks.net/excel-vlookup-hlookup/ VLOOKUP 함수]' 활용 | *Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인. '[https://xlworks.net/excel-vlookup-hlookup/ VLOOKUP 함수]' 활용 | ||
− | + | ==그밖에 놓치기 쉬운 것들== | |
*마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인 | *마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인 | ||
*외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인 | *외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인 |
2022년 9월 16일 (금) 11:06 기준 최신판
WorkSheet 전반적 지침
id
규칙
- 중요한 것: id=label이 아님을 명심할 것!!
- 정확한 이름은 label로 보여주므로 ID는 식별되는 정도로 축약할 것 (20자 이상 불가)
- 하이픈(-), 콜론(:), 언더바(_) 외의 기호, 특수문자 사용 금지
- 콜론(:)은 앞은 붙이고 뒤만 뜀. (A:_abc)
- .은 3.1이나 8.15와 같은 고유명사만 가능함.
- .와 ()와 ,와 ·(가운데점)과 & 도 불가능합니다!!!
- single quotation은 ㄴ+한자를 눌러서 ’(9번째 있는 것) 쓸 것
- 라틴문자: 움나우트 제외하고 씀 -> ä는 a로 기재
- 한글자 짜리 id: 반드시 한자 병기
- 기 등록된 Node (2020, 기초, 다른 사람들의 2021 Node)의 ID를 반드시 확인하여 일치시킬 것.
- 작년도 ID의 변경이 필요하다고 생각되는 경우에는 이야기할 것.
분류별 ID
- 자료 유형에 따라 id 부여 방식 통일
- 전시, 도록, 사진, 도면 → prefix 로 사용, 키워드 부가 가능
- 책의 ID: 문헌-저자이름-연도
- 문헌-알렌-1864 / 2권이상일 시: 문헌-알렌-1864_2
- 책이 다른 연도에 쓰여져서 2개인 것: 책이름_1, 책이름_2 로 기재
- 책 안의 사진: 사진-알렌-1864_제중원, 사진-조선고적도보-숭례문_1,2,3
- 전시ID: 전시-, / 온라인 전시: 온라인전시-
- 전시-서울학교_100년 / 온라인전시-서울학교_100년
- 보고서: 보고서-문화재청-2018 / 여러개인 경우 : 보고서-문화재청-2018-덕수궁
- 보고서 내의 사진: 사진-문화재청-2018_숭례문 / 사진-문화재청-2018_숭례문_1,2,3
- 궁궐(Place)의 ID: 궁궐의 경우 큰건물 및 권역_부속건물
- 경복궁_근정전, 경복궁_광화문, 사직단_제기고, 사직단_삼문
- 주련 현판은 ID, Label 모두 중간에 띄어쓰기. (석어당_주련)
- 석어당_주련(Label은 주련: 주련에 적혀져있는 Text / Class는 Object)- 곤륜산, 서왕무(Info는 isRelatedTo )
- 석어당_현판(Label은 현판: 석어당)
DBA에서 ID 변경하는 법
- ID검색 후 Node ID Manager 클릭
- 첫번째의 Change Node Id에 변경하고자하는 ID 기재 후 옆 icon 누름
- 두 번째의 Change Source and Target Id In Relation Links에 변경하고자 하는 ID기재 후 옆 icon 누름
Label
- label은 256자 이상 불가
- 엑셀에서 len 함수 이용하여 글자 수 확인할 것
- Label에도 Single quotation, Double quotation은 ㄴ+한자를 눌러서 나오는 것으로 이용
- 이외의 이모티콘은 가능
infoURL
- InfoUrl은 다양한 노드를 묶은 집합node가 아닌 이상 빈칸일 수 없음.
- 없는 경우: 다양한 data를 묶어준 집합node - 정해년진찬 물품 등 (집합node 관련하여 하기에 자세히 기재)
- hanyang2 위키는 만들만한 가치가 있는 것 중 자신이 만들 위키페이지인 경우에만 기재
- 이외에는 온라인 상의 Resource(민백, 장서각, 실록위키 등) URL을 기재
- 작년도 위키페이지: 작년 DATA를 그대로 쓸거면 작년도 위키URL을 쓰고, 수정 및 보완할 예정이면 올해 위키로 복붙하나 양식은 올해에 맞게 변형하여 올리기
- 작년도 노드에 있다고 위키페이지가 모두 있는 것은 아니니 반드시 확인할 것
note
- 작업자 이름 혹은 기초(제안 때 만들었던 data), 2020(작년도 한양도성 data)
- 2020년 노드에 본인 이름 X (2020만 기재)
사진 등 참고자료의 출처
- 도서 스캔 등 옛 사진의 출처: Label에 원 도서명 기재
- 온라인으로 퍼블리싱한 곳은 쓰지 않음
- 신문사의 보도사진: 위키에도 WebResource 로, Data에도 WebResource 로 들어감!
- label(표제,출처,날짜)과 Remark(기타 내용)에다 나누어서 넣음
이미지 관련
- 사진은 방향 반드시 확인하고, 맞는 방향으로 업로드할 것
- 이미지는 Data 제출 후 모두 업로드하여 Data Review가 가능하도록 할 것
Web Resource
- WebResource: C Text, 장서각, 네이버 지식사전, 위키 등
- 대표 Node와 연결하고, Relation은 isShownAt 텍스트, isShownBy 사진 및 영상 등 멀티미디어
- 사진 및 영상 등이 많다면, 요즘 찍은 사진 및 동영상은 WebResource, 옛날 것은 시멘틱 데이터로 보여줌
groupName
- Web Resource의 groupName: (text) 해설, 참고, 원문, / (multimedia) 사진, 동영상, 도면, 그림, 지도, 3D_지도, 3D_모델
- 해설: 사전적 성격의 웹자원 (민백, 두산백과, 실록사전과 위키피디아 등 위키, 한국민속대백과, 바이두 등)
- Naver로 검색된 결과가 아닌 실제 URL로 기재(민백, 두산백과, 위키 등)
- 참고: 네이버 지식백과, 문화재청 등 원문, 해설이 아닌 모든 것
- 위키의 resource 칸에 3가지 Category 기재: 네이버 지식백과 > 문화원형백과, 네이버캐스트 등 > 하위 Category
- Data의 Label: 3가지 Category ☞ 항목
- 네이버 지식백과 > 네이버캐스트 > 인물한국사 ☞ 명성황후
Link 관련 지침
- 순접과 역접은 본인의 DATA에 따라 진행하면 됨. 둘다 맞다면 모두 유지할 예정
- 그림A-사건B: 본인의 data에 그림A와 연결된 노드가 많으면 A depices B, 사건B와 연결된 노드가 많으면 B isDepictedIn A
- 추상적으로 설명하면 isRelratedTo / 구체적으로 설명하게 되면 depicts과 같은 다른 relation이 되는 것
- ex. A라는 문헌은 B라는 인물과 isRelratedTo / A라는 문헌에 C라는 사건을 depicts, C라는 사건은 B라는 인물이 participatesIn
- 주의할 것: depicts: 문헌 등에 시각적으로 묘사한 것! (글은 mentions)
이칭의 노드화
- 조선_태조 - 이성계(고려의 장군)처럼 이칭이 반드시 필요한 경우만 별도 노드로 생성
- 사투리,약간의 표기차이 등 노드화할 가치가 없는 것은 좀더 비중이 있는 항목만 노드화하고, Label을 A/B로 할 것
집합node 신설
- 집합node란: 다양한 data를 묶어준 node로 공node라고도 불림
- 정해년진찬_물품, 환구단_정비_계획1
- 사진이 많은 경우 집합node 생성할 것
- 주요node와 집합node를 연결하고, 집합node 내 개별자료는 집합node랑만 연결 (중요node와 연결 X)
- 건물(환구단) isRelatedTo 집합노드(label: 환구단 정비 기본계획 2007) hasPart 개별사진
- 건물(환구단) isRelatedTo 집합노드(label: 환구단 정비 기본계획 2007) hasPart 집합노드(도면) includes 개별도면
- Class: 하위노드의 Class를 동일하게 기재
- InfoUrl: 빈칸 가능하나, 해당 위키페이지에서 다양한 시각자료를 한번에 보여줄 수 있으면 더 좋음.
- 도면일 경우, 위키페이지에 모든 도면을 언제, 무슨 프로젝트에서 쓰인 도면인지 설명 등을 기재
- iconUrl: groupName별 아이콘이 배포될 예정
- 도면 등 공node의 아이콘은 listing.png 이용 (http://digerati.aks.ac.kr/DhLab/2021/hanyang/icon/listing.png)
인물의 관직, 관청 관련 사항
관직 id
- 관직과 관청을 묶어서 id생성(의정부영의정 O, 영의정 X -> 관직명만 쓰는거 X)
- 2020 db에 둘다 있는 경우가 있는데, 관청 안붙은 id에 연결된 데이터가 있는 경우 따로 체크하여 이야기 주세요 (2021에는 관청명 붙은 id로 생성)
- 2020 db의 id 관직 앞에 증, 겸, 행, 수 붙어있는 것은 떼고 생각하시면 됩니다 (증: 죽고나서 붙는것, 겸: 겸직하는것, 행: 품계보다 낮은 관직 받는 것, 수: 품계보다 높은 관직 받는 것 / 2020: 증 영의정 -> 2021: 의정부영의정)
관청관직
- 인물의 관직은 민백에 있는 관직만 데이터화하면 되며, 관직과 관청정보는 네이버지식백과에서 찾으면 믿을만한 정보가 바로 나옵니다 (https://terms.naver.com/search.naver?query=%EB%8C%80%EC%A0%9C%ED%95%99&searchType=&dicType=&subject=) / ex. 대제학: 홍문관대제학, 예문관대제학 2가지가 있음!
- 관직에 대한 관청이 여러가지라 찾기 어려울 경우, 조선왕조실록사이트(http://sillok.history.go.kr/main/main.do)에서 인물 관직으로 치면 관련자료가 나옵니다(ex. 정사룡 대제학)
관직관청 관련 relation
- 인물 servedAs 관직 (ex. 인물 servedAs 의정부좌의정)
- 관직 isOfficialPositionOf 관청 (ex. 의정부좌의정 isOfficialPositionOf 의정부)
Node 관련 지침
개요
- 노드: 모든 개념을 노드화하는 것이 아님. 그래프 가독성을 고려하여 대상에 대한 해설은 해설문으로 설명하고, 굵직한 관계 혹은 유형화하여 다른 네트워크를 만들 것만 노드화할 것.
- 내가 이것을 유형화하여 그래프를 만들 것인가를 고려하여 노드화.
- 덕수궁_중화전(Architecture) - type 정전(Concept) - type 경복궁_근정전(Architecture)
- 위처럼 정전을 유형화하여 각 궁궐의 정전을 연결할 예정: 노드화 가능
- 덕수궁_중화전(Architecture) - type 정전(Concept)
- 위처럼 정전을 유형화하였으나 각 궁궐의 정절을 연결할 예정이 없으면: 노드화 불가능
- 덕수궁_중화전(Architecture) - type 정전(Concept) - type 경복궁_근정전(Architecture)
이름, 용도, 사용자가 바뀐 경우
- 별도 노드화 가능한 경우: 당시의 사진 및 자료가 있는 경우 노드화 가능
- ID는 현재의 권역_전각의 예전이름
- 덕수궁_태극전 (O)
- 경운궁_태극전 (X): 태극전은 덕수궁 이전의 경운궁 시절 중화전의 이름이나 ID 관리를 위하여 경운궁으로 명명하지 않음
- 덕수궁_태극전 (O)
Actor
- 인물 ID는 본명, 정식 명칭을 기준으로 정의
- 도산 안창호 -> 안창호
- 언더우드 -> 호러스_그랜트_언더우드
- 인물의 Label은 반드시 다음과 같이 기재
- 한글명(한자, 생~몰년)
- 영문이름 풀네임 (한글발음)
- remark 에는 Definition 기재
- 【생(시작)~몰년(끝)】. 이후 설명. (끝에 . 붙일 것)
- 날짜표기법: 2021-07-22 (연도 4자리-월 2자리-일2자리) / 음력: 2021-02-10(음) / 연도 혹은 년월만 제시되었을 경우: 1876년(고종 10)~1876-02월(음)
- 이칭은 모든 이칭(호 등)을 다 쓰지 말고 유의미한 것만을 적으며, isSameAs로 연결할 수 있는 것.
- 즉, 조선 태조-이성계, 왕비-대비가 되어 이름이 바뀌는 경우에만 기재
- 여러 개의 경우: ,_ 로 표현)
Event
- Label은 _제외한 id + 일자(기간)를 기재
- 13도 창의군 1907~1910, 가쓰라-태프트 비밀협약 1905, 경성고등연예관 설립 1910
- remark에는 시작연도와 종료연도 기재
- 날짜 표현은 Actor와 동일 -> 【생(시작)~몰년(끝)】. 이후 설명이 있으면 설명 기재. (끝에 . 붙일 것)
- 이칭은 많이 쓰이는 이칭을 기재 (ex.강화도조약-조일수호조규)
Place
- ID: 궁궐의 경우 큰건물 및 권역_부속건물
- 경복궁_근정전, 경복궁_광화문, 사직단_제기고, 사직단_삼문
- groupName: 객관, 교회, 궁궐, 극장, 능묘, 병원, 사당, 사찰, 서원, 서울시문화재표석, 시장, 외국공관, 장소, 제단, 주택, 진전, 호텔 등
- partName은 서울시문화재표석인 경우 기재
- 표석-고지명, 표석-관아, 표석-근대유산, 표석-서원/향교, 표석-왕실유적, 표석-인물유적
- 주소는 현대적 주소가 있는 경우 기재
- 경도와 위도는 확인하여 기재하고, 고도와 이칭은 필요한 경우 기재
- 지역구 이름은 해당 시 이름_Place 로 함 (Label은 시 이름 빼고)
- 서울_정동 (label은 정동), 서울_남산 (label은 남산)
Architecture
- Architecture는 3D모델, 3D지도의 대상이 되는 것이며 이외에는 Place 임
- groupName: 건축, 조형
- partName은 건축중 궁궐과 왕실인 경우 기재 : 건축-궁궐건축, 건축-왕실건축
Object
- 기록화: 라벨에는 작품명 《한자》(작품명 뒤에 공백 한칸)로 기재, 한자 부분에는 《한자》
- 강희언-인왕산도 《仁王山圖》
- remark에는 【제작일자】. 재료, 크기, 소장처 기재. (마침표 유의)
- 크기와 재료는 박물관 도록에 목록화되는 크기와 재료
- 【1600년】. 지본담채, 32.3×49.5㎝, 한국학중앙연구원 장서각.
- 【1583년경】. 견본수묵, 93.0×60.0㎝, 개인소장.
Record
- groupName: 그림, 금석문, 기록, 기사, 문헌, 뮤지컬, 사진, 사진첩, 신문, 엽서, 외국도서, 외국신문, 음악, 의궤, 의장, 일기, 천문도, 도면
- 저작년과 간행년(확인될 경우 기재)
- 외국서인 경우 간행국과 언어를 기재
- 이칭은 번역서가 따로 만들어져 있지 않으며 이름이 다를 경우 기재
- 옛사진 스캔한 자료 - remark에는 FTP 업로드한 url, 출처는 label에 표시 (예: 조선고적도보)
- 현재 사진(예: 일간지 보도에 실린 사진) - 실제 url 그대로 infoUrl 에 사용 / 출처는 label, 추가적인 캡션 내용은 remarks
- 도면도 모두 Record로 취급
Record vs Object
- 사진 Record , 유리원판도 Record
- 기념사진 isDerivativeOf (~의 파생물이다) 유리원판 및 기념일
Concept
- 모든 역사적 사실을 노드화할 필요는 없으며, 개념어의 뜻 풀이 시 필요
Multimedia
- 3D지도, 3D모델인 경우만!! (이외에는 Record)
- 노드의 접두어: 표석은 vmap-, 이외에는 3d-
- 3d-앨버트_테일러_가옥, vmap-관상감_터
Story
- Story 구성의 기준: 반드시 다른 Fact 노드들과 적어도 3개, 보통 5~6개는 Relation이 있어야 함
- groupName: 보통의 경우에는 Episode, Storyline은 4~5개의 Episode를 포함
- Story의 주제별 번호
- E1: 덕수궁
- E2: 정동
- E3: 환구단
- E4: 남대문
- E5: 독립문
- E6: 서울역
- 권역 이외 Story: E0-000
- 영어 Story는 500번대, 중국어 Story는 700번대
- Story 중복 여부 재검토 필요. note에 담당자 이름 표시.
- 예) E1-012 Story Episode 고종황제 즉위 40주년 기념행사와 기념비각
- E1-026 Story Episode 고종황제 즉위 40주년과 망육 축하 진연
- E1-027 Story Episode 고종황제의 오순 축하 진연
인문정보학과 필수 Story
- 인문정보학도 본인의 작업물을 포괄하거나 성격을 보여줄 수 있는 최소 1건의 StoryLine을 만들어야 함.
- 이것도 외국어 Story로 번역할 예정
☑️Data Cleansing을 위한 체크 리스트☑️
1단계
- WorkSheet 표준 양식 준수
- Ontology 어휘 준수
2단계
- 문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation
- 문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인.
- id 문자열 중간 공백의 언더바(_) 처리.
3단계
- 노드의 중복 확인
- 1차(기계적 체크): 문자열 일치 확인. '조건부 서식-중복 값' 활용
- 2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
- Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인. 'VLOOKUP 함수' 활용
그밖에 놓치기 쉬운 것들
- 마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인
- 외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인