"WorkSheet Manual(2021)"의 두 판 사이의 차이
(→3단계) |
(→Actor) |
||
6번째 줄: | 6번째 줄: | ||
**도산 안창호 -> 안창호 | **도산 안창호 -> 안창호 | ||
**언더우드 -> 호러스_그랜트_언더우드 | **언더우드 -> 호러스_그랜트_언더우드 | ||
+ | * remark 에는 Definition 기재 | ||
+ | ** 【생(시작)~몰년(끝)】 이후 설명. (끝에 . 붙일 것) | ||
+ | ** 날짜표기법: 2021-07-22 (연도 4자리-월 2자리-일2자리) / 음력: 2021-02-10(음) / 연도 혹은 년월만 제시되었을 경우: 1876년(고종 10)~1876-02월(음) | ||
===Record=== | ===Record=== |
2021년 7월 29일 (목) 09:57 판
목차
Node ID 정의를 위한 지침
Actor
- 인물 ID는 본명, 정식 명칭을 기준으로 정의
- 도산 안창호 -> 안창호
- 언더우드 -> 호러스_그랜트_언더우드
- remark 에는 Definition 기재
- 【생(시작)~몰년(끝)】 이후 설명. (끝에 . 붙일 것)
- 날짜표기법: 2021-07-22 (연도 4자리-월 2자리-일2자리) / 음력: 2021-02-10(음) / 연도 혹은 년월만 제시되었을 경우: 1876년(고종 10)~1876-02월(음)
Record
groupName: 사진
Story
- Story의 주제별 번호
- E1:
- E2:
- E3:
- E4:
- E5:
- E6:
☑️Data Cleansing을 위한 체크 리스트☑️
1단계
- WorkSheet 표준 양식 준수
- Ontology 어휘 준수
2단계
- 문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation
- 문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인.
- id 문자열 중간 공백의 언더바(_) 처리.
3단계
- 노드의 중복 확인
- 1차(기계적 체크): 문자열 일치 확인. '조건부 서식-중복 값' 활용
- 2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
- Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인. 'VLOOKUP 함수' 활용
그밖에 놓치기 쉬운 것들
- 마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인
- 외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인