"WorkSheet Manual(2021)"의 두 판 사이의 차이
(→Node ID 정의를 위한 가이드라인) |
|||
5번째 줄: | 5번째 줄: | ||
===Record=== | ===Record=== | ||
====groupName: 사진==== | ====groupName: 사진==== | ||
+ | ===Story=== | ||
==☑️Data Cleansing을 위한 체크 리스트☑️== | ==☑️Data Cleansing을 위한 체크 리스트☑️== |
2021년 7월 28일 (수) 23:48 판
목차
Node ID 정의를 위한 가이드라인
Actor
Record
groupName: 사진
Story
☑️Data Cleansing을 위한 체크 리스트☑️
1단계
- WorkSheet 표준 양식 준수
- Ontology 어휘 준수
2단계
- 문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation
- 문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인.
- id 문자열 중간 공백의 언더바(_) 처리.
3단계
- 노드의 중복 확인
- 1차(기계적 체크): 문자열 일치 확인. '조건부 서식' 활용.
- 2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
- Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인
그밖에 놓치기 쉬운 것들
- 마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인
- 외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인