"WorkSheet Manual(2021)"의 두 판 사이의 차이
(→3단계) |
(→3단계) |
||
31번째 줄: | 31번째 줄: | ||
===3단계=== | ===3단계=== | ||
*노드의 중복 확인 | *노드의 중복 확인 | ||
− | **1차(기계적 체크): 문자열 일치 확인. '[https://excelyouth.tistory.com/34 조건부 서식-중복 값]' 활용 | + | **1차(기계적 체크): 문자열 일치 확인. '[https://excelyouth.tistory.com/34 조건부 서식-중복 값]' 활용 |
**2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁 | **2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁 | ||
− | *Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인 | + | *Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인/ '[https://xlworks.net/excel-vlookup-hlookup/ VLOOKUP 함수]' 활용 |
===그밖에 놓치기 쉬운 것들=== | ===그밖에 놓치기 쉬운 것들=== |
2021년 7월 29일 (목) 01:03 판
목차
Node ID 정의를 위한 지침
Actor
- 인물 ID는 본명, 정식 명칭을 기준으로 정의
- 도산 안창호 -> 안창호
- 언더우드 -> 호러스_그랜트_언더우드
Record
groupName: 사진
Story
- Story의 주제별 번호
- E1:
- E2:
- E3:
- E4:
- E5:
- E6:
☑️Data Cleansing을 위한 체크 리스트☑️
1단계
- WorkSheet 표준 양식 준수
- Ontology 어휘 준수
2단계
- 문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation
- 문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인.
- id 문자열 중간 공백의 언더바(_) 처리.
3단계
- 노드의 중복 확인
- 1차(기계적 체크): 문자열 일치 확인. '조건부 서식-중복 값' 활용
- 2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
- Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인/ 'VLOOKUP 함수' 활용
그밖에 놓치기 쉬운 것들
- 마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인
- 외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인