"WorkSheet Manual(2021)"의 두 판 사이의 차이

hanyang2
이동: 둘러보기, 검색
(3단계)
(3단계)
31번째 줄: 31번째 줄:
 
===3단계===
 
===3단계===
 
*노드의 중복 확인
 
*노드의 중복 확인
**1차(기계적 체크): 문자열 일치 확인. '[https://excelyouth.tistory.com/34 조건부 서식-중복 값]' 활용.
+
**1차(기계적 체크): 문자열 일치 확인. '[https://excelyouth.tistory.com/34 조건부 서식-중복 값]' 활용
 
**2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
 
**2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
*Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인
+
*Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인/ '[https://xlworks.net/excel-vlookup-hlookup/ VLOOKUP 함수]' 활용
  
 
===그밖에 놓치기 쉬운 것들===
 
===그밖에 놓치기 쉬운 것들===

2021년 7월 29일 (목) 01:03 판


Node ID 정의를 위한 지침

Actor

  • 인물 ID는 본명, 정식 명칭을 기준으로 정의
    • 도산 안창호 -> 안창호
    • 언더우드 -> 호러스_그랜트_언더우드

Record

groupName: 사진

Story

  • Story의 주제별 번호
    • E1:
    • E2:
    • E3:
    • E4:
    • E5:
    • E6:

☑️Data Cleansing을 위한 체크 리스트☑️

1단계

  • WorkSheet 표준 양식 준수
  • Ontology 어휘 준수

2단계

  • 문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation
  • 문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인.
  • id 문자열 중간 공백의 언더바(_) 처리.

3단계

  • 노드의 중복 확인
    • 1차(기계적 체크): 문자열 일치 확인. '조건부 서식-중복 값' 활용
    • 2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
  • Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인/ 'VLOOKUP 함수' 활용

그밖에 놓치기 쉬운 것들

  • 마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인
  • 외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인