WorkSheet Manual(2021)

hanyang2
서소리 (토론 | 기여)님의 2021년 7월 29일 (목) 01:00 판 (3단계)
이동: 둘러보기, 검색


Node ID 정의를 위한 지침

Actor

  • 인물 ID는 본명, 정식 명칭을 기준으로 정의
    • 도산 안창호 -> 안창호
    • 언더우드 -> 호러스_그랜트_언더우드

Record

groupName: 사진

Story

  • Story의 주제별 번호
    • E1:
    • E2:
    • E3:
    • E4:
    • E5:
    • E6:

☑️Data Cleansing을 위한 체크 리스트☑️

1단계

  • WorkSheet 표준 양식 준수
  • Ontology 어휘 준수

2단계

  • 문자열 앞/뒤 공백 제거. 모든 컬럼이 해당되지만 다음의 컬럼은 반드시 공백 확인: id, class, groupName, partName, source, target, relation
  • 문자열 앞/뒤/중간 불필요한 기호 제거. 예: 문자열 끝에 습관적으로 마침표(.)를 입력하진 않았는지 확인.
  • id 문자열 중간 공백의 언더바(_) 처리.

3단계

  • 노드의 중복 확인
    • 1차(기계적 체크): 문자열 일치 확인. '조건부 서식-중복 값' 활용.
    • 2차:기계적으로 확인되지 않는 것들 체크. 예: 손탁, 앙트와네트_손탁
  • Links의 source, target에 입력한 노드가 노드 리스트에 정의되어 있는지 확인

그밖에 놓치기 쉬운 것들

  • 마우스 드래그를 이용한 '셀 채우기'를 할 때, 불필요한 '연속 데이터 채우기'가 적용되었는지 확인
  • 외부 자원을 복사하여 붙여넣기 할 때, 불필요한 코드값이 입력되어 있는지 확인