"20180123 회의록"의 두 판 사이의 차이

khw
이동: 둘러보기, 검색
(데이터 정제 결과)
(데이터 정제 결과)
44번째 줄: 44번째 줄:
 
| link || 동일 source-target-relation  || 7,000 || style="background:#ffeaaa;"| '''6,980'''
 
| link || 동일 source-target-relation  || 7,000 || style="background:#ffeaaa;"| '''6,980'''
 
|-
 
|-
| rowspan=5| url || 전체(중복제외) || || style="background:#ffeaaa;"| '''3,901'''
+
| rowspan=4 | url || 전체(중복제외) || || style="background:#ffeaaa;"| '''3,901'''
 
|-
 
|-
 
| Encyves 기사(A) || || 1,980
 
| Encyves 기사(A) || || 1,980
51번째 줄: 51번째 줄:
 
|-
 
|-
 
| 기타 웹자원 || || 334
 
| 기타 웹자원 || || 334
|-
 
| writing || || 982
 
 
|}
 
|}
  

2018년 1월 24일 (수) 15:30 판

← Previous 회의록 Next →
20180118 회의록 20180123 회의록 20180125 회의록


회의내용

  • 중복 제외한 "unique" 노드리스트 및 링크리스트 생성
    • unique node_id : 3840건
    • unique node_id, class, node_label, node_url, node_type :
  • URL 정보가 있는 별도의 테이블 생성
    • node_id, node_url, url_type
    • encyves기사/민백기사/기타외부기사 등을 구분하여 기호로 표기할수 있는 속성 컬럼 추가
  • Encyves 지도 데이터 - node_id 의 GPS data
    • 노드별 gps 좌표를 확인할 수 있는 테이블 생성 ... 노드id, 경도, 위도

데이터 정제 결과

  • node_url을 별도의 "웹자원 노드"로 생성하는 과정에서 nodelist 및 linklist 추가 수정
기준 범위 기존 건수 수정 후 건수
node_id 전체 9,032 9,032
node_id 전체(중복제외) 3,858 3,840
node_label 전체(중복제외) 3,870 3,865
node_id A 1,986 1,979
node_id B1 884 880
node_id B2 964 951
node_id C2 114 107
node_id C3 12 12
link 전체 10,605 10,605
link 동일 source-target-relation 7,000 6,980
url 전체(중복제외) 3,901
Encyves 기사(A) 1,980
outlink 중 민백 기사 628
기타 웹자원 334

추가 데이터 생산 방안

  • 서원/향교 - 배향인물
  • 민백
  • 전통사찰 - 본/말사 정보 조사 예정