"20180123 회의록"의 두 판 사이의 차이

khw
이동: 둘러보기, 검색
(데이터 정제 결과)
(서원)
 
(사용자 4명의 중간 판 9개는 보이지 않습니다)
10번째 줄: 10번째 줄:
 
* 중복 제외한 "unique" 노드리스트 및 링크리스트 생성   
 
* 중복 제외한 "unique" 노드리스트 및 링크리스트 생성   
 
**''unique'' node_id : 3840건
 
**''unique'' node_id : 3840건
**''unique'' node_id, class, node_label, node_url, node_type :
 
 
* URL 정보가 있는 별도의 테이블 생성  
 
* URL 정보가 있는 별도의 테이블 생성  
 
**node_id, node_url, url_type
 
**node_id, node_url, url_type
 
**encyves기사/민백기사/기타외부기사 등을 구분하여 기호로 표기할수 있는 속성 컬럼 추가
 
**encyves기사/민백기사/기타외부기사 등을 구분하여 기호로 표기할수 있는 속성 컬럼 추가
 
*Encyves 지도 데이터 - node_id 의 GPS data
 
*Encyves 지도 데이터 - node_id 의 GPS data
**노드별 gps 좌표를 확인할 수 있는 테이블 생성 ... 노드id, 경도, 위도
+
**노드별 gps 좌표를 확인할 수 있는 테이블 node_gps 생성
 +
**<small>원본 kml data는 테이블 gis_xml2</small>
 +
{|class="wikitable"
 +
|-
 +
!name !! des!!gis!!lst_name!!type
 +
|-
 +
|개체명 || 아이콘 및 URL 정보 || 위경도 || 해당 kml 이름 || line / point 구분
 +
|-
 +
|}
  
 
===데이터 정제 결과===
 
===데이터 정제 결과===
44번째 줄: 51번째 줄:
 
| link || 동일 source-target-relation  || 7,000 || style="background:#ffeaaa;"| '''6,980'''
 
| link || 동일 source-target-relation  || 7,000 || style="background:#ffeaaa;"| '''6,980'''
 
|-
 
|-
| rowspan=4| url || 전체(중복제외) || || style="background:#ffeaaa;"| '''3,901'''
+
| rowspan=4 | url || 전체(중복제외) || || style="background:#ffeaaa;"| '''3,901'''
 
|-
 
|-
 
| Encyves 기사(A) || || 1,980
 
| Encyves 기사(A) || || 1,980
51번째 줄: 58번째 줄:
 
|-
 
|-
 
| 기타 웹자원 || || 334
 
| 기타 웹자원 || || 334
|-
 
| writing || || 982
 
 
|}
 
|}
 +
 +
*gps 정보(node_gps 테이블)
 +
** point: 1032건, path: 20건
 +
** 699건의 중복없는 노드id(point 689, path 10)
 +
** Unique 노드 테이블과의 비교 : 126개 노드. 133개의 gps값 있음.
  
 
===추가 데이터 생산 방안===
 
===추가 데이터 생산 방안===
* 서원/향교 - 배향인물
+
*향교
* '''민백'''
+
* '''민백'''- 최신 데이터 필요
 
* 전통사찰 - 본/말사 정보 조사 예정
 
* 전통사찰 - 본/말사 정보 조사 예정
 +
 +
====서원====
 +
*원본 데이터 통계
 +
**서원: 652건(encyves중복노드: 13건)
 +
**인물: 1727건(encyves중복노드: 167건, 민백중복노드: 862건?)
 +
 +
*원본 데이터 점검 사항
 +
**서원: 서원 이름 새롭게 부여해야 되는지 ... 동일 명칭이 많음
 +
**인물: 현재 목록에 있는 인물들이 모두 다른 인물인지 확인 필요 ... 동명이인, 이칭, 한자 등 확인
 +
 +
*encyves node와 비교
 +
**기존 encvyes 노드와 비교하여 중복노드, 신규노드 확인
 +
 +
 +
 +
 +
  
  

2018년 1월 25일 (목) 14:23 기준 최신판

← Previous 회의록 Next →
20180118 회의록 20180123 회의록 20180125 회의록


회의내용

  • 중복 제외한 "unique" 노드리스트 및 링크리스트 생성
    • unique node_id : 3840건
  • URL 정보가 있는 별도의 테이블 생성
    • node_id, node_url, url_type
    • encyves기사/민백기사/기타외부기사 등을 구분하여 기호로 표기할수 있는 속성 컬럼 추가
  • Encyves 지도 데이터 - node_id 의 GPS data
    • 노드별 gps 좌표를 확인할 수 있는 테이블 node_gps 생성
    • 원본 kml data는 테이블 gis_xml2
name des gis lst_name type
개체명 아이콘 및 URL 정보 위경도 해당 kml 이름 line / point 구분

데이터 정제 결과

  • node_url을 별도의 "웹자원 노드"로 생성하는 과정에서 nodelist 및 linklist 추가 수정
기준 범위 기존 건수 수정 후 건수
node_id 전체 9,032 9,032
node_id 전체(중복제외) 3,858 3,840
node_label 전체(중복제외) 3,870 3,865
node_id A 1,986 1,979
node_id B1 884 880
node_id B2 964 951
node_id C2 114 107
node_id C3 12 12
link 전체 10,605 10,605
link 동일 source-target-relation 7,000 6,980
url 전체(중복제외) 3,901
Encyves 기사(A) 1,980
outlink 중 민백 기사 628
기타 웹자원 334
  • gps 정보(node_gps 테이블)
    • point: 1032건, path: 20건
    • 699건의 중복없는 노드id(point 689, path 10)
    • Unique 노드 테이블과의 비교 : 126개 노드. 133개의 gps값 있음.

추가 데이터 생산 방안

  • 향교
  • 민백- 최신 데이터 필요
  • 전통사찰 - 본/말사 정보 조사 예정

서원

  • 원본 데이터 통계
    • 서원: 652건(encyves중복노드: 13건)
    • 인물: 1727건(encyves중복노드: 167건, 민백중복노드: 862건?)
  • 원본 데이터 점검 사항
    • 서원: 서원 이름 새롭게 부여해야 되는지 ... 동일 명칭이 많음
    • 인물: 현재 목록에 있는 인물들이 모두 다른 인물인지 확인 필요 ... 동명이인, 이칭, 한자 등 확인
  • encyves node와 비교
    • 기존 encvyes 노드와 비교하여 중복노드, 신규노드 확인