"20181107 회의록"의 두 판 사이의 차이
khw
(→데이터 현황) |
(→데이터 현황) |
||
| 61번째 줄: | 61번째 줄: | ||
! 출처별|| url노드수 || 링크수 | ! 출처별|| url노드수 || 링크수 | ||
|- | |- | ||
| − | | '''현재총량'''|| | + | | '''현재총량'''|| 12757 || 13063 |
|- | |- | ||
| 민백 || 6701 || 7039 | | 민백 || 6701 || 7039 | ||
2018년 11월 9일 (금) 11:07 판
네트워크 그래프(파이썬)
"모든 데이터가 포함된 그래프 제작할 것"
- 아래의 데이터 참조할 것
- 작년 데이터 중 불교 관련 부분 정리된 것 / 마지막 식별자 검토 후 통합할 것.
- SemanticHeritage.dbo.bhNetNodes
- SemanticHeritage.dbo.bhNetLinkes
- 작년 데이터 중 불교 관련 부분 정리된 것 / 마지막 식별자 검토 후 통합할 것.
웹자원
- Table.웹자원
- 레퍼런스 정보를 노드테이블로 만들 것.
- id(기존url 테이블의 source), label(URL의 Title), URL, reference(민백,위키), 노드테이블(테이블명), relation(isShownAt)
- 금석문(추가) - 문화유산연구지식포털 통합뷰어(원문/해석문/판독문) ...... 1583건
- Table.지리정보
- 위치 정보를 노드테이블로 만들 것.
- id, latitude, longitude, altitude(없음말고), fullAddress, 시도(풀네임:충청남도), 시군구(풀네임:성남시)
- Table.갤러리
- id, label(사진의 캡션,Title), URL, reference(민백,문화재청) 등
- 민백 - 이미지 url/캡션 크롤링
- 문화재청 - 이미지 url/캡션 크롤링
- 금석문 - 탁본 이미지 / 해석문,원문 viewer 크롤링 ..... 5756건
- 캡션이 없는 경우는 과감히 버릴 것. (고민하지 말고)
스토리샘플
- 스토리샘플
- 우선 제작된 스토리 20개를 먼저 PCN에 넘겨줄 것.
- 나머지 80개는 우선 제목만 설정 : 실제 시스템(스토리DB, 이용자가 노드생성,탈락)이 구현이 된 후 내용 입력 (시스템 테스트)
- 그 외 방안이 있으면.. 자유롭게..ㅎㅎ??
데이터 결합
- 불교 문화유산에 불화 관련 데이터 합치기.
작업진행상황
데이터 현황
- 노드수 : (핵심노드+웹자원+갤러리) 40,218
- 링크수 : (핵심링크+웹자원+갤러리) 45,355
- 웹자원
| 노드테이블 | url노드수 | 링크수 | |
|---|---|---|---|
| 현재총량 | 10,352 | 10,426 | |
| 인물노드 | 2550 | 2552 | |
| 공신 | 공신책봉 | 122 | 129 |
| 공신사건 | 83 | 86 | |
| 공신문화재 | 230 | 235 | |
| 서원노드 | 1551 | 1561 | |
| 비석노드 | 3166 | 3166 | |
| 불화작품 | 2653 | 2697 | |
- 지리정보 : 1824
- 갤러리
| 출처별 | url노드수 | 링크수 |
|---|---|---|
| 현재총량 | 12757 | 13063 |
| 민백 | 6701 | 7039 |
| 문화유산연구지식포털 | 5756 | 5756 |
| 문화재청(공신문화재) | 268 | 268 |