20180305 회의록
khw
| ← Previous | 회의록 | Next → |
| 20180228 회의록 | 20180305 회의록 | [[]] |
회의록
인물 데이터 식별
- 역대인물-서원제향인물 데이터 매칭
- 과정:
- 데이터 RDB 적재
- 한글이름, 한자이름을 기준으로 두 테이블 JOIN
- 매칭이 안된 인물 중 오타+역대인물DB와 한자값이 상이한 데이터 수정, 다시 매칭.
- 최종적으로 매칭인물 / 매칭안된인물 추출.
- 역대인물DB 중, 같은 인물이라도 UCI값이 과거시험 날짜에 따라 달라지므로 기준이 되는 인물 고유의 ID값이 존재하지 않음. 한글이름과 한자이름이 모두 같지만 다른 인물인 경우에는 식별 불가.
- 총 매칭된 인물: 907건, 매칭 안된 인물: 801건.
- 과정:
- 조선시대 묘/능 데이터
- 총 매칭인물(역대인물) : 290건 (605건 중)
- 총 매칭인물(민백) : 250건 (605건 중)
Virtuoso 라이센스 구매 관련
- 현재 dh서버에서 사용 중인 virtuoso는 무료로 사용할 수 있는 open source 버전. (6.x)
- 라이선스 새로 구매할 경우 선택가능한 옵션들
| 선택지 | 라이선스 | 사용 | 동시처리 데이터베이스 | 최대 사용가능 CPU 프로세서 | 비용 |
|---|---|---|---|---|---|
| Personal | single seat | workstation만 가능 | 5개 동시처리 | 2 CPU cores | $99.99 |
| Developer | single seat | workstation만 가능 | 5개 동시처리 | 8 CPU cores | $499.99 |
| Project | single seat | workstation만 가능 | 5개 동시처리 | 16 CPU cores | $749.99 |
| Workgroup | single seat | workstation과 server 가능 | 10개 동시처리 | 16 CPU cores | $1,249.99 |
| Department | single seat | workstation과 server 가능 | 10개 동시처리 | 32 CPU cores | $4,999.99 |
- Server에서 사용해야하므로, 'Workgroup'과 'Department' 중에 선택해야 함. 두 라이선스의 차이는 성능.(CPU 16 코어와 32 코어)
- 라이선스가 모두 single seat이므로 하나의 라이선스로 여러 대의 운영 시스템에서 사용하는 것은 불가 / 혹은 구매할 경우 하나의 라이선스로 여러 대의 client pc에 프로그램을 설치해서 사용 가능.
- 'Multi-Tier 데이터 접근'이 가능한 에디션을 구매하고 싶은 경우 별도의 문의가 필요함.
- Single-Tier일 경우 virtuoso가 제공하는 하나의 데이터베이스만 사용 가능하지만, Multi-Tier로 사용할 경우 여러 개의 데이터베이스를 운용할 수 있음.
- 기 제공된 virtuoso db외에 하나의 추가된 DB에 RDB를 가져와서 RDF로 변환을 시도할 수 있지 않을까.
- 일단 r2rml을 통해 외부에 있는 데이터를 연결해서 rdf로 변환이 가능한지, 혹은 Multi-Tier 사용을 통해 DB공간을 추가 확보해 그 공간에 RDB를 가져와서 RDF로 변환이 되는지, 명확히 알아보고 해당 기능이 있는 라이선스를 구매할 필요.