"나라, 김바로 「제도와 인사의 관계성 데이터 아카이브 구축과 활용: 근대 학교 자료(1895~1910)를 중심으로」"의 두 판 사이의 차이

seonae's wiki
이동: 둘러보기, 검색
(*용어-용례)
(*4.용어-용례)
43번째 줄: 43번째 줄:
 
**구한말 관보에서 중앙에 의하여 임명되는 교원 이상은 서임급사령에서 기술.  
 
**구한말 관보에서 중앙에 의하여 임명되는 교원 이상은 서임급사령에서 기술.  
 
**기술되는 정보는 이름, 현재 소속 조직명, 현재 직위명, 인사유형(임명, 면직, 견책 등), 새로운 소속 조직명, 새로운 직위명, 새로운 직급명 등으로 구성
 
**기술되는 정보는 이름, 현재 소속 조직명, 현재 직위명, 인사유형(임명, 면직, 견책 등), 새로운 소속 조직명, 새로운 직위명, 새로운 직급명 등으로 구성
=====*'''4.용어-용례'''=====
+
====='''4.용어-용례'''=====
 
**인사 유형은 구한말 관보의 교원 관련 인사용어에 등장하는 용어를 바탕으로 "임명", "면직", "기타"로 구분
 
**인사 유형은 구한말 관보의 교원 관련 인사용어에 등장하는 용어를 바탕으로 "임명", "면직", "기타"로 구분
 
*** '''"임명":''' 특정한 직위를 획득하는 것 의미. '''관련 용어:''' 임, 겸임, 기복행공, 대, 대임, 명, 명 - 재근, 촉탁, 수칙과 수첩, 증, 훈.
 
*** '''"임명":''' 특정한 직위를 획득하는 것 의미. '''관련 용어:''' 임, 겸임, 기복행공, 대, 대임, 명, 명 - 재근, 촉탁, 수칙과 수첩, 증, 훈.

2019년 1월 31일 (목) 09:16 판

연구의 목적과 대상

  • 목적: 제도와 인사의 관계성 데이터 아카이브(새로운 디지털 백과사전) 구축+활용 방법론 제시
  • 대상: 인물 관련 공구서+제도 관련 공구서+양자의 상호 관계에 집중
    • 근대 학교 자료(1895-1910) - 구한말 관공립학교의 제도+교원의 인사 기록

연구 방법

연구 절차

A.구한말 관공립학교 제도와 교원의 인사 기록 수집
  • 연구 대상: 연속성이 보장되면서도 현존 사료가 풍부하고 국가 권력 혼란기의 변화 양상을 볼 수 있는 1895년 한성사범학교부터 1910년 조선총독부 직원록까지의 사범학교, 소학교, 보통학교 및 그 교원.
    • 기관: 1895년부터 1910년까지의 소학교, 보통학교, 사범학교 274개
    • 인물:《구한말 관보》 에 등장하는 공식적인 학교 관련 인물 4,256명
    • 인물 및 인사운용 자료:《구한말 관보》에서 공식적으로 거론된 기록 7,960건, 직원록 기록 795건, 근현대인물데이터베이스 기록 578건
    • 보조 자료: 《구한말 관보》의 출현 인물과 연계된 『직원록 자료』의 인물 64명과 기록 795건, 『한국근현대인물자료』의 인물 58명, 기록 577건
  • 구한말 교육인사제도 토대 자료: 《구한말 관보》 , 『직원록 자료』, 『한국근현대인물자료』
B.구한말 관공립학교 제도와 교원의 인사 기록 구조 분석
  • 전통적인 고증 방법에 따라서, 우선 수집된 자료의 역사적 맥락 파악
  • 구한말 관공립학교의 제도와 교원의 인사 기록에 관련된 선행 연구의 성과 종합
  • 이를 바탕으로 법제, 학교, 직위, 직급에 대한 명칭과 변화를 살펴보고, 인사 운영의 용어·용례 정리. 즉 조직, 제도(직위, 직급, 직봉), 인사 운영에 대한 고증 수행[1]


1. 학교에 대한 고증 방법

명칭 정보, 분류 정보, 사건 정보, 위치 정보를 중심으로 진행

  • 명칭:한국어명칭-한자명칭 기술
  • 분류 정보: 관립학교, 공립학교, 소학교, 보통학교, 사범학교, 고등학교 등의 내용 파악
 예) 인천부공립소학교는 "공립학교"이며 "소학교"이다.
  • 사건 정보: "개교", "개학", "개명", "개편", "인물승계"로 구분
  • 위치 정보: "한성", "경기도" 등의 심삼도 정보와 "교동초등학교"나 "연합뉴스빌딩" 등과 같은 현재 지명 혹은 "금부직방"과 같은 과거 지명 기술
2. 제도의 고증 방법
  • 교원의 직위
    • 교관, 부교관, 교원, 부교원, 교수, 부교수, 본과훈도, 본과부훈도, 전과훈도, 전과부훈도, 서기, 보모, 학무위원, 학교장, 학원감, 학감, 교감 등의 17 직위
    • 고증은 대상 직위의 직급, 편성인원, 직무 및 관계 법령을 중심으로 진행
  • 교원의 직급
    • 교원의 직급은 당시 전체적인 직급 체계를 우선 고증하고, 그 뒤에 각 학교 분류를 중심으로 직급 체계와 그 변화 양상을 고증.
    • 소학교, 보통학교, 한성사범학교, 관립한성사범학교, 중학교, 관립한성고등학교에 대한 고증 수행. 고증은 대상 직위에 따른 편성 인원 정보, 겸직 정보, 직급 정보, 전임 정보를 중심으로 진행.
  • 교원의 직봉
    • 교원의 직봉은 교원을 중심으로 당시의 직위와 직급 체계의 변화와 이에 따른 직봉 체계의 변화에 대한 고증 수행, 세부적으로 각각의 직봉 법령에 따른 각 직급의 직봉 및 그 변화양상 기술.


3.인사운영의 용어-용례 고증 방법
  • 원본 사료의 인사운영 기술
    • 구한말 관보에서 중앙에 의하여 임명되는 교원 이상은 서임급사령에서 기술.
    • 기술되는 정보는 이름, 현재 소속 조직명, 현재 직위명, 인사유형(임명, 면직, 견책 등), 새로운 소속 조직명, 새로운 직위명, 새로운 직급명 등으로 구성
4.용어-용례
    • 인사 유형은 구한말 관보의 교원 관련 인사용어에 등장하는 용어를 바탕으로 "임명", "면직", "기타"로 구분
      • "임명": 특정한 직위를 획득하는 것 의미. 관련 용어: 임, 겸임, 기복행공, 대, 대임, 명, 명 - 재근, 촉탁, 수칙과 수첩, 증, 훈.
      • "면직": 특정한 직위가 소실되는 것 의미. 관련 용어: 면, 면본관, 면본임, 면겸임, 면본관병겸관, 의원면관, 의원면겸임, 의원면본관병겸관, 해, 해임, 해촉, 의원해촉, 해겸관, 해겸임, 신고, 사거.
      • "기타": 임명과 면직 이외의 인사 운용과 관련된 용어를 포괄적으로 지칭. 기타 용어: 현직, 전직, 승서, 승봉, 책, 견책, 감봉, 벌봉, 면징계, 부우, 모우.

C. 구한말 관공립학교 제도와 교원의 인사기록 데이터 처리

  • B의 고증 결과물을 바탕으로 A에서 수집된 PLAIN TEXT, RDB, XML 형식의

데이터를 정규표현식, RDB 데이터 운용, XML 데이터 운용의 방법을 통해 기계가 독형 데이터로 전환하는 과정 수행

  • 서울대학교 규장각 한국학 연구원의 구한말 관보
    • 규장각 한국한연구원의 웹서비스에서 제공하는 구한말 관보는 관보 이미지를 PLAIN TEXT로 서비스하고 있음
    • 이에 따라서 PLAIN TEXT에서 필요한 정보를 추출하기 위하여 대상 정보 탐구, 정규식 표현식[1]을 통한 문자열 처리, 추출 데이터의 오류에 대한 검토의 과정 수행
公立普通學校本科副訓導 嚴 星 九命公立慶州普通學校在勤 公立普通學校本科訓導 金 慶 淵命公立尙州普通學校在勤 [2]

자연어 상태의 위의 문장을 기계가독형의 데이터로 전환하면 다음과 같다.[3]

公立普通學校   本科副訓導   嚴星九   命在勤   公立慶州普通學校   
公立普通學校   本科訓導   金慶淵   命在勤   公立尙州普通學校

관보의 서술은 동일한 성질의 내용에 대해서 고정적인 형식을 반복적으로 사용한다. 자연어 문장의 경우에도 “(조직명)(관직명)(이름)(命)(조직명)(관직명)(在勤)”의 고정적인 패턴을 보인다는 것을 손쉽게 알 수 있다.

  • 수동 처리 방법
    • 인간이 위의 자연어 문장을 데이터로 전환한다면 다음과 같은 A, B, C의 과정을 거치게 된다.
    • A. 유의미한 내용 판단: 문장에서 유의미한 문장요소를 판단하여 추출한다.
    • B. 개행: 유의미한 문장이 종료된 이후에는 개행을 해서 각각의 열을 독립적인 정보로 만든다.
    • C. 띄어쓰기: 유의미한 문장요소 사이에는 띄어쓰기를 한다.
    • D. 반복: 이제부터 위의 A, B, C의 과정을 지속적으로 문장의 수만큼 반복하게 된다.
  • 정규식 처리
    • 정규식을 활용하게 되면 고정적인 패턴을 가진 문장을 빠른 속도로 처리할 수 있다. 정규식의 처리 과정은 다음과 같은 A, B, C, D의 과정을 거치게 된다.
      • A. 공백 삭제
      • B. 개행
      • C. 띄어쓰기
      • D. 문장 정리
  • 정규식 처리 상의 문제점
    • 정규식 처리의 과정은 복잡해 보이지만 문장이 특정 패턴을 가지고 있을 때, 유용하게 사용할 수 있음
    • 특히 연구자가 해당 패턴을 완전히 파악하고, 관련 용어에 대해 정리를 충분히 수행했다면, 컴퓨터 연산을 통하여 자연어 문장을 빠르게 데이터 처리할 수 있다.
    • 다만 관보의 패턴은 완전한 기계적인 처리를 하는 데 있어 두 가지 장애 요소가 존재하였다.
      • 첫 번째는 관보 문장의 주술 패턴이 불안정하다는 문제
      • 두 번째는 관보 문장의 문자 집합(Character Set)의 문제
  • 국사편찬위원회의 직원록자료
    • 직원록자료는 국사편찬위원회에 귀속되어 있는 공공데이터로, 공공데이터포털을 통하여 직원록자료의 RAWDATA 입수
    • 직원록자료의 RAWDATA는 “|” 문자로 분리된 TXT 파일임
    • 이에 따라서 “|”로 분리된 TXT 파일에서 필요한 정보를 추출하기 위하여 대상 정보의 탐구, DBMS 탑재, 데이터 고도화, 데이터 추출의 과정 수행
      • 대상 정보의 탐구는 대상 데이터의 설계를 탐색하는 과정이며 각의 컬럼들의 의미와 역할 및 상호 관계를 명확하게 이해하는 것임
      • 대상 데이터의 처리를 위하여 DBMS에 탑재함. 본 연구에서는 MSSQL에 대상 데이터를 탑재하였음
  • 국사편찬위원회의 한국근현대인물자료
    • 한국근현대인물자료는 국사편찬위원회에 귀속되어 있는 공공데이터임
    • 본 연구자는 공공데이터포털을 통하여 한국근현대인물자료 RAWDATA 입수
    • 한국근현대인물자료의 RAWDATA는 “|” 문자로 된 CSV 파일임
    • 그런데 RAWDATA는 실제로는 XML 데이터(LEVEL_XML)와 XML 데이터에서 추출한 고유값(LEVEL_ID)으로 구성되어 있음
    • 이에 따라서 “|”로 분리된 TXT 파일에서 필요한 정보를 추출하기 위하여 대상 정보 탐구, DBMS 탑재, 데이터 추출, 데이터 고도화의 과정 수행

D.구한말 관공립학교 제도와 교원의 인사 기록 온톨로지 구축

  • 제도와 인사에 관련된 종이 매체와 디지털 매체의 자료 및 데이터의 모델 살펴봄
  • 이를 통해서 도출된 선행 모델과 구한말 관공립학교 제도와 교원의 인사 기록 구조 분석 결과를 바탕으로 구한말 관공립학교 제도와 교원의 인사 기록 온톨로지 구축
  • 온톨로지의 설계는 크게 인문학 기본 온톨로지, 관공립학교 제도 온톨로지, 인사 기록 온톨로지로 분리하여 설계한 이후에 이를 종합하고 검증


온톨로지 학술.png


  • 인문학 연구의 특질을 반영하여 인문학 정보의 온톨로지 구축을 하기 위한 필수 요소를 제시*다양한 연구자들의 동일한 대상에 대한 서로 다른 판단의 결과를 데이터의 형태로 구축 가능


온톨로지 추정.png


  • 기존 인문학에서 소략되었던 “추정”의 개념을 강조하여, 설령 완벽하게 대상을 파악하지 못하더라도 근사치를 제공하여 지속적인 연구를 위한 토대 제공


온톨로지 사건.png


  • 인문학 정보의 “사건”에 대한 온톨로지 모형을 제시
  • 인문학에서 등장하는 복합적인 지식 정보인 “사건”을 특정 시점을 기준으로 한 선후 변화 개념으로 디지털에 최대한 모사


온톨로지 시스템.png

  • 본 논문에서 제도-인사 연구를 위하여 선행연구의 성과를 참조하여 온톨로지 구축
  • 실제적인 인물의 관직정보는 구한말 관보, 직원록자료, 한국근현대인물자료의 RAWDATA에서 추출.
  • 제도-인사의 선행연구 성과를 참고하는 방법은 기존 인문학 연구의 방법론과 동일
  • 하지만 RAWDATA를 활용한 인물의 관직 정보 추출 방식은 기존 인문학적 연구 방법과 상이 *따라서 방대한 RAWDATA에서 필요한 정보를 추출하여 데이터화하는 방법에 대해서 서술

E.구한말 관공립학교 제도와 교원의 인사 기록 온톨로지를 바탕으로 하는 데이터 모델링

  • 구축된 데이터 틀과 실제 구한말 관공립 학교 제도와 교원의 인사기록 데이터를 바탕으로 시맨틱웹으로 구현할 수 있는 RDF 데이터 모델, 기존 디지털 아카이브에 사전 정보를 추가할 수 있도록 설계된 XML 데이터 모델을 각기 모델링한다.
  • RDF 데이터 모델링
    • RDF 모델 설계: RDF와 RDF를 통한 LOD 서비스를 통하여 무한한 연결 지원
      • 이를 위하여 데이터 속성의 설정 최대한 지양
      • 가부 판단의 ‘boolean’, 경위도값의 ‘float’, 직위수량이나 직봉 등의 일반숫자값을 나타내는 ‘int’, 날짜와 시간에 쓰이는 ‘dateTime’과 같은 숫자값, 그리고 출처 표기(전통형 출처표기, URL표기)와 지명정보에 사용되는 문자값 정도만 데이터 속성으로 정의

온톨로지 전체.png

  • 전체적인 RDF 모델의 구조는 크게 공통 영역, 제도 영역, 인사운용 영역으로 구분
    • 공통 영역
      • 집필자, 집필일자, 근거(전통형 출처표기, URL표기)를 중심으로 하는 학술 모델
      • 100% 확정적이지는 않지만 다양한 근거를 통하여 특정한 대상에 대해서 미루어 짐작할 수 있는 사항을 기록하는 추정 모델
    • 제도 영역은 제도의 세부 내용을 기술하는 곳으로 제도 모델 사용
    • 인사운용 영역
      • 실제적인 임명, 해임 등의 인사 사건과 제도의 변화를 기술하는 곳으로 사건 모델 사용
      • 마지막으로 전체적으로 다양한 이칭의 처리를 위하여 이칭 모델 사용
  • XML 데이터 모델링
    • XML은 RDB에 비하여 비정형데이터를 효율적으로 다룰 수 있음. 이에 따라서 현재 인문학 아카이브의 데이터는 기본적으로 XML 형태로 구축되고 있다.
    • 그러나 해당 XML은 원문에 대한 마크업만을 수행하고 있으며, 원문에서 추출된 인문학 지식 요소에 대한 추가적인 처리는 수행하고 있지 않다.
    • 물론 디지털 백과사전의 편찬자가 각각의 아카이브에서 인문학의 지식요소를 처리하고 연결할 수도 있다.
    • 하지만 원문에 대해서 가장 완전히 파악하고 있는 아카이브 구축자가 직접 해당 아카이브의 내용에서 지식 요소를 추출해야 보다 완전한 인문학 데이터를 구축할 수 있다.

온톨로지 XML.PNG

    • 가장 좋은 것은 RDF 방식으로 지식 자원을 구성하여 언제든지 다른 자원과 연결할 수 있는 LOD 서비스를 구현하는 것이다.
    • 그러나 현실적으로 RDF의 구현은 대량의 자원이 투입되어서 전체적인 온톨로지 및 유관 시스템을 구축한 이후에나 가능하다.
    • 따라서 아카이브를 구축하는 작업자들이 조금씩이나마 현재의 시스템을 기반으로 RDF를 구현할 수 있도록 최대한 단순한 형태의 인사 기록에 대한 XML 설계를 진행한다.
    • 제도는 개별 인문학 자료에서 다루는 것보다는 전문적이고 포괄적인 연구를 통한 온톨로지를 구축하여 관리할 필요가 있다.

따라서 본 장에서는 인물의 임명, 해임, 승진, 처벌 등의 인사 기록에 대한 설계만을 진행한다.

    • 또한 XML 설계는 전통적인 주석에 대한 새로운 발전 방향을 모색한다는 목적도 포함하고 있다.
    • 기존의 주석은 “낱말이나 문장의 뜻을 쉽게 풀이하는 글”로 정의된다. 실제의 주석에서는 인문학 자료에 등장하는 주요 단어에 대해서 풀이하거나, 간략한 관련 부가 정보를 제공하는 수준으로 작업을 진행하였다.
    • 그런데 이러한 작업은 인간을 위하여 “낱말이나 문장의 뜻을 쉽게 풀이하는” 행위이다. 디지털 시대에는 인간이 아닌 기계를 위하여 “낱말이나 문장의 뜻을 쉽게 풀이하는” 행위가 필요하다.
    • 따라서 인문학 자료의 원문을 재구성하여 기계가독형 데이터로 만드는 작업의 수행이 필요하다.

F.구한말 관공립학교 제도와 교원의 아카이브를 바탕으로 하는 시각화

  • 마지막으로 데이터 모델에 따라서 구축된 데이터가 인문학 연구에서 효율적으로 활용될 수 있도록 하는 시각화 방법 모색
  • 시각화는 크게 정보전달형 시각화 모델데이터접근형 시각화 모델로 분리하여 서술
    • 정보전달형 시각화 모델에서는 인간의 다양한 관점에 따른 정보 요구를 수용하기 위해 각각의 관점에 대한 시각화 모델 제시
    • 데이터접근형 시각화 모델에서는 디지털에 익숙하지 않은 사용자들이 데이터에 직접적으로 접근하기 위한 간단하지만 제한적인 접근만이 가능한 키워드 검색 방법과 복잡하지만 다양한 접근이 가능한 블록조합형 질의언어에 의한 시각화 방법론 제시
    • 마지막으로 앞에서 제시한 시각화 모델과 디지털인문학 분석 방법론을 활용하여 구축된 아카이브를 토대로 인문학 연구를 위한 활용 모델 제시
  • 정보 전달형 시각화 모델

정보 전달형 시각화는 크게 표형, 체계형, 타임테이블형, 네트워크형, 공간정보형으로 구분

  • 표형 시각화
    • 표형 시각화는 전통적인 시각화 방식으로 대상을 테이블 형식으로 표현하는 것
    • 디지털에서는 기존 종이매체의 표 시각화에서는 불가능한 두 가지 요소가 추가 가능
      • 파이퍼링크를 통한 특정 대상으로의 전환
      • 타임 슬라이드를 이용한 시간의 시각화

활용모델 표형시각화.png

  • 체계형 시각화
    • 체계형 시각화는 전통적인 시각화 방식으로 대상이 상하위 관계 혹은 포함 관계를 가지고 있을 때 활용 가능
    • 체계형 시각화는 조직 간의 상하위 관계, 조직과 직위의 포함 관계, 조직과 인물의 포함 관계 등에 사용 가능

활용모델 체계형시각화.png

  • 통계형 시각화
    • 통계형 시각화는 표형 시각화와는 다르게 특정한 대상을 파악하기 위하여 일정한 체계에 따라 그 대상을 숫자로 나타내는 것 의미
  • 특정한 대상을 숫자로 파악하기 때문에 기존 통계학의 시각화 방법론을 활용한 다양한 그래프로의 전환이 용이함

활용모델 통계형시각화.png

  • 타임테이블형 시각화
    • 타임테이블형 시각화는 대상이 시간값을 포함하고 있을 때에 활용 가능
    • 타임테이블형 시각화는 시간 고정과 대상 고정으로 시각적 분류 가능
      • 시간 고정은 시간을 고정하고, 시간의 흐름에 따른 대상의 변화상 살펴보는 것
      • 대상 고정은 특정한 대상을 고정하고, 대상의 변화 양상에 따른 시간의 흐름 살펴보는 것

활용모델 타임.png

  • 네트워크 일반형 시각화
    • 데이터 간의 모든 관계의 시각화
    • 일반 네트워크형 시각화는 대상 데이터로 존재하는 모든 관계를 시각적으로 표현하기에 대상에 대한 종합적인 탐색에 용이함
    • 그러나 방대한 데이터상의 모든 관계를 표시하게 되면 오히려 방대함에서 오는 혼란을 야기하기도 함

활용모델 네트워크형시각화 일반.png

  • 네트워크 분석형 시각화
    • 네트워크 분석형 시각화는 네트워크 분석 방법론을 적용하여 도출한 결과 시각화
    • 네트워크 분석형 시각화는 대상 데이터에서 최대 2개의 특정 데이터 범주를 선택하고, 특정 데이터 범주 내에서의 네트워크를 분석하기에 특정 대상에 대한 직관적이고 정확한 네트워크 분석 가능
    • 네트워크 분석형 시각화에서는 기계적인 분석 결과를 점과 선의 요소에 대한 크기, 색, 굵기의 변화로 시각화 가능

활용모델 네트워크형시각화.png

  • 공간정보형 시각화
    • 공간정보형 시각화는 대상이 공간값을 포함하고 있을 때에 활용 가능
    • 공간정보의 시각화 요소는 점으로 표현되는 '포인트(point)', 선으로 표현되는 '라인(line)', 면으로 실현되는 '폴리곤(polygon)'을 기본으로 하여, '히트맵(heat map)', '버블맵(bubble map)', 기타 멀티미디어 효과 추가 가능
    • 시각 정보의 타임라인과 상호연결정보의 네트워크가 공간정보값과 연계되어 지도상에 표시 가능

박사논문 보직이동 18961905.jpg

  • 블록조합형 질의언어
    • 본고에서는 데이터 검색만큼이나 복잡한 프로그래밍을 어린이들에게 교육하기 위해서 제작된 스크래치(Scratch)MIT APP INVENTOR의 방법론 차용
    • 스크래치와 MIT APP INVENTOR는 복잡한 코딩 언어를 조작, 논리, 연산, 데이터 등의 유형으로 분류하여 퍼즐블록화함
  • 블록조합형 질의언어 체계도

활용모델 블록형 체계.png

    • 대상 블록
      • 대상은 파란색 블록으로 표현
      • 사용자들이 본인이 원하는 대상을 입력 혹은 검색-선택 가능
      • 대상으로는 최소한 한 개가 필요
    • 연결 블록
      • 대상 간의 연결 층위는 하늘색으로 표시
      • 사용자들은 본인이 원하는 연결을 입력 혹은 검색-선택 가능
      • 연결은 단일 대상에 대한 정보를 출력할 때에만 생략 가능
      • 단일 대상에 대한 정보의 출력은 해당 대상에 관한 모든 자료를 출력하는 것을 기본값으로 함
    • 출처 블록
      • 대상의 출처 층위는 보라색으로 표시
      • 사용자들은 본인이 원하는 출처를 입력 혹은 검색-선택 가능
      • 대상의 출처는 생략 가능, 생략할 경우 기본값은 검색 가능한 모든 데이터임
    • 조건 블록
      • 대상을 제한하는 조건 정보는 노란색, 구체적인 세부값은 보라색, 연산기호는 연두색으로 표시
      • 사용자들은 본인이 원하는 조건을 입력 혹은 검색-선택 가능
      • 조건은 생략 가능, 생략할 경우 기본값은 검색 가능한 모든 데이터임
    • 출력 블록
      • 대상의 출력 방식을 선택하는 출력 정보는 녹색으로 표시
      • 사용자들은 본인이 원하는 출력 방법을 입력 혹은 검색-선택 가능
      • 기본 출력 방식에는 데이터 출력, 네트워크형 시각화, 타임라인형 시각화, 지리정보형 시각화, 계층형 시각화가 있음
      • 출력 방식은 생략될 수 있으며, 이 경우 기본값은 범용성의 확보를 위해서 일반적으로 해당 데이터 출력
      • 이러한 시각화 모듈은 대상 데이터에 대한 다양한 시각화 방법을 지원하기 위하여 사용자의 시각화 모듈 추가를 지원하는 것임
    • 블록 조합 구조
      • 블록 조합은 전체적으로 “대상” 층위를 중심으로 대상과 대상을 연결하는 “연결” 층위가 배치되는 구조를 가짐
        • “출처” 층위는 “대상-연결” 층위의 상단에 배치
        • “조건” 층위는 “대상” 층위의 하단에 배치
        • 마지막으로 “출력” 층위는 조합의 최상단에 위치
    • 블록 조합 순서
      • 사용자의 블록 질의 프로세스로는 “대상-연결” 층위, “출처” 층위, “조건” 층위, “출력” 층위의 순서 권장
      • 다만 최초의 “대상-연결” 층위를 제외하면 사용자의 사유방식에 따라서 자유롭게 층위의 추가·삭제·변경 가능
  • 블록조합형 질의언어 프로세스

활용모델 블록형.png


  • 연구 사용 소프트웨어
    • 데이터 설계 - protégé(프로테제) & Altova XMLSpy(알토바 엑스엠엘스파이)
    • 지리 정보 수집 - 남한 지역: Daum 지도 & 네이버 지도, 북한 지역: Google 지도 & Google Earth
    • 데이터의 처리 - EmEditor(엠에디터), Microsoft Excel(마이크로소프트 엑셀), RDFConvert
    • 데이터의 분석 - Gephi(게파이), GNU R(지엔유 알)
    • 데이터 검색 - Twinkle(트윙클)
    • 데이터 운용 - Virtuoso Universal Server(벌투오소 유니버샬 서버)
    • 이미지 처리 - Photoshop(포토샵) & Illustrator(일러스트레이터)
    • 논문 집필 문서편집기 - Google Docs(구글 문서), Microsoft PowerPoint(마이크로소프트 파워포인트), 한컴오피스 한글
  • 정규표현식(정규식, 正規表現式, regular expression)은 특정한 규칙을 가진 문자열과 문자열 집합을 표현하는 데 사용하는 형식 언어이다. 일반적인 정규표현식의 표준 문법은 https://en.wikipedia.org/wiki/Regular_expression 을 참조한다.
  • 구한말 관보, 第四千三百七十四號, (온라인 참조 : 관보DB, 규장각한국학연구원, , http://e-kyujanggak.snu.ac.kr/home/index.do?idx=06&siteCd=KYU&topMenuId=206&targetId=379&gotourl=http://e-kyujanggak.snu.ac.kr/home/GAN/GAN_SEOJILST.jsp?ptype=list%5esubtype=01%5elclass=1909%5emclass=5%5exmlfilename=GK17289_00I0165_0010.xml%5enav=12
  • 예시는 어디까지나 최소한의 정보 분리를 행한 결과물이며, 완전한 기계가독형 데이터는 아니다.