나라, 김바로 「제도와 인사의 관계성 데이터 아카이브 구축과 활용: 근대 학교 자료(1895~1910)를 중심으로」

seonae's wiki
Narasunny (토론 | 기여) 사용자의 2019년 1월 31일 (목) 11:43 판 (D.구한말 관공립학교 제도와 교원의 인사 기록 온톨로지 구축)

이동: 둘러보기, 검색

연구의 목적과 대상

  • 목적: 제도와 인사의 관계성 데이터 아카이브(새로운 디지털 백과사전) 구축+활용 방법론 제시
  • 대상: 인물 관련 공구서+제도 관련 공구서+양자의 상호 관계에 집중

연구 절차

A.구한말 관공립학교 제도와 교원의 인사 기록 수집

  • 연구 대상: 연속성이 보장되면서도 현존 사료가 풍부하고 국가 권력 혼란기의 변화 양상을 볼 수 있는 1895년 한성사범학교부터 1910년 조선총독부 직원록까지의 사범학교, 소학교, 보통학교 및 그 교원.
    • 기관: 1895년부터 1910년까지의 소학교, 보통학교, 사범학교 274개
    • 인물:《구한말 관보》 에 등장하는 공식적인 학교 관련 인물 4,256명
    • 인물 및 인사운용 자료:《구한말 관보》에서 공식적으로 거론된 기록 7,960건, 직원록 기록 795건, 근현대인물데이터베이스 기록 578건
    • 보조 자료: 《구한말 관보》의 출현 인물과 연계된 『직원록 자료』의 인물 64명과 기록 795건, 『한국근현대인물자료』의 인물 58명, 기록 577건
  • 구한말 교육인사제도 토대 자료: 《구한말 관보》 , 『직원록 자료』, 『한국근현대인물자료』


B.구한말 관공립학교 제도와 교원의 인사 기록 구조 분석

  • 전통적인 고증 방법에 따라서, 우선 수집된 자료의 역사적 맥락 파악
  • 구한말 관공립학교의 제도와 교원의 인사 기록에 관련된 선행 연구의 성과 종합
  • 이를 바탕으로 법제, 학교, 직위, 직급에 대한 명칭과 변화를 살펴보고, 인사 운영의 용어·용례 정리. 즉 조직, 제도(직위, 직급, 직봉), 인사 운영에 대한 고증 수행[1]


가. 학교에 대한 고증 방법

명칭 정보, 분류 정보, 사건 정보, 위치 정보를 중심으로 진행

  • 명칭:한국어명칭-한자명칭 기술
  • 분류 정보: 관립학교, 공립학교, 소학교, 보통학교, 사범학교, 고등학교 등의 내용 파악
 예) 인천부공립소학교는 "공립학교"이며 "소학교"이다.
  • 사건 정보: "개교", "개학", "개명", "개편", "인물승계"로 구분
  • 위치 정보: "한성", "경기도" 등의 십삼도 정보와 "교동초등학교"나 "연합뉴스빌딩" 등과 같은 현재 지명 혹은 "금부직방"과 같은 과거 지명 기술


나. 제도의 고증 방법
  • 교원의 직위
    • 교관, 부교관, 교원, 부교원, 교수, 부교수, 본과훈도, 본과부훈도, 전과훈도, 전과부훈도, 서기, 보모, 학무위원, 학교장, 학원감, 학감, 교감 등의 17 직위
    • 고증은 대상 직위의 직급, 편성인원, 직무 및 관계 법령을 중심으로 진행
  • 교원의 직급
    • 교원의 직급은 당시 전체적인 직급 체계를 우선 고증하고, 그 뒤에 각 학교 분류를 중심으로 직급 체계와 그 변화 양상을 고증.
    • 소학교, 보통학교, 한성사범학교, 관립한성사범학교, 중학교, 관립한성고등학교에 대한 고증 수행. 고증은 대상 직위에 따른 편성 인원 정보, 겸직 정보, 직급 정보, 전임 정보를 중심으로 진행.
  • 교원의 직봉
    • 교원의 직봉은 교원을 중심으로 당시의 직위와 직급 체계의 변화와 이에 따른 직봉 체계의 변화에 대한 고증 수행, 세부적으로 각각의 직봉 법령에 따른 각 직급의 직봉 및 그 변화양상 기술.


다. 인사운영의 용어-용례 고증 방법
  • 원본 사료의 인사운영 기술
    • 구한말 관보에서 중앙에 의하여 임명되는 교원 이상은 서임급사령에서 기술.
    • 기술되는 정보는 이름, 현재 소속 조직명, 현재 직위명, 인사유형(임명, 면직, 견책 등), 새로운 소속 조직명, 새로운 직위명, 새로운 직급명 등으로 구성


라. 용어-용례
  • 인사 유형은 구한말 관보의 교원 관련 인사용어에 등장하는 용어를 바탕으로 "임명", "면직", "기타"로 구분
    • "임명": 특정한 직위를 획득하는 것 의미. 관련 용어: 임, 겸임, 기복행공, 대, 대임, 명, 명 - 재근, 촉탁, 수칙과 수첩, 증, 훈.
    • "면직": 특정한 직위가 소실되는 것 의미. 관련 용어: 면, 면본관, 면본임, 면겸임, 면본관병겸관, 의원면관, 의원면겸임, 의원면본관병겸관, 해, 해임, 해촉, 의원해촉, 해겸관, 해겸임, 신고, 사거.
    • "기타": 임명과 면직 이외의 인사 운용과 관련된 용어를 포괄적으로 지칭. 기타 용어: 현직, 전직, 승서, 승봉, 책, 견책, 감봉, 벌봉, 면징계, 부우, 모우.


C. 구한말 관공립학교 제도와 교원의 인사기록 데이터 처리

  • B의 고증 결과물을 바탕으로 A에서 수집된 PLAIN TEXT, RDB, XML 형식의 데이터를 정규표현식, RDB 데이터 운용, XML 데이터 운용의 방법을 통해 기계가독형 데이터로 전환하는 과정 수행


가. 서울대학교 규장각 한국학 연구원의 구한말 관보
  • 규장각 한국한연구원의 웹서비스에서 제공하는 구한말 관보는 관보 이미지를 PLAIN TEXT로 서비스하고 있음
  • 이에 따라서 PLAIN TEXT에서 필요한 정보를 추출하기 위하여 대상 정보 탐구, 정규 표현식[1]을 통한 문자열 처리, 추출 데이터의 오류에 대한 검토의 과정 수행
公立普通學校本科副訓導 嚴 星 九命公立慶州普通學校在勤 公立普通學校本科訓導 金 慶 淵命公立尙州普通學校在勤  
  • 자연어 상태의 위의 문장을 기계가독형의 데이터로 전환하면 다음과 같다.[2]
公立普通學校   本科副訓導   嚴星九   命在勤   公立慶州普通學校   
公立普通學校   本科訓導   金慶淵   命在勤   公立尙州普通學校
  • 관보의 서술은 동일한 성질의 내용에 대해서 고정적인 형식을 반복적으로 사용.
  • 자연어 문장의 경우에도 “(조직명)(관직명)(이름)(命)(조직명)(관직명)(在勤)”의 고정적인 패턴을 보인다는 것을 손쉽게 알 수 있음.


  • 수동 처리 방법
    • 인간이 위의 자연어 문장을 데이터로 전환한다면 다음과 같은 A, B, C의 과정을 거치게 됨
    • A. 유의미한 내용 판단: 문장에서 유의미한 문장요소를 판단하여 추출
    • B. 개행: 유의미한 문장이 종료된 이후에는 개행을 해서 각각의 열을 독립적인 정보로 만듬
    • C. 띄어쓰기: 유의미한 문장요소 사이에는 띄어쓰기를 함.
    • D. 반복: 이제부터 위의 A, B, C의 과정을 지속적으로 문장의 수만큼 반복


  • 정규식 처리
    • 정규식을 활용하게 되면 고정적인 패턴을 가진 문장을 빠른 속도로 처리할 수 있음.
    • 정규식의 처리 과정은 다음과 같은 A, B, C, D의 과정을 거치게 됨.
      • A. 공백 삭제
      • B. 개행
      • C. 띄어쓰기
      • D. 문장 정리


  • 정규식 처리상의 문제점
    • 정규식 처리의 과정은 복잡해 보이지만 문장이 특정 패턴을 가지고 있을 때, 유용하게 사용할 수 있음
    • 특히 연구자가 해당 패턴을 완전히 파악하고, 관련 용어에 대해 정리를 충분히 수행했다면, 컴퓨터 연산을 통하여 자연어 문장을 빠르게 데이터 처리할 수 있음
    • 다만 관보의 패턴은 완전한 기계적인 처리를 하는 데 있어 두 가지 장애 요소 존재
      • 첫 번째는 관보 문장의 주술 패턴이 불안정하다는 문제
      • 두 번째는 관보 문장의 문자 집합(Character Set)의 문제
나. 국사편찬위원회의 직원록자료
  • 직원록자료는 국사편찬위원회에 귀속되어 있는 공공데이터로, 공공데이터포털을 통하여 직원록자료의 RAWDATA 입수
  • 직원록자료의 RAWDATA는 “|” 문자로 분리된 TXT 파일임
  • 이에 따라서 “|”로 분리된 TXT 파일에서 필요한 정보를 추출하기 위하여 대상 정보의 탐구, DBMS 탑재, 데이터 고도화, 데이터 추출의 과정 수행
    • 대상 정보의 탐구는 대상 데이터의 설계를 탐색하는 과정이며 각의 컬럼들의 의미와 역할 및 상호 관계를 명확하게 이해하는 것임
    • 대상 데이터의 처리를 위하여 DBMS에 탑재함. 본 연구에서는 MSSQL에 대상 데이터를 탑재하였음


다. 국사편찬위원회의 한국근현대인물자료
  • 한국근현대인물자료는 국사편찬위원회에 귀속되어 있는 공공데이터임
  • 본 연구자는 공공데이터포털을 통하여 한국근현대인물자료 RAWDATA 입수
  • 한국근현대인물자료의 RAWDATA는 “|” 문자로 된 CSV 파일임
  • 그런데 RAWDATA는 실제로는 XML 데이터(LEVEL_XML)와 XML 데이터에서 추출한 고유값(LEVEL_ID)으로 구성되어 있음
  • 이에 따라서 “|”로 분리된 TXT 파일에서 필요한 정보를 추출하기 위하여 대상 정보 탐구, DBMS 탑재, 데이터 추출, 데이터 고도화의 과정 수행


D.구한말 관공립학교 제도와 교원의 인사 기록 온톨로지 구축

  • 제도와 인사에 관련된 종이 매체와 디지털 매체의 자료 및 데이터의 모델 살펴봄
  • 이를 통해서 도출된 선행 모델과 구한말 관공립학교 제도와 교원의 인사 기록 구조 분석 결과를 바탕으로 구한말 관공립학교 제도와 교원의 인사 기록 온톨로지 구축
  • 온톨로지의 설계는 크게 인문학 기본 온톨로지, 관공립학교 제도 온톨로지, 인사 기록 온톨로지로 분리하여 설계한 이후에 이를 종합하고 검증


온톨로지 학술.png


  • 인문학 연구의 특질을 반영하여 인문학 정보의 온톨로지 구축을 하기 위한 필수 요소를 제시
  • 다양한 연구자들의 동일한 대상에 대한 서로 다른 판단의 결과를 데이터의 형태로 구축 가능


온톨로지 추정.png


  • 기존 인문학에서 소략되었던 “추정”의 개념을 강조하여, 설령 완벽하게 대상을 파악하지 못하더라도 근사치를 제공하여 지속적인 연구를 위한 토대 제공


온톨로지 사건.png


  • 인문학 정보의 “사건”에 대한 온톨로지 모형을 제시
  • 인문학에서 등장하는 복합적인 지식 정보인 “사건”을 특정 시점을 기준으로 한 선후 변화 개념으로 디지털에 최대한 모사


온톨로지 시스템.png


  • 본 논문에서 제도-인사 연구를 위하여 선행연구의 성과를 참조하여 온톨로지 구축
  • 실제적인 인물의 관직정보는 구한말 관보, 직원록자료, 한국근현대인물자료의 RAWDATA에서 추출.
  • 제도-인사의 선행연구 성과를 참고하는 방법은 기존 인문학 연구의 방법론과 동일
  • 하지만 RAWDATA를 활용한 인물의 관직 정보 추출 방식은 기존 인문학적 연구 방법과 상이 *따라서 방대한 RAWDATA에서 필요한 정보를 추출하여 데이터화하는 방법에 대해서 서술

E.구한말 관공립학교 제도와 교원의 인사 기록 온톨로지를 바탕으로 하는 데이터 모델링

  • 구축된 데이터 틀과 실제 구한말 관공립 학교 제도와 교원의 인사기록 데이터를 바탕으로 시맨틱웹으로 구현할 수 있는 RDF 데이터 모델, 기존 디지털 아카이브에 사전 정보를 추가할 수 있도록 설계된 XML 데이터 모델을 각기 모델링한다.


  • RDF 데이터 모델링
    • RDF 모델 설계: RDF와 RDF를 통한 LOD 서비스를 통하여 무한한 연결 지원
      • 이를 위하여 데이터 속성의 설정 최대한 지양
      • 가부 판단의 ‘boolean’, 경위도값의 ‘float’, 직위수량이나 직봉 등의 일반숫자값을 나타내는 ‘int’, 날짜와 시간에 쓰이는 ‘dateTime’과 같은 숫자값, 그리고 출처 표기(전통형 출처표기, URL표기)와 지명정보에 사용되는 문자값 정도만 데이터 속성으로 정의

온톨로지 전체.png


  • 전체적인 RDF 모델의 구조는 크게 공통 영역, 제도 영역, 인사운용 영역으로 구분
    • 공통 영역
      • 집필자, 집필일자, 근거(전통형 출처표기, URL표기)를 중심으로 하는 학술 모델
      • 100% 확정적이지는 않지만 다양한 근거를 통하여 특정한 대상에 대해서 미루어 짐작할 수 있는 사항을 기록하는 추정 모델
    • 제도 영역은 제도의 세부 내용을 기술하는 곳으로 제도 모델 사용
    • 인사운용 영역
      • 실제적인 임명, 해임 등의 인사 사건과 제도의 변화를 기술하는 곳으로 사건 모델 사용
      • 마지막으로 전체적으로 다양한 이칭의 처리를 위하여 이칭 모델 사용


  • XML 데이터 모델링
  • XML은 RDB에 비하여 비정형데이터를 효율적으로 다룰 수 있음. 이에 따라서 현재 인문학 아카이브의 데이터는 기본적으로 XML 형태로 구축되고 있다.
  • 그러나 해당 XML은 원문에 대한 마크업만을 수행하고 있으며, 원문에서 추출된 인문학 지식 요소에 대한 추가적인 처리는 수행하고 있지 않다.
  • 물론 디지털 백과사전의 편찬자가 각각의 아카이브에서 인문학의 지식요소를 처리하고 연결할 수도 있다.
  • 하지만 원문에 대해서 가장 완전히 파악하고 있는 아카이브 구축자가 직접 해당 아카이브의 내용에서 지식 요소를 추출해야 보다 완전한 인문학 데이터를 구축할 수 있다.

온톨로지 XML.PNG


  • 가장 좋은 것은 RDF 방식으로 지식 자원을 구성하여 언제든지 다른 자원과 연결할 수 있는 LOD 서비스를 구현하는 것이다.
  • 그러나 현실적으로 RDF의 구현은 대량의 자원이 투입되어서 전체적인 온톨로지 및 유관 시스템을 구축한 이후에나 가능하다.
  • 따라서 아카이브를 구축하는 작업자들이 조금씩이나마 현재의 시스템을 기반으로 RDF를 구현할 수 있도록 최대한 단순한 형태의 인사 기록에 대한 XML 설계를 진행한다.
  • 제도는 개별 인문학 자료에서 다루는 것보다는 전문적이고 포괄적인 연구를 통한 온톨로지를 구축하여 관리할 필요가 있다.
  • 따라서 본 장에서는 인물의 임명, 해임, 승진, 처벌 등의 인사 기록에 대한 설계만을 진행한다.
  • 또한 XML 설계는 전통적인 주석에 대한 새로운 발전 방향을 모색한다는 목적도 포함하고 있다.
  • 기존의 주석은 “낱말이나 문장의 뜻을 쉽게 풀이하는 글”로 정의된다. 실제의 주석에서는 인문학 자료에 등장하는 주요 단어에 대해서 풀이하거나, 간략한 관련 부가 정보를 제공하는 수준으로 작업을 진행하였다.
  • 그런데 이러한 작업은 인간을 위하여 “낱말이나 문장의 뜻을 쉽게 풀이하는” 행위이다. 디지털 시대에는 인간이 아닌 기계를 위하여 “낱말이나 문장의 뜻을 쉽게 풀이하는” 행위가 필요하다.
  • 따라서 인문학 자료의 원문을 재구성하여 기계가독형 데이터로 만드는 작업의 수행이 필요하다.

F.구한말 관공립학교 제도와 교원의 아카이브를 바탕으로 하는 시각화

  • 마지막으로 데이터 모델에 따라서 구축된 데이터가 인문학 연구에서 효율적으로 활용될 수 있도록 하는 시각화 방법 모색
  • 시각화는 크게 정보전달형 시각화 모델데이터접근형 시각화 모델로 분리하여 서술
    • 정보전달형 시각화 모델에서는 인간의 다양한 관점에 따른 정보 요구를 수용하기 위해 각각의 관점에 대한 시각화 모델 제시
    • 데이터접근형 시각화 모델에서는 디지털에 익숙하지 않은 사용자들이 데이터에 직접적으로 접근하기 위한 간단하지만 제한적인 접근만이 가능한 키워드 검색 방법과 복잡하지만 다양한 접근이 가능한 블록조합형 질의언어에 의한 시각화 방법론 제시
    • 마지막으로 앞에서 제시한 시각화 모델과 디지털인문학 분석 방법론을 활용하여 구축된 아카이브를 토대로 인문학 연구를 위한 활용 모델 제시


가. 정보 전달형 시각화 모델

정보 전달형 시각화는 크게 표형, 체계형, 타임테이블형, 네트워크형, 공간정보형으로 구분


  • 표형 시각화
    • 표형 시각화는 전통적인 시각화 방식으로 대상을 테이블 형식으로 표현하는 것
    • 디지털에서는 기존 종이매체의 표 시각화에서는 불가능한 두 가지 요소가 추가 가능
      • 파이퍼링크를 통한 특정 대상으로의 전환
      • 타임 슬라이드를 이용한 시간의 시각화

활용모델 표형시각화.png


  • 체계형 시각화
    • 체계형 시각화는 전통적인 시각화 방식으로 대상이 상하위 관계 혹은 포함 관계를 가지고 있을 때 활용 가능
    • 체계형 시각화는 조직 간의 상하위 관계, 조직과 직위의 포함 관계, 조직과 인물의 포함 관계 등에 사용 가능

활용모델 체계형시각화.png


  • 통계형 시각화
    • 통계형 시각화는 표형 시각화와는 다르게 특정한 대상을 파악하기 위하여 일정한 체계에 따라 그 대상을 숫자로 나타내는 것 의미
    • 특정한 대상을 숫자로 파악하기 때문에 기존 통계학의 시각화 방법론을 활용한 다양한 그래프로의 전환이 용이함

활용모델 통계형시각화.png


  • 타임테이블형 시각화
    • 타임테이블형 시각화는 대상이 시간값을 포함하고 있을 때에 활용 가능
    • 타임테이블형 시각화는 시간 고정과 대상 고정으로 시각적 분류 가능
      • 시간 고정은 시간을 고정하고, 시간의 흐름에 따른 대상의 변화상 살펴보는 것
      • 대상 고정은 특정한 대상을 고정하고, 대상의 변화 양상에 따른 시간의 흐름 살펴보는 것

활용모델 타임.png


  • 네트워크 일반형 시각화
    • 데이터 간의 모든 관계의 시각화
    • 일반 네트워크형 시각화는 대상 데이터로 존재하는 모든 관계를 시각적으로 표현하기에 대상에 대한 종합적인 탐색에 용이함
    • 그러나 방대한 데이터상의 모든 관계를 표시하게 되면 오히려 방대함에서 오는 혼란을 야기하기도 함

활용모델 네트워크형시각화 일반.png


  • 네트워크 분석형 시각화
    • 네트워크 분석형 시각화는 네트워크 분석 방법론을 적용하여 도출한 결과 시각화
    • 네트워크 분석형 시각화는 대상 데이터에서 최대 2개의 특정 데이터 범주를 선택하고, 특정 데이터 범주 내에서의 네트워크를 분석하기에 특정 대상에 대한 직관적이고 정확한 네트워크 분석 가능
    • 네트워크 분석형 시각화에서는 기계적인 분석 결과를 점과 선의 요소에 대한 크기, 색, 굵기의 변화로 시각화 가능

활용모델 네트워크형시각화.png


  • 공간정보형 시각화
    • 공간정보형 시각화는 대상이 공간값을 포함하고 있을 때에 활용 가능
    • 공간정보의 시각화 요소는 점으로 표현되는 '포인트(point)', 선으로 표현되는 '라인(line)', 면으로 실현되는 '폴리곤(polygon)'을 기본으로 하여, '히트맵(heat map)', '버블맵(bubble map)', 기타 멀티미디어 효과 추가 가능
    • 시각 정보의 타임라인과 상호연결정보의 네트워크가 공간정보값과 연계되어 지도상에 표시 가능

박사논문 보직이동 18961905.jpg


나. 데이터접근형 시각화 모델
  • 본고에서는 데이터 검색만큼이나 복잡한 프로그래밍을 어린이들에게 교육하기 위해서 제작된 스크래치(Scratch)MIT APP INVENTOR의 방법론 차용
  • 스크래치와 MIT APP INVENTOR는 복잡한 코딩 언어를 조작, 논리, 연산, 데이터 등의 유형으로 분류하여 퍼즐블록화함
  • 블록조합형 질의언어 체계도

활용모델 블록형 체계.png


  • 대상 블록
    • 대상은 파란색 블록으로 표현
    • 사용자들이 본인이 원하는 대상을 입력 혹은 검색-선택 가능
    • 대상으로는 최소한 한 개가 필요
  • 연결 블록
    • 대상 간의 연결 층위는 하늘색으로 표시
    • 사용자들은 본인이 원하는 연결을 입력 혹은 검색-선택 가능
    • 연결은 단일 대상에 대한 정보를 출력할 때에만 생략 가능
    • 단일 대상에 대한 정보의 출력은 해당 대상에 관한 모든 자료를 출력하는 것을 기본값으로 함
  • 출처 블록
    • 대상의 출처 층위는 보라색으로 표시
    • 사용자들은 본인이 원하는 출처를 입력 혹은 검색-선택 가능
    • 대상의 출처는 생략 가능, 생략할 경우 기본값은 검색 가능한 모든 데이터임
  • 조건 블록
    • 대상을 제한하는 조건 정보는 노란색, 구체적인 세부값은 보라색, 연산기호는 연두색으로 표시
    • 사용자들은 본인이 원하는 조건을 입력 혹은 검색-선택 가능
    • 조건은 생략 가능, 생략할 경우 기본값은 검색 가능한 모든 데이터임
  • 출력 블록
    • 대상의 출력 방식을 선택하는 출력 정보는 녹색으로 표시
    • 사용자들은 본인이 원하는 출력 방법을 입력 혹은 검색-선택 가능
    • 기본 출력 방식에는 데이터 출력, 네트워크형 시각화, 타임라인형 시각화, 지리정보형 시각화, 계층형 시각화가 있음
    • 출력 방식은 생략될 수 있으며, 이 경우 기본값은 범용성의 확보를 위해서 일반적으로 해당 데이터 출력
    • 이러한 시각화 모듈은 대상 데이터에 대한 다양한 시각화 방법을 지원하기 위하여 사용자의 시각화 모듈 추가를 지원하는 것임
  • 블록 조합 구조
    • 블록 조합은 전체적으로 “대상” 층위를 중심으로 대상과 대상을 연결하는 “연결” 층위가 배치되는 구조를 가짐
      • “출처” 층위는 “대상-연결” 층위의 상단에 배치
      • “조건” 층위는 “대상” 층위의 하단에 배치
      • 마지막으로 “출력” 층위는 조합의 최상단에 위치
  • 블록 조합 순서
    • 사용자의 블록 질의 프로세스로는 “대상-연결” 층위, “출처” 층위, “조건” 층위, “출력” 층위의 순서 권장
    • 다만 최초의 “대상-연결” 층위를 제외하면 사용자의 사유방식에 따라서 자유롭게 층위의 추가·삭제·변경 가능
  • 블록조합형 질의언어 프로세스

활용모델 블록형.png

연구 사용 소프트웨어

    • 데이터 설계 - protégé(프로테제) & Altova XMLSpy(알토바 엑스엠엘스파이)
    • 지리 정보 수집 - 남한 지역: Daum 지도 & 네이버 지도, 북한 지역: Google 지도 & Google Earth
    • 데이터의 처리 - EmEditor(엠에디터), Microsoft Excel(마이크로소프트 엑셀), RDFConvert
    • 데이터의 분석 - Gephi(게파이), GNU R(지엔유 알)
    • 데이터 검색 - Twinkle(트윙클)
    • 데이터 운용 - Virtuoso Universal Server(벌투오소 유니버샬 서버)
    • 이미지 처리 - Photoshop(포토샵) & Illustrator(일러스트레이터)
    • 논문 집필 문서편집기 - Google Docs(구글 문서), Microsoft PowerPoint(마이크로소프트 파워포인트), 한컴오피스 한글

주석

  1. 정규표현식(정규식, 正規表現式, regular expression)은 특정한 규칙을 가진 문자열과 문자열 집합을 표현하는 데 사용하는 형식 언어이다. 일반적인 정규표현식의 표준 문법은 https://en.wikipedia.org/wiki/Regular_expression 을 참조한다.
  2. 예시는 어디까지나 최소한의 정보 분리를 행한 결과물이며, 완전한 기계가독형 데이터는 아니다.