DigitalInformatizationOfLiteracyData25-2
DH Edu
목차
Information, 기본 정보
○개설기관 : 동국대학교 문과대학 국어국문문예창작학부
○강좌명 : 문학자료의 디지털 정보화 연습
○학수번호-분반 : KCC2017-01
○이수구분 : 전공(기초공통)
○개설학과(학점) : 문과대학 국어국문문예창작학부(3학점)
○강의시간 : 금요일 10:30-13:15(2.5교시-5교시)
○강의실 : 명진관 A309(307-309 강의실)
○담당교수 : 김지선 (koreadhedu@gmail.com)
Overview, 강의 개괄
Summary
컴퓨터 기술과 웹 환경이 끊임없이 발달함에 따라 인문학 연구에서도 디지털 데이터에 대한 이해의 필요성이 점차 증대하고 있습니다. 이러한 디지털 전환기를 맞아 본 강의에서는 데이터 기반 인문학 연구 사례를 살펴보고, 문학 텍스트를 구조화된 디지털 데이터로 편찬하는 과정을 통해 인문학적 통찰과 디지털 기술을 융합하는 능력을 기르고자 합니다. 특히 1930년대 문학 작품을 중심으로 주어-서술어-목적어 형식의 트리플 데이터(S-P-O, Triple Data) 편찬 방법을 실습하며, 작품 속 정보 요소뿐만 아니라 작가, 문단, 출판, 비평, 독자 등 문학을 둘러싼 다양한 정보 요소들을 체계적으로 데이터화함으로써 전통적인 문학 연구 방법론을 디지털 환경에서 확장하고 새로운 연구 가능성을 탐색하게 될 것입니다.
Objectives
본 강의는 이론 강의와 실습을 병행하며, 한 학기 동안 팀 프로젝트 기반 수업으로 진행됩니다. 수업은 크게 세 단계로 구성됩니다. 첫째, 국내외 디지털 인문학 연구 사례를 살펴보며 해당 연구들에 적용되는 문제의식과 방법론이 무엇인지에 대해 토론을 통해 비판적으로 검토합니다. 둘째, 실제 웹 환경에서 컴퓨터 기술을 활용한 데이터 편찬 과정을 단계별로 익혀나갑니다. 구체적으로 미디어위키(MediaWiki) 전자문서 작성, 온톨로지(Ontology) 설계, Neo4j를 활용한 지식 그래프 구축 등의 기술을 실습할 것입니다. 셋째, 습득한 디지털 기술들을 활용하여 1930년대 문학 작품들을 중심으로 데이터를 편찬하고, 이를 바탕으로 의미 있는 연구 질문을 도출하는 프로젝트를 수행합니다. 이러한 과정을 통해 수강생들은 문학 자료를 기반으로 디지털 데이터를 편찬하는 방법을 익히고, 구축된 데이터에서 기존 연구가 포착하기 어려웠던 새로운 연결고리를 발견하는 경험을 하게 될 것입니다.
Reference Materials
- 단행본
- 논문
Evaluation Standard
- 총점 : 100점
- 출석 : 10점 (10:30-40분 사이 출석 체크. 특별한 이유 없이 결석하지 않을 경우 감점 없음)
- 무단 결석의 경우, 1회당 -2점. 단, 수업 전 사전에 보고할 경우 이유를 불문하고 결석 1회는 용인함.
- 지각: 1회당 -1점.
- 연구기획 : 10점 (각자의 위키 페이지에 One Page Proposal 작성 및 제출)
- 교수자: 팀별 과제로 선정된 기획(n개)의 경우 10점 부여, 나머지는 평가를 통해 8점과 6점 부여.
- 10월 15일 23:55분까지 작성된 내용을 평가 대상으로 삼음. 이후 추가/수정된 내용은 평가 대상으로 삼지 않음.
- 연구 기획 관련하여 질문 혹은 문의 메일은 받지 않습니다
- 학생: 다른 수강생들의 기획안에 대해 10(A), 8(B), 6(C) 중 점수와 그 이유에 대해 작성
- 교수자와 학생들의 점수를 합산한 평균 점수를 최종 점수로 반영 ※학생점수 최대/최소 점수 제외
- 교수자: 팀별 과제로 선정된 기획(n개)의 경우 10점 부여, 나머지는 평가를 통해 8점과 6점 부여.
- 중간과제 : 20점 (연구 목적과 수집한 자료원에 대해 팀별 위키 페이지에 정리)
- 목적 : 10점 (연구기획 단계에서 제시한 문제의식을 잘 정리했는가)
- 10(A), 8(B), 6(C) 중 점수 부여
- 수집 : 10점 (문제의식을 토대로 대상 자원을 체계적으로 수집 및 정리했는가)
- 10(A), 8(B), 6(C) 중 점수 부여
- 11월 5일 23:55분까지 작성된 내용을 평가 대상으로 삼음. 이후 추가/수정된 내용은 평가 대상으로 삼지 않음.
- 목적 : 10점 (연구기획 단계에서 제시한 문제의식을 잘 정리했는가)
- 기말발표 : 60점(기말 발표 평가는 팀별 기준으로 이루어짐)[1]
- 설계 : 10점 (문제의식 토대로 온톨로지 디자인을 적절히 진행했는가)
- 편찬 : 10점 (적절한 자료를 수집-활용해서 데이터를 유기적으로 잘 편찬했는가)
- 분석/해석 : 10점 (온톨로지 디자인과 편찬된 데이터를 바탕으로 분석과 해석을 적절히 잘 수행해 유의미한 사실을 발견했는가)
- 팀원중간평가 : 10점 (※같은 팀 조원들의 평가 점수를 합산해서 평균 점수 반영 / 근거 자료 제출 필수!)
- 10(A), 8(B), 6(C), 4(D)
- 팀원최종평가 : 10점 (※같은 팀 조원들의 평가 점수를 합산해서 평균 점수 반영 / 근거 자료 제출 필수!)
- 10(A), 8(B), 6(C), 4(D)
- 팀별평가 : 10점 (※팀 과제에 대한 다른 팀 구성원들의 평가 점수를 합산해서 평균 점수 반영)
- 10(A), 8(B), 6(C), 4(D) ※최대/최소 점수 제외
- ※기한 내 팀원최종평가+팀별평가 미송부 및 코멘트 미작성 시 감점 -1
- 출석 : 10점 (10:30-40분 사이 출석 체크. 특별한 이유 없이 결석하지 않을 경우 감점 없음)
Assignment
- 연구기획(개인)
- 중간과제(팀)
- 기말발표: 학기 후반부에 데이터를 편찬한 내용을 발표합니다.
- 실습 결과물 확인을 위한 피드백 시간이 있을 예정입니다.
Other Things
- 본 강의는 컴퓨터 기술에 대한 초보적인 이해를 가진 학생(엑셀 초보, 컴퓨터로 문서 작성만 해본 학생 등)도 얼마든지 수강 가능합니다.
- 본 강의는 웹 기반 미디어위키(MediaWiki) 플랫폼에서 진행될 예정입니다. 이에 따라 개인 PC 지참이 필수적으로 요구됩니다.
- 수업 시간에 다루게 될 툴 특성상 개인 PC 성능은 Netbook 이상이어야 하며, 태블렛 PC는 불가합니다.
Students, 수강생
| no | team | 개인페이지 | 연구기획서 | lst문서 |
|---|---|---|---|---|
| 1 | 서사죄아 | LDB25DGU☆☆☆ | 연구기획서 | LDB25DGU.lst |
| 2 | HJW25DGU멜키 | 미제출 | HJW25DGU.lst | |
| 3 | KHH25DGU알딸딸 | 연구기획서 | KHH25DGU.lst | |
| 4 | GZW25DGU보드읽러버 | 연구기획서 | GZW25DGU.lst | |
| 5 | KYW25DGU김다정 | 연구기획서 | KYW25DGU.lst | |
| 6 | KHA25DGU소믈리에 | 연구기획서 | KHA25DGU.lst | |
| 7 | 불굴자 | PDE25DGU블루블루바다 | 연구기획서 | PDE25DGU.lst |
| 8 | KHY25DGU인티제루티너 | 연구기획서 | KHY25DGU.lst | |
| 9 | PSY25DGU댕댕이러버 | 연구기획서 | PSY25DGU.lst | |
| 10 | SYW25DGU냠냠냠 | 연구기획서 | SYW25DGU.lst | |
| 11 | 심야괴담조 | YYW25DGURideTheStorm | 연구기획서 | YYW25DGU.lst |
| 12 | KDW25DGUStay | 연구기획서 | KDW25DGU.lst | |
| 13 | EYB25DGU뮤직러버🎵 | 연구기획서 | EYB25DGU.lst | |
| 14 | JJE25DGU기타리스트 | 연구기획서 | JJE25DGU.lst | |
| 15 | KJE25DGU럭키비키 | 연구기획서 | KJE25DGU.lst | |
| 16 | PSH25DGU팬케잌마스터 | 연구기획서 | PSH25DGU.lst | |
| 17 | 장기결석 | SHI25DGU지리산은사랑을싣고 | - | - |
Research: Team & Students & Topic 연구: 팀별 구성원과 주제
서사죄아💖서사를 사랑하는 게 죄는 아니자나~~
불굴자💪🏻
심야괴담조👻
Plan, 강의 계획
- 강의 내용은 실습 진도에 따라 변동될 수 있습니다.
- 12/5~11 기말고사 기간
| 주차 | 날짜 | 강의 내용 | 강의 형식 | 비고 |
|---|---|---|---|---|
| 01 | 9/5 | ①오리엔테이션 | 강의 소개 | |
| 02 | 9/12 | ②나의 데이터 공간 만들기: MediaWiki 소개 및 전자문서 작성 실습 위키 문법 / 자기소개 페이지 예: KJS25DGU 관심 키워드 입력 안내 |
이론/실습 | |
| 03 | 9/19 | ③근대 자료 아카이브 소개 관심 키워드 탐색 실습 & 연구기획서 작성 안내 |
실습 | 관심 키워드 준비 해오기 |
| 04 | 9/26 | ④디지털 인문학 개론: 데이터 기반의 인문학이란 무엇인가 | 이론 | |
| 05 | 10/3 | 개천절 휴강 (보강은 추가 학습 기간인 12/19 예정) |
||
| 06 | 10/10 | ⑤해외 디지털 인문학 프로젝트 사례와 그 의미 연구 기획 채점 안내 |
이론 | |
| 07 | 10/17 | ⑥온톨로지(Ontology)와 지식네트워크 연구기획 발표 및 팀 선정 👨🏻💻팀별 첫 회동 시간 |
이론/토론 | ①10/15 수요일 23:55분까지 연구기획 작성 ②10/15(수) 23:55 이후~10/16(목) 23:55까지 연구기획채점 |
| 08 | 10/24 | ⑦중간고사 대체 과제 | ||
| 09 | 10/31 | ⑧Triple Data(S-P-O) 디자인 실습: 네트워크 그래프 작성 KJS25DGU.lst / 실습 예제 👨🏻💻조별 소모임 시간 |
이론/실습/토론 | 11/5 수요일 23:55분까지 중간과제 작성 완료 |
| 10 | 11/7 | ⑨Knowledge Graph: 인문지식 네트워크와 그래프 데이터베이스 기초 Neo4j 기본 활용 보강 논의! |
이론/실습/토론 | Neo4j AuraDB 가입 및 초기 설정 해오기 |
| 11 | 11/14 | ⑩1차 피드백: 팀별 문제의식/연구대상/온톨로지 초안 피드백 | 토론 | TEAM: 팀별로 설계한 초벌 온톨로지 이야기 |
| 12 | 11/21 | ⑪Knowledge Graph: Neo4j 질의어 구성 실습 - 기초(1) 조별 팀원 평가 안내 👨🏻💻조별 소모임 시간 |
실습/토론 | |
| 13 | 11/28 | ⑫Knowledge Graph: Neo4j 질의어 구성 실습 - 심화(2) 2차 피드백: 팀별 데이터시트 피드백 |
실습/토론 | TEAM: 데이터 시트 준비 11/27 목요일 23:55분까지 팀원중간평가 송부 |
| 14 | 12/5 | ⑬Knowledge Graph: Neo4j 질의어 구성 실습 - 응용(3) Data Visualization - Dash board 활용 👨🏻💻조별 소모임 시간 |
실습/토론 | 기말 발표 형식 안내 |
| 15 | 12/12 | ⑭3차 피드백: 지식 그래프 구현 결과물 초안버전 소개 Data Visualization - Explore 활용 👨🏻💻마지막 조별 소모임 시간多多多 |
실습/토론 | TEAM: Neo4j 실습 초안 소개 기말 발표 순서 정하기 코멘트 작성 및 평가 점수 제출 안내 |
| 16 | 12/19 | ⑮기말 발표회 심야괴담→불굴자→서사죄아 |
발표/토론 | 25분 발표(시간 엄수!) / 15분 내로 질의응답 |
| 12월 20일(토요일) 오후 18시까지 코멘트 작성 + 조원 평가 점수 + 팀 평가 점수 송부 완료 | ||||
Useful Information 유용한 정보
How to use Mediawiki
○위키 문법
○출처 표기 규칙
○엑셀 to Wiki 변환 사이트1
○엑셀 to Wiki 변환 사이트2
○김지선·장문석·류인태, 「공유와 협업의 글쓰기 플랫폼, 위키」, 『한국학연구』60, 인하대학교 한국학연구소, 2021.open
How to design Ontology
○온톨로지 참고
- 장문석·김윤진·이은지·송가배·고자연·김지선, 「디지털 인문학과 지식의 공동생산 — 위키 플랫폼과 <한국 근대 지식인 아카이브> 편찬」, 『인문논총』78, 서울대학교 인문학연구원, 2021.open
- 디지털인문학연구소 온톨로지 정리(김지선)
How to create a Data Network
○네트워크 그래프 작성 방법
○Neo4j AuraDB 초기 설정 매뉴얼
○Neo4j 샘플 쿼리
- ↑ ※상대평가임을 고려하여 성적 이의 제기 시 팀원중간평가+최종평가 합산 점수만 공개하며, 세부 사항은 공개하지 않음(팀원 평가의 익명성 보장을 위함)