행위

HumanitiesAndArtificialIntelligence

red

길혜빈 (토론 | 기여) 사용자의 2020년 6월 16일 (화) 20:43 판 (신경망 기술과 이미지 분류 실습)

Information

  • 개설기관 : 경희대학교 대학원
  • 강좌명 : 인문학과 인공지능(Humanities and Artificial Intelligence)
  • 학수번호-분반 : KL7295-00
  • 이수구분 : 공통과목
  • 개설학과(학점) : 국어국문학과(3)
  • 강의시간 : 수요일 10:30-13:15
  • 강의실 : 문과대 201A
  • 강사 : 류인태

Overview

Summary

본 강의는 인공지능(AI) 기술로 인해 전통적인 인문학적 가치와 소양 그리고 연구방법론에 대한 근본적 질문이 대두하고 있는 상황에서, 인공지능(AI)을 어떻게 바라보아야 할 것인지에 대해 이야기해보고자 합니다. 인공지능(AI) 기술이 등장한 배경과 그 이면의 여러 지점들을 포착해 비판적으로 살펴보고, 더 나아가 기계학습(Machine Learning), 심층학습(Deep Learning) 등의 영역을 포괄하는 인공지능(AI) 기술이 인문학 연구에서 구체적으로 어떻게 활용될 수 있는 지에 대해서 살펴보고자 합니다. 인문학적 관점에서 비판적으로 바라보아야 할 인공지능(AI)의 일면과, 한편으로 인문학 연구에 능동적으로 활용 가능한 연구방법론으로서의 인공지능(AI)의 일면을 함께 짚어보고자 하는 것이 본 강의의 가장 큰 목적이라 할 수 있습니다.

Objectives

  • 비판적 대상으로서 인공지능 기술에 대해 이해한다.
    • 과학기술로서 인공지능 발달의 역사를 파악한다.
    • 과학기술로서 인공지능 기술의 원리를 이해한다.
    • 인공지능의 발달이 초래할 사회문화적 변화와 그에 대한 비판적 이해를 시도한다.
  • 인문학 연구 방법론의 일환으로서 인공지능 기술의 가능성을 검토한다.
    • 활용 가능한 인공지능 기술에 대한 기초 맥락을 이해한다.
    • 인공지능을 활용한 인문학 연구 사례에 대해 살펴본다.
    • 인공지능 기술 활용에 필요한 기초 기술(데이터 파싱, 크롤링, 스크래핑 등)을 익힌다.
    • 이미지와 텍스트를 대상으로 한 인공지능 기술 활용 방법론을 이해하고 적용해본다.

Teaching Method

  • 이론 강의 : 2주차, 3주차, 8주차, 9주차.
  • 실습 : 10주차, 11주차, 12주차.
  • 발표와 토론 : 4주차, 5주차, 6주차, 13주차, 14주차.

Reference Materials

Evaluation Standard

  • 총점 : 100%
  • 출석 : 10% (특별한 이유없이 결석하지 않을 경우 감점 없음)
  • 참여 : 10% (토론에 능동적으로 참여하는 학생에게 10점 가산)
  • 발표 : 30% (중간 발표와 기말 발표로 나누어 평가, 발표는 팀 기준으로 이루어짐)
    • 중간발표 : 15% (A : 15, B : 13, C : 11, D : 9)
    • 기말발표 : 15% (A : 15, B : 13, C : 11, D : 9)
  • 과제 : 50% (중간 과제와 기말 과제로 나누어 평가, 과제는 개인 기준으로 이루어짐)
    • 중간과제 : 25% (A : 25, B : 23, C : 21, D :19)
    • 기말과제 : 25% (A : 25, B : 23, C : 21, D :19)

Assignment

  • 중간고사 이전 1회, 중간고사 이후 1회의 발표를 한다.
    • 중간고사 이전에는 인공지능 관련 주제(문헌) 가운데 하나를 선택하고 그에 대한 리뷰 내용을 발표한다.
    • 중간고사 이후에는 단일 연구 주제를 선택해 딥러닝 기술을 적용한 인문학 연구를 기획하고 실제 진행한 내용을 발표한다.
  • 중간고사 평가는 상황에 따라 시험 or 과제를 유동적으로 실시한다.
  • 기말고사 평가는 기말발표 내용에 대한 리뷰에 근거해 그에 대한 내용을 보완한 결과물 평가로 대신한다.

Other Things

  • 본 강의는 웹 환경에서의 컴퓨터 기술이 기본적으로 활용되기에 수강생 개개인의 노트북 지참을 필수적으로 요구한다.

Students

길혜빈 김웅기 김태형 아슈토시 윤석만 이만호 임연 임예찬 장민주



Plan

본래주차 변경주차 날짜 강의 내용 강의 형식
01주차 - 03/04 코로나 바이러스로 인한 개강연기 -
02주차 - 03/11 코로나 바이러스로 인한 개강연기 -
03주차 01주차 03/18 오리엔테이션[1] 강의 소개(영상)
04주차 02주차 03/25 "인공지능(AI) 기술의 역사와 원리" (PPT) 이론 강의(영상)
05주차 03주차 04/01 미디어위키(Mediawiki) 전자문서 작성 실습 실습
06주차 04주차 04/08 인공지능 분야의 고전에 담긴 사유 검토 발표와 토론
07주차 05주차 04/15 실제 인공지능 사례 분석 및 정리[2] 발표와 토론
08주차 06주차 04/22 문예작품 속 인공지능에 대한 비판적 이해 발표와 토론
09주차 07주차 04/29 중간고사 평가
10주차 08주차 05/06 "기호적 접근, 규칙기반 인공지능 이해: 온톨로지(Ontology)" (PPT) 이론 강의
11주차 09주차 05/13 온톨로지(Ontology) 설계와 인문 데이터 편찬1 이론과 실습
12주차 10주차 05/20 온톨로지(Ontology) 설계와 인문 데이터 편찬2 이론과 실습
13주차 11주차 05/27 데이터 수집: 웹 크룰링과 웹 스크래핑 이론과 실습
14주차 12주차 06/03 "비기호적 접근, 학습기반 인공지능 이해: 신경망(Neural Network)" (PPT) 이론 강의
15주차 13주차 06/10 신경망(Neural Network) 기술과 이미지 분류 이론과 실습
16주차 14주차 06/17 신경망(Neural Network) 기술과 자연어 처리 이론과 실습
17주차 15주차 06/24 기말고사 평가

Report

Research Topics

중간고사 이전

중간고사 이후

신경망 기술과 이미지 분류 실습

①문제의식

- 백인, 흑인 등 동아시아로부터 멀리 떨어져 사는 나라의 사람들은 한국과 중국, 일본 사람들의 얼굴을 쉽게 구분하지 못한다. 그러나 한국인은 직관적으로 중국인과 일본인을 구별해 낸다. 피부색이나 눈, 코, 입 등 생김새의 차이점을 구체적으로 집어내긴 어렵지만 분명한 차이점을 느끼고 있다.

- 그렇다면 인공지능도 한국과 중국, 일본 사람들의 얼굴을 구분할 수 있을까. 흑인과 백인, 황인을 구별하는 것은 그 차이점이 뚜렷하기 때문에 어렵지 않다. 같은 아시아에서도 동북아시아와 동남아시아를 구분하는 것은 쉽다. 그러나 한중일은 유사점이 매우 많아 쉽지 않다. 인공지능은 과연 이들을 구별할 수 있을까.

②학습설계

- 한중일의 표본 얼굴이 될 만한 자료를 모으는 것이 본 실험에서 가장 중요하다. 왜냐하면 인공지능이 무엇을 학습하느냐에 따라 결과값이 다르게 나오기 때문이다. 예를 들어 중국 샘플은 남자 아이돌을, 한국은 50대 등산 동호회 여성의 얼굴을 학습시킨다면 올바른 설계라고 보기 어렵다.

- 그러므로 본 실험에서는 국적만 다르되 동일한 기준으로 수집된 얼굴 데이터를 학습에 사용키로 했다. 1)자료 획득이 용이하며, 2)한중일 모두 공통된 기준이 적용되고, 3)모집단에 가장 가까울 만한 표본이어야 했다. 그래서 구글에서 상위 검색되는 순으로 한중일 정치인의 얼굴을 쓰기로 했다.

- 이 때 여성은 제외하고 남성의 얼굴만 사용했다. 상대적으로 여성 정치인의 숫자가 적을 뿐 아니라 남녀의 얼굴이 섞일 경우 오히려 학습을 통해 일관된 패턴을 익히는데 방해가 될 수 있기 때문이다. 흑백이나 얼굴이 작게 나온 사진, 지나치게 얼굴이 가려진 사진 등은 제외했다.

③1차 결과

- 학습 때 사용된 것과 전혀 다른 한중일 지도자의 얼굴을 모델에 투입했더니 <문재인 한국 100%>, <시진핑 중국 76% 한국 24%>, <아베 일본 48% 중국 41% 한국 11%>의 결과가 나왔다. 대체적으로 인공지능의 학습은 잘 된 것으로 평가된다. 다만 아베의 경우 중국이 2순위 높은 수치로 나온 것은 헤어스타일과 의상 등이 영향을 미쳤던 것이라 사료된다.

④2차 결과

- 이번에는 한중일을 대표하는 3명의 미남 배우 얼굴 사진을 투입했다. 각각 1)이마를 가린 헤어스타일 2)머리를 넘긴 헤어스타일 두 종류의 사진을 썼다. 먼저 정우성은 1차에서 <한국 70% 일본 30%>의 결과가 나왔다. 2차에서는 <한국 95% 일본 5%>의 값이 나왔다. 이마를 가린 경우에는 얼굴 윤곽이 뚜렷하지 않아 일본이 섞인 것으로 분석된다.

- 다음에는 일본의 대표 미남배우 기무라 타쿠야의 얼굴을 썼다. 1차에서는 <일본 88% 한국 12%>가 나왔고, 2차에서는 <일본 65% 중국 31% 한국 4%>의 값이 나왔다. 머리를 뒤로 넘긴 2차 실험의 경우 아베처럼 중국의 비율이 높게 나왔다.

- 끝으로 중국의 미남배우 우효광의 얼굴 사진을 투입했다. 1차에서는 <중국 83% 일본 14% 한국 3%>, 2차에서는 중국 90% 일본 6% 한국 4%>가 나왔다. 우효광은 기무라 타쿠야와 달리 자국 비율이 1, 2차 모두 높게 나왔다.

⑤3차 결과

- 3차 실험에서는 인공지능을 속여보기로 했다. 즉, 중국인처럼 보이는 정우성 사진과 한국인처럼 보이는 우효광 사진을 썼다. 먼저 정우성의 경우 영화 ‘검우강호’에 출연 당시 스틸컷을 썼다. 중국식 복장을 하고 있어 이 사진을 선택했다. 결과는 <한국인 100%>였다.

- 그 다음은 한국식 머리 스타일과 메이크업 등을 하고 있는 우효광 사진을 썼는데 <한국 99% 일본 1%>가 나왔다. 즉, 화장과 사진의 밝기 등에 따라 얼굴형이 매우 달라질 수 있다는 뜻이다. 정우성은 의상만 무협 세계에 나오는 중국옷을 걸쳤을 뿐 얼굴은 그대로였다.

Useful Information

How to use Mediawiki

How to create Network Graph

External Website

Footnote

  1. 03.16부터 03.20까지 수강정정기간
  2. 04.15은 제21대 국회의원 선거일(공휴일)이며, 이로 인해 보강계획 필요