행위

한중일 얼굴의 특성

red

①문제의식

- 백인, 흑인 등 동아시아로부터 멀리 떨어져 사는 나라의 사람들은 한국과 중국, 일본 사람들의 얼굴을 쉽게 구분하지 못한다. 그러나 한국인은 직관적으로 중국인과 일본인을 구별해 낸다. 피부색이나 눈, 코, 입 등 생김새의 차이점을 구체적으로 집어내긴 어렵지만 분명한 차이점을 느끼고 있다.

- 그렇다면 인공지능도 한국과 중국, 일본 사람들의 얼굴을 구분할 수 있을까. 흑인과 백인, 황인을 구별하는 것은 그 차이점이 뚜렷하기 때문에 어렵지 않다. 같은 아시아에서도 동북아시아와 동남아시아를 구분하는 것은 쉽다. 그러나 한중일은 유사점이 매우 많아 쉽지 않다. 인공지능은 과연 이들을 구별할 수 있을까.

②학습설계

- 한중일의 표본 얼굴이 될 만한 자료를 모으는 것이 본 실험에서 가장 중요하다. 왜냐하면 인공지능이 무엇을 학습하느냐에 따라 결과값이 다르게 나오기 때문이다. 예를 들어 중국 샘플은 남자 아이돌을, 한국은 50대 등산 동호회 여성의 얼굴을 학습시킨다면 올바른 설계라고 보기 어렵다.

- 그러므로 본 실험에서는 국적만 다르되 동일한 기준으로 수집된 얼굴 데이터를 학습에 사용키로 했다. 1)자료 획득이 용이하며, 2)한중일 모두 공통된 기준이 적용되고, 3)모집단에 가장 가까울 만한 표본이어야 했다. 그래서 구글에서 상위 검색되는 순으로 한중일 정치인의 얼굴을 쓰기로 했다.

- 이 때 여성은 제외하고 남성의 얼굴만 사용했다. 상대적으로 여성 정치인의 숫자가 적을 뿐 아니라 남녀의 얼굴이 섞일 경우 오히려 학습을 통해 일관된 패턴을 익히는데 방해가 될 수 있기 때문이다. 흑백이나 얼굴이 작게 나온 사진, 지나치게 얼굴이 가려진 사진 등은 제외했다.

③1차 결과

- 학습 때 사용된 것과 전혀 다른 한중일 지도자의 얼굴을 모델에 투입했더니 <문재인 한국 100%>, <시진핑 중국 76% 한국 24%>, <아베 일본 48% 중국 41% 한국 11%>의 결과가 나왔다. 대체적으로 인공지능의 학습은 잘 된 것으로 평가된다. 다만 아베의 경우 중국이 2순위 높은 수치로 나온 것은 헤어스타일과 의상 등이 영향을 미쳤던 것이라 사료된다.

④2차 결과

- 이번에는 한중일을 대표하는 3명의 미남 배우 얼굴 사진을 투입했다. 각각 1)이마를 가린 헤어스타일 2)머리를 넘긴 헤어스타일 두 종류의 사진을 썼다. 먼저 정우성은 1차에서 <한국 70% 일본 30%>의 결과가 나왔다. 2차에서는 <한국 95% 일본 5%>의 값이 나왔다. 이마를 가린 경우에는 얼굴 윤곽이 뚜렷하지 않아 일본이 섞인 것으로 분석된다.

- 다음에는 일본의 대표 미남배우 기무라 타쿠야의 얼굴을 썼다. 1차에서는 <일본 88% 한국 12%>가 나왔고, 2차에서는 <일본 65% 중국 31% 한국 4%>의 값이 나왔다. 머리를 뒤로 넘긴 2차 실험의 경우 아베처럼 중국의 비율이 높게 나왔다.

- 끝으로 중국의 미남배우 우효광의 얼굴 사진을 투입했다. 1차에서는 <중국 83% 일본 14% 한국 3%>, 2차에서는 중국 90% 일본 6% 한국 4%>가 나왔다. 우효광은 기무라 타쿠야와 달리 자국 비율이 1, 2차 모두 높게 나왔다.

⑤3차 결과

- 3차 실험에서는 인공지능을 속여보기로 했다. 즉, 중국인처럼 보이는 정우성 사진과 한국인처럼 보이는 우효광 사진을 썼다. 먼저 정우성의 경우 영화 ‘검우강호’에 출연 당시 스틸컷을 썼다. 중국식 복장을 하고 있어 이 사진을 선택했다. 결과는 <한국인 100%>였다.

- 그 다음은 한국식 머리 스타일과 메이크업 등을 하고 있는 우효광 사진을 썼는데 <한국 99% 일본 1%>가 나왔다. 즉, 화장과 사진의 밝기 등에 따라 얼굴형이 매우 달라질 수 있다는 뜻이다. 정우성은 의상만 무협 세계에 나오는 중국옷을 걸쳤을 뿐 얼굴은 그대로였다.