행위

영어와 한자가 간판에서 사용되는 정도 분석

red


1) 처음 Raw data는 preview image에 있는 다양한 글자를 인식할 수 있도록 다양한 색깔과 모양의 한글 자모, 영어 알파벳, 한자 각 100장씩으로 설정하였다. Epochs 50, Batch Size 128로 설정한 뒤에Training 결과는 정확도가 한글(0.5), 영어(0.75), 한자(0.87)로 낮게 나왔다. 따라서 다시 Raw data를 수집하게 되었다.


2) 2번째로 학습시킨 Raw data는 배경은 흰색, 글자는 검정으로 통일한 한글 자모, 영어 알파벳, 한자 부수 각 100장씩이였다. 한자는 영어 알파벳과 한글 자모같은 것은 없지만, 한자 부수가 있기 때문에 한자 부수를 택하여 수집하였다. Epochs 46, Batch Size 128로 설정한 후 Training 결과는 정확도가 한글(0.94), 영어(0.94), 한자(0.94)로 1차 Raw data에 비해 높게 나왔다. 따라서 이 결과로 학습을 시키기로 결정했다.


    • 학습결과 :


문제의식대로 결과값을 얻기 위해서 먼저 이 설정이 간단한 글귀를 해석할 수 있는지의 여부부터 알아보기로 했다. 이에 일상생활에서 볼 수 있는 간단한 한글, 영어, 한자 글귀 이미지를 찾아서 테스트해 보았다. 그러나 결과는 한자 글귀를 제외하고는 간단한 한글, 영어 글귀도 제대로 인식하지 못하였다. 이 연구에서는 서울 번화가 거리의 '간판' 사진을 넣은 후 나오는 결과값(수치)을 통해서 서울 번화가 거리에서 한글, 영어, 한자가 어느 정도의 수치로 혼용되어 사용되고 있는지 간단히 알고자 했지만, 간단한 글귀도 제대로 인식하지 못하는 결과로 인해 위의 문제의식에 따라서 진행하려고 했던 검사는 할 수 없게 되었다. 간단한 글귀를 인식한 결과값은 다음과 같다.


    • 학습 결과 이미지 :

결과1 결과2 결과3 결과4 결과5 결과6 결과7