2018년 11월 3일 토요일

인공지능과 예술: 예술을 계산할 수 있을까?(1)


세상의 모든 사고와 논리가 정보처리에 불과하다면, 그래서 그것이 수에 대한 계산으로 설명될 수 있는 것이 사실이라면, 과연 예술은 여기서 예외일 수 있을까요? 그렇지 않습니다. 예술 역시도 소리나 색과 같은 정보의 형식으로 기술될 수 밖에 없으며, 그래서 정보처리의 대상이 됩니다. 인공지능을 통해 예술적인 문제들을 풀고자 하는 계산적 창의computational creativity가 가능하려면 예술도 정보라는 대전제가 작동해야 합니다.


Gatys, L. A., Ecker, A. S., & Bethge, M. (2016). Image style transfer using convolutional neural networks. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 2414-2423).



위의 그림은 인공지능과 예술이라는 키워드에 조금이라도 관심이 있는 분이라면 한 번쯤은 보았을 그림입니다. 이 그림은 컴퓨터가 합성곱신경망CNN: Convoultional Neural Network이라는 딥러닝 알고리즘을 통해 학습을 하고, 학습한 결과에 따라 이미지를 합성시킨 것입니다. 컴퓨터가 독일 튀빙겐 지역의 풍경 사진을 고흐나 뭉크같은 유명 작가의 화풍으로 다시 그려낸 것입니다 (Gatys, L. A., Ecker, A. S., & Bethge, M., 2016).

이야기를 풀어가기에 앞서서 합성곱신경망에 대해서 잠시 살펴보고 가겠습니다. ‘합성곱이라는 것은 필터의 특징과 입력된 이미지의 특징을 곱한 후 모두 더해서 새로운 특징을 합성해convolved 내는 것을 말합니다. ‘똑같은 가중치와 편향이 적용되어 있는 필터로 이미지의 구석구석을 촬영하면서 입력된 이미지 전체를 훑어 내립니다. 이 때 히든레이어의 다른 층에는 가중치와 편향이 다르게 적용된 필터를 적용할 수 있고, 이런 층을 여러개 쌓아 엣지edge나 색비color contrast같은 특징을 추출할 수 있습니다. 이 그림에서는 5x5의 이미지를 3x3 필터를 이용해서 특징을 찾아내는 것을 보여줍니다.


http://deeplearning.stanford.edu/wiki/index.php/Feature_extraction_using_convolution



이 신경망은 이미지 인식, 즉 컴퓨터비젼에서 탁월한 성능을 보이기 때문에 자율주행이나 얼굴인식을 할 때 많이 사용된다고 합니다. ‘보는일을 잘 처리하다보니 자연스럽게 시각예술인 미술과도 연결됩니다.

그런데 본다라는 것은 무엇을 의미할까요? ‘보는행위로 부터 우리가 얻을 수 있는 이득은 무엇일까요? 가장 큰 이득 중 하나는 분류classification입니다. 다른 말로 하면 사물과 사물의 경계를 구분하는 것입니다. 예를 들어보겠습니다.

우리가 도로 위에서 운전을 할 수 있는 것은 차도와 인도의 경계, 하행선과 상행선의 경계, 내 차선과 옆 차선의 경계를 알아보기 때문입니다. 앞차, 옆차와 부딛히지 않고 달릴 수 있는 이유는 내차와 다른 차들의 경계를 구분할 수 있기 때문입니다. 횡단보도를 지나는 행인을 피할 수 있는 이유도 사람의 경계를 정확하게 잡아내기 때문입니다. 무의식적으로 운전을 하고 있지만 사실은 우리의 눈이 1초에 20번 정도 사진을 찍어서 뇌로 전송하고, 뇌가 그것들을 화면으로 재구성하고, 화면 속 사물에 대한 분류 작업을 성공적으로 수행하기 때문에 사고 없이 주행할 수 있습니다. 운전 뿐만이 아닙니다. 맹수와 배경의 경계를 잡아내야 도망갈 수 있고 아기와 배경의 경계를 구분해야 젖을 먹일 수 있습니다. 이처럼 분류는 생존을 위한 기본 중의 기본입니다

분류가 시각정보에만 해당하는 것은 아닙니다. 언어에서도 너무 중요합니다. 단어에는 중의적 표현이 많아서 시각 정보만큼 경계가 뚜렷하지는 않지만 어쨌거나 인간은 단어와 단어 사이의 경계를 최대한 명확히 하고자 ‘사전’이라는 어마어마한 책을 만들었습니다. 
음악에서도 분류는 중요합니다. 오케스트라는 수십 개의 악기를 동시에 연주하는데 우리의 귀는 놀랍게도 개별 악기 소리의 ‘경계’를 찾아냅니다. 무엇이 바이올린 소리이고 무엇이 피아노 소리인지를 구분하는 것입니다. 만일 우리가 이 모든 정보를 ‘분류’할 수 없다면, 하루에도 수십 번 씩 교통사고를 낼 것이고, 언어의 뜻이 모호해져서 의사소통에 어려움을 겪을 것이며, 악기 소리를 구분하지 못하기 때문에 여러 가지 악기가 존재해야 할 이유조차 없어집니다. 그리고 결국 생존률은 낮아질 것입니다. 

분류는 이처럼 정보처리에 있어서 너무나도 중요합니다. 그리고 그것은 예술이라고 해서 예외가 아닙니다. 그리고자 하는 대상이 빌딩인지 사과인지 원숭이인지 분류하지 못한다면 아무것도 그릴 수가 없습니다. 그리고자 하는 대상을 분류했더라도 그것을 어느 정도의 굵기의 선으로 그릴 것인지, 어느 정도 농도의 색으로 표현할 것인지 등을 분류하지 못한다면 자신만의 스타일을 가질 수가 없습니다. 이쯤에서 다시 컴퓨터가 그린 ‘고흐 풍의 괴팅겐 풍경’으로 돌아가 보겠습니다. 

그려진 결과만 놓고보면 그동안 우리가 영상편집프로그램에서 사용해왔던 필터 기능과 크게 달라보이는 것이 없습니다. 그래서 사람들은 이 그림을 보고 과거의 방식과 뭐가 다르냐는 질문을 하고, 이것을 예술로 볼 수 있느냐는 질문도 하고, 어디가 창의적인것이냐고 묻기도 합니다. 그러나 우리가 눈 여겨 봐야 할 것은 ‘결과’가 아니라 ‘과정’입니다. 이것은 이 책 전반에서 누누히 강조한 것이기도 합니다. 창의는 결과에 한정되는 것이 아니라 결과가 있기까지의 과정이 반드시 포함되어야 하기 때문에, 어떻게 해서 그 결과에 이르게 되었는지, 그 과정에 창의적이라고 할 만한 것들이 담겨있는지를 살펴보는 것이 반드시 요구됩니다. 



도서 <다빈치가 된 알고리즘> 중에서