네그로폰테의 [디지털이다](백욱인역, 박영률출판사)

 

 

 

한국어판 서문                  

 

 

내 책이 한국어로 번역된다는 사실을 알고 매우 기뻤다.

그런데 그 이유가 독자 여러분이 짐작하는 것과는 다를지도 모르겠다.

내가 소장으로 있는 엠아이티(MIT)의 미디어랩(Media Lab)은 엘지(LG), 삼성, 키스트(KIST)와 아주 밀접한 관계를 맺어왔다. 이들과 맺은 연구협정 덕분에 나는 한국을 여섯 번 방문할 기회가 있었고 그때마다 무지무지하게 열심히 일하는 고학력의 철저하게 훈련받은 사람들을 보았다. 한국을 여행하면서 10년 전 일본을 여행했던 기억이 떠올랐다. 순수한 젊은이들과 그들의 선배들이 전자를 포함한 여러 분야에서 한국을 지도적 위치에 올려놓기 위해 노력했다. 대한민국에 이름을 하나 더 첨가한다면 ‘인내’라는 단어를 사용해 ‘대한 인내 민국’이라고 부르고 싶다.

나는 한국인들과의 공동 작업에 자부심을 느낀다. 당신들의 조국이 번창하리라는 것을 확신한다. 반도체 분야에서의 리더십과 디지털 세계에 대한 한국의 공헌은 부인할 수 없는 것이다. 그러나 이런 이유로 내 책의 한국어판 출간을 기뻐하고 있는 것은 아니다.

전해 들은 것이기도 하고 직접 체험하지 않은 경험이긴 하지만 한국에는 또 다른 얼굴이 있다. 바로 당신들의 교육체제, 내가 이 책에서 가장 크게 중점을 두었던 바로 그 문제에 대해 말하고 싶다. 내가 받은 인상으로는 당신들은 교육 분야에서 극히 위험한 길을 걷고 있다. 창의적이고 유연한 교육의 길 대신에 주입식 암기교육에 극단적으로 가치를 부여하고 있기 때문이다.

디지털 체계가 등장하기 전에는 단일한 교육체계나 교육방법이 모든 분야에 적용되어야만 했다. 강요된 역할에 순응하지 못하는 어린이들은 모두가 낙오했다. 높은 성적을 받지 못한 자녀를 둔 가족은 실의에 빠졌다. 교육체계가 잘못되어 있고 학교 밖에서 배울 게 더 많다는 사실을 부모에게 말할 수 있는 열네 살짜리 소년(소녀)은 없다.

홀연듯, 디지털 세계가 출현해 상이한 학습 분야를 통합하고 나섰다. 예술과 과학과 공학 분야 사이의 완고한 장벽을 날려보내기 시작했다. 같은 사물을 이해하는 데는 참으로 다양한 방법이 있다. 어린애들은 야구를 할 때처럼 즐겁게, 그리고 쉽게 아이디어와 함께 즐길 수 있다. 내가 이 책의 한국어판 출간을 그렇게 기뻐하는 이유는 바로 여기에 있다. 바라건대 이 책을 읽은 한국의 부모님들이 정보화 사회 혹은 내가 이 책에서 말한 디지털 세상이 출현하면서, 세상에 지금까지 없었던 새로운 성취 목표가 나타나고 있다는 사실을 이해해주기 바란다.



1995년 8월

니콜라스 네그로폰테








서문:종이책의 파라독스            








나는 독서 장애자이기 때문에 책 읽기를 싫어한다. 어린 시절 나는 고전 대신 기차 시간표를 읽곤 했다. 기차 시간표를 보면서 알듯말듯한 유럽 도시를 상상 속에서 여행하곤 하였다. 이렇게 몰입한 결과 나는 유럽 지리에 통달할 수 있었다.

그로부터 30년이 흘렀다. 나는 미디어랩의 소장이 되었고 때마침 한창 달아오르던, 미국대학으로부터 외국 기업에 기술을 이전하는 문제에 관한 논쟁에 참여하게 되었다. 나는 업계와 정부가 서로 만나는 두 개의 회의를 플로리다와 캘리포니아에서 소집했다.

회의장에는 1리터짜리 유리병에 든 에비앙 생수가 제공되었다. 다른 참석자들은 잘 몰랐겠지만 나는 과거의 내 기차 시간표 덕분에 에비앙의 정확한 위치를 알 수 있었다. 에비앙은 대서양에서 500마일 이상 떨어져 있다. 이 무거운 생수병들은 거의 유럽의 3분의 1을 돌아 대서양을 건넌 후, 캘리포니아까지 다시 3,000마일을 더 여행한 것이다.

그때 그 자리에서 우리는 회의 석상의 물조차 미국 것을 제공하지 못하면서 미국의 컴퓨터 산업과 전자 분야의 경쟁력에 대해 논의하고 있었던 것이다.

오늘 내가 에비앙 이야기를 꺼낸 이유는 프랑스산 미네랄 워터와 미국산 생수 간의 경쟁력 때문이 아니라 아톰과 비트 간의 근본적인 차이점을 설명하기 위해서이다. 국제 무역은 전통적으로 물질, 곧 아톰을 교환하는 것이다. 에비앙 생수는 크고 무거운 불활성 물체를 많은 비용을 들여 조심스레 천천히 선적한 후 여러 날 동안 수천 마일을 거쳐 전달된다. 세관을 통과할 때에는 비트가 아니라 아톰임을 밝혀야 한다. 플라스틱 시디에 녹음된 디지털 음악의 경우도 포장, 선적, 목록 작성에 비용이 든다.

그런데 이러한 사정이 매우 빨리 변하고 있다. 책, 잡지, 신문, 비디오 카세트처럼 사람이 직접 손으로 취급하던 정보가 플라스틱 조각에 녹음된 전자 자료―값싸고 직접적인 전달 체제―로 변하여 광속으로 전달된다. 이렇게 해서 누구나 정보에 접근할 수 있다. 토마스 제퍼슨(Thomas Jefferson)은 무료로 책을 빌려볼 수 있는 도서관 개념을 제시했다. 그러나 이 위대한 우리의 선조는 2,000만 명의 사람이 그 내용을 무료로 꺼내 볼 수 있는 디지털 도서관에 대해서는 생각하지 못했다.

아톰에서 비트로 변화하는 추세는 돌이킬 수도, 막을 수도 없다.

도대체 지금 이것이 왜 중요한가? 변화가 매우 급박하게 이루어지고 있기 때문이다. 어제의 조그만 차이가 내일이면 충격적인 결과를 낳는다.

일당 1페니짜리 일을 하는 사람의 급여를 매일 두 배씩 올려주면 그의 한달 급여가 얼마나 될지를 묻는 어린애들의 수수께끼를 들어본 적이 있는가? 새해 첫날부터 이 놀라운 급여 체제를 시행하면 1월 마지막 날에는 하루에 1,000만 달러 이상을 받게 된다. 대부분의 사람들은 이 수수께끼를 단지 이런 정도로만 기억한다. 똑같은 계산 방식을 적용할 경우 1월이 2월처럼 3일만 짧더라도 130만 달러밖에 받지 못한다는 사실을 알고 있는 사람은 드물다. 한달이 31일인 1월에는 2,100만 달러였으나 한달이 28일이라면 2개월간의 총수입이 260만 달러밖에 안된다. 우리는 컴퓨팅과 디지털 텔레커뮤니케이션의 이 마지막 3일 안에 살고 있다.

이와 같은 기하급수적 속도로 컴퓨터가 우리의 일상 생활에 다가오고 있다. 미국 가정의 35%, 10대의 50%가 집에 개인용 컴퓨터를 갖고 있으며, 3,000만 명에 달하는 사람이 인터넷을 사용하고 있다. 1994년에 전세계에서 팔린 컴퓨터 가운데 65%가 가정용이다. 이 가운데 90%는 모뎀이나 시디롬 드라이브를 갖추고 있는 것으로 추산된다. 이러한 수치는 1995년에 출고된 자동차에 설치된 50여 개의 마이크로프로세서나 토스터, 응답 전화기, 시디 플레이어, 인사 카드 등에 사용된 마이크로프로세서는 제외한 것이다. 위에 든 수치가 틀렸다면 잠시 기다려주기 바란다.

컴퓨터 사용과 관련된 수치는 엄청나게 빠른 속도로 증가하고 있다. 인터넷을 사용하는 데 필요한 모자이크라는 프로그램의 경우 1993년 2월에서 12월까지 매주 11%의 비율로 사용자가 늘어났다. 인터넷 사용자 수 자체도 매달 10%씩 증가하고 있다. 이런 식으로 사용자가 증가할 경우(거의 불가능한 일이지만) 2003년에는 인터넷 사용자 수가 전세계 인구를 능가할 것이다.

어떤 사람들은 앞으로 정보를 많이 가진 사람과 정보를 적게 가진 사람, 정보를 가진 자와 정보를 갖지 못한 자, 제1세계와 제3세계 간의 사회적 단절에 대해 염려한다. 그러나 진짜 문제는 세대간에 이루어지는 문화 단절이다. 나에게 시디롬이 무엇인지 알게 되었다고 말하는 부인은 아마 틀림없이 5세~10세짜리 자녀를 두고 있을 것이다. ‘아메리카 온라인’(America Online)을 접하고 흥분하는 부인은 틀림없이 집에 10대 자녀가 있을 것이다. 시디롬은 전자책이고 ‘아메리카 온라인’은 사회적인 미디어다. 어른들이 공기에 대해 (그것이 없어지지 않는 한) 의심하지 않듯 아이들에게 이들 매체는 너무나도 자연스럽다.

컴퓨팅은 이제 더 이상 컴퓨터에 국한된 문제가 아니다. 그것은 삶이다. 메인 프레임(mainframe)이라는 이름의 거대한 중앙 컴퓨터는 개인용 컴퓨터로 완전히 대체되었다. 컴퓨터는 에어컨이 딸린 방만한 크기에서 자그만 책장 크기로, 다시 데스크탑(desktops)으로, 이제는 랩탑과 포켓 사이즈로 작아졌다. 그러나 아직 끝나지 않았다.

21세기 초가 되면 와이셔츠 커프스나 귀걸이만한 크기의 컴퓨터로 저궤도 위성을 이용해 통신을 할 수 있게 된다. 크기는 작아져도 그 컴퓨터의 성능은 지금 당신이 쓰고 있는 컴퓨터보다 훨씬 강력해진다. 전화는 아무때나 울리지 않게 된다. 잘 훈련된 영국 집사처럼 당신에게 필요한 통화만 골라 연결해 준다. 매스미디어는 개인화된 정보와 오락을 전달하고 전달받는 체계를 가리키는 말로 다시 규정된다. 학교는 전세계의 어린이가 아이디어를 모아 그들의 공동체를 만드는 박물관이나 운동장 비슷하게 된다. 디지털 세계는 아주 작은 공간으로 보여지고 느껴질 것이다.

우리가 서로 연결되면서 크고 작은 전자 공동체는 국민국가가 신봉하던 수많은 가치를 대체한다. 우리는 물리적 공간에 제약받지 않고 시간의 역할이 종전과 달라지는 디지털 이웃들과 공동체를 이룬다. 지금부터 20년이 지나면 5,000마일이나 떨어진, 시간차가 6시간이나 나는 곳을 집 창문을 통해 내다볼 수 있게 된다. 1시간짜리 텔레비전 프로그램이 1초도 안 되어 당신의 집에 도달한다. 아르헨티나 남부 파타고니아에 대해 읽으면서 마치 그곳에 있는 것 같은 감각적 체험을 하게 된다. 윌리암 버클리(William Buckley)의 책을 읽으면 마치 그와 대화하는 것처럼 느끼게 될 것이다.

그런데 왜 네그로폰테(Negroponte)는 삽화 한 장 없는 책을 만들었을까? 왜 크노프 출판사는 이 책이 에비앙 생수와 달리 아주 간단히 디지털 형식으로 전환될 수 있음에도 불구하고 비트가 아니라 아톰으로 디지털이다를 만들었을까? 이제 그 이유를 설명하겠다.

첫번째 이유는 근본적으로 새로운 문화를 가장 먼저 이해할 필요가 있는 경영인, 정치가, 부모들이 디지털 미디어와 친숙하지 않기 때문이다. 무소불위의 컴퓨터이지만 현재의 인터페이스(interface)는 아주 원시적이고 여전히 멍청하기 때문에 잠자리에까지 들고 갈 맛이 나지 않는다.

둘째는 내가 와이어드(Wired)지에 연재한 칼럼 때문이다. 와이어드의 놀랄 만한 성공을 보면서 이론이나 컴퓨터 장비뿐만 아니라 디지털 라이프 스타일과 사람에 관한 정보를 고대하는 수많은 독자가 있음을 확인하였다. 내가 쓴 텍스트 위주의 칼럼에 관해 많은 사람들이 그들의 의견을 보내주었다. 답장을 받고 난 후에 이전에 쓴 원고를 다시 손보기로 했다. 왜냐하면 그것을 쓴 지 얼마되지 않았지만 그 짧은 기간 동안에 너무나 많은 것이 달라졌기 때문이다. 당연한 일이다. 그 글은 컴퓨터 그래픽을 위한 새로운 시스템, 인간 커뮤니케이션, 쌍방향 멀티미디어를 고안해내던 시기에 쓴 이야기이기 때문이다.

세번째 이유는 좀더 개인적이면서 약간은 금욕주의적인 것이다. 상호소통적인 멀티미디어는 상상력의 여지를 별로 남겨두지 않는다. 멀티미디어 이야기는 할리우드 영화처럼 특정한 표상을 포함하기 때문에 마음의 눈에는 아주 작은 여지만을 열어둔다. 이와 대조적으로 글로 쓴 이야기는 이미지를 자극하고 은유를 촉발하여 독자의 상상력과 체험에서 나오는 풍요로운 의미를 던져준다. 당신은 소설을 읽으면서 무수한 색깔과 소리, 움직임을 만들어낸다. 나는 디지털이다가 당신의 삶에 의미하는 바가 무엇인지를 느끼고 이해하려면 이런 종류의 개인적인 확장이 필요하다고 생각한다.

나는 당신이 이 책에서 당신을 읽기 바란다. 책 읽기 싫어하는 사람으로서 하는 얘기다.







정보의 디엔에이(DNA)              1





비트와 아톰



지털 세계가 가져올 영향과 혜택을 이해하는 지름길은 비트(bits)와 아톰(atoms)의 차이를 곰곰이 생각해 보는 데 있다. 우리가 정보화 시대에 살고 있음에도 불구하고 신문, 잡지, 책 등 대부분의 정보는 아톰 형태로 우리에게 전달된다. 경제가 정보 경제를 중심으로 이루어지고 있지만 무역에 관한 서류를 작성하거나 대차대조표를 쓸 때 우리는 여전히 아톰을 염두에 두고 있다. 가트(GATT)는 아톰의 교역에 관한 협정이다.

나는 최근에 미국의 5대 종합 반도체 제조 회사 가운데 한 곳을 방문했다. 입장 수속을 할 때 안내자가 나에게 랩탑 컴퓨터를 갖고 있는가 물었다. 물론 갖고 있었다. 안내자가 모델명과 시리얼 번호 그리고 가격을 물었다. 나는 “대략 100만~200만 달러쯤 되겠지요”라고 말했다. “아니, 선생님! 그럴 리가 있나요”라고 그녀가 대답했다. “도대체 무슨 말씀이죠? 어디 제게 보여주세요.” 그녀에게 오래된 나의 파워북을 보여주었더니 그녀는 그 가격을 2,000달러로 매겼다. 그녀가 가격을 기입한 후에야 구매로 입장할 수 있었다. 아톰은 2,000달러만큼의 가치도 없다. 그러나 비트의 가치는 따질 수 없을 정도다.

얼마전에 나는 캐나다의 브리티시 컬럼비아 주, 밴쿠버시에 위치한 폴리그램사 경영자를 위한 회의에 참석한 적이 있다. 그 회의의 목적은 중견 경영자들 간의 커뮤니케이션을 증진하고, 곧 시판될 음악, 영화, 게임, 오락 비디오를 포함한 출시 예정 소프트를 보여주는 데 있었다. 회의에서 사용될 샘플은 시디 음반, 비디오 카세트 테이프, 시디롬과 같이 질량과 부피를 가지고 있으며 포장되어 속달우편(FedEx)을 이용하여 배달될 예정이었다. 불행히도 몇몇 물품이 세관에 억류되어 전달이 보류되었다. 같은 날 나는 호텔 방에서 엠아이티를 포함해 세계 곳곳에 비트를 전달하고 있었다. 폴리그램사의 아톰과 달리 나의 비트는 세관에 억류될 우려가 없었다.

정보고속도로는 무게 없는 비트를 빛의 속도로 세계에 전달한다. 각 산업마다 디지털 세상에서 자신의 미래상이 어떨지를 거울에 비쳐본다. 회사의 미래는 그들이 제공하는 제품이나 서비스를 디지털 형태로 바꿀 수 있는 능력에 달려 있다. 캐시미어 스웨터나 중국 요리도 머지않아 비트로 전환될 수 있을 것이다. “스코티, 나를 빛으로 바꿔줘요”는 정말 기가 막힌 꿈이다. 그러나 이런 일은 앞으로 몇 세기 안에는 이루어지지 않는다. 그때까지는 아톰을 전달해 줄 페더럴 익스프레스나 자전거, 배달부가 필요하다. 디지털 기술이 아톰과 관련된 사업의 디자인, 제조, 마케팅, 경영에 별로 도움이 안된다는 말은 아니다. 그러나 핵심 사업은 변하지 않을 것이며, 제품도 아톰에서 비트로 대치되지 않는다는 뜻이다.

정보산업과 오락산업에는 대개 비트와 아톰이 섞여 있다. 출판업자는 정보(비트) 전달 사업자인가, 아니면 아톰 제조업자인가? 역사적인 틀에서 볼 때 둘 다 맞는다. 그러나 정보 적용 분야가 확대되고 사용자에게 친근해질수록 사정은 달라진다. 지금 당장은 어렵지만 앞으로는 디지털 책이 인쇄 책과 질을 겨루게 될 것이다.

책은 선명도가 뛰어나고, 가벼우며, 별로 비싸지 않다. 그러나 그것이 당신에게 전달되려면 운송과 보관이 필요하다. 교과서의 경우 전체 가격의 45%가 운송 및 보관, 반품에 드는 비용이다. 더 불행한 사실은 책은 절판될 수 있다는 사실이다. 디지털 책에는 절판이란 게 없다. 디지털 책은 항상 남아 있다.

책 이외의 다른 미디어는 더욱 직접적인 위험에 직면해 있다. 그러나 동시에 기회도 넓어진다. 고객들이 아톰을 다시 반납해야 하고 지정된 날짜에 반납하지 못할 경우 벌금(미국 비디오 대여 시장의 매출액 120억 달러 가운데 30억 달러가 늦게 반납한 데 대한 벌칙금이다)을 물어야만 하는 대여점 비디오 테이프가 제일 먼저 비트로 바뀌게 된다. 다른 미디어의 경우 편의성, 경제적 유인, 탈규제 정도에 따라 디지털화가 추진될 것으로 보인다. 이러한 경향은 매우 빠르게 진행되고 있다.




도대체 비트란 무엇인가?



비트는 색깔도, 무게도 없다. 그러나 빛의 속도로 여행한다. 그것은 정보의 디엔에이를 구성하는 가장 작은 원자적 요소이다. 비트는 켜진 상태이거나 꺼진 상태, 참이거나 거짓, 위 아니면 아래, 안 아니면 바깥, 흑이거나 백, 이들 둘 가운데 한 가지 상태로 존재한다. 이해를 쉽게 하기 위해 우리는 비트를 1 혹은 0으로 간주한다. 1의 의미, 혹은 0의 의미는 별개의 문제이다. 컴퓨팅의 초창기에 비트열(a string of bits)은 대개 수치 정보를 가리켰다.

수를 헤어보자. 1과 0이 아닌 다른 숫자는 건너뛴다. 그러면 다음과 같은 결론을 얻게 된다. 1, 10, 11, 100, 101, 110, 111,‧‧‧‧‧‧ 이 숫자는 1, 2, 3, 4, 5, 6, 7,‧‧‧‧‧‧ 등을 나타내는 이진법 수가 된다.

비트는 항상 디지털 컴퓨팅의 기본 단위였지만 지난 25년 동안 이진법 어휘는 단순한 숫자를 넘어 엄청나게 확장되었다. 우리는 오디오나 비디오를 1과 0으로 바꿈으로써 더 많은 정보를 디지털화할 수 있게 되었다.

신호를 디지털화하는 것은 신호를 잘게 쪼개어 샘플링함으로써 다음에 이 신호를 완벽하게 복제할 수 있도록 하는 것이다. 예를 들어 오디오 시디(CD)의 경우 음향은 1초에 44,100번 샘플링된다. 음향의 진동 형태(전압으로 측정된 음압 레벨)는 불연속적인 숫자(비트로 전환된)로 기록된다. 이러한 비트 스트링이 1초에 44,100번 재생되면서 오리지널 음악을 연주한다. 소리의 파형은 전압차로 측정되는 음악에 의해 나타난다. 이것은 숫자값으로 녹음된다. 일초 동안 44,100회로 나누어 샘플링된 비트들을 연결하면 결과적으로 원래 음악과 같은 연속적인 소리를 들을 수 있다. 짧은 시간동안 많은 수의 샘플링이 이루어져 좁은 간격을 유지하며 연결되어 있는 이들 단속적인 값들을 우리는 불연속적이며 분리된 소리로 듣지 못한다. 그것은 연속적인 소리로 느껴진다.

흑백 사진의 경우도 마찬가지이다. 전자카메라가 이미지를 섬세한 그리드(grid)로 나눈 뒤 그것을 일정한 면적에서 포착되는 회색의 농도로 기록한다고 생각해 보자. 검정색을 농도 0으로, 흰색은 농도 255로 수칫값을 준다면 모든 회색은 이 두 수치 사이에서 일정한 농도값을 갖게 된다. 편리하게도 8비트는 00000000에서 시작하여 11111111로 끝나는, 0과 1로 구성되는 256개의 순열을 갖는다. 이러한 섬세한 농담(gradation)과 그리드를 이용해 인간의 눈이 포착하는 그림을 완벽하게 재구성할 수 있다. 이보다 거친 눈금을 사용하거나 회색 농담의 단계 폭을 넓혀주면 강렬한 흑백 대비 현상이나 거친 윤곽선이 드러나는 디지털 작품을 볼 수 있게 된다.

개별 픽셀(pixel)로부터 하나의 형상이 만들어지는 과정은 물질 세계에서 훨씬 정교한 축척으로 사물을 관찰할 때 일어나는 현상과 유사하다. 잘 연마된 금속 표면을 원자보다 더 작은 것을 관찰할 수 있는 고배율 현미경으로 관찰하면 숭숭 뚫린 구멍을 볼 수 있다. 그것이 부드러우면서도 단단해 보이는 이유는 최소 조각들이 아주 작기 때문이다. 디지털의 경우도 마찬가지이다.

그러나 우리가 경험하는 세계는 아날로그의 공간이다. 우리 눈으로 볼 때 세계는 디지털이 아닌 연속성의 세계이다. 아날로그의 세계에서는 갑자기 켜지거나 꺼지는 일, 검정에서 흰색으로 바뀌는 일, 단계적 변환 없이 어떤 한 상태에서 다른 상태로 급변하는 일은 있을 수 없다. 그러나 마이크로의 단계로 다가서면 이러한 현상은 진리가 아닐 수도 있다. 전선을 흐르는 전자나 우리 눈으로 들어오는 광자의 차원에서는 사물이 불연속적으로 존재하기 때문이다. 우리가 대개 연속적인 것이라고 생각하는 수많은 사물은 사실 수많은 독립 구성요소로 이루어진다. 이 책(아날로그 매체)은 대충1,000,000,000,000,000,000,000,000개의 아톰으로 구성되어 있다.

디지털화하면 많은 이점을 얻을 수 있다. 중요한 내용 중에 데이터 압축과 에러 수정이 있는데, 비용이 많이 들거나 잡음이 많은 채널을 통하여 정보를 송신할 때 큰 역할을 한다. 방송업자는 경비를 절약할 수 있으며, 시청자는 스튜디오 수준의 화상과 음향을 보고 들을 수 있다. 그러나 디지털 세상이 가져오는 결과는 이런 것보다 훨씬 중요하다.

음향과 영상을 비트로 표현하면 아주 적은 수의 비트만 사용해도 되기 때문에 자연히 이점이 발생한다. 이것은 바로 에너지 절약과 밀접한 관련이 있다. 그러나 1초 동안 사용하는 비트의 수, 혹은 1평방 인치에 사용되는 비트의 수는 음악이나 이미지의 충실도에 곧바로 영향을 미친다. 일반적으로 아주 높은 해상도로 디지타이징(digitizing)한 다음에 이보다 해상도가 떨어지는 수준에서 음향과 영상 자료를 사용하는 경우가 많다. 예를 들어 최종 인쇄물을 위한 컬러 이미지는 해상도가 아주 높게 디지털화되지만 컴퓨터를 사용하는 편집 레이아웃에서는 낮은 해상도를 적용하는 경우가 많다. 비트의 경제성은 비트가 저장되고 전달되는 매체의 한계에 의하여 부분적으로 영향을 받는다.

채널(구리선, 라디오 스펙트럼, 광섬유 등)을 통하여 1초 동안 전달되는 비트의 수를 채널당 대역폭(bandwidth)이라 부른다. 이는 해당 통로를 통해 얼마나 많은 비트가 전달되는지를 측정한 수치이다. 전달 비트수는 각 유형의 데이터(음성, 음악, 비디오)를 전환하는 데 필요한 비트 수와 일치해야 한다. 양질의 음성을 들으려면 초당 64,000비트가 전송되어야 하며, 하이파이(high-fidelity) 음악을 들으려면 초당 120만 비트, 비디오를 전달하려면 초당 4,500만 비트로 전송되어야 한다.

지난 15년 동안 우리는 비트를 시간과 공간의 측면에서 연구함으로써(쓰지 않는 비트를 골라내고 반복되는 비트를 제거함으로써) 음향과 영상을 디지털 형태로 압축하는 방법을 알아냈다. 여러 가지 미디어가 이처럼 빠른 속도로 디지털화되기 시작한 이유는 대부분의 사람들이 생각한 것보다 훨씬 빨리 높은 수준의 압축 기술이 개발되었기 때문이다. 실제로 1993년만 해도 유럽인들은 21세기에나 디지털 비디오가 현실화되리라고 주장했다.

5년 전에 대부분의 사람들은 1초 분량의 4,500만 비트짜리 오리지널 디지털 비디오가 120만 비트로 축소될 수 있다는 사실을 믿지 않았다. 그러나 1995년에 우리는 질을 크게 훼손하지 않으면서 싼 비용으로 여러 가지 비율로 비디오를 압축․복원하고, 인코딩․디코딩할 수 있게 되었다. 마치 물만 부으면 이탈리아 레스토랑 커피의 맛과 향기로 되살아나는 냉동 건조 카푸치노를 만들 수 있게 된 것이나 마찬가지다.




모든 미디어가 비트가 될 때



디지털 세상이 되면 전화 정전기, 라디오 잡음, 텔레비전의 스노 현상과 같은 신호 전달 에러를 정정하여 정보를 전달할 수 있다. 여분의 다른 비트를 사용하여, 잡음의 형태나 미디어의 종류에 관계없이 정교하게 에러를 보정할 수 있기 때문이다. 시디의 경우 전체 비트의 3분의 1 가량이 오류 정정을 위해 사용된다. 이와 같은 기술은 기존의 텔레비전에 응용되어 가정에서 방송국 수준의 방송을 수신할 수 있으며, 현재의 화질이나 음질과 비교하여 훨씬 선명하여 고선명 텔레비전이라고 착각할 정도일 것이다.

에러 수정과 데이터 압축의 두 기술은 디지털 텔레비전에 있어 필수불가결한 사항이다. 이전에 잡음이 뒤섞인 아날로그 텔레비전 방송이 사용하던 대역폭을 이용하여 앞으로는 방송국 수준의 화질과 음질을 갖는 네 개의 디지털 텔레비전 신호를 보낼 수 있다. 동일한 채널을 사용하여 더 나은 화상을 얻음으로써 잠재적으로 4배의 시청자와 광고 수입을 얻을 가능성이 생겨난다.

대부분의 미디어 경영자들은 이미 존재하는 매체를 더욱 효율적인 전달 수단으로 만들기 위해 디지털을 어떻게 활용할까 고민중이다. 그러나 트로이 목마처럼 디지털의 선물은 놀랄 만한 결과를 가져온다. 디지털 세상에서는 새로운 경제 모델, 소규모 정보 산업, 오락물 제공자 등 완전히 새로운 내용이 태동될 것이다.

모든 미디어가 디지털이 되면―비트는 비트이기 때문에―두 가지 근본적이고 직접적인 결과가 나타난다.

첫째, 비트는 손쉽게 혼합된다. 비트는 뒤섞여 함께 사용되거나 독립적으로 사용된다. 오디오, 비디오, 데이터의 혼합을 멀티미디어(multimedia)라 부른다. 대단히 복잡한 것처럼 들리지만 비트를 섞어놓은 것에 불과하다.

둘째, 다른 비트에 관한 정보를 당신에게 알려주는 신종 비트의 탄생이다. 가장 전형적인 새로운 비트는 신문기자들이 기사 내용을 구분하기 위하여 정리할 때 붙이는(우리는 볼 수 없지만) ‘슬러그’(slug)처럼 전형적인 ‘헤더’(header) 기능을 수행하는 것이다. 이러한 헤더는 잡지 게재 논문에 사용할 핵심 단어를 준비하는 학술 논문 저자들에게 이미 익숙한 것이다. 헤더는 내용 목록일 수도 있고, 다음에 나올 데이터에 관한 설명일 수도 있다. 요즘 사용되는 시디에는 어떤 노래를 듣다가 다른 곡을 듣기 위해 건너뛰거나, 혹은 좀더 상세한 정보를 전달하는 데 필요한 간단한 헤더가 포함되어 있다. 이들 비트는 보이지 않고 들리지도 않으나, 사람과 컴퓨터, 그리고 특수 목적의 오락 기기들에게 신호의 특성을 알려 준다.

‘혼합 비트’와 ‘비트에 관한 비트’라는 이 두 가지 현상으로 말미암아 미디어 환경은 완전히 변해버릴 것이다. 지역 케이블을 통한 주문형 비디오나 전자 게임은 빙산의 일각에 불과할 뿐이다. 컴퓨터가 해독할 수 있는 지시문과 함께 전달되는 텔레비전 쇼가 어떤 결과를 가져올까에 대해 생각해 보라. 당신은 방송 시간과 채널에 상관없이 당신이 원하는 내용을 녹화할 수 있다. 수신기에서 오디오, 비디오, 문자 형태로 프로그램을 만들 수 있는 디지털 지시문은 또 어떤가? 누구나 이들 비트를 아주 손쉽게 전달할 수 있게 되면 거대 미디어 회사는 당신과 나에 비해 어떤 강점을 가질까?

디지털 세계는 그런 질문을 우리에게 던진다. 디지털화는 비트의 발생원들을 완전히 새롭게 조립함으로써 새로운 내용의 창작물이 만들어질 수 있는 가능성을 창조하는 것이다.

 



지능의 거처



텔레비전 방송은 모든 지능이 발생지(the point of origin)에 몰려 있는 경우다. 송신자가 모든 것을 결정한다. 수신자는 수신된 것만 얻게 된다. 실제로 크기에 비하여 텔레비전은 집안에서 가장 멍청한 제품(물론 프로그램에 대해 이야기하는 것은 아니다)에 불과하다. 전자 오븐만 해도 텔레비전보다 더 많은 마이크로프로세서가 들어 있다. 차세대 텔레비전의 발전 단계를 해상도, 더 좋은 색상, 더 많은 프로그램으로 생각하지 말고, 지능 분배의 변환, 혹은 좀더 정확히 말하면 수신자로부터 송신자 쪽으로 지능이 흘러가는 것으로 이해하기 바란다.

신문도 역시 송신자의 지능에서 시작한다. 그러나 복합 편집 신문과 같은 매체는 천편일률적인 정보에서 벗어날 수 있는 가능성을 제시한다. 각기 다른 사람들이 각기 다른 시간에 각각 다르게 사용할 수 있기 때문이다. 헤드라인과 그림을 안내 자료로 삼아 이 페이지 저 페이지를 훑어가다 보면 수십만 명의 독자들은 모두 다 제 각각의 눈으로 사물을 보게 된다. 비트는 같지만 독서 체험은 다르다.

디지털 세상의 미래를 미리 보는 한 가지 좋은 방법이 있다. 한 미디어의 질이 어떻게 바뀌는가를 물어보면 된다. 텔레비전 시청이 신문을 보는 것보다 나을 수는 없을까? 많은 사람들은 신문 뉴스가 텔레비전보다 더 깊이가 있다고 말한다. 꼭 정말 그럴까? 한편 텔레비전은 신문보다 현장감이 더 큰 것으로 알려져 있다. 언제나 그럴까?

이에 대한 대답은 기사를 걸러내고, 검색하고, 우선 순위를 결정하는 컴퓨터―우리가 명령을 내리면 신문을 읽고, 우리를 위하여 텔레비전을 대신 봐주는 컴퓨터, 그리고 편집자 기능을 수행하는 컴퓨터―를 만들어내는 데 달려 있다. 이러한 종류의 지능은 서로 다른 두 곳에 위치할 수 있다.

지능은 송신기에 위치할 수 있다. 마치 당신이 편집기자를 개인적으로 고용하는 것처럼 뉴욕 타임스가 당신 개인의 관심거리만을 편집해 신문 한 부를 발행하는 것이다. 이 경우에는 당신만을 위한 비트가 골라진다. 비트는 걸러지고, 잘 정리되어 당신에게 전달되며 당신의 집에서 인쇄된다. 전자 디스플레이를 사용하면 신문구독의 쌍방향 커뮤니케이션 기능은 더욱 높아진다.

두번째는 뉴스 편집 시스템이 수신기에 달려 있는 경우이다. 이는 뉴욕 타임스가 아마도 5,000여 가지에 달하는 엄청나게 많은 비트를 전송하고, 그 가운데서 자신의 관심 분야와 습관, 그날의 계획에 부합하는 기사만을 선별하는 경우다. 이 경우 지능이 수신기에 위치하고 송신기는 모든 비트를 모든 사람에게 무차별 전송한다.

미래는 첫번째 경우, 혹은 두번째 경우가 되기보다는 양자 모두의 모습으로 나타날 것이다.








대역폭의 신비를 벗긴다              2





물방울에서 폭포로



1960년대 말 내가 컴퓨터 그래픽 교수였을 당시에 컴퓨터 그래픽이 무엇인지 아는 사람은 하나도 없었다. 컴퓨터는 일상 생활과 아무런 관련도 없었다. 그러나 오늘날 예순다섯 먹은 실업계 거물들이 자기 마술상자의 메모리 용량과 하드 디스크 성능에 대해 자랑을 늘어놓는 광경을 흔히 대하게 된다. 어떤 사람은 분명히 알지도 못하면서 자기 컴퓨터의 처리 속도(‘인텔 인사이드’ Intel Inside라는 훌륭한 캠페인 덕분에)에 대해 이야기하고 자기가 사용하는 운영 체계(operating system)를 열렬히 지지한다. 최근에 사교계의 돈 많고 매력적인 부인을 만난 적이 있다. 그녀는 마이크로소프트의 운영체계에 대해 잘 알고 있었는데, 최근에 ‘통신 초보자’(less-wired)를 위한 컨설팅 서비스 사업을 시작했다. 그녀의 명함에는 “나는 윈도우를 쓸 줄 압니다”라고 적혀 있었다.

대역폭(bandwidth)은 이와는 다르다. 대개 오해하는 경우가 많은데, 특히 요즘에는 광섬유를 통해 무한대의 대역폭이 만들어질 것이라고 생각하는 사람들이 많다. 대역폭이란 특정 채널로 정보를 전달하는 능력을 말한다. 대부분의 사람들은 대역폭을 파이프의 직경이나 고속도로의 차선 수에 빗대어 생각한다.

이러한 유추는 전송 매체(구리, 광섬유, ‘공중파’) 간의 미세하고도 중요한 차이점을 간과하고 있다. 그들은 신호를 디자인(그리고 변조)하는 방식에 따라 구리선, 광섬유, 혹은 ‘공중파’를 통해 초당 전달되는 비트 수를 가감할 수 있다는 사실을 무시한다. 물론 전화선, 광섬유망 그리고 라디오 주파수 범위라는 일반적인 용어를 사용하면 비트의 움직임을 보다 쉽게 이해할 수 있다.

흔히 ‘트위스티드 페어’(twisted pair:유럽의 고풍스러운 고급 호텔에서 볼 수 있는 구식 램프 전선처럼 꼬여 있는 형태)라 부르는 전화 구리선을 낮은 주파수 대역 채널로 생각한다. 그러나 전화선은 적당한 모뎀(비트를 파형으로 바꾸고 다시 파형을 비트로 바꾸는 과정을 의미하는 모듈레이터-디모듈레이터 modulator-demodulator의 합성어)만 있으면 1초에 600만 비트를 전송할 수 있다. 미국에는 이러한 전화선이 600억 달러치나 가설되어 있다. 모뎀은 보통 1초에 9,600비트 혹은 9,600보드(baud)의 속도를 낸다(1초당 전달 비트 수 bits per seconds:비피에스 bps는 보드 baud와 같은 의미이다. 보드는 텔렉스 전신기를 발명한 에밀 보도 Emile Baudot의 이름을 딴 것이다).

아주 깜찍하고 성능 좋은 모뎀은 38,400보드까지 속도를 낸다. 이 정도의 속도는 대부분의 미국 가정에 보급된 구리선의 잠재 전달 능력보다 100배나 느린 것이다. 전화선을 생각하면 토끼와 거북이 이야기에 나오는 거북이를 연상하게 된다. 전화선은 느리지만 당신이 생각하는 만큼 느리지는 않다.

광섬유의 전달 능력이 무한대라고 생각해 보라. 문자 그대로 우리는 한 가닥의 광섬유가 전달할 수 있는 비트 수를 모른다. 최근의 조사에 따르면 1초에 1,000억 비트 가량 전달할 수 있다고 한다. 머리카락 굵기의 광섬유가 1초도 안되는 시간 동안 이제까지 간행된 월 스트리트 저널(Wall Street Jour-

nal) 모두를 전달할 수 있다는 뜻이다. 그 정도의 데이터 전송 속도라면 대략 전화선보다 10만 배 가량 빠른 속도로 100만 개에 달하는 텔레비전 채널을 동시에 전달할 수 있다. 그야말로 엄청난 비약이다. 지금 내가 광섬유 한 가닥을 이야기하고 있음을 상기하기 바란다. 더 전달하기 원한다면 몇 가닥 더 만들면 된다. 광섬유는 따지고 보면 모래알갱이에 불과하기 때문이다.

사람들은 에테르(ether:흔히 ‘공중파’로 통하는)의 전송 능력이 무한하다고 가정한다. 왜냐하면 그건 결국 공기인데, 공기는 어디에나 존재하기 때문이다. 나는 역사적인 맥락에서 에테르라는 단어를 사용한다. 라디오파가 발견되었을 때 에테르는 파장을 전달하는 신비로운 물질이라고 생각되었다. 결국 에테르의 존재를 밝히지 못하고 이후에 광자(photons)를 발견하기에 이르렀다. 정지위성은 적도 상공 22,300마일(35,800킬로미터) 궤도를 돈다(이는 약 34조 입방 마일에 달하는 에테르가 포함되어 있음을 의미한다). 이처럼 수많은 에테르가 서로 충돌하지 않으면서 많은 양의 비트를 전달해야만 한다. 이 세상에 있는 수백만 대의 텔레비전 수상기를 조작하는 데 리모컨 무선 통신이 사용된다는 사실을 생각할 때 이러한 생각도 일리가 있다. 그러나 이들의 용량은 아주 작기 때문에 리모컨에서 텔레비전으로 전달되는 데이터의 비트는 이웃 동네나 아파트의 텔레비전 수상기에 아무런 변화도 주지 못한다. 무선 전화기의 경우는 사정이 다르다.

고출력 통신과 방송에 에테르를 사용할 경우 한 신호가 다른 신호를 간섭하지 않도록 주의해야 한다. 우리는 미리 결정되어 있는 스펙트럼(할당 주파수)을 벗어나서는 안되고 에테르를 마구잡이로 사용해서도 안된다. 가능한 한 효과적으로 사용해야 한다. 광섬유와는 달리 에테르는 새로 만들 수 없다. 단 한번 자연이 그것을 만들었을 뿐이다.

효율적으로 주파수 대역을 사용하는 방법에는 여러 가지가 있다. 전송 셀의 그리드로 같은 주파수를 사용하게 하거나 이전에는 기피되던 스펙트럼(이유가 있다면 그 주파수가 무고한 날짐승들을 튀김으로 만들어버릴 수도 있다는 까닭으로)을 사용할 수도 있다. 그러나 어떤 방법을 이용해 효율을 높이더라도 에테르 안에서 얻을 수 있는 주파수 대역은, 얼마든지 새로 만들 수 있고 설치할 수 있는 광섬유에 비하면 희소하기 이를 데 없다. 이런 이유 때문에 나는 오늘날의 유선과 무선 정보 간의 위상 교환을 제안하였다.

네브라스카 상원의원 봅 케리(Bob Kerry)가 대통령 유세 기간 동안 미디어랩을 방문하여 두 시간 정도 그와 함께 이야기한 적이 있다. 그가 처음 꺼낸 말은 ‘네그로폰테 스위치’(Negroponte Switch)였다. 이 아이디어는 조지 길더(George Gilder)와 내가 연설자로 초청되었던 노던 텔레콤(Northern Telecom) 회합에서 처음으로 논의되고 제시되었다. 간단히 말하자면 현재 지상(말하자면, 유선)으로 전송되는 정보가 미래에는 에테르를 통해 전송되고, 에테르로 전송되는 정보가 지상으로 전송되는 것을 의미한다. 공중에 있는 것은 지하로 들어가고 지하에 있는 것은 공중으로 올라간다는 말이다. 나는 이것을 ‘장소 바꾸기’(trading place)라고 불렀고 길더는 ‘네그로폰테 스위치’라고 불렀다. 결국 이름을 결정하지 못했다.

이러한 장소 바꾸기가 자명한 이유는 지상의 주파수 대역이 무한한 반면 에테르는 그렇지 못하기 때문이다. 우리는 오직 하나의 에테르와 무한한 광섬유를 갖고 있다. 우리가 보다 현명하게 에테르를 사용하려면, 결국에는 비행기나 배, 자동차 그리고 서류가방이나 손목시계처럼 한 곳에 잡아 매둘 수 없는 이동성 사물과 커뮤니케이션하기 위한 모든 주파수를 절약할 수밖에 없게 된다.




광섬유, 곧 자연의 길



6년 전 베를린 장벽이 무너질 때 도이췌 분데스포스트(Deutsche Bundespost)지는 5~7년 정도 빨리 통일이 이루어졌다고 신음하였다. 아직까지 광섬유 값이 비싼 편인데, 동독에 광섬유 전화국을 설립하는 과제가 너무 빨리 다가왔기 때문이었다.

현재 광섬유의 값은 두 접속 지점의 전자 장비 비용을 포함해도 구리보다 더 싸다. 만일 당신이 사는 곳에서는 사정이 다르다면, 광섬유 연결기, 스위치, 변환기(transducers) 값이 떨어질 때까지 몇 달만 기다리면 된다. 가까운 거리에 통신선을 깔거나 설치 전문가가 없는 경우가 아니라면 오늘날 전화통신을 위해 구리선을 이용할 하등의 이유가 없다(특히 당신이 구리선의 유지 보수 비용까지 부담해야 한다면). 중국에서는 마을 사람들이 구리선을 파내어 암시장에 내다 팔기 때문에 광섬유를 사용한다.

구리선의 유일한 이점은 전기를 전달할 수 있다는 것이다. 이는 전화회사에게 매우 예민한 주제이다. 전화회사는 태풍 때문에 전기공급이 중단되어도 전화는 작동한다는 사실에 대해 대단한 자부심을 갖는다. 만약 구리 대신에 광섬유를 사용한다면 지역전기회사에서 별도로 전력을 공급받아야 하고 그렇게 되면 정전시에 문제가 생긴다. 건전지로 전력을 대체할 수는 있겠지만 특별한 유지와 배려가 필요하기 때문에 별로 도움이 되지 못한다. 이 때문에 구리선을 입힌 광섬유나 광섬유를 입힌 구리선이 출현하게 된다. 그러나 비트 입장에서 보면 전세계의 접속망(wired planet)은 결국 광섬유로 구성될 것이다.

미국의 전화회사들은 매년 대략 5% 정도 전화국 설비를 대체한다. 이들은 유지 보수와 몇 가지 다른 이유 때문에 구리선을 광섬유로 바꾸고 있다. 이러한 사실을 보면 구리선에서 광섬유로 바뀌어가는 추이를 확인할 수 있다. 이런 변화가 전국적으로 고르게 진행되지는 않지만 이런 추세로 광섬유가 깔리게 되면 앞으로 20년 안에 미국 전역에 광섬유가 깔릴 것이다. 우리가 그것을 필요로 하든 안하든, 혹은 대역폭을 사용하는 방법을 알든 모르든 매우 빠른 속도로 전국적인 광대역 인프라스트럭처가 갖춰질 것이다. 결국 광섬유는 더욱 향상된 질과 신뢰성 있는 ‘평범한 구식 전화 서비스’(업계 사람들이 포츠 POTS라 부르는)를 제공할 것이다.

1983년 헤럴드 그린(Harold Greene) 판사가 제정한 지역전화회사의 정보․오락산업 참여 금지법은 그로부터 10년이 더 지나서야 시정되었다. 1994년 10월 20일 연방통신위원회(FCC)가 이른바 ‘전화 비디오’(video dialtone)를 허용하면서 아주 중요한 변화가 일어났다.

아이러니하게도 지역전화회사의 로비스트들은 정보․오락 분야 진입을 정당화하기 위해 실용성은 없지만 효과는 높은 논쟁에 불을 붙였다. 전화회사들은 포츠(POTS)로는 서비스가 충분치 않다고 주장하면서, 그들이 여러 가지 다양한 정보를 제공하는 사업을 할 수 없게 한다면 새로운 인프라스트럭처(광섬유)를 까는 데 드는 엄청난 비용을 부담할 수 없다고 주장하였다.

그런데 잠깐. 전화회사는 이전부터 정보 제공자였지 않은가? 실제로 대부분의 지역전화회사들은 전화번호부를 통해 엄청난 이윤을 챙겼다. 그러나 전화회사는 이 정보를 아톰으로 만들어 당신 집 현관 앞에 집어던지면 그만이었다. 그러나 만약 이를 비트로 만들어 전자로 전달하면 법률에 위반된다는 것이다. 어찌되었거나 그린 판사는 그렇게 보았다.

그래서 전화회사의 로비스트들은 지역전화회사가 지역 광섬유 설치 비용을 정당화하려면 자신들이 전자정보전달 사업을 할 수 있어야 한다고 주장했다. 새로운 수입 창출의 원천이 없다면 이처럼 거대한 투자는 매력이 없다고 주장했다. 이들의 주장이 먹혀들어 결국 전화회사는 현재 정보사업과 오락사업으로 진입하게 되었으며, 이전보다 빠른 속도로 광섬유를 가설하고 있다.

나는 이런 결과가 잘된 것이라 생각한다. 이것은 소비자에게 혜택을 가져다 준다. 이에 대한 논쟁은 필요없다. 전화회사들은 그럴 듯한 법률에 대항하기 위한, 그럴 듯한 주장에 얽매여 있다. 정보와 오락 서비스를 전달하는 데 이처럼 거대한 대역폭은 필요없다. 실제로 대부분의 멀티미디어에는 120만에서 600만 비피에스(bps) 정도의 대역폭이면 충분하다. 그들은 120만~600만 비피에스의 창조적 가능성도 제대로 이해하지 못하고 있다. 변호사와 집행부가 그린 판사에게 압력을 가하던 10년 동안에도 전화선이라는 엄청난 인프라스트럭처가 이미 존재하고 있었음을 잊고 있다.

사람들은 구리 전화선이 얼마나 훌륭한가에 대해 잘 모르고 있다. 비동기 디지털 수신자 루프(ADSL:asymmetrical digital subscriber loop)라 불리는 기술은 상대적으로 짧은 거리에서 구리선을 사용하여 거대한 양의 데이터를 전송하는 방법이다. 에이디에스엘 원(ADSL-1)은 미국 전체 가구의 75%, 캐나다의 80%에 154만 4,000비피에스를 전송하고 64,000비피에스를 전송받을 수 있다. 에이디에스엘 투(ADSL-2)는 300만 비피에스, 에이디에스엘 스리(ADSL-

3)는 600만 비피에스 이상의 속도를 낸다. 에이디에스엘 원(ADSL-1)은 브이에치에스(VHS) 비디오 수준의 화질을 전송할 수 있다.

구리 전화선이 멀티미디어를 가정으로 전송하는 궁극적 해결책은 아니지만 왜 이처럼 무시되고 있는지 알 수 없다. 그 이유는 수신자 일인당 설비 비용이 높다는 데서 찾아진다. 그러나 높은 비용은 인위적으로 낮게 산정한 수신자 시장규모 때문이다. 만일 가구당 설치비가 1,000달러 정도로 높더라도 가입 가구수가 많아지면 그 가운데 상당 부분을 각 가구에서 수취할 수 있다. 만약 서비스 내용이 재미있으면 3, 4년 이내에 많은 미국인들이 수천 달러를 기꺼이 지불할 것이고, 그렇게 되면 초기 비용을 뽑을 수 있을 것이다. 결론적으로 말하자면 광섬유가 미래의 매체임은 틀림없는 사실이지만 현재 존재하는 구리 설비를 가지고도 아주 많은 일을 할 수 있고 배울 수 있다.

많은 사람들이 구리선이 앞으로의 발전에 초석이 된다는 사실을 무시한다. 그들은 자연법칙이나 상업 이윤을 고려하지 않은 채 경쟁력에 유리한 지점을 유지하기 위해 무한대의 대역폭을 제공하는 광섬유를 도매금으로 사들이려 한다. 게다가 그것이 당장에 필요하기 때문에, 결국 규제 유인의 장벽을 넘어서 자연스럽게 광섬유가 도입될 것이라고 생각한다. 열받은 개처럼 잡학자들은 모든 정치적 기회를 이용해 마치 그것이 국가적 사명, 혹은 시민권이나 되는 듯이 광대역폭 네트워크의 시급성을 주장한다. 그러나 실제로 무한대의 대역폭은 사람들을 너무 많은 비트 속에 허우적거리게 만들거나 기계를 구석에 처박아놓고 사용하지도 않는, 귀머거리로 만드는, 역설적이고 부정적인 영향을 미친다. 무한대의 대역폭이 틀렸다거나 나쁘다고 할 수는 없다. 그러나 프리 섹스처럼 반드시 좋지도 않다. 우리는 정말로 모든 비트를 원하고, 모든 비트가 필요한가?

 



더 적은 것이 더 많은 것이다



건축가 미스 반 데어 로(Mies van der Rohe)의 이 말은 전달될 필요가 있는 정보의 양과 우리가 경험하게 되는 정보전달 수단에 대해 내가 배우고 연구하면서 찾아낸 멋진 표현이다. 이것은 새로운 미디어의 경우에도 적용된다. 초보자는 “적을수록 좋다”는 말을 이해하지 못한다.

홈 비디오 카메라를 예로 들어보자. 캠코더를 처음 손에 넣으면 당신은 갑자기 넓어진 표현의 자유를 실험하기 위해 줌(zooms)과 팬(pans)을 아주 많이 시도할 것이다. 그 결과는 보여주기가 민망스러울 정도인데, 화면이 극단으로 덜거덕거리는 홈 비디오가 된다(가족들까지 끊임없는 패닝과 주밍 때문에 질겁하고 지겨워할 것이다). 시간이 좀 지나 진정되면 이 새로운 자유를 좀더 빈틈없이, 아껴서 사용하게 된다.

자유도가 너무 높으면 레이저 프린트의 하드카피 결과물에도 나쁜 영향을 미친다. 글자 모양과 크기를 마음대로 바꿀 수 있게 되면서 현재 대학과 사무실의 문서―보통, 볼드(bold), 이탤릭(italic), 음영을 사용한 것과 사용하지 않은 것, 세리프(serif)와 산 세리프(sans serif) 등 모든 종류의 글꼴과 크기가 무감각하게 혼용된다―가 오염되고 있다. 한 가지 글꼴을 고집하고 글씨 크기도 많이 변화시키지 않는 것이 더 좋다는 사실을 이해하려면 타이포그래피(typography)에 대한 깊은 이해가 필요하다. 더 적은 것이 더 많은 것이 되기 때문이다.

대역폭도 마찬가지이다. 광대역이 있기 때문에 그것을 사용해야 한다는 생각은 억지 논리이다. 어떤 사람에게 더 많은 비트를 퍼부어야 한다는 발상은 더 많은 정보를 얻기 위해 라디오 볼륨을 높이는 짓보다 현명하지도, 논리적이지도 않다.

1995년의 수준에서 120만 비트는 브이에치에스(VHS) 수준의 비디오를 전달하기 위한 최소의 문턱이다. 화질을 높이기 위해 2배, 혹은 3배로 비트 수를 높여 보라. 개인이 새로운 창의적 서비스를 전달하기 위해 600만 비피에스 이상을 (만약 그만큼 갖고 있다면) 제대로 감당하기란 매우 어렵다.

새로운 정보 오락 서비스는 집까지 깔린 광섬유를 기다리지 않는다. 상상력을 기다리고 있을 뿐이다.




10만 비트를 1비트로 압축하기



대역폭과 컴퓨팅의 관계는 미묘하다. 대역폭과 컴퓨팅 간의 거래는 비디오 전화와 좀더 비싼 비디오 회의에서 명확히 드러난다. 비디오 회의는 양쪽에서 컴퓨터를 사용하기 때문에 더 적은 비트를 보낼 수 있다. 각각의 말단에서 디지털 비디오를 처리한다. 약간의 돈을 들여 압축하고 다시 해제함으로써 채널 용량은 물론 돈과 전송량이 절약된다.

일반적으로 디지털 비디오는 정보 내용에 관계 없이 데이터를 압축하는 사례이다. 미식축구(NFL) 게임이나 테드 코펠(Ted Koppel) 스타일의 인터뷰, 제임스 본드(James Bond) 추격전에 동일한 코딩 기술을 사용한다. 그러나 컴퓨터 과학자가 아닐지라도 이들 각각의 프로그램이 데이터 압축에 각각 다른 접근 방법을 사용하리라 추측할 수 있다. 내용을 검토하고 난 후 데이터를 아주 다른 방식으로 압축할 수 있다. 사람과 사람 간의 대화에서 이루어지는 다음의 예를 고려해 보자.

여섯 사람이 테이블에서 저녁을 들고 있다고 상상해 보라. 그들은 그 자리에 참석하지 않은 어떤 사람에 대해 아주 진지하게 이야기한다. 미스터 엑스(X)에 대한 대화가 진행되는 동안 나는 테이블 건너편에 앉은 내 아내를 바라보며 윙크를 던진다. 식사가 끝나고 당신이 내게 와서 말하기를 “니콜라스, 당신이 엘렌느에게 윙크하는 걸 보았는데요. 그녀에게 무어라고 말했어요?” 나는 이틀 전에 미스터 엑스하고 저녁을 같이 했는데 아까 대화와는 반대로 그는, 사실은 뭐뭐했고, 사람들이 뭐뭐하게 생각하고 있지만 사실은 그가 뭐뭐하기로 결정했으며‧‧‧‧‧‧ 등을 말했다고 설명한다. 말하자면 내가 아내와 나눈 1비트(에테르를 통해 전달된 윙크를 1비트라고 가정하는 것을 너그러이 받아주기 바란다)를 10만 비트 정도로 재구성하여 말할 수 있다.

이 사례에서는 송신자(나)와 수신자(엘렌느)가 공통의 지식을 갖고 있어서 우리의 대화가 단축될 수 있었다. 나는 에테르를 통해 약간의 비트를 쏘았을 뿐인데 그것이 그녀의 머리에서 확장되어 다른 많은 정보를 움직여 놓았다. 내가 눈으로 말한 것을 입으로 말해 달라고 하면 10만 비트 모두를 전달할 수 있다. 나는 10만 비트를 1비트로 데이터 압축한 것이다.

수백 가지 음담패설을 너무나 잘 알고 있어 서로 번호만 주고받는 부부가 있다. 몇 개 숫자가 전체 이야기를 상기시켜 한두 개만 전달하면 서로 배꼽을 잡고 웃는다. 컴퓨터 데이터 압축에서는 좀더 단조롭게 이 방법을 사용하여 일반적으로 사용되는 긴 단어를(전체 문자열 대신에) 몇 비트로 보낸다. 우리가 공유하는 지식을 대역폭과 교환할 때는 이런 기술을 더 많이 사용할 것이다. 정보의 압축은 발송 비용을 절약할 뿐 아니라 시간도 절약해 준다.



판매의 경제



현재의 전화 요금 방식으로 미스터 엑스에 관한 내 이야기를 전달하려면 엘렌느에게 내가 보냈던 윙크에 비해 10만 배 정도 많은 요금을 지불해야 한다. 전화회사는 송수신 비트 수를 줄인다고 해도 수입면에서 별로 나아지는 것이 없다. 현재의 전화 경제 모델은 비트가 무엇이든 상관없이 초당, 혹은 비트 사용량에 대해 요금을 매긴다.

주파수 대역의 경제학을 이해하는 데 가장 적절한 질문은 다음과 같다. 어떤 비트는 다른 비트보다 더 가치가 있는가? 그 대답은 명백하게 ‘그렇다’이다. 그런데 더 복잡한 질문이 제기된다. 비트의 가치는 그 자체의 본질적 성격(예를 들어 영화비트, 대화비트, 심장박동 측정기의 비트)만이 아니라 누가 그것을 사용할 것인가, 혹은 언제, 어떻게 사용할 것인가에 따라서 달라져야 하는가?

내셔널 지오그래픽사를 포함하여 우리들 대부분은 여섯 살짜리 어린아이가 숙제를 하기 위해 그림 아카이브를 사용하는 경우 무료 혹은 거의 무료로 그 비트를 사용할 수 있어야 한다는 데 동의할 것이다. 반대로 내가 논문이나 사업을 위해 그것을 사용한다면 정당한 값을 지불해야 하고, 어쩌면 여섯 살짜리 꼬마를 위한 과외 기금까지 지불해야 할지도 모른다. 오늘날 비트는 서로 다른 가치를 갖고 있을 뿐만 아니라 누가 어떻게 그것을 사용하느냐에 따라 그 가치가 달라진다. 분명히 복지용 비트, 소수자용 비트, 장애인용 비트가 존재한다. 의회는 공정한 가격 체계의 골격을 작성하는 데 아주 창의적인 노력을 기울여야 할 것이다.

비트의 차별적 가격 책정은 새로운 것이 아니다. 나는 다우존스(Dow Jones)에 계정을 하나 갖고 있는데, 이를 통해 주식 시장에 접속하곤 한다. 내 계정을 사용하면 15분 늦게 정보가 전달된다. 주식중개사를 하고 있는 여든여섯 살 먹은 나의 아저씨처럼 최신의 정보를 얻으려면 나는 상당한 액수의 프리미엄을 다우존스나 아저씨에게 지불해야 한다. 이것은 항공 우편과 보통 우편 간의 차이, 비행기로 전달되는 비트와 기차로 전달되는 비트 간 차이의 현대적인 모습이다.

실시간 정보의 경우 주파수 대역은 대화 매체에 의해 결정된다. 내가 전화로 당신과 대화할 때 내가 말하는 속도보다 더 빨리 내 목소리를 당신에게 전달하는 것은 아무런 의미도 없다. 마찬가지로 더 늦어지거나 지연되는 것도 물론 참을 수 없는 일이다. 위성 전화통화에서 1/4초 정도 늦는 것도 대부분의 사람을 안절부절하게 만든다.

그러나 내가 분당 요금을 지불하면서 테이프에 메시지를 녹음하여 당신에게 전달할 경우 나는 분명히 1초당 가능한 많은 비트를 전달하려 할 것이다. 이는 해외 접속을 통해 데이터를 검색하거나 데이터를 랩탑으로 끌어오려는 모뎀 사용자들이 공통적으로 느끼는 감정이다. 몇 년 전만 해도 2,400보드의 속도는 아주 훌륭한 것으로 간주되었다. 오늘날에는 38,400비피에스가 일반적으로 채택되고 있는데, 그 결과 전화 요금을 94% 절약할 수 있다.

전화회사에게는 기분좋은 일이겠지만, 태평양을 가로지르는 전화 통화의 50%와 대서양을 가로지르는 통화의 30%는 64,000비피에스를 이용할 수 있는데도 불구하고 9,600비피에스 속도의 팩스 데이터로 전송된다.




별과 고리



채널의 대역폭만이 문제가 아니라 배열도 문제다. 간단히 설명하면 전화 시스템은 ‘별모양’(star) 네트워크다. 이것은 워싱턴의 애비뉴나 파리의 부르바르(boulevards)처럼 한 점에서 방사선상으로 뻗어나가는 선으로 구성된다. 문자 그대로 당신의 집에서 가장 가까운 지역전화회사의 스위치까지 ‘홈 런’(home run)한다. 전화선을 따라가면 지역전화회사의 지역 스위칭 설비에 도달할 수 있다.

이와 대조적으로 케이블 텔레비전은 크리스마스 트리 장식용 전구와 같은 ‘고리모양’(loop)에서 시작되었다. 이것은 한 집을 거쳐 다음 집으로 이어진다. 이들 각각의 네트워크(별모양과 고리모양:stars and loops)는 전화선의 협대역폭과 동축선의 광대역폭 형태를 가정하고 있다. 별모양의 경우에는 각 가정에 전용 협대역폭 선을 제공한다. 고리모양의 경우에는 많은 수의 가정이 공동의 광대역 서비스를 공유한다.

별모양과 고리모양 아키텍처는 또한 내용에 따라 결정되기도 한다. 전화 네트워크의 경우에 각각의 대화는 별개의 것이며, 한 가정으로 가는 비트는 다른 가정(한 가정을 빼고)으로 가는 것과는 완전히 별개이다. 그 기능상 다수 대 다수 접점 시스템이다. 텔레비전의 경우에는 이웃간에 동일한 프로그램을 공유하기 때문에 크리스마스 트리의 전구와 같은 접근 방식인 단수 대 복수 시스템을 채택한다. 케이블 사업자의 전통적인 지혜는 공중파 방식을 본떠서 텔레비전을 에테르에서 와이어(wire)로 전환한 것이다.

그러나 관습적인 지혜가 갖는 문제는 바로 그것이 관습적이라는 데 있다. 텔레비전 프로그램 전달 방식은 근본적인 변화를 겪고 있다. 당신은 당신 이웃에게 전달되는 프로그램에 만족할 수 없게 된다. 정해진 시간에 정해진 영화를 보아야만 한다는 데 불만이 생긴다. 이런 이유로 케이블 회사는 점점 더 전화회사와 같은 방식으로 더 많은 스위칭(switching)과 홈 런(home runs)에 대해 생각하게 되는 것이다. 향후 25년 후에는 회사의 특성뿐만 아니라 네트워크 아키텍처(network architecture)에서도 케이블과 전화 간의 차이가 사라질 것이다.

결국 대부분의 유선은 별모양이 될 것이다. 고리모양은 변방 지역이나 분배 매체가 한꺼번에 전체 가구에 전달되는 무선 방송 형식에서나 사용될 것이다. 지엠 휴즈사(GM Hughes Electronics)사는 위성을 이용한 다이렉티브이(DirecTV)를 ‘굽어진 파이프’(bent pipe)라고 부르고 싶어한다. 그들은 위성 텔레비전 시스템(direct-broadcast satellite television system)이 미국의 모든 가구를 관통하는 케이블 시스템이라고 보는 것이다. 정말 맞는 말이다. 당신이 지금 이 순간에 미국에서 이 책을 읽고 있다면 휴즈사의 위성은 10억 비피에스 상당의 비트를 당신의 머리에 뿌려대고 있는 셈이다. 당신이 납우산을 쓰고 있지 않다면 말이다.




비트 패키징



디지털 세계에 첫발을 들여놓은 많은 사람들은 대역폭을 지하에 매설된 수도관처럼 생각한다. 비트를 아톰처럼 생각하니까 큰 파이프와 작은 파이프, 수도꼭지, 길거리의 소화전이 연상되는 것이다. 일반적인 비유법으로 생각하면 광섬유는 소화전으로 물을 마시는 꼴이 된다. 이러한 유추는 건설적이기는 하지만 오해를 불러일으킨다. 물은 흐르기도 하고 흐르지 않기도 한다. 수도꼭지를 돌리면 정원 호스에서 흘러나오는 물의 양을 조절할 수 있다. 길거리 소화전의 물줄기도 한 방울씩 흐를 수 있다. 물의 원자는 집단으로 움직인다.

비트는 이와 다르다. 스키 리프트가 더 좋은 비유가 된다. 리프트는 사람이 더 타든 덜 타든 일정한 속도로 움직인다. 이와 마찬가지로 패킷(packet)에 비트를 담아서 1초에 100만 비트의 전송 속도를 가진 파이프 안에 던져놓을 수 있다. 이제 10비트짜리 패킷을 아주 빠른 속도로 움직이는 파이프에 던져놓는다고 하자. 그래 봐야 효율적인 대역폭은 파이프의 최대 전달 속도가 아니라 10비피에스에 불과하다.

매우 낭비적으로 들릴지 모르지만 다른 사람들이 같은 파이프―이는 인터넷이나 에이티엠(ATM:asynchronous transfer mode 비동기전송모드, 머지않은 장래에 모든 전화 네트워크 라인이 이 방식을 사용하게 될 것이다)과 같은 시스템이다―에 패킷을 떨어뜨리기 때문에 실제로는 아주 현명한 방식이다. 패킷은 음성 전화처럼 전체 전화선을 다 사용하는 것이 아니라 이름과 주소가 붙은 패킷을 라인의 대기 행렬에 떨구기 때문에 각 패킷은 언제 어디에서 이 스키 리프트를 이탈할 것인가를 알 수 있다. 당신은 사용 시간이 아니라 전달한 패킷에 대해서만 비용을 지불한다.

대역폭을 동일하게 패킷화하는 또 다른 방식을 생각할 수 있다. 초당 10억 비트를 가장 잘 활용하는 방법은 100만분의 1초에 1,000비트를 사용하거나 1,000초에 100만 비트를 사용하는 것이다. 예를 들어 텔레비전의 경우 수도꼭지 방식을 사용하지 않고 몇 초 동안에 한 시간짜리 비디오를 전달받는 방식을 이용할 수도 있다.

모든 사람에게 1,000개의 텔레비전 프로그램을 전달하는 대신에 1,000분의 1초 동안에 각 사람에게 하나의 프로그램을 전달하는 것이 더 낫다. 이것은 우리가 방송 미디어를 생각하는 방식을 완전히 변화시킬 것이다. 대부분의 비트 방송은 우리가 일상적으로 그것을 소비하는 속도와 절대로, 아무런 관계도 없다.







비트 방송                           3

 




이 그림에 무엇이 잘못되었나?


텔레비전을 보면서 화면의 해상도와 스크린의 모양, 동화상의 질에 대해 불만을 가진 적이 있는가? 아마도 없을 것이다. 대부분의 불만은 프로그램에 관한 것이다. 그렇지 않으면 브루스 스프링스틴(Bruce Springsteen)의 말처럼 ‘57개 채널이 있지만 볼거리가 없다’는 것이 문제이다. 그런데 텔레비전 발전에 관한 대부분의 연구는 내용의 예술성이 아니라 디스플레이의 해상도에 맞추어져 있다.

1972년에 미래를 내다보던 일본인 몇 사람이 텔레비전의 다음 발전 단계에 대해 논의하였다. 그들은 흑백에서 컬러로 이어진 발전 단계는 결국 사진 정도의 질을 가진 텔레비전, 이른바 고선명 텔레비전(HDTV)으로 연결될 것이라고 가정하고 결론은 더 높은 선명성에 있다고 확신했다. 아날로그의 세계에서는 텔레비전 해상도 향상이 발전의 논리적 단계일 것이다. 일본은 이것을 하이비전(Hi-Vision)이라 이름 짓고 그후 14년 동안 추진하였다.

1986년 일본의 차세대 텔레비전 계획은 유럽을 긴장시켰다. 더구나 미국은 하이비전을 받아들이고, 하이비전을 다음 세대 세계 표준으로 설정하기 위해 일본인과 로비하였다. 미국의 고선명 텔레비전 지지자들과 대부분의 신국수주의자들은 일본의 아날로그 시스템을 지원했던 과거를 너무나 쉽게 잊어버린다. 유럽인들은 단순히 보호주의적 측면에서 하이비전을 반대했다. 그들은 사태를 정확하게 파악하지 못했으며 우리에게 호의적인 태도를 취했다. 그후 유럽은 그들 자신의 고선명 텔레비전 시스템인 에이치디 맥(HD-

MAC)을 개발하기 시작했는데, 내 눈에는 하이비전과 별로 차이가 없어 보였다.

그후 마치 잠든 거인이 그랬던 것처럼, 미국이 잠에서 깨어나 다른 나라처럼 아날로그에 매혹되어 고선명 텔레비전의 문제점을 공격했다. 미국은 텔레비전의 미래가 화질에 달려 있다고 주장하면서 후속 대열에 참가했다. 더구나 미국은 구식 아날로그 기술을 가지고 그 문제에 파고들었다. 모든 사람들이 화질 향상을 추구하는 것이 합당한 길이라고 가정했다. 불행히도 사실은 그렇지 않다.

소비자들이 내용보다 화면의 질을 더 선호하리라는 증거는 어디에서도 찾을 수 없다. 이제까지 제시된 고선명 텔레비전의 해결책은 현재 스튜디오에서 보는 텔레비전 화질(아마 당신은 한 번도 본 적이 없을 것인데, 그것이 얼마나 훌륭한지 상상이 안될 것이다)처럼 우리 눈에 확 뜨일 만큼 이미지를 향상시키지 못하고 있다. 현재의 고선명 기술 수준 정도의 고선명 텔레비전은 정말 어리석은 것이다.




나중된 자가 먼저되리라



1990년에 우리는 미래의 텔레비전에 대해 각기 다른 방향으로 나아가고 있는 일본, 유럽, 미국이 과연 어떤 결과를 초래할 것인지에 대해 생각하게 되었다. 당시 일본은 이미 고선명 텔레비전에 18년 동안이나 돈과 노력을 투자하고 있던 참이었다. 유럽은 컴퓨터 산업이 그들의 수중에서 빠져나가는 낌새를 이미 알아차리고 텔레비전 분야에서는 그런 사태가 일어나지 않도록 단단히 벼르고 있었다. 한편 실제로 텔레비전 산업을 포기하고 있던 미국은 고선명 텔레비전을 (웨스팅 하우스 Westinghouse, 알시에이 RCA, 앰팩스 Ampex 등 근시안적 기업들이 일찍이 포기한) 가전 소비 시장에 재진입할 수 있는 절호의 기회로 보았다.

미국이 선진 텔레비전 기술의 도전을 받았을 때만 해도 디지털 압축이 아직 발전 초기였기 때문에 분명한 행동 방식을 취할 수 없었다. 한편 문제의 주인공인 텔레비전 장비 제조업자들은 멍청한 일을 하고 있었다. 애플, 선마이크로시스템(Sun Microsystems) 같은 젊은 디지털 회사와 달리 텔레비전 제조 회사들은 아날로그식 사고의 고리타분한 안식처에 머물러 있었다. 그들은 텔레비전을 비트가 아니라 영상을 다루는 것으로 보았다.

그러나 1991년에 미국이 잠에서 깨어나면서 사태가 달라졌다. 하룻밤 사이에 모든 사람이 제너럴 인스트루먼트사(General Instrument Corporation)의 주도하에 디지털 텔레비전 지지자로 돌변했다. 문자 그대로 6개월도 채 안되어 고선명 텔레비전에 대한 미국의 제안이 아날로그에서 디지털로 바뀐 것이다. 디지털 신호 처리가 비용 효율면에서 우월하다는 것이 분명했지만 유럽에서는 1993년 2월까지 이 문제를 놓고 논란이 오갔다.

나는 1991년 9월에 미테랑 대통령 그리고 그의 각료들과 점심을 같이하면서 이 문제에 대해 이야기했다. 나는 불어를 썩 잘하지는 못했기 때문에, 그들이 우려했던 것처럼, 그들의 주도권을 빼앗으려는 것이 아니라  내가 ‘그들 목에 걸린 가시를 빼내주려’ 한다는 사실을 충분히 납득시킬 수 없었다.

1992년에 일본 수상 키치 미야자와를 만났을 때 나는 그가 하이비전이 별볼일 없다는 사실을 알아차리고 있음을 느꼈다. 마가렛 대처(Margaret Thatcher)는 나의 이야기를 신중하게 경청했다. 결국 1992년 말 6억 에퀴(유럽 연합 화폐, 8억 달러)에 이르는 고선명 텔레비전 보조금 지급에 대한 존 메이어(John Major)의 대담한 거부권 행사로 사태가 바뀌기 시작했다. 결국 유럽연합(EU:당시는 유럽공동체 European Community)은 1993년 초에 아날로그 고선명 텔레비전을 버리고 디지털의 미래를 선택했다.

일본은 디지털 텔레비전이 미래를 지배하리라는 사실을 너무나 잘 알고 있다. 1994년 2월에 비운의 일본 우정성 방송행정국 총국장 아키마사 에가와(Akimasa Egawa)는 일본이 디지털 세계에 합류할 것임을 시사하였다. 일본 산업계의 리더들은 이에 거세게 항의하였다. 다음날 그들은 에가와의 말에 대해 해명을 요구했다. 일본은 공공자금을 고선명 텔레비전에 아주 많이 투자했음에도 불구하고 공공적으로 그 손실을 보완하려 들지 않았다.

나는 당시에 텔레비전으로 중계된 패널 토론에서 거대 가전사 사장들이 전통적인 하이비전을 끝까지 고수할 것을 맹세하면서 에가와를 미쳤다고 몰아붙이던 일을 생생하게 기억한다. 나는 그들을 개인적으로 잘 알고 있었다. 그들은 사석에서는 정반대로 이야기했으며, 디지털 텔레비전에 경탄할 만한 노력을 기울였다. 나는 디지털 혀를 깨물 수밖에 없었다. 그들의 체면을 살려주려면 두 가지를 모두 다하는 수밖에.




옳은 기술, 틀린 문제



좋은 뉴스는 미국이 옳은 기술, 곧 디지털을 미래의 텔레비전에 적용하고 있다는 것이다. 나쁜 뉴스는 아직까지도 별 생각 없이 틀린 문제, 곧 화질―해상도, 프레임 비율, 스크린 모양(화면 비율) 등―에 관해 이야기하고 있다는 사실이다. 더욱 한심한 일은 각각의 사항에 대하여 특정한 수치를 결정하고 항구적으로 고정시키려 하는 것이다. 변화하는 값들을 고정된 값으로 만드는 것이다. 디지털 세계가 우리에게 선사하는 가장 큰 선물은 이를 결정할 필요가 없다는 점이다.

아날로그의 세계에서조차 고정된 사고방식에서 벗어나려는 움직임이 보인다. 유럽을 여행해 본 사람은 누구나 110볼트 기기를 220볼트 어댑터에 연결하느라 끙끙댔던 끔찍한 경험이 있을 것이다. 아이비엠 피시(IBM PC)를 만든 아이비엠(IBM)의 경영자 돈 에스트리지(Don Estridge)는 플로리다 보카 라튼의 회사 주차장에서 전원이 110볼트이든 220볼트이든 상관없이 공용으로 작동하는 피시를 만들라고 지시했다. 얼핏 보기에 멍청해 보이는 이 지시는 곧바로 시행에 옮겨져 오늘날에는 대부분의 컴퓨터가 서로 다른 여러 가지 전원 코드에 연결되어 사용될 수 있게 되었다. 에스트리지의 요구는 지능을 기계에 집어넣음으로써 (이전에 인간이 걱정하던 일을 플러그가 알아서 처리하도록) 현실화되었다. 이제 텔레비전 생산자들이 이를 적용해야 한다.

점차 110볼트나 220볼트 모두에서 쓸 수 있고, 60헤르츠나 50헤르츠 양쪽 모두에서 쓸 수 있을 뿐만 아니라 주사선 수, 프레임 비율, 화면비율을 변화시킬 수 있는 시스템이 출현할 것이다. 이처럼 유연한 시스템이 모뎀 분야에서 이미 출현하고 있다. 가능한 최적의 통신 프로토콜을 서로 설정하기 위해 많은 노력을 기울이고 있다. 확장을 통해, 서로 다른 기계 간에 메시지를 전달하기 위해 여러 가지 프로토콜을 사용하는 전자우편에서도 이런 일이 일어난다.

디지털되기는 성장을 위한 면허증이다. 아이(i)자에 점을 찍거나 (t)자에 가로선을 그을 필요가 없다. 장래의 확장에 대비하여 비트 줄기가 서로 자신을 알릴 수 있도록 프로토콜을 개발할 수 있다. 디지털 텔레비전 연구자는 이러한 특질을 무시하였다. 그들은 고선명이라는 잘못된 문제에 관해 연구했을 뿐만 아니라 디지털의 다른 변수들도 마치 110볼트에서 사용하는 헤어드라이어처럼 다루었다.

‘인터레이스’(interlace)에 대한 논란은 이에 대한 완벽한 사례이다. 텔레비전은 1초당 30프레임을 사용한다. 각 프레임은 전체 주사선의 절반(홀수와 짝수)을 차지하는 2개의 필드로 이루어진다. 따라서 비디오 프레임은 1/60초마다 하나의 주사선을 번갈아서 브라운관에 전달하는 2개의 필드로 구성된다. 텔레비전을 볼 경우 1초에 60필드(그래서 동작이 부드럽게 느껴진다)를 보는 셈이다. 이들 60개의 필드는 함께 ‘인터레이스’되지만 각 필드는 전체 그림의 반만 전달한다. 그 결과 아주 좋은 화질의 동영상을 볼 수 있고, 오로지 대역폭의 반만 활용하여 아주 선명하게 정지된 대상물을 볼 수 있다. 주파수대역에 프리미엄이 붙었던 아날로그 시절에는 텔레비전 방송을 위한 대단한 아이디어였다.

컴퓨터 디스플레이에서는 인터레이스가 의미가 없을 뿐만 아니라 인터레이스가 동영상을 저해한다. 이것이 인터레이스의 딜레마이다. 컴퓨터 디스플레이는 더 정확해야 한다(해상도가 더 높아야 하고 훨씬 가까운 지점에서 볼 수 있어야 한다). 동영상은 아주 가까이에서 보는 컴퓨터 스크린의 경우 아주 다른 역할을 한다. 보완하자면 컴퓨터와 관련해서는 인터레이스의 미래가 없다. 인테레이스는 모든 컴퓨터 기술자에게 귀찮은 존재이다.

그러나 인터레이스는 자연스럽게 사라질 것이다. 인터레이스에 반대하는 법안을 통과시키는 것은 엄격한 청교도식 법률처럼 이성적일 것이다. 디지털 세상은 아날로그의 영토보다 훨씬 더 탄력적이다. 디지털 신호만으로도 모든 부가적인 정보를 운반할 수 있다. 컴퓨터는 신호를 즉각 처리 혹은 추후 처리할 수 있으며, 인터레이스를 증가시키거나 감소시킬 수 있고, 프레임 비율을 변화시킬 수 있으며, 화면의 가로세로 비율을 특정 디스플레이의 형태 혹은 특정 신호를 영상표현하는 데 필요한 화면의 사각형 틀의 비율에 맞게 조절할 수도 있다.





미국 헌법과 같은 유연성을



디지털 세계는 본질적으로 유연성이 있다. 디지털은 종전의 아날로그 시스템에 비해 연속적이고 유기적인 방식으로 성장․변화할 수 있다. 새 텔레비전 수상기가 필요하면 오래된 텔레비전을 버리고 완전히 새로운 수상기를 구입한다. 이와 대조적으로 컴퓨터의 경우에는 사소한 성능 향상을 위해 모든 것을 바꾸는 대신 새로운 하드웨어와 소프트웨어를 추가하는 데 익숙하다. 사실 성능 향상(upgrade)이라는 단어는 그 자체가 디지털의 음색을 갖고 있다. 우리는 갈수록 컴퓨터 시스템의 성능을 향상시키는 데 익숙해져, 더 나은 디스플레이를 사용하게 되고, 더 질 좋은 음향을 즐기고, 바이러스 침투의 위험이 전혀 없는 소프트웨어를 더 잘 운용할 수 있게 될 것이다. 왜 텔레비전은 그렇지 못할까?

텔레비전도 그렇게 될 것이다. 오늘날의 텔레비전은 3개의 아날로그 표준에 얽매여 있다. 미국과 일본은 엔티에스시(NTSC:국립 텔레비전 시스템 위원회 National Television Systems Committee를 의미한다. 유럽인들은 이것이 ‘자연색을 재생할 수 없는 것’ Never the Same Color을 의미한다고 말할 것이다)를 사용한다. 유럽에서는 팔(PAL:Phase Alternating Line)방식이 지배적이고, 프랑스는 세캄(SECAM:SEquential Couleur Avec Memoire)방식을 사용한다. 미국은 이것의 진정한 의미를 ‘미국과 본질적으로 다른 것’(Something Essentially Contrary to America)으로 받아들인다. 나머지 나라들은 싫든 좋든 제2외국어를 선택하는 논리와 유사하게 이들 셋 가운데 하나를 순수한 형태, 혹은 혼합한 형태로 사용한다.

디지털화되면 표준에 제약받지 않게 된다. 만약 당신의 텔레비전이 특수한 언어를 전달하지 않는다면 마치 오늘날 피시를 사용하기 위해 소프트웨어를 사는 것처럼 컴퓨터 상점에서 디지털 디코더(digital decoder)를 구입해야 할지도 모른다.

만일 해상도가 중요한 문제라면 해결책은 주사선을 변화시킬 수 있는 시스템을 만들면 된다. 그러나 지금 우리는 흔히 한 종류의 주사선 방식에만 집착한다. 1,125개나 1,250개의 주사선 수에 현혹될 필요는 없다. 오늘날의 주사선 수는 브라운관으로 디스플레이할 수 있는 최대치에 육박한다. 사실 텔레비전 엔지니어들이 주사선에 대해 가졌던 과거의 사고방식은 더 이상 의미가 없다.

과거에는 텔레비전 수상기가 커지면 시청자는 수상기로부터 점점 멀리 떨어져 앉아야 했고 급기야 텔레비전 시청용 안락의자까지 등장했다. 시청자의 눈동자에 도달하는 1평방 밀리미터당 주사선의 수는 대개 일정하다.

그러다 1980년경에 갑작스런 변화가 일어났다. 18인치 화면을 생생하게 체험하기 위해 안락의자에서 책상으로 자리를 옮겼다. 주사선에 대한 사람들의 생각이 뒤집혔다. 왜냐하면 이제 우리는 더 이상 화면 단위로 (우리가 항상 텔레비전 수상기를 생각해 온 방식처럼) 주사선을 생각하지 않게 되었기 때문이다. 이제 우리는 종이나 현대적인 컴퓨터 화면을 생각하듯이 1인치 단위로 주사선을 생각한다. 제록스(Xerox)사의 팔로알토 연구소(PARC:Palo Alto Research Center)는 세계 최초로 1인치당 주사선 수를 적용하는 방안을 생각해냈다. 화면이 커지면 주사선 수도 더 많아져야 한다. 결과적으로 평면 디스플레이를 함께 붙일 수 있으면 해상도 1만 라인짜리 이미지를 제공할 수 있게 될 것이다. 대략 1,000라인 정도에 생각이 머문다면 근시안적이다.

앞으로 월등한 고해상도를 실현하는 방법은 지금 시스템을 가변성 있게 만드는 것이다. 그러나 오늘날의 어떤 디지털 텔레비전에서도 이런 기능을 지닐 가능성을 찾아볼 수 없다. 참 이상한 일이다.





요금 징수소로서의 텔레비전



컴퓨터 하드웨어와 소프트웨어를 만드는 제작자들은 케이블 텔레비전 산업의 비위를 맞추려 한다. 이에스피엔(ESPN)이 6,000만 명 이상의 가입자를 갖고 있다는 사실을 생각하면 별로 놀랄 만한 일이 아니다. 마이크로소프트(Microsoft), 실리콘 그래픽스(Silicon Graphics), 인텔(Intel), 아이비엠(IBM), 애플(Apple), 덱(DEC), 휴렛패커드(Hewlett-Packard)는 모두 케이블 산업과 주요한 협정을 맺었다.

이러한 소란은, 현재는 튜너 정도로 사용되지만 앞으로는 아주 중요하게 될 셋탑박스(set-top box)를 염두에 둔 것이다. 사태가 진전되면 곧 현재 우리가 갖고 있는 적외선 리모컨(케이블용, 위성용, 전화선용, 브이에치에프 VHF 전송용 등)만큼이나 많은 종류의 셋탑박스를 갖게 될 것이다. 서로 호환성이 없는 잡동사니 셋탑박스는 정말 끔찍한 발상이다.

이러한 박스가 관심을 끄는 이유는 그것이 향후 통로(gateway) 역할을 할 수 있기 때문이다. 박스 ‘제공자’와 인터페이스는 톨게이트를 통해 당신의 집으로 정보가 전달될 때 정보에 대해 요금을 부여하고 검색하는 성가신 일을 대행하는 문지기 역할을 할 수 있다.

사업으로는 매력 있어 보일 수도 있지만, 이것이 공중의 이해를 가장 잘 반영하는지는 불분명하다. 더구나 셋탑박스 자체는 기술적으로 근시안적이며 초점을 잘못 맞추고 있다. 우리는 비전을 넓혀 우리의 시야를 일반적인 목적과 좀더 호환성이 높은 컴퓨터 디자인에 맞추어야 한다.

‘셋탑박스’의 박스라는 단어는 잘못된 함의를 담고 있다. 케이블 텔레비전은 현재 대역폭에 대한 우리의 왕성한 식욕 때문에 정보와 오락 서비스의 광대역 제공자로서 주도적인 위치를 차지하고 있다. 케이블을 수신할 수 없는 텔레비전 수상기가 많기 때문에 케이블 텔레비전은 셋탑박스를 제공하고 있다. 이 박스를 받아들이고 부가 기능을 덧붙여 셋탑박스의 기능을 확장하는 방법에 대한 여러 가지 아이디어가 제시되고 있다.

이 계획은 무엇을 잘못 판단하고 있나? 대답은 간단하다. 가장 보수적인 방송 기술자도 텔레비전과 컴퓨터의 차이가 종국에는 사소한 차이로 좁혀지고, 결국 그것이 어느 방에 놓여 있는가 정도의 차이로 귀착되리라는 데 동의한다. 그럼에도 불구하고 케이블 산업의 독점 충동과 1,000개 프로그램(어떤 한순간에 개념상 999개는 보지 않고 있는)을 박스 하나로 통제할 수 있도록 기능을 개선해 가면서 셋탑박스에 대한 꿈은 동의를 얻어간다.

디지털 텔레비전을 만드는, 이윤이 많이 남는 스포츠에서 컴퓨터는 일 라운드에서 아주 ‘참패했다.’ 그러나 다음 라운드에서는 승리할 것이다.




컴퓨터 텔레비전



나는 사람들에게 트레이시 키더(Tracy Kidder)의 책 새로운 기계의 정신(The Soul of a New Machine)을 기억하냐고 즐겨 묻는다. 그리고 나서 그것을 읽은 사람에게 문제의 컴퓨터 회사 이름이 생각나느냐고 질문한다. 이제까지 나는 그것을 기억하는 사람을 보지 못했다. 데이터 제너럴(Data General), 왕(Wang), 프라임(Prime) 등 한때 잘 나가던 회사는 개방시스템에서 완전히 버림받았다. 선점체제가 대단한 경쟁 이득이 될 것이라고 주장하는 사람들의 얘기를 중역실 테이블에 앉아 듣던 때가 생각난다. 만일 당신이 독점적인, 혹은 대중적인 시스템을 둘 다 만들 수 있다면 대개는 독점적 방향을 선택해 경쟁을 피하려 할 것이다. 이것은 얼핏 논리적으로 들리지만 사실은 완전히 틀린 생각이다. 바로 이 때문에 프라임이 사라졌고, 다른 많은 회사와 마찬가지로 나머지 두 회사도 그들이 한때 누렸던 영광의 그림자를 좇고 있다. 이 때문에 애플사도 지금 전략을 바꾸고 있다.

‘개방시스템’은 우리 경제의 기업 정신을 강화시키는 한편, 선점체제와 독점체에게 도전하는 핵심 개념이다. 개방시스템은 승리를 거두고 있다. 개방시스템에서는 배타성(a lock and key)과 경쟁하는 것이 아니라 우리의 상상력과 경쟁한다. 결과적으로 많은 기업이 성공하게 될 뿐만 아니라 소비자들의 선택폭이 넓어지게 되고 민첩하게 변신하고 성장할 능력을 갖춘 영민한 사업가에게 활동 영역이 확장된다. 진정한 개방시스템은 일반인들이 무료로 이용할 수 있는 시스템이며 개인이 이를 바탕으로 자신의 시스템을 구축할 수 있도록 한다. 개인용 컴퓨터는 너무 빠르게 발전하기 때문에 미래의 개방 아키텍처 텔레비전은 개인용 컴퓨터 그 자체가 될 것이다. 셋탑박스는 크레디트 카드의 삽입 장치로 되어 컴퓨터를 케이블 텔레비전, 전화, 또는 위성으로 연결시켜 주는 창구 역할을 할 것이다. 다시 말해 미래에는 텔레비전 수상기 산업이 사라질 것이다. 디스플레이는 많은 메모리와 여러 가지 일을 처리하는 파워로 채워진다. 몇몇 컴퓨터 제품은 18인치가 아니라 10피트 크기가 될지도 모르고, 개인이 아니라 집단이 이를 사용하게 될지도 모른다. 그러나 어찌되든 당신이 보는 것은 여전히 컴퓨터이다.

그 이유는 컴퓨터의 비디오 처리 능력이 갈수록 높아져서 데이터 형태로 비디오를 처리하고 보여줄 수 있게 되기 때문이다. 비디오는 원격회의, 멀티미디어 출판, 그리고 시뮬레이션 어플리케이션의 호스트로서 모든 컴퓨터에 사용되고 있다. 이러한 사태는 너무 빨리 진행되기 때문에 텔레비전이 디지털을 채용한다 하더라도, 발전 속도가 너무 늦어 개인용 컴퓨터에 의해 압도된다.

고선명 텔레비전의 발전 리듬은 올림픽게임과 동시적으로 이루어져 왔다. 부분적으로는 국력 과시를 위해, 다른 한편으로는 스포츠 이벤트의 멋진 장면을 좀더 분명하게 보여주는 기술력을 과시하기 위해서. 일반 텔레비전에서는 하키 퍽을 실제로 볼 수 없다. 그래서 일본은 하이비전을 출범시키기 위해 1988년 서울 올림픽을 활용하였다. 유럽은 1992년 알베르빌 동계 올림픽을 활용하였다(1년도 안되어서 이것은 중단되었다).

미국은 1996년 여름 아틀랜타 올림픽을 새로운 디지털 폐쇄 아키텍처 고선명 텔레비전 시스템을 선보이는 계기로 잡고 있다. 그러나 그때는 너무 늦어 고선명 텔레비전은 실패작이 될 것이다. 그때가 되면 2,000만 미국인은 개인용 컴퓨터의 스크린 오른쪽 위 귀퉁이에서 엔비시(NBC)를 시청하는 것을 당연하게 생각할 것이다. 인텔과 시엔엔(CNN)은 1994년 10월에 이러한 서비스를 제공하기로 공동발표하였다.




비트 방송 사업



미래의 텔레비전을 이해하려면 텔레비전을 더 이상 텔레비전으로 생각하지 말아야 한다. 비트의 맥락에서 사고해야 가장 많은 이득을 얻는다. 영화도 데이터 방송의 특정 사례에 불과하다. 비트는 비트다.

6시 뉴스는 당신이 원할 때 전달됨은 물론 당신을 위해 편집될 수 있고 당신이 필요할 때 언제든지 다시 볼 수 있다. 오후 8시 17분에 험프리 보가트가 나오는 영화를 보고 싶다면 전화회사의 전화선을 통해 받아볼 수 있다. 야구 게임을 볼 때 그야말로 야구의 관점에서 경기장의 어떤 장소에나 앉을 수 있게 될 것이다. 이런 변화는 디지털화를 통해 이루어진다. 지금의 해상도보다 2배 선명하게 ‘사이펠드’(Seinfeld)를 보는 것과는 정반대되는 일이다.

텔레비전이 디지털화되면 거기엔 새로운 비트가 사용된다. 이 새로운 비트는 지금까지와는 다른 새로운 정보를 알려주는 역할을 한다. 이 비트는 해상도, 주사선 수, 화면비율을 알려주어 텔레비전이 수신한 신호를 최대한 완벽하게 처리․표시할 수 있도록 하는 간단한 지시신호가 될 수도 있다. 이 비트는 암호 해독 알고리즘(algorithm)이 될 수도 있다. 이것을 콘 플레이크(corn flakes) 상자에 붙어 있는 바코드와 연결시키면 우리는 암호화된 낯선 신호를 읽을 수 있게 된다. 비트는 외국 영화를 모국어로 듣게 해주는 12개의 사운드트랙 가운데 하나일 수도 있다. 또 비트는 엑스(X) 등급을 알(R) 등급으로, 알 등급을 피지(PG) 등급의 프로그램으로 바꾸는(반대 방향으로도 가능하다) 조절 스위치를 조정하는 데이터 역할을 할 수도 있다. 오늘날의 텔레비전 수상기는 밝기, 볼륨, 채널을 선택할 수 있지만 미래의 텔레비전에서는 섹스, 폭력, 정치적 성향을 선택할 수 있게 된다.

대부분의 텔레비전 프로그램은 스포츠 이벤트와 선거 결과 방송을 제외하면 실시간으로 전달될 필요가 없다. 이는 디지털 텔레비전에게 결정적으로 중요하다. 그러나 이 사실은 대체로 무시된다. 이것은 대부분의 텔레비전이 실제로는 컴퓨터가 파일을 다운로딩하는 것과 아주 흡사하다는 사실을 의미한다. 비트는 그것이 어떻게 보여질지에 대해서는 아무 상관 없이 전달될 뿐이다. 더 중요한 것은 보내진 순서대로 그들을 볼 필요가 없다는 사실이다. 시간이나 날짜, 전송에 필요한 시간과 상관없이 텔레비전은 책이나 신문처럼 펼쳐볼 수 있는 무작위 접근 매체가 된다.

텔레비전의 미래에 대하여 고선명이란 사고방식을 벗어나는 순간, 텔레비전은 완전히 다른 미디어 비트 방송이 된다. 그러면 우리는 정보고속도로를 달리는 수많은 창조적이고 새로운 어플리케이션을 마주 대하게 될 것이다. 비트 경찰이 우리를 제지하지만 않는다면.








비트 경찰관                         4

 




비트 방송 면허


 

정보와 오락은 위성, 공중파 방송, 케이블, 전화, 그리고 패키지 미디어(카세트, 시디, 인쇄물 등 아톰)의 다섯 가지 통로를 통해 가정에 전달된다. 연방통신위원회(FCC:Federal Communications Commission)는 전달 경로와 정보 내용을 규제함으로써 일반 공중의 이익을 도모하고 있다. 연방통신위원회는 보호와 자유, 공공 부문과 사적 부문, 경쟁과 독점 사이에서 종종 곤경에 처한다.

무선 통신에 사용되는 주파수는 연방통신위원회의 주된 관심 분야 가운데 하나다. 주파수는 모든 사회 구성원의 공동 소유다. 주파수는 미국 국민의 삶을 풍요롭게 하는 자원이기 때문에 공정하고, 경쟁적이며, 방해 없이 사용되어야 한다. 이러한 규정은 분명한 의미를 갖는다. 왜냐하면 이러한 통괄 규정이 없다면 텔레비전 신호와 무선 전화 간의 신호가 충돌하고, 라디오가 해군의 브이에치에프(VHF) 신호와 부딪혀 공중을 달리는 고속도로에 정말로 교통 정리원이 필요하게 되기 때문이다.

최근에 경매를 통해 특정 주파수대가 아주 높은 가격으로 무선 전화회사와 인터랙티브 비디오에 할당되었다. 공공복지를 위해 무료로 제공되는 주파수대도 있다. 광고 지원을 받아 시청자에게 ‘무료’(free)로 제공되는 텔레비전 방송이 그런 경우다. 무료 시청이지만 속내를 살펴보면 세탁비누(Tide)나 그밖의 다른 상품을 살 때 시청료를 내는 셈이다.

연방통신위원회는 기존 텔레비전 방송사에게 현재 사용중인 6메가 헤르츠(MHz) 주파수를 15년 내에 반환하는 조건으로 고선명 텔레비전 용도로 6메가 헤르츠 ‘레인’(lane)을 무료로 추가 제공하겠다고 제안하였다. 이렇게 되면 향후 15년 동안에 기존 방송사가 12메가 헤르츠의 주파수대를 소유하게 된다. 이러한 생각은 현재의 텔레비전이 미래의 텔레비전으로 진화하는 과정에서 일종의 과도기적 문제점을 안게 된다. 아날로그가 아날로그로 전환하리라 생각했던 6년 전에는 이러한 조치가 타당했을 것이다. 그러나 갑자기 출현한 고선명 텔레비전은 디지털이다. 이제 우리는 6메가 헤르츠의 주파수를 이용하여 2,000만 비피에스를 전송하는 방법을 알고 있다. 모든 규칙이 어느날 갑자기 변하고 어떤 의미에서 전혀 예측하지 못했던 방식으로 바뀌게 된다.

당신이 텔레비전 방송국을 소유하고 있는데, 연방통신위원회가 2,000만 비피에스로 방송할 수 있는 허가를 내주었다고 상상해 보라. 당신은 비트 방송 사업의 지역 중심국 허가권을 받은 것이다. 이 면허는 텔레비전에 관한 것이다. 자, 이 허가권을 갖고 당신은 실제로 무엇을 할까?

정직하게 이야기해 보자. 고선명 텔레비전 방송은 아마 당신이 가장 꺼려하는 사업이 될 것이다. 왜냐하면 고선명 텔레비전용으로 만들어진 프로그램이 드물고 고선명 텔레비전 수신기의 보급률이 아주 낮기 때문이다. 약간만 머리를 쓰면 스테레오로 방송되는 표준 엔티에스시(NTSC) 방송 4개 채널(개당 500만 비피에스)을 디지털로 운영함으로써 잠재적 시청자 점유율과 광고 수입을 확대할 수 있음을 알게 될 것이다. 머리를 좀더 잘 쓴다면 3개의 텔레비전 채널에 1,500만 비피에스를 할당하고 나머지 500만 비피에스는 주식 데이터 방송 시스템과 무선호출 서비스를 위한 2개의 디지털 라디오 신호에 사용할 수도 있다.

텔레비전을 보는 사람이 거의 없는 한밤에는 허가받은 방송망을 최대한 이용해서 가정에서 프린트해 볼 수 있는 개인 신문(personalized newspapers) 전송을 위해 비트를 분출할 수도 있다. 아니면 토요일에는 (미식 축구 게임을 위해) 해상도를 높여 2,000만 비트 가운데 1,500만 비트를 고해상도 전송을 위해 사용할 수도 있다. 문자 그대로 당신은 6메가 헤르츠, 혹은 2,000만 비트를 당신의 판단대로 할당하는 연방통신위원회가 될 수 있다.

물론 연방통신위원회가 기존 방송사에게 고선명 텔레비전 주파수대를 할당할 때부터 이런 생각을 했던 것은 아니다. 기존 텔레비전 방송국이 향후 15년 내에 주파수대를 2배로 늘리고 아무런 추가비용 지출 없이 4배의 방송 능력을 갖게 되었다는 사실을 비트 방송 사업을 열망하는 집단들이 알아차리면 그들은 연방통신위원회의 유혈낭자한 살인에 대해 절규할 것이다.

이러한 사실로 미루어볼 때, 이 새로운 주파수대와 2,000만 비트가 오직 고선명 텔레비전 방송에만 사용되는지 여부를 확인하기 위해 비트 경찰을 보내야 할까? 그렇게 되지 않기를 바란다.

 



유연한 비트


 

아날로그 시절에는 주파수를 할당하는 연방통신위원회의 업무가 훨씬 더 수월했다. 서로 다른 주파수 부문에 대해 이것은 텔레비전, 이것은 라디오, 저것은 무선 전화 등으로 설정해 주면 그만이었다. 각 주파수대는 특정한 목적을 염두에 둔 통신이나 방송 수단이었다. 그러나 디지털 세계에서는 이러한 차이가 엷어지거나 어떤 경우에는 아주 없어진다. 다시 말해 모든 것이 비트다. 라디오 비트, 텔레비전 비트, 혹은 해군용 통신 비트로 구분할 수 있지만 어쨌거나 그것은 멀티미디어의 비트 혼용과 다중 사용을 위한 비트이다.

향후 5년 동안에 텔레비전 방송에는 이해하기 어려울 만큼 커다란 변화가 예상된다. 연방통신위원회가 고선명 텔레비전, 일반 텔레비전, 라디오에 사용될 비트 할당을 결정하거나 규제하지는 않을 것이다. 시장경쟁이 훨씬 더 유능한 조정자가 될 것이 분명하다. 텔레비전 방송이나 데이터 방송이 더 많은 수입을 낳는 것을 뻔히 알면서 2,000만 비피에스를 라디오 방송에 전부 다 써버릴 사람은 없다. 요일, 시간, 휴일이나 특별한 행사 일정에 따라 스스로 비트 할당을 바꿀 수 있다. 유연성이 결정적으로 중요하며, 비트를 가장 창조적으로 사용하면서, 변화에 가장 빨리 적응하는 사람이 공중을 위해 가장 큰 기여를 하게 될 것이다.

가까운 장래에 방송사들은 전송 시점에서 (텔레비전이나 라디오 같은) 특정 매체별로 비트를 할당할 것이다. 이러한 현상은 디지털의 집중화(digital convergence), 또는 비트의 확산(bit radiation)이라고 설명할 수 있다. 송신자가 수신자에게 여기는 텔레비전 비트, 여기는 라디오, 여기는 월 스트리트 저널 비트라고 이야기한다.

좀더 시간이 지나면 송신기를 떠날 때 비트는 특정 미디어에 할당되지도 않을 것이다.

기상을 예로 들어보자. 기상통보원과 우리에게 잘 알려진 기상지도, 도형 대신에 기상 컴퓨터 모델을 전송하는 경우를 생각해 보라. 기상 정보를 담고 있는 비트가 컴퓨터 텔레비전에 도착하면 전송 과정의 마지막에 있는 당신은 컴퓨팅 지능을 사용하여 전송된 비트를 음성, 인쇄된 지도, 당신이 좋아하는 디즈니 캐릭터를 사용한 애니메이션 만화 등으로 전환한다. 스마트 텔레비전 수상기가 당신의 성향과 기분까지 고려하여 당신이 원하는 모든 것을 제공한다. 여기서 방송자는 자신이 전송한 비트가 비디오, 오디오, 혹은 인쇄물 가운데 무엇으로 바뀔지 알 수 없다. 바로 당신이 이것을 결정한다. 방송국을 출발한 비트는 여러 가지 컴퓨터 프로그램에 의하여 개인 용도에 맞게 전환되어 사용된다. 비트는 이처럼 여러 가지 다양한 방식으로 변신한다.

비트 방송과 데이터 방송이 이런 모습으로 나타날 것이라는 데에는 의심의 여지가 없다. 이렇게 되면 오늘날 송신자가 자신의 송출 신호가 텔레비전용인지 라디오용인지 혹은 테이터용인지를 구분함으로써 발생되는 각종 방송 규제 행위도 사라지게 된다.

많은 독자는 비트 경찰에 관한 내 이야기를 내용 심의 비슷한 것으로 상상할지 모르겠다. 그러나 그렇지 않다. 검열은 소비자가 수신기에게 어떤 비트를 선별해야 할지를 지시함으로써 이루어진다. 비트 경찰은 과거의 관습에서 벗어나 미디어 자체를 통제하려 할 것이다. 그러나 실제로 이것은 아무런 의미를 갖지 못한다. 문제는 명확히 정치적인 것이다. 고선명 텔레비전 할당에 대한 제안이 마치 공식성명처럼 보인다는 문제가 있는 것이다. 연방통신위원회가 특정인에게 횡재를 안겨주려 하는 것은 아니지만 많은 주파수 대역을 확보한 측은 더욱더 많은 주파수 대역을 확보하려 할 것이기 때문에 특정 이해 집단이 야단법석을 떨 것이다.

나는 연방통신위원회가 멍청하게 비트 경찰을 자임하지는 않으리라 믿는다. 연방통신위원회가 위임받은 권한은 정보와 오락 서비스의 발전이 공공이해를 위해 사용되고 있는가를 감시하는 것이다. 초기의 용감한 데이터 방송자가 일을 진척시키다가 워싱턴의 사자에게 물릴 가능성은 있지만, 로마가 기독교를 막을 수 없었던 것과 마찬가지로, 비트 방송의 자유를 제한할 어떠한 방법도 없다.





교차소유권

 


오늘날의 신문을 생각해 보자. 컴퓨터를 사용하여 본문이 준비되며, 리포터들은 종종 전자우편(e-mail)으로 기사를 보낸다. 사진도 디지털화되어 통신선을 통해 전송된다. 현대의 신문은 필름으로 뜰 데이터와 직접 판형으로 들어갈 데이터를 준비하는 컴퓨터 디자인 시스템(computer-aided design sys-

tems)으로 편집된다. 이것은 신문의 전체 개념과 구성이 처음부터 끝까지, 잉크가 종이에 먹혀드는 마지막 단계까지, 디지털이라는 사실을 의미한다. 이것이 바로 비트가 아톰으로 태어나는 단계이다.

그러면 신문 제작 공정의 마지막 단계가 인쇄 공장에서 끝나지 않고 당신에게 직접 비트로 전달되는 경우를 상상해 보자. 하드카피가 읽기 편하기 때문에 집에서 프린트할 수도 있다(프린트할 때 반복해서 사용할 수 있는 용지를 쓰게 될 것이므로 집에 인쇄 용지를 쌓아둘 필요는 없겠다). 아니면 이것을 랩탑, 팜탑 혹은 머지않아 등장할 아주 유연한 1/200인치 두께의 방수 디스플레이로 받아볼 수 있을 것이다. 그 디스플레이는 총천연색임은 물론이고 엄청난 고해상도에 대형판형(large-format)이 가능하며, 당신이 원한다면 마치 종이처럼 보이고 종이 냄새가 나는 기계가 될 수도 있다. 비트를 얻는 방법은 여러 가지가 있지만 그 가운데 하나는 분명히 방송이 될 것이다. 텔레비전 방송자가 당신에게 신문 비트를 보낼 수 있다.

그런데 잠깐만! 일반적으로 교차소유 법규에는 동일 장소에서 신문사와 텔레비전 방송국을 소유할 수 없다고 규정되어 있다. 아날로그 시절에는 독점을 방지하고 다양한 목소리를 보장하는 가장 손쉬운 방식으로 한 마을이나 도시에서 한 개의 미디어만 소유하도록 제한하였다. 미디어의 다양성은 내용의 다양성을 의미한다. 그래서 당신이 신문을 소유하고 있다면 텔레비전 방송국을 소유할 수 없으며, 그 반대의 경우도 마찬가지다.

1987년에 상원의원 테드 케네디(Ted Kennedy)와 어니스트 홀링스(Ernest Hollings)는 연방통신위원회의 교차소유 규제에 대한 임시 포기 연장을 금지하는 예산 결의안을 보완 조항에 추가하였다. 이것은 보스턴에 유에치에프(UHF) 방송국을 갖고 있으면서 신문사를 인수한 루퍼트 머독(Rupert Murdoch)을 겨냥한 조치였다. 머독을 겨냥한 이른바 레이저 빔(laser-beam) 법안은 몇 달 후 법정에서 뒤집혔지만, 연방통신위원회의 수정안 혹은 교차소유 규제 철회에 대한 의회의 거부권도 여전히 유효하다.

동일 지역에서 신문 비트와 텔레비전 비트를 소유하는 것이 정말로 법률에 위배될까? 신문 비트가 복합적이고, 개인화된(personalized) 멀티미디어 인포메이션 시스템에서 텔레비전 비트를 합성하면 어떻게 될까? 비트가 뒤섞이고 여러 가지 분석 수준과 디스플레이 질을 선택할 수 있다면 소비자에게 큰 혜택을 줄 것이다. 현재의 교차소유 규제정책이 계속될 경우 미국 시민은 풍부한 정보 환경의 가능성을 빼앗기지 않을까? 특정 비트가 다른 비트와 한데 어울리는 것을 금지하면 우리 자신은 꼴사납게 왜소화될 것이다.

매스 미디어의 독점 제국이 개미군단 기업으로 분해되고 있기 때문에 복수성을 보장하면 예상보다 규제의 필요성이 적어진다. 온라인이 진행되면 될수록 점점 더 많은 비트를 전달하게 되고, 아톰 전달은 갈수록 줄어들기 때문에 인쇄 공장을 소유함으로써 생기는 힘은 사라질 것이다. 재능 있는 자유 기고가들이 당신의 집으로 직접 전자 칼럼을 보내게 되면 전세계에 퍼져 있는 보도 스탭도 그 영향력을 다소 잃게 될 것이다.

오늘날의 미디어 백작들은 그들의 중앙집권적 제국의 장래에 집착한다. 나는 2005년까지 미국인들이 네트워크 텔레비전보다 인터넷(아니면 그것을 무엇이라 부르든 상관없이)을 사용하는 데 더 많은 시간을 쓰리라 믿는다. 기술과 인간 본능이 결합된 힘은 궁극적으로 어떤 법률 관련 위원회보다 훨씬 효율적으로 다양성을 도모할 것이다. 장기적 측면으로 혹은 단기간의 과도기적 전망에서 내가 오류를 저지를지는 모른다. 그러나 연방통신위원회는 산업 시대의 교차소유 법률을 디지털 세계를 위한 자극과 안내서로 바꾸는 창조적 틀을 찾아야 할 것이다.

비트 보호?


 

저작권법은 완전히 시대에 뒤떨어졌다. 그것은 구텐베르크(Gutenberg)의 유물이다. 저작권법은 반동적인 태도이기 때문에 고치기보다는 완전히 폐기해야 마땅하다.

대부분의 사람들이 복제판을 만들기가 쉽다는 측면에서 저작권에 대해 걱정한다. 디지털 세계에서는 단지 복제가 문제되는 것이 아니다. 디지털 복제판이 원판만큼 완벽할 뿐더러 환상적인 컴퓨팅을 사용하면 원판보다 질이 더 좋아진다. 마찬가지로 비트 열의 오류를 정정할 수 있고 복제판을 지우거나 강화하거나 노이즈를 제거할 수 있다. 복제판은 완벽하다. 음악 산업계에는 이러한 사실이 잘 알려져 있다. 이 때문에 몇몇 소비자용 전자 제품, 특히 디에이티(DAT:digital audiotape) 같은 제품의 상품화가 연기되고 있다. 그러나 이런 지연은 무의미하다. 왜냐하면 복제판의 질이 떨어져도 불법 복제판이 판치고 있기 때문이다. 몇몇 나라의 경우 판매된 전체 비디오 카세트의 95%가 해적판이다.

오늘날 저작권에 대한 관리와 태도는 매체에 따라 아주 다르다. 음악은 국제적 관심이 집중된 분야로서 선율, 가사, 사운드를 만든 창조적인 사람들이 수년에 걸쳐 보상을 받았다. 「해피 버스데이」(Happy Birthday)의 선율은 공공의 것이지만 영화에 이 노래를 사용할 경우 워너/샤펠(Warner/Chappell)에게 로열티를 지급해야 한다. 별로 합리적이지는 않지만 어쨌든 저작권법은 음악 작곡자와 연주자를 보호하는 복합 체제의 한 부분이다.

이와는 대조적으로 화가는 그의 그림을 파는 시점에서 어쨌거나 자신이 그린 그림과 이별한다. 그림에 대해 ‘보는 만큼 지불’(pay-per-view)하는 방식을 적용할 수는 없다. 한편 어떤 지역에서는 예술가의 동의 없이도 그림을 작은 조각으로 쪼개 팔거나 카펫이나 타월에 복제해서 판매해도 법적으로 전혀 문제가 되지 않는다. 미국에서는 1990년에 이르러 이런 종류의 조작을 금지하는 시각예술저작권보호법(Visual Artists Rights Act)이 제정되었다. 이런 현실을 볼 때 아날로그 세계에서조차도 저작권 체제가 안정적이지 않고 완전히 정착되지도 않았음을 알 수 있다.

디지털 세계에서 복사를 더 쉽게 할 수 있다거나 더 충실하게 만들 수 있다는 사실이 문제가 되는 것은 아니다. 우리는 결코 도용이라 할 수 없는 새로운 종류의 도용을 보게 될 것이다. 내가 인터넷에서 어떤 글을 읽고 그 복사본을 다른 사람, 혹은 메일링 리스트에 올라 있는 사람들에게 보내도 아무런 해가 되지 않는다. 또한 (신문 클립핑과는 달리) 열두 번도 채 안되게 키보드를 두드려서 지구상의 수천 명에게 그것을 다시 보낼 수 있다. 비트를 클립핑하는 것은 아톰을 클립핑하는 것과 아주 다르다.

인터넷의 비합리 경제학에서는 위에 든 사실을 수행하는 데 한푼도 돈이 안 든다. 인터넷에서 누가 무엇에 대해 지불해야 하는가에 대해 명확한 생각을 갖고 있는 사람은 없다. 인터넷의 정보는 대부분의 사용자에게 무료로 보내진다. 미래에 인터넷의 이러한 무료 복사 관행이 변하고 합리적인 경제 모델이 형성된다고 해도 백만 명의 사람에게 백만 비트를 분배하는 데 드는 비용은 1~2페니에 불과할 것이다. 분명한 것은 인터넷에서 자료를 전송할 경우 아톰을 이동할 때 필요한 우표나 페더럴 익스프레스(FedEx)요금 같은 비용은 들지 않을 것이다.

더 나아가 사람이 아니라 컴퓨터 프로그램이 이 책과 같은 물질을 읽고 자동으로 요약할 것이다. 저작권법에 따르면 어떤 소재를 요약할 경우 요약자가 그 요약에 대한 지적 재산권을 갖는다. 법 제정자들은 사람이 아닌 로봇해적(robo-pirates)이 요약 작업을 수행할 수 있다는 사실에 대해서는 검토해 본 적이 별로 없을 것이다.

미국에서는 특허와 저작권은 각기 다른 기관에 의해 다루어진다. 상무성, 행정부가 특허를 관장하고 입법부인 의회가 저작권을 담당한다. 저작권은 아이디어 그 자체가 아니라 아이디어의 표현과 형태를 보호한다. 좋은 일이다.

앞서 예를 들었던 기상 데이터와 같이 실제로 형태가 없는 비트를 전달할 경우 어떤 일이 벌어질까? 날씨에 관한 컴퓨터 모델이 날씨를 표현하는 것인지 아닌지 판단하기란 내게는 좀 곤란한 일이다. 사실 날씨에 관한 완벽하고 확고한 컴퓨터 모델은 기상 시뮬레이션으로 가장 잘 설명되는데 이것은 상상할 수 있는 ‘실제 사실’에 가장 가깝다. 확실히 ‘실제 사실’은 사실에 관한 표현이 아니라 사실 그 자체이다.

날씨는 다음과 같은 형태로 표현될 수 있다. 억양이 있는 목소리, 애니메이션 도형을 통한 컬러와 움직임, 혹은 지도로 그려진 인쇄물일 수도 있다. 이들 표현은 데이터가 아니라 유사(혹은 실제) 지능 기계가 만든 데이터의 구현물이다. 더 나아가 이들 상이한 구현물은 지역, 전국, 세계 기상 예보처럼 당신과 당신의 표현 취향을 반영할 수 있다. 수신자의 시점에서 이들은 저작권과 아무런 관련도 없다.

주식 시장을 예로 들어보자. 시시각각 변하는 주식 가격 등락은 여러 가지 상이한 방식으로 조합될 수 있다. 데이터 자체는 전화회사의 백서처럼 저작권을 인정받을 수 없다. 그러나 특정 주가나 어떤 주식 집단의 추이에 관한 그림은 확실하게 저작권을 인정받을 수 있다. 이런 종류의 형태는 송신자가 아니라 수신자에 의해 지속적으로 자료에 부가되기 때문에 저작권 보호의 문제를 더욱 복잡하게 만든다.

형태가 없는 데이터 개념은 어느 단계까지 확장될 수 있을까? 뉴스 리포트(가능하다), 혹은 소설(상상하기 힘들다)까지? 비트가 비트가 되면 해적질과 같은 오래된 질문이 아니라 새로운 질문이 제기된다.

이제 더 이상, 미디어는 메시지가 아니다.








혼합 비트                           5

 




머티어리얼 걸(Material Girl) 다시 만들기


 

타임워너는 서른네 살 먹은 전직 미시간 치어리더가 일년에 12억 달러나 벌어들인 사실을 놓치지 않았다. 1992년에 타임워너(Time Warner)는 마돈나와 6,000만 달러에 ‘멀티미디어’ 계약을 체결하였다. 그 당시 나는 서로 관계 없는 인쇄물, 음반, 영화 제작물의 집합을 멀티미디어라고 설명하는 것을 보고 놀랐다. 월 스트리트 저널은 거의 매일 인터랙티브나 디지털, 광대역을 의미하는 수식어로 멀티미디어라는 단어를 사용하였다. “멀티미디어 상점이 레코드 상점을 밀어내고 있다”는 표제까지 등장했다. 멀티미디어 사업을 계획하고 있지 않는 정보 오락 제공자는 곧 망할 것 같다. 이게 도대체 무슨 일인가?

멀티미디어는 새로운 내용인 동시에 오래된 내용을 새로운 방법으로 보는 것이다. 멀티미디어는 본질적으로 인터랙티브한 미디어로서 비트의 디지털 혼합(lingua franca)에 의해 가능하게 되었다. 멀티미디어는 비용은 낮추면서 능력을 향상시키는 것이며, 컴퓨터가 폭발적으로 등장하면서 가능해진 것이다.

멀티미디어는 이러한 기술적 당김(pull) 요인과 마돈나(이것은 아주 잘 팔렸다)와 같은 과거의 비트를 가능한 한 최대로 판매․재판매하려는 미디어 회사의 공격적인 밀어붙이기(push)로 더욱 기세를 높였다. 그 결과 과거의 음악과 필름 라이브러리가 다시 사용되기 시작했고 오디오와 비디오를 데이터와 섞어 사용하는 사례도 많아졌다. 필요하다고 생각되면 무엇이든 여러 개의 패키지에 담겨져서, 혹은 여러 가지 채널을 통해서 상품이 만들어지게 되었다. 제작사는 최소의 한계비용과 최대의 이윤 창출을 위해 비트를 새로운 눈으로 바라보기 시작했다.

시비에스(CBS)나 폭스(FOX)가 30분짜리 시츄에이션 코미디를 만드는 데 50만 달러가 든다면 1만 시간에 달하는 필름 자료로 이윤을 만드는 것은 쉬운 일이다. 오래된 비트의 가격을 아주 박하게 책정하여 새로운 비트의 50분의 1 정도로 생각한다면 당신은 그 라이브러리로 2억 달러를 벌 수 있다. 나쁜 일이 아니다.

재상품화(repurposing)는 새로운 미디어의 탄생과 함께 이루어진다. 영화는 연극을 다시 사용하였고, 라디오는 퍼포먼스(performances)를 다시 팔았으며 텔레비전은 영화를 다시 돌렸다. 당연히 할리우드는 자신이 소유하고 있는 비디오 보관물을 재생품화하거나 음악 또는 텍스트와 결합시키고 싶어한다. 문제는 아직까지 이 새로운 멀티미디어라는 매체에 꼭 알맞은 자료를 구하기가 쉽지 않다는 데 있다.

새로운 멀티미디어에서 이익을 얻어내고, 동시에 그 새로운 멀티미디어를 규정해 나갈 정보․오락 서비스는 앞으로 계속 진화의 과정을 거칠 수밖에 없다. 이를 위해서는 성공과 실패에 적응하기 위한 충분한 임신 기간이 꼭 필요하다. 결론적으로 오늘날의 멀티미디어 생산물은 아주 훌륭한 유전자를 타고났지만 아직까지 분명한 성격과 튼튼한 육체를 갖추지 못한 어린아이와 같다. 대부분의 멀티미디어 어플리케이션은 아직 연약하며 생존기회도 협소하다. 그러나 우리는 아주 빨리 배우고 있다.

역사적인 관점에서 볼 때 새로운 미디어의 인큐베이션(incubation) 기간은 아주 길 수도 있다. 카메라 앞에서 배우를 움직이게 하는 기법 대신에 무비 카메라를 움직이는 기법을 생각하기까지 많은 시간이 필요했다. 영화에 소리를 더하는 데는 32년이 걸렸다. 조만간 10여 개의 새로운 아이디어가 영화와 비디오에 완전히 새로운 언어를 제공할 것이다. 이와 같은 일이 멀티미디어에서도 일어날 것이다. 이런 개념들이 튼튼한 몸통을 형성하게 될 때까지는 당분간 과거에 쌓아놓았던 비트가 쏟아져 나오는 광경을 보고 있을 수밖에 없을 것이다. 「밤비」(Bambi) 비트의 경우에는 아무 문제도 없을지 모르지만 「터미네이터 2」(Terminator 2)를 보는 것만큼 재미는 없을 것이다.

아이들은 똑같은 이야기를 몇 번이나 계속해서 듣고 보려고 하기 때문에 동화를 시디롬(CD-ROM, 곧 아톰의 형태로) 형태의 멀티미디어로 전달하면 아주 성공적이다. 나는 1978년에 세계 최초의 레이저디스크인 파이오니어 제품을 하나 구입했다. 그 당시에는 레이저디스크로 만들어진 영화는 「스모키와 산적」(Smokey and the Bandit)밖에 없었다. 그때 여덟 살 먹은 아들은 그 영화를 100번이라도 보려 하였다. 그 아이는 초당 30프레임으로 흘러가는 화면에서 거의 불가능한 컷(재키 글리슨 Jackie Gleason이 한 프레임에서는 차 문 왼편에 있다가 다른 프레임에서는 차 문 오른편에 있는)을 찾아냈다. 다음에 출시된 「조스」(Jaws)를 보고 그 아이는 어떤 프레임에서 상어를 묶은 철사를 찾아냈다. 이런 짓을 하면서 내 아들은 몇 시간을 보냈다.

그 당시엔 멀티미디어가 스트로보 불빛과 섬광을 내뿜는 전자 나이트클럽 정도로 치부되었다. 당시의 멀티미디어는 라이트 쇼(light show)와 함께 록 음악을 전달했다. 국방성은 내 연구 제안서에서 멀티미디어라는 단어를 빼라고 특별히 요구하였다. 국방성 스탭은 내가 상원의원 윌리암 프록스마이어(Wil-

liam Proxmire)가 수여하는 악명 높은 골든 플리스 상(Golden Fleece Award)―전혀 필요없는 정부 지원 프로젝트와 그와 함께 출판되는 부정적인 출판물에 매년 수여되는 상―을 받을까 봐 걱정했다(1979년 12월에 대학생에게 텔레비전을 보는 방법을 가르치는 ‘커리큘럼패키지’(curriculum package)를 개발하기 위해 21만 9,592달러를 사용한 프로젝트 담당자 가운데 한 명에게 이 상이 수여되었다).

그러다가 그들은 우리가 컴퓨터 스크린으로 총천연색 그림을 보여주고, 그 그림을 손으로 만지자 그것이 소리나는 영화로 변했을 때 놀라움에 휩싸였다. 오늘날 우리 앞에 나타난 멋진 멀티미디어는, 그 질은 떨어지지만 잠재력을 갖고 있던 당시의 실험이 고품위 가치로 새롭게 태어난 번역판이다.




멀티미디어의 탄생



1976년 7월 3일 늦은 밤, 이스라엘 특공대는 우간다의 엔테베 공항에 잠입하였다. 그들은 독재자 이디 아민으로부터 안전한 피난처를 지원받은 친팔레스타인계 게릴라들에게 볼모로 잡혀 있던 103명의 인질을 구출하는 데 성공했다. 한 시간에 걸친 작전이 끝났을 때 20~40명의 우간다 군인과 하이제커 7명이 전부 죽었다. 반면에 이스라엘 군인 단 한 명과 인질 세 명이 목숨을 잃었다. 여기에 크게 감동받은 미국 군부는 국방성 아르파(ARPA:the Advanced Research Projects Agency)에게 엔테베에서 이스라엘을 성공으로 이끈 훈련 방법을 미국 특공대도 사용할 수 있도록 이에 필요한 전자기술 연구를 지시했다.

이스라엘은 사막에 엔테베 공항의 실물 모형을 만들었다(이스라엘 기술자들이 두 나라가 우호적이던 시절에 그 공항을 설계했기 때문에 그들에게는 매우 손쉬운 일이었다). 특공대는 이륙과 착륙을 연습하였고 모형 지점에 대해 정확한 모의 공격을 실험하였다. ‘실제’ 우간다에 도착했을 때 그들은 그 장소에 대한 예민한 공간감각과, 경험적 감각을 갖고 있어서 원주민처럼 작전을 수행할 수 있었다. 간단하지만 얼마나 엄청난 아이디어인가?

그러나 그 아이디어를 실제로 필요한 모든 상황에 적용시키기는 어려웠다. 예상 가능한 모든 인질 상황이나 공항, 대사관 같은 테러리스트의 목표를 전부 다 복제물로 만들 수는 없었다. 이를 실현하려면 컴퓨터가 필요했다. 다시 한번 우리는 아톰이 아닌 비트를 사용해야 했다. 그러나 비행기 시뮬레이션에서 사용되는 컴퓨터 그래픽만으로는 적절하지 않았다. 어떤 시스템으로 발전되든지간에 장소의 실제 감각을 전달하고 주변 환경을 몸으로 느끼려면 할리우드 무대 세트의 완전한 포토 리얼리즘(photorealism)이 필요했다.

나와 내 동료는 이에 대한 간단한 해결책을 제시하였다. 비디오디스크(vid-

eodiscs) 사용자가 마치 거리를 자동차로 달려 내려가는 느낌이 들도록 만드는 것이다. 테스트를 위해 우리는 플리스상 수상의 위험을 무릅쓰고 콜로라도의 아스펜(Aspen)을 선택했다. 그 도시는 규모면에서 조작이 용이했고 도시 구획의 모양 또한 작업에 적합했으며, 사람들도 아주 독특하여 특수제작한 촬영용 트럭이 서너 계절에 걸쳐서 몇 주 동안 거리 한가운데를 달려 내려가도 전혀 걱정하지 않았다.

이 시스템이 작동하는 방식은 간단하다. 모든 거리를 1프레임당 3피트씩 양쪽 방향에서 촬영한다. 같은 방식으로 모든 골목의 커브를 양쪽 방향에서 촬영한다. 비디오 디스크 1에는 직선도로를 촬영한 영상을 넣고 비디오 디스크 2에는 모퉁이 길을 촬영한 영상을 넣는다. 이를 이용해 우리는 완벽한 운전 경험을 얻을 수 있다. 교차점에 도달하면 디스크 플레이어 1과 2는 일렬로 일치하게 되고 당신이 오른쪽이나 왼쪽으로 돌려고 하면 그쪽 방향의 길을 보여준다. 커브를 도는 동안에는 디스크 플레이어 1이 지금까지 내려왔던 직선도로를 비추지 않게 되고, 커브를 돌고 나면 다시 작동하여 당신은 새로운 직선도로를 달려내려가기 시작한다.

1978년에 이 아스펜 프로젝트는 마술이었다. 옆 창문으로 밖을 내다볼 수 있고, 경찰서 건물 정면에서 멈춰서 그 안으로 들어가 서장과 대화를 나누고, 계절을 바꿔가며 접속해 들어가 40년 전의 빌딩을 둘러보고, 안내 관광을 한 후에 지도 위를 헬리콥터로 날아 애니메이션으로 재현한 시내를 한 바퀴 돈 후, 바에서 술 한잔 걸치고, 애리에드니(Ariadne)처럼 실을 남겨 처음 출발한 곳으로 되돌아올 수 있었다. 멀티미디어가 탄생한 것이다.

그 프로젝트는 아주 성공적이어서 테러리스트로부터 공항과 대사관을 보호하기 위해 야전 모형을 만드는 군수업자를 고용하게 되었다. 아이러니하게도 처음에 선택했던 장소 가운데 하나가 테헤란이었다. 아뿔싸! 좀더 일찍 끝냈어야 했는데.

 



90년대 베타판



오늘날 멀티미디어 제품은 시디롬 타이틀 형태의 최종 소비재로서 5세에서 10세 어린이를 겨냥하고 있지만 어른에게도 접근 폭을 넓혀가고 있다. 1994년 크리스마스 시즌에 미국에서 2,000개가 넘는 시디롬 타이틀이 출시되었다. 현재 모든 종류의 시디롬 타이틀을 다 합하면 대략 만 개 정도에 이를 것으로 추산된다. 1995년에는 대부분의 데스크탑 컴퓨터가 시디롬 드라이브를 갖출 것이다.

읽기 전용 메모리(ROM:read-only memory)로 사용되는 시디는 50억 비트(제조가 용이하기 때문에 한쪽 면만을 사용함)의 저장 능력을 갖고 있다. 2~3년 후쯤이면 한쪽 면이 갖는 저장 능력이 500억 비트로 늘어날 것이다. 사실은 50억 비트도 엄청난 용량이다. 월 스트리트 저널 한 회분을 담는 데 1,000만 비트(따라서 시디롬 한 장에 2년분이 들어갈 수 있다) 정도가 필요하다. 다시 말해 한 주에 두 권의 소설을 읽는 사람이 5년 동안 읽을 거리가 시디 한 장에 들어간다.

관점을 바꾸면 50억 비트도 그다지 큰 용량이 아니다. 그 용량으로는 압축된 비디오를 한 시간 정도밖에 저장하지 못한다. 이런 측면에서 보면 현재의 시디 용량은 겨우 중간 정도에 불과하다. 시디롬 타이틀은 단기적으로 많은 텍스트(경제적으로 비트에 잘 어울린다), 수많은 정지 사진, 약간의 음향, 그리고 초보적인 풀모션(full-motion) 비디오를 사용하리라 예상된다. 아이러니하게도 시디롬은 우리가 읽어야 할 분량을 줄여주는 게 아니라 오히려 더 많이 읽게 만든다.

그러나 멀티미디어는 장기적으로 50억, 500억 비트 용량의 50센트짜리 플라스틱 조각이 아니라 전송 능력에 제한이 없는 온라인 시스템을 성장 기반으로 사용할 것이다. 와이어드의 설립자인 루이 로세토(Louis Rossetto)는 시디롬을 지금은 이미 소멸한 베타맥스(Betamax) 비디오 표준에 빗대어 ‘90년대의 베타판’이라 부른다. 장기적으로 온라인이 멀티미디어를 지배할 것이라는 점에서 그의 지적은 맞다. 온라인 연결과 시디롬을 소유하는 것은 서로 다른 경제 모델에 속하지만 광대역 접근의 기능은 같다.

이제 길이와 폭은 더 이상 양자 택일의 조건이 아니기 때문에 편집에서 근본적인 변화가 일어난다. 인쇄된 백과사전이나 세계지도, 동물의 왕국에 관한 책을 살 경우 일반적이고 포괄적인 토픽을 기대한다. 이와는 대조적으로 윌리암 텔(William Tell)이나 알류샨 열도(Aleutian Islands), 캥거루에 관한 책을 구입할 경우 사람이나 장소, 동물에 관한 ‘깊이 있는’ 정보를 기대한다. 아톰의 세계에서는 물리적인 한계 때문에 동일한 분량이라면―1마일 정도의 두께를 갖는 책이 아닌 한―깊이와 넓이를 동시에 충족시키기 힘들다. 디지털 세계에서는 이런 문제가 사라진다. 디지털 세계에서 저자와 독자는 일반성과 전문성 사이를 좀더 자유롭게 넘나들 수 있다. 실제로 “좀더 이야기해 주세요”라는 생각은 바로 멀티미디어의 구성 부분인 동시에 하이퍼미디어(hypermedia)의 근거이다.




페이지 없는 책



하이퍼미디어는 고도로 상호연결된 설명 또는 상호연계된 정보를 가리키는 용어로서 하이퍼텍스트가 확장된 개념이다. 이 아이디어는 스탠포드 연구소(Stanford Research Institute)의 더글라스 잉글바트(Douglas Englebart)의 초기 실험에서 태동하였는데, 1965년경 브라운 대학의 테드 넬슨(Ted Nelson)이 하이퍼미디어라는 말을 만들었다. 인쇄된 책에서는 저자와 책 자체의 물리적이고 연속적인 구성에 따라 문장, 절, 페이지, 장이 이어진다. 무작위로 책을 펴볼 수 있고, 눈에 닿는 대로 아무데나 읽을 수 있다. 그럼에도 불구하고 물리적으로 규정된 3차원 세계에서 벗어날 수 없다.

디지털 세계에서는 그렇지 않다. 정보공간은 결코 3차원에 국한되지 않는다. 아이디어 표현이나 사고훈련은 다차원 네트워크를 통하여 보다 세심한 검토와 논의로 진입될 수 있다. 어디까지 어떻게 검토 논의할 것인가는 사용자의 선택에 따라 달라진다. 텍스트의 구조는 복합분자모델을 상상해 보면 거의 흡사하다. 정보덩어리는 추가 주문할 수도 있고 문장은 확장시킬 수도 있으며 잘못 사용한 단어의 오류도 골라낼 수 있다(이 책에서는 당신이 이런 일을 겪지 않게 되길 바란다). 이러한 연관구조의 형태는 인쇄할 때 저자가 결정할 수도 있고 나중에 읽으면서 독자가 할 수도 있다.

하이퍼미디어를 독자의 행동에 따라 늘이거나 줄일 수 있는 신축성 메시지 집합물로 생각해 주기 바란다. 여러 가지 아이디어를 아주 다양하고 섬세하게 제안하고 분석할 수 있다. 종이로 만든 것 가운데 이와 가장 비슷한 것은 아마도 애드벤트 달력(Advent calendar)일 것이다. 그러나 당신이 종이 표지 대신에 전자책의 작은 문을 열고 안을 들여다보면 상황에 따라 내용이 달라지는 상이한 이야기 줄거리들을 만날 수 있게 된다. 마치 이발소에서 마주보며 붙어 있는 거울을 들여다볼 때의 체험처럼 그곳에는 하나의 이미지 안에 또 다른 이미지, 그리고 그 안에 또 다른 이미지가 존재한다.

모든 멀티미디어는 상호작용을 포함하고 있다. 만일 우리가 경험한 내용을 수동적으로만 받아들인다면 캡션 텔레비전이나 자막이 붙은 영화 정도를 비디오, 오디오, 데이터의 합성물로 생각하게 될지도 모른다.

멀티미디어 제작물은 인터랙티브 텔레비전과 비디오를 볼 수 있는 컴퓨터를 모두 포함한다. 앞에서 논의한 것처럼 이들 간의 차이는 점점 줄어들어 결국에는 사라질 것이다. 많은 사람들(특히 부모들)은 ‘인터랙티브 비디오’ 하면 닌텐도, 세가, 그리고 다른 메이커의 ‘트위치’(twitch)게임을 머리에 떠올린다. 조깅 옷을 입고 몸을 움직이지 않으면 게임을 할 수 없는 전자게임도 있다. 그러나 미래의 텔레비전은 로드러너(Road Runner)의 과잉 활동이나 제인 폰다(Jane Fonda)의 체격을 반드시 요구하지는 않을 것이다.

오늘날 멀티미디어는 책상, 혹은 거실을 체험하는 정도다. 왜냐하면 도구가 아주 거추장스럽기 때문이다. 조개 껍질 디자인의 랩탑조차 극히 개인적인 정보 어플리케이션으로 사용하기 힘들다. 그러나 앞으로는 작고, 밝고, 얇고, 탄력적인 고선명 디스플레이와 함께 극적으로 변할 것이다. 멀티미디어는 점차 둘둘 말아 잠자리에 들고 가서 대화를 하거나 이야기를 던지는 책처럼 될 것이다. 언젠가는 멀티미디어가 신문의 느낌과 가죽 냄새를 풍기는 섬세함을 갖게 될 것이다.

멀티미디어는 비디오, 오디오, 데이터를 고정된 덩어리로 뒤섞어놓은 개인적인 세상 이야기나 정보의 ‘소리와 빛’(son et lumie`re) 이상의 것이다. 하나에서 다른 어떤 것으로 자유롭게 변환하는 것이야말로 멀티미디어 분야가 지향하는 바이다.







미디어 없음



디지털 세계에서 미디어는 메시지가 아니다. 미디어는 메시지의 구현이다. 메시지는 같은 데이터에서 저절로 유출되는 몇 가지 구현물로 나타난다. 미래의 방송자는 기상의 예에서 본 것처럼 수신자가 여러 가지 방식으로 바꿀 수 있는 비트 줄기를 보내게 된다. 시청자는 똑같은 비트를 여러 가지 시각에서 볼 수 있다. 스포츠 행사를 예로 들어보자.

수신되는 미식축구 비트는 컴퓨터-텔레비전에 의하여 경기 내용을 비디오로 보거나 아나운서의 목소리를 통하여 듣거나, 아니면 도식으로 이해할 수 있도록 변환된다. 이 모든 것이 똑같은 경기이며 동일한 비트 저장고에서 만들어진다. 오디오로만 재현되도록 비트를 조정하면 음향기기는 듣는 사람에게 행동을 상상케 한다(하지만 동시에 자동차 운전도 할 수 있다). 비트가 비디오로 전환될 경우 상상력의 여지는 더 줄어든다. 뒤범벅된 선수들의 움직임 때문에 양팀의 전술을 읽어내기도 힘들어진다. 비트가 도형으로 전환되면 전략과 수비 형태가 한눈에 드러난다. 이들 세 가지 형태를 돌아가며 볼 수도 있다.

다른 예로 곤충에 관한 시디롬 타이틀을 생각해 보자. 이것의 구조는 책이라기보다는 테마파크(theme park)에 더 가까울 것이다. 여러 사람이 여러 가지 다양한 방법으로 탐험한다. 모기의 구조는 그림으로, 나는 모습은 애니메이션으로, 모기 소리는 (분명히) 음향으로 가장 잘 표현된다. 그러나 각각의 구현물이 서로 다른 데이터베이스이거나 별개로 기능화된 멀티미디어 체험일 필요는 없다. 그들 모두는 하나의 구현물이지만 어떤 한 미디어에서 다른 미디어로 전환되어야 한다.

멀티미디어를 생각하려면 하나의 미디어에서 다른 미디어로 전환하는 유동적인 움직임, 같은 사실을 다르게 말하는 것, 인간의 여러 가지 감각에 호소하는 방식 등을 생각할 수 있어야 한다. 내가 어떤 내용에 대해 이야기하는데 상대가 그것을 이해하지 못한다면 만화나 3차원 그래픽으로 그것을 보여줄 수 있다. 미디어가 형태를 변환시키는 사례로는 이런 것도 있다. 예를 들면 처음엔 은은한 목소리로 당신에게 책을 읽어주다가 당신이 깜빡깜빡 졸기 시작하면 우렁찬 목소리로 변해 당신의 잠을 깨워버리는 한 편의 영화 같은 것을 들 수 있다.

하나의 미디어에서 다른 미디어로의 자동변환과 같은 최근의 획기적인 기술은 ‘움직이는 듯한 화면’(salient stills)이라고 불리는 미디어랩의 월터 벤더(Walter Bender)와 그의 학생들에 의하여 개발되었다.

그들이 제기한 문제의식은 어떻게 하면 몇 초짜리 비디오에서 개별 프레임보다 훨씬 선명한 정지화상을 얻을 수 있는가에 관한 것이었다. 8밀리 비디오의 한 프레임은 35밀리 슬라이드 필름(수천 라인)에 비해 대단히 낮은 해상도(200라인 이상)를 갖는다. 이에 대한 해답은 시간으로부터 해상도를 끌어당김으로써 앞 뒤에 있는 많은 프레임을 한꺼번에 보는 방법이다.

이 연구는 엉성한 8밀리 비디오로부터 대단히 높은 수준의 비디오 프린트(문자 그대로 3피트×4피트 크기의 코닥 컬러 프린트)를 만들어내는 기술 개발로 연결되었다. 이들 프린트물은 5,000라인 이상의 해상도를 갖는다. 이는 미국 가정의 벽장 속에 처박혀 있는 가정용 8밀리 비디오 안에서 잠자고 있는 수십억 시간이 초상화나 크리스마스 카드로 변형될 수 있으며, 35밀리 카메라 사진보다 더 높은 해상도를 갖춘 사진앨범으로 인쇄될 수 있음을 의미한다. 뉴스의 경우 퍼져보이는 조잡한 이미지 대신에 시엔엔(CNN) 방송의 필름이 신문 1면이나 타임지의 표지로 인쇄될 수 있다.

돌출 스틸은 실제로는 존재하지 않는 이미지이다. 이것은 수초간의 정지된 프레임의 반영이다. 그 시간 동안에 카메라는 아마도 줌(zoomed)이나 패닝(panned)을 하고 장면의 대상물도 움직일 것이다. 그럼에도 불구하고 이미지는 퍼짐 없이 똑똑히 완벽하게 해결된다. 스틸 사진의 내용은 필름 제작자의 의도에 따라 카메라가 주밍되거나 계획된 장면을 넓히는 데는 좀더 많은 해상도를 줌으로써 실제 수준을 보장한다. 벤더가 만든 돌출 스틸을 쓰면 빠른 속도로 무대를 건너지르는 사람의 움직임도 일시적으로 안정시킬 수 있다.

‘멀티미디어’의 이런 예는 하나의 차원(시간)이 다른 차원(공간)으로 전이되는 것을 보여준다. 간단한 예는 연설(음향 위주)이 억양을 가리키는 구두점이 찍힌 프린트(텍스트 위주)로 번역되는 경우이다. 혹은 연극을 위한 스크립트(script)의 경우 대사 다음에 원하는 톤을 얻기 위해 수많은 지시가 이어지는 경우를 들 수 있다. 이런 것들은 우리가 의식하지 못한 채 넘어가는 멀티미디어의 형식이다. 그러나 이것은 아주 커다란 사업이다.








비트 비즈니스                       6

 




2비트 이야기


 

나는 내가 변화를 예측하거나 변화에 당면하면 나 스스로를 극단주의자라고 생각한다. 그럼에도 불구하고 새로운 서비스나 기술 변화, 규제 변화를 마주하게 되면 내가 믿었던 것보다 훨씬 빨리 사태가 변화하고 있음을 알게 된다. 전자 고속도로에는 분명히 속도의 제한이 없다. 그것은 마치 아우토반에서 시속 160킬로미터로 달리는 것과 비슷하다. 속도가 너무 빨라서 나로서는 ‘’ 하고 달리고 있다고 표현할 수밖에 없을 지경인데도 메르세데스(Mercedes)가 나를 앞지르고 이어 또 다른 차들이 계속 나를 추월한다. 그들은 시속 120마일(시속 193킬로미터)로 운전하고 있음이 틀림없다. 이것이 정보고속도로의 고속 차선에서 일어나는 일이다.

전반적인 변화의 속도는 과거 어느 때보다 빠르지만 트랜지스터, 마이크로프로세서 또는 광섬유 같은 획기적 과학연구영역의 발전속도는 상대적으로 늦어지는 반면 휴대형 컴퓨터, 글로벌네트워크 그리고 멀티미디어 같은 새로운 응용분야의 발전속도는 더 빠르게 진행된다. 여기에는 두 가지 원인이 있다. 하나는 새로운 어플리케이션이 막대한 메모리와 고성능 컴퓨팅 능력을 요구하기 때문에 이를 만족시킬 수 있는 새로운 칩을 개발해야 하는데 칩의 생산설비를 구성하는 데 막대한 비용이 들어가기 때문이다. 다른 하나는 대부분 하드웨어 영역에서 이미 우리가 물리적 한계에 부딪치고 있기 때문이다.

빛이 1피트를 여행하는 데에는 10억분의 1초가 걸린다. 이 사실은 결코 바뀌지 않는다. 컴퓨터 칩을 아주 작게 만들어도 칩의 속도는 조금 증가할 뿐이다. 그러나 전체 컴퓨터 성능을 획기적으로 변화시키려면, 같은 시간에 여러 기계와 동시에 작동할 수 있도록 새로운 해결책을 고안해야 한다. 컴퓨터와 통신에서 일어나는 커다란 변화는 물질 과학이 아니라 기본적인 인간의 필요, 곧 어플리케이션에서 나온다. 월 스트리트는 이런 관측을 놓치지 않았다.

유명한 작가이자 엔지니어이며 벨코어(Bellcore:과거에 7개 지역 전화회사의 연구기관이었음)의 응용 연구 부회장인 봅 럭키(Bob Lucky)는 학문적 출판물이 아니라 월 스트리트 저널을 통해 최근의 기술적 동향을 파악한다고 지적했다. ‘비트’산업의 미래를 전망하는 가장 좋은 방법 가운데 하나는 뉴욕, 아메리칸, 나스닥(NASDAQ) 주식 거래소에 한발씩 들여놓고서 망원경의 삼각대를 미국의 흥행사업, 비즈니스, 규제와 관련된 정세를 향해 놓는 것이다.

큐브이시(QVC)와 바이아콤(Viacom)이 파라마운트 인수를 둘러싸고 다툴 때 분석가들은 승자가 패자가 될 것이라고 주장했다. 파라마운트사의 재정 사정은 구혼이 시작된 후 나빠졌지만 그럼에도 불구하고 바이아콤으로서는 여러 가지 비트를 소유하는 아주 훌륭한 일거리를 만들어낸 것이다. 섬너 레드스톤(Sumner Redstone)과 배리 딜러(Barry Diller)는 오직 한 가지 종류의 비트를 만드는 것으로는 앞으로 성공하기 어려울 것이라는 사실을 알고 있다. 파라마운트 이야기는 에고(egos)가 아니라 비트(bits)에 관한 이야기이다.

비트의 가치는 대부분 중복하여 사용될 수 있는 가능성에 따라 결정된다. 이런 측면에서 미키 마우스 비트는 포리스트 검프(Forrest Gump)보다 훨씬 더 가치가 크다. 미키 비트는 막대기 달린 사탕(소모되어 버리는 물질)으로도 판매된다. 더 재미있는 것은 디즈니가 미리 확보한 청중이 시간당 12,500명을 넘는 속도로 다시 태어나고 있다는 사실이다. 1994년에 매출액이 벨 어틀랜틱의 2/3밖에 안되고, 이윤도 반밖에 안되지만 디즈니의 시장 가치는 벨 어틀랜틱보다 20억 달러나 크다.

 



비트 운반



비트 운송은 요금 경쟁이 치열한 항공 운송보다 조건이 더 나쁘다. 통신 사업이 얼마나 규제되고 있는가를 다음 예를 통해 살펴보자. 나이넥스(NYNEX)는 브룩클린(Brooklyn:여기에서는 전화 부스가 48시간 이상을 견디지 못한다)의 어두운 골목에 전화 부스를 설치해야만 하는 반면, 규제를 받지 않는 경쟁자는 5번가나 파크 애비뉴, 혹은 공항 클럽 라운지에 공중전화를 설치할 수 있다.

더 심한 것은 전체 통신의 경제적 가격 모델이 엉망이 될 지경이란 점이다. 현재 요금은 분, 마일, 비트 단위로 결정되는데, 이들 세 가지 기준이 모두 쓸모없는 기준이 되고 있다. 요금체계는 시간(백만분의 일초부터 24시간까지), 거리(수 피트로부터 5만 마일까지), 비트 수(1비트부터 200억 비트까지) 등 여러 가지 기준으로 나뉘어 있다. 가격 결정의 차이가 이처럼 극단적이지 않았을 때에는 예전 가격 모델도 큰 무리가 없었다. 9,600비피에스(bps) 모뎀을 사용할 경우 2,400비피에스 모뎀을 사용하던 때보다 접속 시간을 75% 절약할 수 있다. 그런데 누구도 여기에 신경을 쓰지 않았다.

그러나 고속 모뎀이 널리 퍼지게 되자 누구나 여기에 관심을 갖는다. 시간 체제도 하나의 예이다. 전송 속도나 비트 수와 상관없이 4분짜리 통화 30개와 2시간짜리 영화에 대해 똑같은 요금을 지불한다면 믿을 수 있을까? 만약 120만 비피에스의 속도로 팩스를 전송하면 요금이 지금의 1/125로 줄어들 수 있을까? 에이디에스엘(ADSL:비동기 디지털 수신자 루프) 영화 채널을 통해 16,000비피에스 음성을 전송할 수 있다면 2시간분 통화요금으로 5센트만 지불해도 되는가? 리모트 컨트롤 페이스메이커(pacemaker)를 달고 퇴원한 장모가 일정하지 않은 간격으로 한 시간에 여섯 번 채집하는 비트를 집에서 병원으로 전송하기 위해 「바람과 함께 사라지다」를 보는 데 필요한 120억 비트와 같은 요금을 내야 하는가? 사업 모델을 한번 그려보기 바란다.

좀더 지능적인 틀을 개발해야 한다. 아마 앞으로는 요금의 근거와 조절변수로서 시간, 거리, 비트를 사용하지는 않을 것이다. 나는 주파수 대역은 무료로 제공되어야 한다고 생각한다. 우리는 영화, 장거리 건강 진단, 문서가 전달되는 채널을 구입하는 것이 아니고 그들 정보의 가치를 구입하는 것이다. 장난감을 살 때 그것을 구성하는 원자의 수에 대해 돈을 지불하는가? 비트와 아톰이 각각 무엇을 의미하는가를 이해해야 한다.

전화회사가 자신의 장기 경영 전략을 비트를 전달하는 사업에만 국한할 경우 지분 참가자들은 최상의 이익을 보장받을 수 없을 것이다. 비트 사용권, 비트에 의미 있는 가치를 부가하는 것이 전체 사업 방정식에 포함되어야 한다. 그렇지 않으면 수입을 늘릴 방도가 없게 되고, 전화회사는 격화되는 경쟁 상황과 늘어나는 주파수대역 때문에 갈수록 가격이 떨어지는 재래의 서비스에서 벗어나지 못할 것이다. 그러나 여기에 함정이 있다.

내가 어렸을 때는 모든 사람이 전화회사(성인이 되면서 나는 혐오 목록 1위에 보험회사를 올려놓았다)를 싫어했다. 1950년대의 영악한 아이들은 누구나 전화회사를 골탕먹일 계획을 세우고 있었을 것이다. 지금은 요금은 올리면서 형편없는 서비스를 제공하는 케이블 회사가 이 영광을 누리고 있다. 전화회사보다 더 나쁜 점은 케이블 회사는 “단순히 내용만을 배달하지 않는다”는 데 있다. 케이블 회사는 케이블 선을 타고 달리는 내용까지도 관리한다.

케이블 산업은 처음에는 지역 공동체에 대한 잡동사니 서비스를 제공한다는 명목하에 연방통신위원회의 규제에서 벗어나 수많은 독점 혜택을 누려왔다. 케이블 프랜차이즈가 합병되고 전국적인 네트워크를 구성하자 사람들은 케이블 회사가 채널과 내용을 동시에 통제한다는 사실을 알게 되었다. 전화회사와는 달리 케이블 회사는 지역적 공공 목적을 제외하고는 통행권(right-of-way)을 제공할 의무가 없다.

전화 산업에 대한 규제는 모든 사람에게 그 사용을 허용한다는 아주 단순한 원칙에서 출발한다. 그러나 광대역 시스템이 전화 네트워크가 아니라 현재의 케이블 회사와 유사한 모양으로 진행될 경우 어떤 일이 일어날지 알 수 없다. 의회는 채널 소유자가 내용 소유자를 겸하게 될 경우의 공정성(fairhandedness)에 대해 신경을 곤두세우고 있다. 만약 당신이 내용과 채널을 모두 소유하게 될 경우 당신은 중립성을 유지할 수 있겠는가?

다른 식으로 표현하자면 만약에 에이티앤티(AT&T)와 디즈니의 합병으로 탄생한 새로운 회사가 과연 어린이를 위해 버그스 바니(Bugs Bunny)보다 미키 마우스(Mickey Mouse)를 더 싸게 공급할 것인가?




설익은 비트



1993년 가을 벨 어틀랜틱사가 케이블의 거인 티시아이(TCI:TeleCommuni-

cations Inc.)를 214억 달러에 구입하기로 합의했을 때 정보고속도로 관련 학자들은 이 사건을 디지털 시대의 진정한 출발을 알리는 신호로 받아들였다. 디지털 시대를 알리는 테이프를 끊은 것이다.

그러나 합병은 규제 논리와 상식에 직면하여 무산되었다. 전화회사와 케이블 회사는 그들 서로를 라이벌로 보았으며, 정부의 규제는 대부분의 공동 소유를 배제했다. 전화와 케이블의 합병은 기름에 식초를 섞는 일처럼 여겨졌다. 순투자율이 떨어졌다. 넉 달 후에 벨 어틀랜틱과 티시아이(TCI)의 합의가 무산되었을 때 디지털 시대는 다시 한번 연기되었다. 티시아이의 주가는 30% 떨어졌고, 컨소시엄에 참여한 다른 연합 회사들도 타격을 받았다. 너무 빨리 샴페인을 터뜨린 것이다.

그러나 내가 보기에 이것은 심각한 불상사가 아니었다. 사실 벨 어틀랜틱과 티시아이의 협정은 가장 재미없는 기업 합병이었다. 그것은 마치 두 개의 가스 배관 회사가 두 개의 서로 다른 파이프를 마케팅하면서 그들의 발명품을 결합하기로 한 것과 같다. 그것은 비트 제조와 비트 분배를 뒤섞는, 채널과 내용의 튼튼한 결합이 아니었다. 디즈니와 할리우드의 제왕 마이클 오비츠(Michael Ovitz)는 1994년 3개의 지역 전화회사와 협력하기로 했는데 지금은 이것이 훨씬 더 흥미를 끈다.

전자제품 회사가 오락(엔터테인먼트) 회사와 이런 결합을 시도하고 있다. 원칙적으로 이것은 매우 강력한 아이디어이긴 하지만 아직까지는 여러 가지 문화적 차이 때문에 연쇄 효과를 얻지 못하고 있다. 소니가 시비에스(CBS)를 구입하고 이어서 컬럼비아 영화사를 인수했을 때 미국인들은 얼굴을 찌푸리며 소리질렀다. 록펠러 센터의 방매처럼 소니사의 구입은 국가적 문화 자산에 대한 외국의 통제를 상징적으로 보여주는 이슈가 된다. 얼마 후 마쓰시다가 엠시에이(MCA)를 인수했을 때 사람들은 더욱 경악을 금치 못했다. 왜냐하면 엠시에이 회장인 류 와서만(Lew Wasserman)은 가장 미국적인 최고 경영자로 손꼽혔기 때문이다. 나는 제1차 석유파동 이후 엠시에이 본관을 방문했을 때 엘리베이터 단추에 붙은 스티커(류의 메시지)를 본 적이 있다. “당신의 건강과 국가를 위해 한 층은 걸어 올라가고 두 층은 걸어 내려와라.” 이런 식의 기업 매각은 미국적 사고와 일본적 사고 간의 깊은 문화적 단절을 제기할 뿐만 아니라 엔지니어링과 예술 간의 단절 문제를 상기시킨다. 아직까지는 별다른 낌새가 없지만 앞으로 그런 문제가 일어날 것이라고 생각한다.




문화수렴



인위적이기는 하지만 기술과 인간성, 과학과 예술, 왼쪽 뇌와 오른쪽 뇌 사이에는 양극간의 단절이 있다. 싹터오르는 멀티미디어는 건축학처럼 이들간의 격차를 메우는 분야 가운데 하나가 될 것이다.

텔레비전은 순전히 기술적 요청에 힘입어 발명되었다. 필로 판스워스(Philo Farnsworth), 블라디미르 츠보리킨(Vladimir Zworykin) 같은 개척자들은 1929년에 우표딱지 크기의 전자 이미지를 보고서는 기술 자체의 매력에 이끌려 그 기술을 완성하기에 이르렀다. 츠보리킨은 초창기에 텔레비전의 사용을 너무 단순하게 생각했기 때문에 말년에 실망하였다.

엠아이티(MIT) 전 학장이었던 제롬 비스너(Jerome Wiesner)는 자신이 존 에프 케네디의 가까운 친구인 동시에 과학 자문이던 시절 어느 일요일날 츠보리킨이 백악관을 방문한 이야기를 들려준 적이 있다. 비스너는 츠보리킨에게 대통령을 만나 본 적이 있느냐고 물었다. 그가 만나보지 못했다고 말하자 비스너는 그를 대통령에게 “당신이 선출되도록 만든 사람”이라고 소개했다. 깜짝 놀란 케네디가 “어떻게 그런 일이”라고 물어보았다. 비스너는 “이 사람이 텔레비전을 발명한 사람입니다”라고 대답했다. 케네디는 텔레비전 발명이 얼마나 끔찍하고 중요한가에 대해 말했다. 츠보리킨은 얼굴을 찡그리며 비꼬듯이 “최근에 텔레비전을 보셨나요?”라고 응답했다.

텔레비전은 처음엔 단순히 기술 욕구 때문에 발전하기 시작했다. 그후에 다른 가치관과 상이한 지적 문화를 가지고 있는 창조적인 탤런트들이 바톤을 이어받았다.

그러나 사진은 사진작가에 의해 발명되었다. 사진기술을 완성한 사람은 작가가 그들의 생각을 잘 전달하기 위해 연애 소설, 에세이, 만화 책을 발명했듯이 예술 목적을 완성시키기 위해 사진 기술을 개발하고 세련되게 만들었다.

개인용 컴퓨터는 컴퓨터 과학을 기술적 필요의 차원에서 건져올려 사진처럼 진화하도록 만들었다. 컴퓨팅은 더 이상 군대, 정부, 대기업의 독점적 영역이 아니다. 컴퓨터는 사회 모든 분야의 창조적 개인에게 직접 연결되어 그 사용과 발전면에서 창조적 표현을 위한 수단으로 변하고 있다. 멀티미디어의 의미와 메시지는 기술적 성취와 예술적 성취의 혼합이 될 것이고 가전제품이 그 추진력을 이룰 것이다.

전자 게임 사업(전세계적으로 150억 달러에 이르는)이 좋은 예이다. 이 사업은 미국 영화 산업보다 규모가 크며 성장 속도도 훨씬 빠르다. 게임 회사는 낮은 가격으로 가상현실이 ‘현실’로 될 수 있도록 디스플레이 기술을 개발하고 있다. 나사(NASA)는 극히 부분적인 성공을 거두기 위해 20만 달러를 들였다. 1994년 11월 15일에 닌텐도는 ‘가상 소년’(Virtual Boy)이라는 가상현실게임을 199달러에 출시하였다.

최근의 가장 빠른 인텔 프로세서는 1초에 100밉스(MIPS)로 명령을 처리한다. 소니가 게임시장을 목표로 최근에 출시한 1,000밉스 속도의 200달러짜리 ‘플레이스테이션’(Playstation)과 비교해 보라. 무엇이 이루어지고 있는가? 대답은 간단하다. 새로운 오락에 대한 우리의 갈망은 의심의 여지가 없다. 게임산업이 시작한 새로운 리얼타임 3차원 내용물은 그에 걸맞는 처리 방식과 새로운 디스플레이를 필요로 한다. 어플리케이션이 요청되는 것이다.





끌어당기기(pulling) 와 밀어내기(pushing)



바이아콤, 뉴스 코퍼레이션(News Corporation) 그리고 이 책의 출판사 같은 거대 미디어 기업은 상품을 유통시킴으로써 정보와 오락 내용의 가치를 배가시킨다. 내가 앞에서 말한 대로 아톰의 분배는 비트보다 훨씬 더 복잡하며 수많은 회사의 힘을 필요로 한다. 이와 반대로 비트 운반은 훨씬 간단하다. 원칙적으로 비트 운반은 이들 거대 회사를 필요로 하지 않는다. 거의 그럴 것이다.

나는 뉴욕 타임스(The New York Times)를 통해 컴퓨터와 커뮤니케이션 리포터인 존 마코프(John Markoff)의 글을 처음 접하였다. 그러나 마코프가 쓴 새로운 이야기를 자동으로 수집하는 방법을 사용하여 그것을 나의 개인 신문(personalized newspaper)이나 추천 독서 파일(suggested-reading file)에 떨구면 그의 글을 수집하고 읽는 일이 아주 수월해질 것이다. 아마 그렇게 되면 나는 그의 이야기 한 개당 ‘2센트’ 정도를 마코프에게 지불하게 될 것이다.

1995년에 인터넷을 사용하는 전체 사용자 가운데 2/100가 이런 서비스에 가입하고 존이 일년에 100편 정도의 글을 쓴다고 가정하면 (그는 실제로 일년에 120~140편 정도의 글을 쓴다) 그는 일년에 100만 달러를 벌게 된다. 이 액수는 그가 뉴욕 타임스에서 받는 돈보다 많을 것이다. 만약에 2/100가 너무 크게 설정한 수치라고 생각되면 잠시 기다려주기 바란다. 이 수치는 실제로 일어나고 있는 현실이다. 디지털 세계에서는 누군가가 자리를 잡으면 유통업자의 부가가치는 점점 더 작아진다.

비트의 유통과 이동에는 여과와 선택 과정이 포함되어야 한다. 미디어 회사는 무엇보다도 탤런트를 스카우트하고 유통 채널은 대중 여론의 시험장을 제공한다. 그러나 어떤 점에서 저자는 이런 포럼이 불필요하다. 크노프 출판사에게는 미안한 이야기지만 디지털 시대에 마이클 크라이튼(Michael Crichton)은 자신의 책을 직접 팔아 이전보다 훨씬 더 큰 돈을 벌 수 있다.

디지털시대에는 매스미디어의 성격이 비트를 사람들에게 밀어내는 과정으로부터 사람들(혹은 그들의 컴퓨터)이 비트를 끌어당기도록 만드는 과정으로 변할 것이다. 이것은 아주 근본적인 변화이다. 왜냐하면 미디어에 대한 우리의 전반적 개념이 연속적인 여과 행동 과정으로 바뀌게 되기 때문이다. 사람들은 이 여과과정을 통해 정보와 오락물을 ‘가장 재미있는 이야기’ 혹은 ‘가장 잘 팔리는 책’으로 정리해 내게 되고, 이렇게 정리된 정보와 오락물은 전혀 다른 별개의 수용자들에게 전달된다. 미디어 회사가 잡지 사업처럼 내로우캐스팅(narrowcasting)이 되면서 그들은 아직도 자동차광이나 알파인 스키어, 포도주 예찬자 등 특정 이해 집단에게 밀고 들어가기도 한다. 나는 최근에 요금이 싼 심야 텔레비전 광고에서 불면증 환자를 위한 틈새(niche) 잡지를 하나 본 적이 있다.

정보 산업은 패션 산업(boutique) 이상이 될 것이다. 정보산업 시장은 전세계적인 정보고속도로이다. 고객은 인간과 컴퓨터 대리인이 될 것이다. 디지털 시장이 실재하는가? 그렇다. 그러나 인간과 컴퓨터 간의 인터페이스가 사람과 이야기하는 것만큼 쉬워질 경우에만 디지털 시장은 열릴 것이다.







사람과 비트가 만나는 곳            7





숙명적인 반작용



나는 하루에 최소한 3시간 정도 컴퓨터 앞에 앉아 있다. 이렇게 몇 년 동안 해왔지만 아직도 가끔씩 컴퓨터에 대하여 좌절감을 느낀다. 컴퓨터를 이해하기란 은행 청구서를 이해하는 것만큼이나 어렵다. 그런데 왜 컴퓨터(그리고 은행 명세서)는 그렇게 쓸데없이 복잡할까? ‘디지털이 되기’는 왜 이리 힘들까?

사실 컴퓨터는 그다지 어렵지 않고, 사용이 힘들 이유도 없다. 컴퓨팅은 매우 빨리 발전하여 최근에는 사람과 컴퓨터 간의 상호 작용을 쉽게 만드는 데 값싼 컴퓨팅 파워를 사용하게 되었다. 그동안 사용자 인터페이스에 돈과 시간을 투자하는 일은 부질없는 낭비로 간주되었다. 지금까지의 컴퓨터에서는 속도가 가장 중요하였으므로 모든 노력을 이 속도 문제에 집중하였기 때문이다.

과학자들은 그간 여러 방식으로 사용자에게 불편을 강요하는(stoic) 인터페이스를 정당화하였다. 예를 들어 1970년대 초반에 몇몇 ‘학술적인’ 신문들은 흑백 디스플레이가 컬러 디스플레이보다 더 좋다는 내용의 기사를 실었다. 컬러 디스플레이는 나쁘지 않다. 연구 공동체는 적당한 가격으로 좋은 인터페이스를 제공할 능력이 없다는 사실을, 조금 냉소적으로 이야기하면, 상상력을 희생하면서까지 입증하려 했다.

1960년대 말부터 1970년대 내내 인간-컴퓨터 인터페이스를 연구하던 우리들은 컴퓨터 시스터 보이로 취급당하였으며 노골적인 경멸의 눈총을 받았다. 우리의 작업 분야는 비록 인정은 받고 있었지만 적절한 연구 소재는 아니었다. 감지하고 느끼고 피드백하는 것이 얼마나 중요할 수 있는가를 스스로 확인하기 위해서 최근에 당신이 승강기 단추를 눌렀는데도 불이 들어오지 않았던 경우를 생각해 보라. (아마 전구가 끊어져서 그랬겠지만) 당신은 대단히 당황하면서 그 스위치를 바로 눌렀는지 의심했을 것이다. 인터페이스 디자인과 기능은 매우 중요하다.

1972년에 전세계의 컴퓨터는 15만 대에 불과했다. 그런데 앞으로 5년 안에 집적회로 제조 회사인 인텔(Intel)사 하나가, 한 해에 1억 대의 컴퓨터에 탑재될 칩을 생산할 것으로 보인다(나는 이 수치가 과소평가되었다고 생각한다). 30년 전에 컴퓨터를 사용하는 것은 달 착륙선을 조종하는 것과 같이 컴퓨터를 다루는 요술을 배운, 소수의 교육을 받은 사람들만의 영역이었다. 사실은 기계를 다루는 데 필요한 원시적 언어와 토글 스위치, 그리고 깜빡이는 불빛 외에 아무것도 아니다. 나는 승려의 지식 독점이나 중세시대의 기괴한 종교 의식처럼 컴퓨터의 신비를 유지하려는 무의식적인 노력이 있었다고 생각한다.

우리는 아직도 그 대가를 치르고 있다.

사람들은 컴퓨터가 보고 느끼는(look and feel) 것에 대해 이야기할 때, ‘전문가’들이 구이(GUI)라고 부르는 그래픽 사용자 인터페이스(graphical user interface)를 떠올린다. 구이는 1971년경에 시작된 제록스(Xerox)의 작업, 엠아이티와 다른 지역에서 진행된 연구, 그리고 10년 후 스티브 잡스(Steve Jobs)의 지혜와 인내가 낳은 매킨토시(Macintosh) 컴퓨터의 탄생에 힘입은 바 크다. 맥(Mac)은 시장을 엄청나게 변화시켰다. 굳이 비교해서 말하자면 그후 새로워진 것이 아무것도 없을 정도다. 5년 후 다른 컴퓨터 회사가 애플 흉내를 냈지만 그 결과는 아직까지 신통치 않다.

기계를 좀더 사용하기 쉽게 만들려는 인간의 노력은 컴퓨터와 사람이 접촉하는 감각적인 부분(sensory points of contact)을 강화하고 물리적인 디자인을 개선하는 데 맞추어졌다. 인터페이스는 전통적인 산업 디자인 문제로 취급되었다. 찻주전자나 부지깽이 디자이너는 손잡이를 만들 때 먼저 모양을 생각한 다음 열을 차단하고 물집이 생기지 않도록 하는 데 중점을 둔다.

비행기 조종실의 디자인은 대단히 위압적이다. 수많은 스위치, 손잡이, 다이얼, 계기판이 있을 뿐만 아니라 유사한 두세 종류의 감각 입력이 상호 방해 작용을 할 수 있다. 1972년에 이스턴 항공사(Eastern Airlines)의 엘(L)1011기가 바퀴가 나오지 않아 추락했다. 관제사의 음성과 계기판 컴퓨터의 삑삑거리는 소리 때문에 승무원이 경고 메시지를 듣지 못한 것이다. 죽음을 부른 인터페이스 디자인이다.

내 집에는 거의 완벽하게 음성을 인식함은 물론이고 나에 관한 정보가 입력된 지능 브이시알(VCR)이 있다. 나는 프로그램 명칭으로 녹화를 하도록 명령할 수 있었고 어떤 때는 내가 요구하지 않아도 스스로 알아서 녹화하는 경우도 있었다. 그러던 중에 녹화를 맡아해 주던 내 아들이 갑자기 대학에 입학해서 집을 나가버렸다.

그후 나는 텔레비전 프로그램을 6년 동안 녹화하지 않았다. 녹화를 할 줄 몰랐기 때문이 아니다. 노력에 비해 그 가치가 너무나 보잘것 없었기 때문이다. 더 중요한 이유는 브이시알과 리모컨을 사용하는 일이 단지 버튼을 누르는 문제로 취급되었기 때문이다. 이와 마찬가지로 개인 컴퓨터의 일반적인 인터페이스도 물리적인 디자인 문제로 간주되어 왔다. 그러나 인터페이스는 단순히 컴퓨터가 보고 듣도록 하는 것이 아니다. 그것은 개성의 창조이며, 지능을 디자인하는 일인 동시에 기계가 인간의 감정을 인식하도록 만드는 일이다.

강아지는 100야드나 떨어진 곳에서 걸음걸이만 보고도 당신을 알아차린다. 그런데 컴퓨터는 당신이 바로 앞에 있어도 모른다. 애완 동물은 당신이 화났다는 것을 알아차리지만 컴퓨터는 그 낌새조차 모른다. 강아지도 자기가 무엇을 잘못했는지 알지만 컴퓨터는 모른다.

향후 10년 동안, 우리의 도전은 더 큰 스크린을 만들거나, 더 좋은 음질, 사용하기 쉬운 그래픽 입력 장치를 만드는 데 있지 않다. 다음에 도전해야 할 대상은 컴퓨터로 하여금 당신을 알게 만들고, 당신에게 필요한 것이 무엇인지를 알게 하고, 목소리와 목소리 이상의 언어들까지도 인식하도록 하는 것이다. 컴퓨터는 ‘키신저’(Kissinger)와 ‘키싱 허’(kissing her)를 구분해낼 수 있어야 한다. 컴퓨터가 미세한 음향 차이를 가려내야 한다는 말이 아니라 의미를 이해할 수 있어야 한다는 말이다. 바로 이것이 훌륭한 인터페이스이다.

오늘날 상호작용에 대한 부담은 전적으로 사람의 몫이다. 컴퓨터 파일 인쇄처럼 진부한 일은 존경받을 만한 인간의 행위가 아니다. 그런 것은 차라리 눈속임 같은, 정신 건강을 해치는 행위에 가깝다. 그 결과, 수많은 성인들이 컴퓨터 스위치를 끄고 아무런 대책 없이 컴퓨터 문맹으로 남는다.

그러나 앞으로 이런 사태는 바뀔 것이다.




오디세이



1968년에 아서 클라크(Arthur C. Clarke)는 스탠리 큐브릭(Stanley Kubrick)과 함께 「2001:우주 오디세이」(2001:A Space Odyssey)로 오스카상을 공동 수상하였다. 이상하게도 영화가 책보다 먼저 나왔다. 클라크는 영화가 크게 성공한 후 그의 원고를 수정하였다. 그는 이야기 줄거리를 영화로 모의 실험한 다음, 그의 개념을 다듬을 수 있었다. 책을 출판하기 전에 그의 아이디어를 먼저 보고 들을 수 있었던 것이다.

영화의 주인공인 컴퓨터 할(HAL)은 미래의 인간과 컴퓨터 간의 인터페이스를 훌륭하게(치명적이기는 하지만) 보여주었다. 할(HAL)은 완벽하게 말(이해와 발성)을 구사하고, 뛰어난 시력을 갖고 있었을 뿐만 아니라 지능의 최종 단계인 유머까지 지니고 있었다.

그후 거의 사반세기가 지나서 또 하나의 멋진 인터페이스, 지식항해자(The Knowledge Navigator)가 출현하였다. 이 비디오 테이프와 비디오 시제품이라 불리는 극장용 작품은 당시 애플사의 회장이었던 존 스컬리(John Sculley)에게 맡겨졌다. 스컬리는 자신이 쓴 책도 오디세이라는 제목을 가지고 있었으며, 지식항해자의 아이디어와 함께 끝나고 있었는데, 이 아이디어도 후일 비디오로 제작되었다. 그는 마우스와 메뉴 방식을 뛰어넘는 미래의 인터페이스를 그려 보여주고자 했다. 그는 매우 훌륭한 일을 해냈다.

지식항해자를 읽어보면 소탈하게 보이는 교수의 책상 위에는 책같이 생긴 평범한 장비가 펼쳐져 있다. 디스플레이 한쪽 구석에는 나비 넥타이를 맨 사람이 있는데 그가 바로 기계 인간이다. 교수가 이 대행자에게 강의를 준비하도록 지시하고, 몇 가지 일을 시키고 다른 일에 대해 주의를 준다. 기계인간은 사람처럼 보고, 듣고, 지적으로 반응할 수 있다.

할과 지식항해자는 둘 다 물리적인 인터페이스가 필요 없을 정도로 높은 지능을 가지고 있다는 공통점이 있다. 바로 여기에 인터페이스 디자인의 비밀이 숨어 있다. 인터페이스 자체를 없애버려라. 우리는 모르는 사람을 처음 만났을 때 그들의 생김새, 말투, 몸짓에 대해 신경을 많이 쓰게 된다. 처음에는 목소리의 톤이나 얼굴의 표정언어가 크게 영향을 미치지만, 곧 내용이 대화를 지배하게 된다. 훌륭한 컴퓨터 인터페이스도 이와 같이 되어야 한다. 인터페이스 디자인이란 계기판이 아니라 인간을 디자인하는 문제로 봐야 한다.

한편 대부분의 인터페이스 설계자들은 똑똑한 사람이 멍청한 기계를 좀더 쉽게 사용할 수 있도록 만들기 위해 노력해 왔다. 인간의 신체가 감각을 어떻게 사용하는가에 관한 연구와, 도구를 사용하여 일하는 효과에 관한 연구가 미국과 유럽의 인간공학 분야(감수자 주:인간공학을 미국에서는 hu-

man factors, 유럽에서는 ergonomics라고 부르고 있다)를 선도하고 있다.

전화 수화기는 아마 지구상에서 새로운 디자인이 가장 많이(지나칠 정도로) 시도된 물건일 것이다. 그래도 여전히 불만족스러운 상태로 남아 있다. 무선 전화기의 불안정한 인터페이스 때문에 브이시알이 껌뻑거릴 경우가 있다. 뱅 앤드 올프슨(Bang & Olufsen) 전화기는 전화기라기보다는 차라리 조각에 가깝다. 이것은 검정색 구식 다이얼 전화기보다 더 사용하기 힘들다.

더 나쁜 것은 전화 디자인이 하도 많이 ‘등장해서’ 거의 죽을 지경이라는 점이다. 번호 저장, 재발신, 신용카드 관리, 발신 대기, 발신, 자동응답, 번호검색 등을 얇은 몸체 안에 우겨넣어서 손바닥만한 기계의 사용을 불가능하게 만들고 있다.

나는 이런 기능을 사용하고 싶지 않음은 물론이고 전화기 다이얼조차 돌리고 싶지 않다. 우리 가운데 전화기 다이얼을 돌리고 싶은 사람이 하나도 없다는 사실을 전화 디자이너들은 왜 모를까? 우리는 전화를 통하여 사람들과 접촉하기를 바라는 것이다!

기회가 된다면 그 일을 대행시킬 수 있다. 전화 문제의 해결책은 수화기 디자인이 아니라, 당신의 주머니에 들어갈 만한 로봇 비서를 디자인하는 데서 찾아야 한다.




더 이상 그림을 새겨넣지 않는다



컴퓨터 인터페이스 디자인은 1960년 3월 릭라이더(J. C. R. Licklider)가 「사람과 컴퓨터의 공생」(Man-Computer Symbiosis)이라는 논문을 발표함으로써 시작되었다. 릭(Lick, 릭라이더의 애칭)은 실험 심리학자인 동시에 음향학자였다. 그는 컴퓨터를 파고들어 초기 아르파(ARPA) 컴퓨팅을 이끄는 컴퓨팅의 구세주가 되었다. 그는 1960년대 중반에 미래의 텔레비전에 대한 카네기위원회(Carnegie Commission) 보고서의 부록 집필을 의뢰받았다. 바로 이 부록에서 릭은 내로우캐스팅(narrowcasting)이라는 용어를 처음 사용하였다. 릭은 그의 두 가지 업적, 곧 인간과 컴퓨터 간의 공생과 내로우캐스팅이 30년 후 하나로 수렴될 운명을 지녔다는 점을 당시에는 전혀 몰랐다.

1960년대 초반의 인간-컴퓨터 인터페이스 연구는 두 부분으로 나뉘어 있었고, 그후 20년이 지나도록 하나로 합쳐지지 않았다. 하나는 상호작용성(interactivity)에, 다른 하나는 다양한 감각의 활용(sensory richness)에 초점을 맞추었다.

상호작용성 문제는 공동사용이 불가능한 고가의 컴퓨터를 공유할 수 있도록 만드는 데에서 실마리가 풀렸다. 1950년대와 1960년대 초반에는 컴퓨터가 너무 비싸서 그것을 쉬지 않고 돌리는 데 온갖 노력을 기울였다. 키보드를 연결하여 컴퓨터로 하여금 질문에 답하게 한다거나, 사람이 읽고 생각하고 응답하는 동안 기계를 가만히 내버려두는 일은 생각도 할 수 없었다. 시분할(time sharing)이라는 새로운 개념은 서로 떨어진 장소에서 하나의 기계를 여러 사용자가 공유함을 말한다. 하나의 자원을 열 사람에게 나누어준다고 해서 한 사람이 전체 기계의 1/10만 사용하는 것은 아니다. 한 사람이 생각하는 동안 다른 사람은 컴퓨터 전부를 사용할 수 있다.

디지털 파일을 공유하려면 많은 양의 컴퓨팅이나 대역폭을 사용하는 욕심꾸러기 사용자가 없어야 한다. 초기의 터미널은 110보드의 속도였다. 300보드로 속도가 향상되었을 때 매우 빠르게 느껴졌던 당시의 기억이 지금도 생생하다.

이와 대조적으로 다양한 감각의 활용은 아주 높은 주파수 대역을 갖는 그래픽 상호작용과 연계된다. 초기의 컴퓨터 그래픽은 이미지를 제공하는 전용 기계가 필요했다. 그것은 원리적으로는 오늘날의 개인용 컴퓨터와 다른 점이 없었지만 커다란 공간을 차지했으며 막대한 비용이 들었다. 컴퓨터 그래픽은 선을 그리는 매체로 탄생되었으며 브라운관의 전자 빔을 직접 컨트롤하기 위해 강력한 컴퓨팅 파워를 필요로 했다.

10년이 지나서야 컴퓨터 그래픽은 선 그리기에서 형태와 이미지 그리기로 넘어갈 수 있었다. 래스터 주사선(raster scan) 디스플레이라고 불리는 새로운 디스플레이는 그림을 점 단위로 저장하는 데 엄청난 양의 메모리를 필요로 했다. 오늘날에는 이러한 사실을 누구나 알고 있지만 당시만 해도 이단으로 간주되었다(1970년에는 그래픽을 위해 컴퓨터 메모리를 충분히 사용할 수 있을 만큼 메모리 값이 떨어지리라 생각한 사람은 아무도 없었다).

시분할과 컴퓨터 그래픽은 그후 20년 동안 불편한 동료 관계를 유지하였다. 감각 능력이 향상된 시분할 시스템이 비즈니스와 학술용 컴퓨팅을 위한 도구로 출현하였다. 이는 오늘날 우리가 당연하게 받아들이는 은행 거래의 전산화와 비행기 예약 시스템의 모태가 되었다. 상업적인 용도의 시분할은 효율적인 인터페이스 디자인을 통해 아주 잘 이루져 있으며, 보통 타이프라이터의 인쇄 속도는 한 사람의 사용자가 사용하기에는 아주 느리게 설계되었다. 그래서 한 사용자의 출력 내용이 느리게 인쇄되는 동안 다른 사용자들도 할당된 시간을 활용할 수 있다.

한편 컴퓨터 그래픽은 대부분 독립적인 개별 컴퓨팅(stand-alone)을 위하여 개발되었다. 1968년에는 공장 자동화 및 기계 자동화에 아주 정교한 실시간 통제가 필요했기 때문에 2만 달러짜리 미니 컴퓨터가 나오기 시작했다. 컴퓨터 그래픽도 마찬가지였다. 이처럼 디스플레이 기구와 한짝으로 제공되는 독립 컴퓨터 그래픽 시스템은 지금 사용되는 워크스테이션의 시조다. 사실 워크스테이션은 성능이 좋아진 개인용 컴퓨터에 지나지 않는다.





다양한 감각을 이용하는 인터페이스



여분은 일반적으로 불필요한 수다 혹은 부주의한 반복을 암시하는 바람직하지 않은 징후로 간주된다. 초기의 휴먼 인터페이스 디자인에서 사람들은 상호작용 기술을 사려깊게 연구함으로써 어떤 상황에 적합한 단 하나의 수단을 선택하고자 했다. 광학펜이 데이터 입력 타블렛보다 더 나았나? ‘이것 아니면 저것’(either/or)이라는 태도는 어떤 상황이 주어지든 가장 적절하면서도 보편적인 해결책이 있으리라는 잘못된 믿음 때문에 생겨난다. 이것 아니면 저것이라는 태도는 사람들이 서로 다르고, 상황이 변하며, 특수한 상호작용 환경이 당신이 선택할 수 있는 채널에 의해 만들어지기 때문에 틀린 것이다. 인터페이스 디자인에서 최상이란 있을 수 없다.

1970년대 중반에 가장 선진적인 지휘통제 시스템을 갖춘 사람 가운데 하나인 해군 제독을 만난 적이 있다. 그가 수병 하사에게 두서 없는 말로 주문하면 충성스러운 수병은 그것을 적절한 명령으로 바꾸어 타이프를 치곤 했다. 이런 의미에서 이 시스템은 굉장한 인터페이스―인내심을 가지고 이야기를 인식할 줄 아는―를 갖고 있었다. 제독은 방안을 어슬렁거리며 말을 했고 제스처를 구사하였다. 그는 그 자신일 뿐이었다.

그럼에도 불구하고 제독은 그처럼 간접적인 인터페이스를 통해서는 공격 준비를 할 수 없었다. 그는 수병이 컴퓨터 시스템의 디스플레이라는 작은 구멍을 통하여 상황을 보고 있음을 알아차렸다. 그 제독은 적당한 모양의 파란 배와 붉은 배를 붙여놓을 수 있는 ‘극장’식 벽지도를 사용해서 직접 상호작용하기를 더 좋아했다(그 당시 우리는 러시아인이라면 똑같은 색깔을 어떻게 사용할지에 대해 농담을 주고받았다).

제독은 이 지도가 해상도가 높고 구식이어서가 아니라 자신의 몸 전체를 사용하여 참여할 수 있었기 때문에 아주 만족해했다. 그가 배를 움직일 때 그의 몸짓과 동작은 그의 기억을 더욱 생생하게 만들어 주었다. 그는 목 근육이 뻣뻣해질 정도로 이 디스플레이에 깊이 몰두해 있었다. 그것은 이것 아니면 저것이라는 양자택일식 인터페이스가 아니라 공존의(both/and) 인터페이스이다.

두 가지 모두를 선택하면 사고의 돌파구가 열린다. 간단히 말해서 여분은 좋은 것이다. 최상의 인터페이스는 상이하나 동시에 사용할 수 있는 여러 가지 커뮤니케이션 채널을 구비하게 될 것이다. 이 채널을 통해, 사용자와 기계가 가진 상이한 감응기기(sensory devices)로부터 의미를 표현하고 골라낼 수 있다. 아니면 하나의 커뮤니케이션 채널이 다른 곳에서 빠진 정보를 제공할 수도 있는데 이것 또한 ‘공존’ 인터페이스의 중요한 장점이다.

예를 들어 몇 사람이 있는 방에서 어떤 사람에게 “당신 이름이 무엇입니까?”라고 물을 때 묻는 이가 어디를 보고 있는지 알 수 없다면 이 질문은 무의미하다. 말하자면 시선의 방향에서 그 의미가 생긴다.

인식의 중요성은 엠아이티의 딕 볼트(Dick Bolt)와 크리스 쉬만트(Chris Schmandt)가 개발한 ‘그것을 그곳에 놓아라’(Put-That-There)라는 프로그램에 잘 나타나 있다. 1980년에 처음으로 구체화된 이 프로그램은 벽 크기의 디스플레이를 보며 말과 제스처로 지시하면 빈 스크린 주위에 있는 단순한 물건들이 움직이게 되어 있다(나중에 스크린은 카리브해로, 물건들은 배로 바뀌었다). ‘그것을 그곳에 놓아라’의 촬영된 시범을 보여주는 과정에서 이 프로그램은 명령을 잘못 인식하였다. 쉬만트가 혼자말로 중얼거린 “오, 제기랄”이라는 말이 필름에 포착되어 있는 것을 보고 미래의 청중들은 아직도 보완해야 할 점이 많다는 사실을 알아버렸다.

결론은 간단하다. 말하기, 가리키기, 보기는 다양한 감각을 이용하는 인터페이스의 개별 요소로서 함께 작용해야 한다. 이러한 다형태 인터페이스는 시분할을 가능케 한 방식처럼 메시지를 앞뒤로 갖다붙이는 것이 아니라 얼굴을 마주보며 나누는(face-to-face), 인간과 인간의 대화에 더 가깝다.

초기에 인터페이스 디자인에 대한 하나의 대안으로써 시도했던 여러 가지 ‘공존’(both/and)적 접근은 싱거운 과학처럼 보인다. 나는 인터페이스 연구를 시험하거나 평가하는 데 별로 관심이 없다. 거만하게 들릴지 모르지만 내 주장은 서로간의 차이를 유심히 가려내기 위해 어떤 것을 시험할 경우 처음엔 큰 차이를 발견하기 힘들다는 점이다.




알아차릴 수 있는 차이



내가 어렸을 때 집에 어머니의 린넨 벽장이 하나 있었는데 그 벽장 뒷면에는 ‘비밀 벽’(secret wall)이 있었다. 뭐 대단한 비밀은 아니고 주기적으로 내 키를 잰 후 조심스럽게 연필로 표시해 둔 많은 선들이 그어져 있었다. 연필선 옆에는 날짜가 적혀 있었다. 어떤 선들은 너무 자주 키를 재서 촘촘하게 붙었고 다른 것들은 여름 방학 때 집을 비웠기 때문에 틈이 벌어졌다. 두 개의 벽장을 쓴다는 것은 별 의미가 없어 보였다.

이러한 측정의 기준은 개인적인 것이었다. 나는 우유, 시금치, 그밖의 다른 음식물을 내가 얼마나 섭취했는지를 어떤 방식으로든 잴 수 있었으리라 생각한다.

이와 대조적으로 키는 훨씬 더 극적으로 나타난다. 가끔씩 만나는 삼촌이 이렇게 말하곤 하였다. “닉크! 네가 이렇게 컸다니!” (그는 아마 2년 만에 우리를 보았을 것이다). 그러나 나는 진정으로 그 변화를 이해하지 못했다. 내가 볼 수 있는 것이라고는 린넨 벽장에 그어진 선들뿐이었다.

‘변별가능 최소 차이’(JND:just-noticeable difference)는 정신물리학(psycho-

physics)에서 쓰는 측정 단위이다. 제이앤디(JND)라는 용어가 휴먼 인터페이스 디자인에 영향을 미쳤다. 스스로에게 물어보라. 아주 작은 차이라면 신경을 쓸 이유가 뭔가? 어떤 차이가 있는가를 알아내려고 주의깊게 측정하다 보면 정작 중요한 일을 소홀히 넘길 수 있다.

예를 들어 대부분의 어플리케이션에서 말과 자연 언어는 인간과 컴퓨터 사이의 적합한 커뮤니케이션 채널이 아니라고 주장한 학술 연구들이 있다. 이 기술 보고서에는 자연 언어가 인간과 컴퓨터 간의 의사소통을 혼란스럽게 만든다는 사실을 증명하기 위해 온갖 도표와 비교 그룹들이 동원된다.

나는 점보 여객기 조종사가 “위로, 위로 높이”라고 노래를 함으로써 비행기를 활주시키고 이륙시키는 것을 기대하지는 않는다. 그러나 비행기 조종실에서 풍부한 말과 제스처를 왜 사용하지 않는지 이해할 수가 없다. 컴퓨터가 어디에 사용되든 가장 효율적인 인터페이스 디자인은 다양한 감각의 활용과 기계의 지능을 한데 결합함으로써 실현될 것이다.

이 결합이 가능해질 때, 우리는 변별가능 최소 차이를 분간할 수 있게 될 것이다. 또한 벽장에 그어진 선 대신에 나의 삼촌이 가졌던 시각을 이해하게 될 것이다.




지능 인터페이스



인터페이스에 대한 나의 꿈은 사람 같은 컴퓨터를 만드는 것이다. 이런 발상은 너무 낭만적이고 공허하며 실현 불가능하다고 비판받기 쉽다. 글쎄, 나의 꿈은 오히려 목표를 너무 낮게 잡은 것이 아닐까. 오늘날 우리가 알지 못하는 색다른 커뮤니케이션 채널은 무수히 많을 것이다(나라면 일란성 쌍둥이끼리 초감각적 커뮤니케이션이 가능하리라는 사실을 기꺼이 믿겠다).

1960년대 중반에 나는 대면 커뮤니케이션을 몸짓 언어와 얼굴 표정, 그리고 사지의 움직임으로 에뮬레이트하려는 목표를 세웠다. 앞서 예로 든 제독이 모델로 채택되었다.

공간 데이터 관리 시스템(Spatial Data Management System)은 1976년경에 나왔는데, 이 획기적인 프로젝트의 목표는 앞에 등장한 제독이나 회사 회장, 혹은 여섯 살짜리 꼬마가 직접 컴퓨터를 사용할 수 있도록 휴먼 인터페이스를 제공하는 것이었다. 이 시스템은 30초 안에 배울 수 있도록 고안되었다. 책상과 책장에 친숙한 사람이면 누구나 복잡한 오디오, 비디오, 데이터를 훑어보면서 쉽게 사용할 수 있었다.

1970년대 후반 당시만 해도 이 프로젝트는 급진적이었다. 그렇지만 제독과 수병 간의 대화를 모델로 해서 만든 우리의 커뮤니케이션 틀은 여전히 중요한 핵심을 놓치고 있었다. 미래의 인터페이스는 풀 다운(pull down), 팝 업(pop up), 클릭(click)과 같은 직접 조작이나 마우스 인터페이스가 아니라 위임(delegation)에 기반을 두게 될 것이다. ‘사용의 편리성’에 지나치게 집착하다 보면 많은 사람들이 전혀 기계를 사용하고 싶어하지 않는다는 사실을 잊어버리기 쉽다. 사람들은 컴퓨터가 스스로 알아서 일을 다 끝내기 원한다.

오늘날 ‘대행자 기반 인터페이스’(agent-based interfaces)라고 일컬어지는 방식이야말로 인간-컴퓨터 인터페이스의 지배적인 수단으로 출현할 것이다. 비트가 아톰으로 변형되고, 아톰이 비트로 변형되는 시공간의 특별한 포인트가 있을 것이다. 그것이 액정을 전달하든 아니면 언어 발생기의 공명을 전달하든, 인터페이스는 크기, 모양, 색깔, 목소리 톤, 그밖의 다른 감각들을 갖춰야 할 것이다.








그래픽의 개성                       8





그래픽 빅뱅



엠아이티의 이반 서더랜드(Ivan Sutherland)는 대화형(interactive) 컴퓨터 그래픽의 세계에 관해 연구했는데, 1963년에 발표된 그의 박사 논문 「스케치패드」(Sketchpad)는 전세계에 커다란 반향을 불러일으켰다. 스케치패드는 사용자가 ‘광학펜’으로 컴퓨터 스크린과 직접 상호작용할 수 있는 실시간 선그리기 시스템(real-time line-drawing system)이었다. 그가 이룬 성과는 너무나 방대해서 우리 가운데 몇 명이 달려들어도 모든 내용을 이해하고 활용하는 데 10년은 족히 걸릴 만했다. 스케치패드는 여러 가지 새로운 개념을 소개하였다. 그 가운데 몇 개를 꼽아보면 동적 그래픽(dynamic graphics), 비쥬얼 시뮬레이션(visual simula-

tion), 압축 해상법(constraint resolution), 펜 추적(pen tracking), 좌표계(virtually in-

finite coordinate system) 등이 있다. 스케치패드는 컴퓨터 그래픽의 빅 뱅(big bang)이었다.

그후 10년 동안 연구자들은 컴퓨터 그래픽의 실시간 상호작용에 대해 흥미를 잃는 듯했다. 대신 오프라인(off-line)으로 사실적인 이미지를 합성하는데 그들의 창조적인 에너지를 쏟았다. 서더랜드 자신은 컴퓨터 이미지를 실제 사진처럼 정교하게 만드는 비쥬얼 실재(visual verisimilitude) 문제로 약간 우회하였다. 그림자(shadows), 색조(shading), 반사(reflections), 굴절(refractions), 잠복 표면(hidden surfaces) 등이 그의 연구 초점이었다. 아름답게 그려진 장기 말과 찻주전자가 스케치패드 다음 시대의 우상이 되었다.

이 시기에 나는 그래픽 아이디어를 쉽게 표현하는 일이 그래픽을 합성 사진처럼 그려내는(to render) 기계의 성능보다 더 중요하다는 사실을 확신하게 되었다. 훌륭한 인간-컴퓨터 인터페이스 디자인은 복잡한 묘사에서 볼 수 있는 완벽성과 일관성보다는 어떤 디자인 과정에서나 초기 단계에 전형적으로 나타나는 현상, 곧 컴퓨터에 대한 불완전한 사고와 애매한 사고를 지니고 있었다. 손으로 그린 스케치를 온라인, 실시간(real-time)으로 추적하는 일은 나에게 훌륭한 연구 과제를 제공해 주었다. 이 작업을 통해 나는 컴퓨터 그래픽이 동적이고 상호작용적이며 표현에 강한 매체라는 사실을 이해하게 되었다.

내 작업의 핵심 개념은 한 사람의 그래픽 ‘의도’(intent)를 이해하는 것이었다. 사용자가 완만한 곡선을 천천히 그었을 때 컴퓨터는 그의 의도를 안다. 그러나 똑같은 형태의 선이라도 빠르게 그어진 것이라면 사용자는 원래 직선을 그으려 했을 것이다. 과정을 무시하고 결과만 놓고 본다면 두 개의 곡선은 거의 똑같다. 그러나 두 사람의 의도는 완전히 다르다. 스케치하는 행위는 사람마다 다르다. 그러므로 컴퓨터는 각 사용자의 스타일을 배워야 한다. 30년 후, 애플이 만든 개인 휴대용 통신 단말기인 뉴턴(Newton)에 의해 이와 같은 개념이 재현되었다. 성능에 약간의 문제가 없지는 않았지만 어쨌든 뉴턴은 사용자의 필체를 파악해서 손으로 쓴 글씨를 인식할 수 있었다.

스케치한 모양이나 대상을 인식하는 것을 보고 컴퓨터 그래픽에 관한 나의 생각은 선에서 점으로 바뀌었다. 스케치에서는 선 사이에 있거나 선으로 보완된 부분이, 그 그림이 무엇을 그린 것인가를 이해하는 데 가장 중요한 역할을 한다.

같은 기간에 제록스의 팔로알토 연구소(PARC)에서는 컴퓨터 그래픽에 대한 형태지향적(shape-oriented) 접근방식을 창안해냈다. 이 접근 방법에서는 무수한 점의 집합으로 이미지를 저장하고 보여줌으로써 무정형의 영역을 다루었다. 그 당시 몇 명의 동료가 미래의 대화형 컴퓨터 그래픽은 스케치패드와 같이 선을 긋는 장치가 아니라 텔레비전과 유사한 래스터 스캔(raster scan) 시스템이 되리라는 결론을 내렸다. 이 시스템은 브라운관(CRT)의 빔을 엑스(X), 와이(Y)축에다 움직이는 것과 마찬가지로 컴퓨터 메모리에 저장된 이미지를 디스플레이 장치 위에 그려내는데, 이 과정은 마치 그림을 새겨넣는 것과 흡사하다. 한때 선으로 인식되었던 컴퓨터 그래픽의 기본적 요소는 이제 픽셀로 발전하였다.




픽셀의 위력



비트가 정보의 최소 단위인 것처럼 픽셀은 그래픽의 분자이다(픽셀은 보통 한 개 이상의 비트로 만들어지기 때문에 이것을 원자 수준에 놓을 수는 없다). 컴퓨터 그래픽을 하는 사람들은 그림(picture)과 요소(element)라는 단어의 앞 글자를 따서 픽셀(pixel)이라는 용어를 만들었다.

번호가 적혀 있지 않은 크로스워드 퍼즐처럼 픽셀의 행과 열을 모아놓은 것이 이미지라고 생각해 보라. 어떤 흑백 이미지를 만드는 데 얼마나 많은 행렬을 사용할지 결정할 수 있다. 행렬이 많고 면적이 좁을수록 입자(grain)는 섬세해지고 더 좋은 결과물을 얻을 수 있다. 마음속으로 사진 위에 이 격자 눈금(grid)을 얹어놓고 각 부위를 명암으로 채워보라. 완성된 크로스워드 퍼즐은 수치들의 배열(array)이 될 것이다.

컬러일 경우에는 세 개의 픽셀이 필요한데 각각의 픽셀은 빨간색, 초록색, 파란색 혹은 명도(intensity), 색상(hue), 채도(saturation)를 맡는다. 우리는 학생 시절에 빨강, 노랑, 파랑이 삼원색이라고 배웠지만 여기서는 그 삼원색이 아니다. 텔레비전에서와 같은 가산적 삼원색은 빨강, 초록, 파랑이다. 인쇄에서와 같은 감산적 삼원색은 마젠타(magenta), 시안(cyan), 노랑색이다. 빨강, 노랑, 파랑이 아니다(아이들에게 가르칠 때 마젠타라는 단어가 너무 길어서 이 용어를 쓰지 않는다고 들었다. 많은 어른들도 시안이란 말을 들어보지 못했을 것이다. 어쨌거나).

동작의 경우―영화의 프레임처럼―시간이 샘플링된다. 각 샘플은 하나의 프레임이다. 이 프레임들을 한데 모아 충분히 빠른 속도로 연속해서 돌려보면 유연하게 움직이는 것 같은 시각 효과가 만들어진다. 역동적인 그래픽이 별로 없을 뿐만 아니라 비디오가 아주 작은 화면에 디스플레이되는 이유는, 메모리로부터 충분히 많은 비트를 받아서 픽셀을 충분히 빠른 속도로 스크린 위로 보내기가 어렵기 때문이다. 깜빡임이 없는 유연한 동작을 만들려면 초당 60에서 90프레임이 필요하다. 앞으로 누군가가 속도를 향상시킨 새로운 제품을 만들거나 신기술을 개발해낼 것이다.

픽셀의 진정한 힘은 그것이 갖고 있는 분자적 성격에서 나온다. 픽셀은 텍스트에서 선, 사진에 이르기까지 모든 것을 구성할 수 있다. 비트가 비트인 것과 마찬가지로 픽셀은 픽셀이다. 충분한 픽셀과 한 픽셀당 충분한 비트(회색톤이나 컬러)를 갖추면 현대의 개인용 컴퓨터와 워크스테이션에서 훌륭한 디스플레이 화질을 얻을 수 있다. 그러나 질이 좋아지는 것과 마찬가지로 질이 떨어지는 것 또한 격자 구조의 제한 때문에 생긴다.

픽셀은 많은 메모리를 요구한다. 더 많은 픽셀과 픽셀당 더 많은 비트를 사용할수록 그것을 저장하는 데 더 많은 메모리가 필요하다. 컬러로 가로 1,000 세로 1,000 픽셀을 보여주는 전형적인 스크린에는 2,400만 비트의 메모리가 필요하다. 1961년 내가 엠아이티의 신입생이었을 때 메모리에 드는 비용은 1비트당 1달러였다. 지금은 2,400만 비트의 가격이 60달러 정도이다. 이제는 픽셀 지향 컴퓨터 그래픽이 메모리를 많이 잡아먹어도 크게 문제되지 않는다.

5년 전만 해도 사정이 달랐다. 사람들은 픽셀을 훨씬 적게 쓰고 픽셀당 비트수도 대폭 줄임으로써 비용을 절감했다. 사실상 초기의 레스터 스캔 디스플레이는 한 픽셀당 오직 1비트만 사용했다. 그 때문에 우리는 아주 특수한 문제점, 곧 그래픽이 톱날처럼 들쭉날쭉해지는 윤곽 왜곡 현상(jaggies)을 유산으로 물려받았다.




용납할 수 없는 들쭉날쭉함(Jaggies)



컴퓨터 스크린에 왜 들쭉날쭉한 선이 만들어지는지 의아하게 생각해 본 적이 있는가? 피라미드의 이미지는 왜 지구라트(ziggurats:바빌로니아, 아시리아형 피라미드)처럼 보이는가? 이(E), 엘(L), 티(T) 등의 대문자는 아주 분명하게 보이는데, 왜 에스(S), 더블유(W), 오(O)자는 엉성하게 만들어진 크리스마스 장식품처럼 보이는가? 곡선은 또 왜 중풍걸린 사람이 그린 것처럼 보이는가?

그 이유는 이미지를 디스플레이하는 데 픽셀당 하나의 비트만이 사용되기 때문이다. 그 결과 불필요한 계단효과(staircase effect)나 공간의 에일리어즈 현상(spatial aliasing:테두리 부분에 생기는 진한 형태)이 생긴다. 이러한 문제는 하드웨어나 소프트웨어를 만들 때 픽셀당 더 많은 비트를 사용하거나 컴퓨팅 파워를 좀더 높인다면 깨끗이 해결할 수 있다.

그런데 왜 컴퓨터 디스플레이는 에일리어즈 문제에 대비하지 않는가? 너무 많은 컴퓨팅 파워가 필요하다는 이유로 에일리어즈 현상이 용납되고 있다. 10년 전만 해도 컴퓨터 파워를 에일리어즈 제거보다는 다른 용도에 사용하는 것이 더 낫다고 주장할 수 있었다. 왜냐하면 에일리어즈 제거에 쓰이는 중간 레벨의 그레이가 오늘날처럼 일반화되지 않았기 때문이다.

불행하게도 소비자는 윤곽 왜곡 현상을 용납하도록 길들여졌다. 심지어는 60년대와 70년대의 그래픽 디자이너들이 전자적인 느낌을 만들기 위해 우스꽝스러운 자기판독 폰트(MICR)를 사용했던 것처럼, 윤곽 왜곡 현상을 일종의 전자의 상징처럼 여기기까지 한다. 80년대와 90년대의 디자이너들은 컴퓨터로 작업했음을 드러내기 위해 과장된 에일리어즈 타이포그라피를 사용함으로써 똑같은 짓을 반복하고 있다. 선과 글자가 완벽한 부드러움을 갖지 못하거나 인쇄의 질보다 떨어질 이유는 전혀 없다. 누가 다른 식으로 말하면 믿지 말라.




아이콘 그래픽



1976년에 아르파(ARPA)의 사이버네틱 기술부 책임자 크레이그 필즈(Craig Fields, 그는 나중에 아르파 책임자가 되었다)는 뉴욕 컴퓨터 애니메이션 회사에 다르 엘 마라(Dar El Marar)라는 가상 사막도시에 관한 영화를 만들어 달라고 부탁했다. 이 만화 영화는 다르 엘 마라 상공을 나르는 헬리콥터 조종석에서 내려다 본 광경―거리를 향해 내려가고, 시 전체를 보기 위해 다시 올라가고, 이웃을 방문하고, 빌딩 안을 보기 위해 가까이 접근하는 광경―을 묘사했다. 영화는 시의 정경이나 빌딩의 세계를 경험하기 위해서가 아니라 피터 팬이 되어 정보의 세계를 탐험하도록 가상적으로 구성되었다. 이러한 개념은 당신이 도시를 설계했다는 가정하에 마치 다람쥐가 알밤을 저장해 놓듯이 특정한 빌딩 안에 데이터를 저장하여 정보 마을을 건설한다. 그런 다음 마술 양탄자를 타고 정보를 저장해 둔 장소로 날아가 원하는 정보를 다시 꺼내 볼 수 있다.

고대 그리스의 시인이었던 케오스(Ceos)의 시모니데스(Simonides:B.C. 556~468)는 경이로운 기억력으로 유명했다. 초대를 받고 간 연회장의 지붕이 무너졌을 때 그는 손님들이 앉았던 장소를 근거로 토막난 사체의 신원을 확인할 수 있었다. 그는 정신적인 공간 이미지 안의 특정한 지점에 사물을 연결함으로써 기억을 되살릴 수 있다고 생각했다. 그는 긴 연설을 상기하는 방법으로 이 기술을 활용했는데, 연설 부분을 사원 안에 있는 대상물과 그 위치에 연결했다. 연설을 하는 동안 그는 생각을 정연하고 이해하기 쉽게 만들기 위해 마음속으로 사원을 다시 그려보곤 하였다. 중국의 초기 제수이트들은 이와 같은 과정을 일컬어 ‘마음의 궁전’을 짓는 일이라 했다.

이러한 예는 정보를 저장하고 꺼내기 위해 3차원 공간을 항해하는 모습을 보여준다. 어떤 사람은 이것을 잘 하지만 어떤 사람은 잘 못한다.

2차원에서는 대부분의 사람이 잘할 수 있다. 책장의 2차원적인 외관을 생각해 보라. 아마 책이 있는 ‘장소’로 곧장 다가가서 어떤 책이라도 쉽게 찾을 수 있을 것이다. 당신은 아마도 책의 크기, 색깔, 두께, 제본 방식을 기억할 것이다. 만약 그 책을 ‘그곳에’ 놓아두었다면 이 정보를 상기하기가 훨씬 쉬웠을 것이다. 엉망진창인 책장일지라도 사용자가 그것을 그렇게 만들었기 때문에 그는 어디에 무엇이 있는지 잘 안다. 사서가 들어와서 듀이의 십진법 분류에 따라 책을 다시 정리하거나 하녀가 책상을 정돈한다면 최악의 상황이 될 것이다. 당신은 아마 갑자기 혼란에 빠질 것이다.

이러한 관점을 토대로 우리는 공간 데이터 관리 시스템(SDMS:spatial data management system)을 개발했다. 에스디엠에스(SDMS)는 천정에서 바닥까지, 벽에서 벽까지, 완전 컬러로 된 디스플레이를 비롯하여 두 개의 보조 데스크탑 디스플레이, 8음 사운드(octophonic sound), 특수 제작된 임즈 체어(Eames chair:몸에 딱 맞게 디자인된 의자)와 그밖의 장비들을 갖춘 방이다. 에스디엠에스는 사용자에게 안락의자처럼 편안한 의자를 제공함으로써, 거실의 대형 창문만한 크기의 디스플레이를 바라보며 데이터 위를 날아다닐 수 있게 만들었다. 사용자는 데이터랜드(Dataland)라고 불리는 가공의 2차원 풍경 속을 항해하기 위하여 화면을 끌어당겨 일부분을 확대하여 보거나 밀어서 전체를 보는 기능을 자유롭게 구사할 수 있었다. 또한 개인용 파일, 통신, 전자 책, 위성 지도, 그리고 다양한 최신 데이터(예를 들면 「콜롬보」에 나오는 피터 포크 Peter Falk의 비디오 클립이나 예술과 건축에 관한 54,000개의 스틸 사진) 속으로 들어갈 수 있었다.

데이터랜드 그 자체가 이미 기능을 설명하는 작은 이미지들, 혹은 그 이미지의 배후에 있는 테이터를 총체적으로 보여주는 풍경화였다. 데스크탑 캘린더의 이미지 뒤에는 사용자의 비망록(agenda)이 있다. 예를 들어 사용자가 전화 이미지를 구동하면 에스디엠에스는 전화걸기 프로그램을 개인 전화번호부(Rolodex)에 연결한다. 이것이 바로 아이콘의 출발이었다. 아이콘의 사전적인 의미는 실제로 적절하지 않았기 때문에 우리는 이를 그림문자(glyphs)라고 불렀지만 결국은 아이콘이라는 용어가 정착되었다.

이들 우표딱지 크기의 이미지들은 데이터나 기능만을 나타내는 것이 아니라 각각 특정한 ‘장소’를 차지하고 있었다. 책장에 꽂혀 있는 책처럼 그것이 있는 곳으로 다가감으로써, 그 위치와 색깔, 크기 그리고 그것이 내는 소리를 통해 무엇인가를 얻을 수 있었다.

에스디엠에스는 당시 너무 앞서 있어서 10년이 흐르고 개인용 컴퓨터가 나온 다음에야 비로소 몇 가지 개념이 시행에 옮겨질 수 있었다. 오늘날 아이콘은 모든 컴퓨터에서 공통적으로 사용된다. 사람들은 쓰레기통, 계산기, 전화 수화기의 이미지를 표준 메뉴로 간주한다. 실제로 어떤 시스템은 문자 그대로 스크린을 ‘책상’(desk-top)으로 쓴다. 차이점은 오늘날의 데이터랜드가 천정에서 바닥까지, 벽에서 벽까지를 차지하지 않는다는 점이다. 그대신 데이터랜드는 ‘윈도우’의 기능 안에 함축적으로 포함되어 있다.



윈도우의 모양



참신한 이름짓기가 소비자에게는 잘못된 인상을 심어주지만 시장에서는 큰 돈을 버는 일이 종종 있다. 아이비엠이 개인용 컴퓨터를 피시(PC)라고 부르기로 결정한 것은 천재적인 위업이었다. 애플사가 4년이나 먼저 시장에 진출했음에도 불구하고 피시라는 이름은 개인용 컴퓨터의 대명사가 되었다. 마찬가지로 마이크로소프트사는 차세대 운영체제의 이름을 윈도우라고 이름지음으로써, 애플이 윈도우 분야에서 5년이나 앞서 있었고 수많은 워크스테이션 제조업자가 이미 광범하게 윈도우를 사용하고 있었음에도 불구하고 그 용어를 영원히 자기 것으로 만들 수 있었다.

윈도우는 컴퓨터 스크린이 작기 때문에 필요하다. 윈도우를 쓰면 상대적으로 협소한 작업 공간에서 서로 다른 처리과정을 동시에 수행할 수 있다. 이 책 전체는 출판사가 만든 부분이나 출판사를 위한 부분을 제외하면 종이 없이 9인치짜리 스크린으로 집필되었다. 대부분의 사람에게 윈도우 사용은 자전거를 타는 것과 같다. 어떻게 하는가를 배울 필요 없이 그냥 하면 된다.

윈도우는 텔레비전의 미래에 대한 은유로서도 흥미롭다. 특히 미국인들은 텔레비전 영상이 스크린을 꽉 채워야 한다고 주장해 왔다. 그러나 모든 영화나 텔레비전 프로그램이 동일한 직사각형 형태로 만들어지지 않았기 때문에 스크린을 꽉 채우는 데는 비용이 든다.

실제로 1950년대 초기의 영화 산업은 초창기 텔레비전 보급을 저해하기 위해 의도적으로 와이드 스크린(시네라마, 슈퍼 파나비전, 슈퍼 테크니라마, 35밀리 파나비전 그리고 아직까지 사용되고 있는 시네마스코프 등) 쪽으로 방향을 틀었다. 현재 텔레비전에서 사용되는 4대3 비율은 2차대전 이전에 만들어진 영화의 가로 세로 비율을 본뜬 것이다. 이것은 시네마스코프, 곧 지난 40년 동안에 만들어진 대부분의 영화 형태에는 맞지 않는다.

유럽의 방송사들은 이른바 레터 박스(letter boxing)를 사용하여 이러한 화면 비율의 차이를 해결하였다. 그들은 텔레비전 스크린의 윗부분과 아랫부분을 검게 만들어 나머지 사용 영역이 정확한 화면 비율을 갖도록 하였다. 몇 개의 픽셀을 희생함으로써 시청자는 각 프레임의 모습이 충실하게 재현된 영화를 볼 수 있었다. 나는 레터 박스의 효과를 만족스럽게 생각한다. 왜냐하면 그것이 없을 경우 영상의 상하 수평선은 텔레비전 수상기의 둥그런 플라스틱 테두리 때문에 두리뭉실해질 것이다.

미국에서는 레터 박스 방식을 거의 쓰지 않는다. 대신에 필름을 비디오로 옮길 때 와이드 화면 영화를 가로 세로 4대3의 직사각형 틀에 짜넣는 ‘팬 스캔’(pan-and-scan) 방식을 사용한다. 단순히 그림을 짜넣는 것은 아니다(제목과 크레디트 credits 자막이 뜰 때는 그렇지만). 필름이 기계(플라잉 스포트 스캐너 flying spot scanner)를 거치는 동안 그 위에 덧씌워진 4대3 윈도우를 사람이 수동으로 움직여 각 장면에서 가장 적절한 부분을 잡아낸다.

우디 알렌(Woody Allen) 같은 감독은 이런 작업을 용납하지 않겠지만 대부분의 감독은 별로 개의치 않는 것 같다. 이러한 팬 스캔이 대책 없이 실패한 예를 영화 「졸업」(The Graduate)에서 볼 수 있다. 더스틴 호프만(Dustin Hoffman)과 앤 밴크로프트(Anne Bancroft)가 화면 양 끝에서 각자 옷을 벗는 장면에서 아무리 애를 써도 비디오 한 프레임에 그들 둘을 동시에 집어넣을 수는 없었다.

일본과 유럽에서는 새로운 와이드 화면비 16대9를 대세로 몰아가고 있고, 미국의 고선명 텔레비전 경쟁자들은 조심스럽게 이를 따르고 있다. 16대9 화면 비율은 실제로 4대3보다 더 나쁜 결과를 낳는다. 왜냐하면 4대3 비율로 만들어진 기존의 비디오 자료를 보기 위해 16대9 스크린의 양쪽 가장자리에 이른바 검정 커튼을 치고 보아야 하기 때문이다. 이러한 커튼은 시각적으로 레터 박스에 못미칠 뿐만 아니라 필요할 때 팬 스캔을 할 수도 없다.

화면 비율은 가변적이어야 한다. 텔레비전이 충분한 픽셀을 갖는다면 윈도우 스타일은 굉장한 의미를 만들어낼 것이다. 10피트 영화 스크린의 경험과 18인치 텔레비전 화면의 경험이 하나로 합쳐지게 된다. 미래의 어느 날, 바닥에서 천정에 이르는 고선명 디스플레이가 등장할 경우 당신은 텔레비전 이미지를―작은 스크린 주위의 프레임같이 고정된 형태가 아니라 방안에 화분들을 위치시키듯이―스크린 위에 올려놓을 것이다. 전체 벽에다 말이다.




소비자 그래픽



5년 전만 해도 애플을 포함한 컴퓨터 제조업자들은 가정을 그들의 시장으로 여기지 않았다. 믿기지 않는 이야기다. 그보다 몇 년 전에 텍사스 인스트루먼츠(Texas Instruments)사가 가정용 컴퓨터 사업에서 손을 떼겠다고 발표하자 주가가 급등한 일까지 있었다.

1977년 아이비엠의 회장 프랑크 케리(Frank Cary)는 주주들에게 아이비엠이 가전제품 사업에 뛰어들 것이라고 발표하였다. 전형적인 아이비엠 방식으로 전담반이 구성되어 손목시계를 포함하여 여러 가지 후보 품목을 검토하였다. 아이비엠은 가정용 컴퓨터를 만들기로 결정하였다. 암호명 ‘’ (Cas-

tle)이라는 일급 비밀 프로젝트가 시행되었는데, 나는 한 주에 한 번 고문으로 그 프로젝트에 참가하였다. 아주 야심찬 개인용 컴퓨터가 고안되었다. 그것은 바로 내장형 디지털 비디오 디스크였다.

뛰어난 산업 디자이너 엘리엇 노이스(Elliott Noyes)는 가정용 컴퓨터의 원형을 만들었다. 20년이 지난 지금 우리 모두는 바로 그 가정용 컴퓨터가 집에 한 대씩 있다는 사실을 자랑스러워하게 되었다. 뉴욕의 푸기킾시(Pough-

keepsie)에 있는 아이비엠 연구소는 10시간짜리 디지털 비디오 디스크를 적절하게 작동시키는 광투과성의(레이저광이 반짝이는 표면으로부터 반사하는 것이 아니라 투명한 디스크를 통과하는 방식인) 디스크를 만들 수 없었다. 그래서 개인용 컴퓨터와 비디오디스크는 서로 분리되었다. ‘’은 분할되었다.

그 프로그램의 개인용 컴퓨터 부문은 다른 아이비엠 연구소인 버몬트(Ver-

mont)의 벌링턴(Burlington)으로, 이후에는 보카 라턴(Boca Raton)으로 이전되었다. 나머지, 곧 비디오디스크 부문은 역사의 일부로 묻혀버렸다. 비디오디스크는 결국 엠시에이(MCA)와 조인트 벤처를 만들기 위해 중지되었다(두 회사는 곧 후회하였다). 은 실패작이었으며 개인용 컴퓨터는 그 탄생을 보기까지 스티브 잡스의 차고에서 몇 년 더 기다려야 했다.

같은 시기에 전자 게임은 컴퓨터와 그래픽의 다른 성격을 소개하였다. 전자게임과 같은 소비재는 내재적인 상호작용성을 갖고 있기 때문에 대단히 역동적이다. 게다가 하드웨어와 내용이 아주 자연스럽게 조화를 이룬다. 게임 제조자들은 하드웨어에서 돈을 버는 것이 아니다. 그들은 게임으로 돈을 번다. 이것은 면도기와 면도날에 관한 이야기와 같다.

그러나 게임 제조업자들은 이제는 망해버린 독점 컴퓨터 회사처럼 그들의 폐쇄된 시스템을 개방하고 상상력을 완성할 수 있는 기회를 잃어버렸다. 세가와 닌텐도는 개인용 컴퓨터가 그들의 시장을 잠식하고 있다는 사실을 깨닫지 못하면 역시 망할 것이다.

오늘날 프리랜서 게임 디자이너들은 게임이 범용 플랫폼―인텔 한 회사가 일년에 1억 개를 팔 계획이다―으로 만들어질 경우 베스트셀러가 될 수 있다는 점을 인식해야 한다. 피시의 컴퓨터 그래픽은 가장 선구적인 아케이드 게임을 뒤쫓아 급속히 진화할 것이다. 피시에 기반한 게임이 우리가 오늘날 알고 있는 게임 전용 시스템을 점령할 것이다. 특별한 목적의 하드웨어가 비슷한 역할을 할 수 있는 분야는 가상현실(virtual reality)뿐이다.








20/20 가상현실                    9





모순어법인가 중복어법인가



마이크 해머(Mike Hammer:그는 세계 일류 기업을 돌보는 의사, 곧 리엔지니어다)에 의하면 기업의 변화(corporate change)는 ‘중복어법’이라는 종착역을 향해가고 있는 ‘모순어법’이다. 중복어법은 그 자신의 마음(in one’s own mind)이라는 말처럼 강조를 위한 중복 표현이다. 모순어법은 인공지능(artificial intelligence)이나 비행기 기내 음식(airplane food)이란 말처럼 서로 명백하게 모순되는 두 단어를 하나로 결합한 합성어를 가리킨다. 중복어법은 모순어법과 정반대이다. 최상의 모순어법에 상을 준다면, 틀림없이 가상현실(VR:virtual reality)이라는 용어가 일등을 차지할 것이다.

가상현실이란 합성어에서 가상과 현실이 동격으로 받아들여진다면 가상현실을 중복어법의 잉여 개념으로 생각하는 것이 더 의미 있다. 가상현실은 가공의 것을 마치 현실적인 것처럼 만들 수 있는데, 현실보다 더 실감나는 것일 수도 있다.

고도로 세련된 가상현실 어플리케이션으로서 가장 오랫동안 이용되어 온 비행기 시뮬레이션은 실제 비행기를 타는 것보다 더 현실감을 준다. 새로 훈련받았지만 완벽한 조종술을 구비한 파일럿들이 처음 비행에서 ‘실제’ 승객을 가득 실은 747 비행기를 몬다. 이런 일이 가능한 이유는 시뮬레이터를 통해 실제 비행에서 배울 수 있는 것보다 더 많은 것을 배웠기 때문이다. 시뮬레이터 안에서 파일럿은 현실 세계에서는 불가능한 온갖 희귀한 상황들을 다 겪는다.

신뢰도가 높은 또 다른 가상현실의 어플리케이션 사례로는 자동차 학원을 들 수 있다. 미끄러운 길에서 어린아이가 차 사이에서 뛰어들어올 때 우리는 당황하여 어찌할 바를 모른다. 가상현실은 이와 같은 상황을 직접 체험하게 해준다.

시점이 바뀜과 동시에 이미지를 변화시킴으로써 ‘거기에 있는 것 같은’(being there) 임장감을 전달하는 것이 가상현실의 발상이다. 공간의 현실감에 대한 우리의 인식은 상대적 크기, 밝기, 각의 움직임 같은 여러 가지 시각신호(visual cues)에 의해 이루어진다. 가장 강력한 것 가운데 하나가 시각(perspective)인데, 왼쪽 눈과 오른쪽 눈으로 각기 다른 영상을 보는 쌍안경 형태에서 특히 잘 드러난다. 이 두 개의 영상을 하나의 3차원 인식으로 합성하는 것이 입체 시각의 근본 원리다.

두 눈이 각각 약간 다른 영상을 봄으로써 생기는 깊이에 대한 지각, 곧 시차(eye parallax)는 대상물이 6피트 이내에 있을 때 가장 효과적이다. 멀리 떨어진 대상을 볼 때 두 눈에 들어오는 영상은 본질적으로 똑같다. 3차원 영화에는 가까운 곳에서 앞뒤로 왔다갔다하는 움직임이 왜 그렇게 많은가? 대상물들은 왜 또 항상 관객 쪽으로 돌진해 오는가? 바로 그 지점에서 입체 영상이 가장 생생해지기 때문이다.

가상현실을 위한 전형적인 장치는 물안경과 같이 양쪽 눈에 각각 별도의 디스플레이를 장착한 헬맷이다. 각 디스플레이는 당신이 가상의 장소에 있을 경우 보게 될 영상을 조금 다른 시각에서 보여준다. 머리를 움직일 때마다 새로운 영상들이 아주 빠른 속도로 추가되는데, 당신은 마치 머리를 움직였기 때문에 그런 변화가 생긴 것처럼 착각하게 된다(사실은 컴퓨터가 당신의 움직임을 쫓는다). 결과와 원인이 뒤바뀐 것이다.

시각 경험이 얼마나 사실적으로 보이는가를 두 가지 요인의 결합으로 판단할 수 있다. 하나는 화질, 다시 말해 디스플레이된 화면의 수와 화면 사이의 짜임새이다. 다른 하나는 반응 시간, 곧 이들 정경이 추가되는 속도다. 이들 변수는 둘 다 엄청난 컴퓨터 파워를 필요로 한다. 그래서 최근까지 대부분의 제품 개발자들이 손대지 못한 것이다.

가상현실의 시발은, 서더랜드가 머리에 쓰는 최초의 디스플레이 시스템을 만든 1968년까지 거슬러 올라간다. 그후 나사(NASA)와 국방성에서 진행된 작업은 가상현실이 우주 개발과 군사적 용도로 적용될 수 있음을 보여주었다. 탱크나 잠수함 시뮬레이터는 가상현실이 아주 적절하게 사용된 분야다. 어쨌든 쌍안경이나 잠망경을 실제로 보는 것 같은 경험을 할 수 있었기 때문이다.

이와 같은 가상현실 기술을 단순 오락 매체로 생각해도 될 만큼 파워가 충분하고 값도 저렴한 컴퓨터를 갖게 되었다. 얼마나 놀라운 일인가.




안락의자(Couch) 특공대



쥬라기 공원은 신화적인 가상현실 체험을 만들었다. 동명의 책이나 영화와 달리 그것은 이야기 줄거리가 필요없었다. 마이클 크라이튼은 무대세트나 테마파크의 디자이너로서 공룡에게 외관, 개성, 행동, 목적을 듬뿍 불어넣는 일이 그의 직무였다. 시뮬레이션을 작동시키고 그 세계로 들어가 보라. 텔레비전은 상대도 안된다. 디즈니랜드처럼 전시물을 보존하기 위해 방부제를 칠 필요도 없다. 인파도 없고, 차례를 기다리는 기다란 줄도 없으며, 팝콘 냄새도 나지 않는다(오직 공룡의 똥만 있다). 마치 선사시대의 정글 속에 있는 것 같고, 실제 정글보다 더 위험해 보일 수도 있다.

미래에는 어린이는 물론 성인 세대도 이런 방식으로 오락을 즐기게 될 것이다. 실재가 아니라 상상의 세계를 컴퓨팅했기 때문에 크기나 장소에 구애받을 필요도 없다. 가상현실에서는 은하수와 어깨동무를 하고 사람의 혈관 속에서 수영을 하거나 이상한 나라의 앨리스(Alice in Wonderland)를 방문할 수 있다.

오늘날의 가상현실은 약점을 갖고 있다. 가상 체험이 널리 퍼지기 전에 먼저 수정되어야 할 기술상의 문제도 있다. 예를 들어 싸구려 가상현실은 매끄럽지 못한 그래픽으로 오염되어 있다. 움직일 경우 윤곽 왜곡 현상은 불안정성을 가중시킨다. 왜냐하면 왜곡된 부분이 반드시 어떤 장면(scene)과 동일한 방향으로 움직이지는 않기 때문이다. 수평선이 완벽하게 수평을 이룬다고 생각해 보라. 이제 그것을 아주 조금 기울이면 가운데에 들쭉날쭉한 계단이 한 개 나타난다. 조금 더 기울여보라. 두 개, 세 개, 점점 더 많은 계단(굴곡)이 나타난다. 45도 각도가 될 때까지 마치 그들 스스로 움직이는 것처럼 보인다. 그러다가 45도 각도에 이르면 선은 이제 픽셀로 만들어진 완벽한 계단이 된다. 보기 싫다.

설상가상으로 가상현실은 아직도 충분할 만큼 빠르지 않다. 대규모 비디오게임 제작자들이 출시한 모든 상업용 시스템은 지체현상(lag)을 극복하지 못했다. 머리를 움직이면 영상이 빨라지긴 하겠지만 충분하게 빠른 속도는 아니다. 그래서 영상이 지체된다.

초기의 3차원 컴퓨터 그래픽에서는 3차원 효과를 얻기 위해 여러 가지 입체 안경을 사용하였다. 별로 비싸지 않은 폴라로이드 렌즈를 쓰거나 어떤 때는 상이한 영상에 대해 두 개의 눈을 번갈아 노출시키는 좀더 비싼 전자 셔터를 사용하였다.

이들 기구를 갖고 처음 작업을 할 당시에 모든 사람―문자 그대로 모든 사람(everybody)―이 이 안경을 처음 낀 후 스크린의 3차원 영상을 보면서 영상의 변화를 보기 위해 그들의 머리를 좌우로 움직였다. 그러나 입체 영화처럼 3차원 효과가 일어나지 않았다. 머리를 움직여 봐야 아무런 효과도 없었다.

‘목경련’을 일으키는 이러한 현상은 가상현실의 문제점을 잘 보여준다. 가상현실은 진정으로 기계가 아니라 시청자가 변화를 일으키도록 동작과 위치 감각을 하나로 결합시켜야 한다. 가상현실에서는 머리의 움직임을 추적하고 그 움직임의 변화 속도에 반응하는 것을 고려해야 한다. 이미지가 추가되는 속도(주기 반응:the frequency response)는 분명히 해상도보다 더 중요하다. 우리 몸의 동작 감응 체계는 아주 예민해서 조금만 지체되어도 가상 체험을 망치게 된다.

대부분의 제조업자들은 아마 이 점을 완전히 놓쳐버리고 반응시간을 희생시키는 대신 최대한의 해상도를 갖춘 초기 가상현실 시스템을 시장에 내놓을 것이다. 하지만 그래픽을 더 줄이고, 이미지의 왜곡을 방지하고, 빠른 반응을 전달한다면 훨씬 더 만족스런 가상현실 체험을 제공할 수 있을 것이다.

앞으로의 대안은 두 눈에 분리된 시각 영상을 전달하는 머리에 쓰는 디스플레이를 내던져버리고, 이른바 공간에 실제의 물체를 띄우거나 홀로그래픽 이미지를 두 눈에 전달하는 자동 입체 기술(auto-stereoscopic)로 옮아갈 것이다.




말하는 머리인형



1970년대 중반에 아르파(ARPA)는 국가 안보를 위한 원격회의 분야 연구에서 선도적인 작업을 개시하였다. 5개의 서로 다른 장소에 떨어져 있는 5명의 사람에게 전자적으로 완벽한 현장감을 전달하는 것이 연구의 핵심과제였다. 물리적으로 떨어져 있는 5명 각각은 나머지 다른 4명이 물리적으로 존재한다는 사실을 확신할 수 있어야 했다.

이 특별한 텔레커뮤니케이션은 핵공격의 위협이나 핵공격이 발발했을 때 정부가 긴급조치를 취할 수 있도록 추진되었다. 1970년대에 다음과 같은 일이 시행되었다. 미국 대통령, 부통령, 국무장관, 합참의장, 하원의장이 버지니아산 밑에 위치한 잘 알려진 장소로 즉시 이동한다. 그곳의 첨단의 지휘통제실(영화 「워 게임」 WarGames에 나오는 것 같은)에서 공격과 공습으로부터 안전을 확보한 뒤 그들은 미국을 방어한다.

그러나 5명이 잘 알려진 하나의 장소에 함께 있는 것이 과연 안전한가? 그들이 한 장소에 함께 있는 것처럼 느낄 수만 있다면 5명이 각기 다른 장소(한 명은 공중, 다른 한 명은 잠수함, 또 다른 한 명은 산에)에 있는 것이 훨씬 더 안전하지 않은가? 당연하다. 이런 이유로 아르파는 원격회의(tele-

conferencing) 연구에 자금을 지원하였다. 이 과정에서 나와 내 동료들은 한 사람이 ‘여러 다른 장소에 동시에 존재하는 효과’(telepresence)를 디지털적으로 창조하기 위한 계약을 체결하였다.

우리는 사람의 얼굴 모양을 정확하게 본뜬 실물 크기의 투명 가면으로 각 사람의 머리를 네 개 복제하는 방법을 제시하였다. 얼굴 마스크는 2도 정도의 각도로 수평유지장치 위에 놓여졌는데 고개를 끄덕이고 머리를 돌릴 수 있었다. 이런 움직임들을 완벽하게 기록한 비디오가 그 안에 투사되었다.

각 장소에 한 명의 실제 인물과 네 개의 흔들리는 플라스틱 머리가 똑같은 순서로 테이블 주위에 앉도록 구성하였다. 한 사람 한 사람의 비디오 화상과 머리 위치가 포착되어 붙잡아 전달되었다. 대통령이 부통령 쪽으로 몸을 돌려 이야기하면 국무장관은 그가 있는 장소에서 대통령과 부통령의 플라스틱 인형 머리가 똑같이 움직이는 모습을 볼 수 있다. 정말로 기괴한 장면이었다.

그렇게 투사된 비디오는 실제 살아 있는 것처럼 생생하여 한 제독은 나에게 매일 밤 ‘말하는 머리들’의 악몽에 시달린다고 토로했다. 그는 그의 항공모함 함교에서 끄덕이는 사령관의 머리를 보기보다는 대통령의 ‘발사’(FIRE) 명령이 담긴 대문자로만 씌어진 노란 종이 전문을 통해 명령받는 것을 더 좋아했다. 그는 비디오 영상과 음성이 (어떤 자가 대통령 흉내를 내는 것이 아니라) 정말로 대통령의 것인지의 여부에 대해 편집증적 반응을 보였다. 그러나 전문은 더 조작하기 쉽다.

우리는 아마 다음 100~200년 동안에도 사람을 분해하고, 전달하고, 다시 조립하는 방법을 만들어내지 못할지도 모른다. 그러나 조만간 우리가 아주 익숙해져 있는 평면 스크린과 결별한 수많은 새로운 디스플레이 기술이 개발될 것이다. 홈(bezel)이라 불리는 디스플레이의 주변 테두리는 크고 작은 영상을 지금보다 덜 제약하게 될 것이다. 가장 상상력이 넘치는 미래의 기구는 아예 테두리가 없을 것이다.




알투디투(R2D2) 3차원



먼 훗날 우리들의 손자나 증손자들은 커피테이블(그때에도 이 물건을 그렇게 부른다면)을 한쪽으로 밀어 놓은 후 8인치 크기의 선수들이 거실(그때에도 그렇게 불린다면)에서 반 인치 크기의 풋볼을 앞뒤로 패스하며 경기하는 미식 축구(그때에도 이 경기를 그렇게 부른다면)를 관람할 것이다. 이런 사고방식은 초기의 가상현실 사고방식과는 정반대되는 것이다. 어느 방향에서 보아도 동일한 해상력이 보장된다. 당신이 어디에 앉아서 보더라도 3차원 픽셀(종종 복셀 voxels이나 복셀 boxels로 부르기도 한다)은 공간을 떠다닌다.

영화 「스타워즈」(Star Wars)에서 알투로봇(R2D2)은 이런 방식으로 레이아 공주를 오비-완 케노비(Obi-Wan Kenobi)의 방에 투사하였다. 아름다운 공주는 모든 각도에서 볼 수 있도록(원칙상으로는 그렇다) 공간에 투사되어 유령처럼 출현한다. 이러한 특수 효과를 「스타 트렉」(Star Trek)을 비롯한 다른 공상과학 영화에서 너무 자주 보게 되었기 때문에 이제 관객들은 홀로그래피 같은 기술에 싫증을 내게 되었다. 영화에서 이런 것을 자주 봤기 때문에 이 기술을 그리 대단치 않게 생각하는 사람이 많다.

이 기술은 엠아이티 교수 스테판 벤튼(Stephen Benton)이 발명했다. 그가 발명한 백색빛 홀로그램(white light hologram, 모든 신용카드에서 볼 수 있는)은 100만 달러짜리 슈퍼 컴퓨터와 매우 비싼 특수 목적 광학장비 및 10여 명의 뛰어난 박사 과정 학생들의 피나는 노력의 산물로서 개발에만 20년이 넘게 걸렸다.

홀로그래피는 1948년 헝가리의 과학자 데니스 가보(Dennis Gabor)가 발명하였다. 아주 간단히 말하자면 홀로그램은 사물을 가능한 모든 측면에서 바라보아 이것을 하나의 빛 변조 모형판(single plane of light modulating patterns)으로 모은 것이다. 빛이 나중에 이 판을 통과하거나 반사되면 영상이 광학적으로 공간상에 다시 만들어진다.

홀로그래피는 더 좋은 디스플레이를 만드는 기술경쟁에서 다크 호스로 등장하였다. 그럴 수밖에 없는 것이 홀로그래피는 엄청난 해상도를 필요로 하기 때문이다. 당신이 보는 텔레비전은 잘해야 480개 주사선(아마 이보다 훨씬 적을 것이다)으로 영상을 재현한다. 높이가 10인치 정도 되는 아담한 텔레비전 스크린의 경우 (최상의 조건에서) 1인치당 대략 50개의 주사선이 배정된다. 홀로그래피는 1인치당 5만 주사선이 필요한데, 텔레비전보다 1,000배나 많다. 더구나 해상도는 가로, 세로의 엑스(X), 와이(Y) 두 축으로 이루어지기 때문에 1,000의 제곱, 곧 현재 사용하는 텔레비전의 100만 배이다. 신용카드나 은행 수표에 홀로그램을 찍어넣는 이유는 이것의 해상도가 아주 섬세하여 인쇄 기술상 위조하기가 매우 어렵기 때문이다.

벤튼과 그의 동료들이 이 분야에서 이룬 진보는 인간의 눈과 인식체제를 위해 실제로 필요한 해상도와 홀로그램이 생산할 수 있는 해상도를 현명하게 구분했다는 점이다. 이미지 인식을 담당하는 눈이 볼 수 있는 것보다 더 섬세한 해상도를 제공하는 것은 어리석은 짓이다. 마찬가지로 그는 우리가 영화에서 한 프레임씩 장면을 연결해 보는 것과 꼭 마찬가지 방법으로(시간 단위로 샘플된 것), 실제와 같은 공간 이미지를 볼 수도 있다(공간적으로 샘플링한 것)는 점을 강조했다. 비디오는 1초에 30프레임(60필드 fields) 정도를 사용하여 부드러운 움직임을 보여준다. 따라서 모든 관측 시점에서 포착되는 영상을 한꺼번에 표현하는 홀로그램을 만드는 대신에 1인치에 한 개의 영상 정보만을 표현하는 홀로그램을 만들고 그 사이에 있는 영상 레이저를 무시한다고 해서 안될 일이 무엇이겠는가? 그래도 우리 눈에는 아무런 차이가 없다.

벤튼과 그의 동료들은 우리의 공간 감각이 대체로 수평적이라는 사실을 지적하였다. 눈이 가로로 달려 있고, 대부분의 경우 수평으로 움직이기 때문에 수평 시차가 수직 시차(아래 위의 변화)보다 훨씬 더 지배적인 공간 신호이다. 만약에 우리의 눈이 세로로 달려 있다든가 나무를 아주 많이 오르내린다면 사태는 달라질 것이다. 사람의 경우는 그렇지 않다. 실제로 우리 지각의 수평적 인식이 아주 강력하기 때문에 벤튼은 수직적 시차를 전부 무시할 수 있다고 결론을 내렸다.

이런 이유로 미디어랩에서 상연된 홀로그램은 수직 시차를 고려하지 않았다. 내가 사람들에게 벤튼의 실험실 밖에 걸려 있는 조그만 전시품 갤러리를 보여주면 그들은 처음에는 잘 알아채지 못한다. 이 사실을 말해주면 그것을 확인하기 위해 사람들은 무릎을 굽히고 발 끝을 세운다.

수평 시차만 사용하여 공간 샘플링하면 다른 방식으로 완전한 해상도의 홀로그램을 만들 때 필요한 1만분의 일 정도의 컴퓨팅 파워로 같은 영상을 만들 수 있다. 이런 이유 때문에 그들은 세계 최초로 공중에 자유롭게 떠 있는 총천연색, 입체영상의 실시간 홀로그래픽 비디오를 성취할 수 있었다. 그것은 바로 찻잔의 크기와 형태, 혹은 뭉뚝해 보이는 레이아 공주에 관한 홀로그래피였다.

시각 이상의 것



디스플레이의 화질은 문자 그대로 눈에만 관련된 것이 아니다. 그것은 다른 감각이 참여하는 시청 경험이다. 전체로서 얻어지는 집합적 감각은 부분의 합보다 진정으로 크다.

고선명 텔레비전의 초기 시절 당시에 엠아이티에 근무하던 사회과학자 루스 노이만(Russ Neuman)은 디스플레이의 화질에 대한 시청자의 반응에 관한 이정표적 실험을 전개한 바 있다. 그는 두 개의 고해상도 텔레비전과 최고급 브이시알을 설치하고 똑같은 고선명 비디오 카세트를 틀었다. 그러나 하나의 장치(A)에는 일반적 음질의 브이시알과 텔레비전에 딸린 조그만 스피커를 사용하고, 다른 장치(B)에는 시디 수준 이상의 음질을 내는 성능이 뛰어난 라우드스피커를 사용하였다.

매우 놀라운 결과가 나왔다. 많은 실험 대상자들이 비(B)에서 훨씬 좋은 화질을 볼 수 있었다고 답했다. 화질은 사실상 에이(A)와 비(B)가 똑같았다. 그러나 시청 체험은 비(B)가 월등하게 좋았다. 우리는 부분이 아니라 감각적 총체로 경험을 판단한다. 이처럼 중요한 관찰이 가상현실 시스템 디자인에서 종종 잊혀진다.

군대의 탱크 조작 훈련장비를 디자인하면서(돈이 아무리 많이 들더라도) 디스플레이 질을 높이기 위해 굉장한 노력을 기울였다. 그 결과 디스플레이를 바라보며 훈련해도 탱크의 작은 창을 통해 밖을 보며 실제 행동하는 것과 비슷한 감각을 가질 수 있게 되었다. 좋은 일이다. 주사선 수를 증가하기 위한 피나는 노력을 기울인 끝에 디자이너들은 비용이 별로 많이 들지 않는, 조금씩 진동하며 움직이는 플랫폼을 생각해냈다. 약간의 부가적인 감각 효과―탱크 모터 소리와 바퀴 구르는 소리―를 첨가함으로써 대단한 ‘사실주의’적 효과를 얻을 수 있었다. 이를 통해 설계자들은 주사선 수를 줄일 수 있었다. 그럼에도 불구하고 시스템의 해상도는 인간이 보고 느낄 수 있는 수준을 넘고 있었다.

식사를 할 때 왜 안경을 쓰고 있느냐는 질문을 끊임없이 받는다. 분명히 음식물이나 포크를 보는 데 안경이 필요하지는 않다. 나의 대답은 간단하다. 음식 맛은 내가 안경을 쓸 때 훨씬 낫다. 음식물을 똑똑히 보는 것은 식사의 질을 결정하는 한 부분이다. 보는 것과 느끼는 것은 서로 영향을 미친다.








보고 느끼기                       10

 




당신을 본다



개인용 컴퓨터는 간단한 센서를 갖춘 현대식 화장실이나 옥외등(floodlights)보다도 사람의 존재를 인식하는 데 서툴다. 별로 비싸지 않은 자동 초점 카메라의 물체 판별 지능이 컴퓨터보다 훨씬 낫다.

컴퓨터 키보드에서 손을 들어올리면 컴퓨터는 이 멈춤 동작이 반사동작인지, 일시 중단인지, 점심을 먹기 위한 휴식인지 알아채지 못한다. 컴퓨터는 혼자 말하는 것과 여섯 명의 다른 사람과 함께 이야기하는 것 간의 차이점을 구분하지 못한다. 컴퓨터는 당신이 잠옷을 입었는지, 연회복을 입었는지, 아니면 아예 벌거벗었는지 분별하지 못한다. 컴퓨터가 중요한 것을 당신에게 보여줄 때 당신은 잠시 등을 돌릴 수도 있고, 컴퓨터가 말할 때 소리를 들을 수 없는 곳에 있을 경우도 있다

우리는 어떻게 하면 사람들이 컴퓨터를 더 쉽게 쓸 수 있을까 하는 생각에만 골몰하고 있다. 그러나 이제는 어떻게 하면 컴퓨터가 인간을 좀더 쉽게 다룰 수 있을까 하는 문제를 생각할 때가 되지 않았을까? 예를 들어 당신 앞에 사람이 있는지 없는지 알지 못하면서 어떻게 대화를 나눌 수 있겠는가? 당신은 그들을 볼 수도 없고 사람이 몇 명 있는가도 모른다. 그들은 웃고 있나? 내게 신경은 쓰고 있는 것인가? 우리는 아주 열심히 인간과 컴퓨터 간의 상호작용과 대화체계에 대해 논의해왔지만 아직까지 이 대화 상대자를 깜깜한 어둠 속에 내버려두고 있다. 컴퓨터로 하여금 보고 듣게 만들어야 할 때가 되었다.

컴퓨터 시력(computer vision)에 관한 연구와 어플리케이션은 거의 대부분 무인전차나 스마트 폭탄과 같은 군사적 용도를 위한 영상(scene) 분석에 국한되었다. 우주 공간에서 필요한 어플리케이션을 개발해야 한다는 주장이 강하게 제기되어 결국 이 분야가 기술 개발을 선도하였다. 달 표면에서 어슬렁거리는 로봇은 그가 본 영상을 지구에 있는 조정자에게 단순히 전송만을 하여서는 안된다. 광속으로 신호를 보낸다고 해도 신호가 도달해야 할 거리가 너무 멀기 때문이다. 로봇이 절벽 앞에 도달할 때 조정자가 낭떠러지의 영상을 보고 달로 메시지를 보내 로봇에게 앞으로 가지 말라고 말하는 순간 로봇은 이미 벼랑 아래로 떨어졌을 것이다. 이 사례는 로봇 스스로가 사물을 보고 판단해야 함을 뜻한다.

과학자들은 형상 이해 분야를 지속적으로 발전시켜 왔다. 예를 들어 그림자를 보고 형체를 인식하거나 배경에서 목표물을 분리하는 기술이 개발되었다. 최근 들어서야 인간과 컴퓨터 간의 인터페이스를 향상시키기 위해 컴퓨터의 인간 인식을 연구하기 시작했다. 당신의 얼굴은 실제로 당신의 디스플레이 기구이다. 당신 컴퓨터는 그걸 읽어낼 수 있어야 한다. 표정과 그 독특한 표현양식을 인식해야 한다.

인상을 쓰는 것은 우리가 표현하려는 내용과 바로 연결된다. 전화로 이야기할 때는 상대편이 볼 수 없기 때문에 얼굴 표정은 별로 바뀌지 않는다. 실제로 말을 하면서 그 내용에 힘을 주거나 특별히 강조하기 위해 우리는 얼굴을 찌푸리는 몸짓을 사용한다. 얼굴 표정을 인식함으로써 컴퓨터는 말이나 글로 된 메시지를 보강할 수 있는 여분의 동시발생적 신호를 확보한다.

얼굴과 표정을 인식하는 데 필요한 기술 요소는 엄청나게 방대하다. 그럼에도 불구하고 다른 맥락에서 보면 이를 아주 쉽게 얻을 수 있다. 당신과 당신 컴퓨터를 위한 어플리케이션이라면 컴퓨터가 지구상의 모든 사람이 아니라 단지 당신만 인식하면 된다. 배경은 추가로 쉽게 분리될 수 있다.

조만간 컴퓨터가 당신을 보게 될 것이다. 1990~91년 걸프 전쟁 기간 동안에 비즈니스 여행이 금지되었는데, 그 기간 동안에 원격 화상회의가 급격하게 늘어났다. 그리고 점점 더 많은 개인 컴퓨터에 값싼 화상회의 하드웨어가 장착되기 시작했다.

원격 화상회의 장비는 디스플레이 위에 놓인 텔레비전 카메라와 인코딩, 디코딩에 필요한 하드웨어와 소프트웨어, 컴퓨터 화면의 일부분 혹은 전체를 사용하는 실시간 비디오로 구성된다. 개인 컴퓨터의 화상 인식 능력은 급격히 향상되고 있다. 원격 화상회의 시스템 설계자는 대면(face-to-face) 커뮤니케이션을 즐기기 위해 개인용 컴퓨터를 위한 카메라를 사용할 생각을 하지 않는다. 왜 이런 생각을 하면 안될까?




마우스와 사람



미디어랩의 닐 거센펠트(Neil Gershenfeld)는 몇 분 정도면 사용법을 배울 수 있는 30달러짜리 마우스와 평생을 배워도 다 배우지 못하는 3만 달러짜리 첼로 활을 비교한 적이 있다. 그는 첼로의 16가지 연주 기술과 마우스의 클릭(click), 더블 클릭(double-click), 드래그(drag)를 대비시켰다. 첼로의 활은 대연주가를 위한 것이고 마우스는 대부분의 평범한 사람을 위한 것이다.

마우스는 그래픽을 입력하는, 간단하지만 귀찮은 매체(medium)이다. 마우스는 네 가지 단계를 요구한다. 1) 마우스를 손으로 더듬어 찾는다. 2) 커서(cursor)를 찾기 위해 마우스를 흔든다. 3) 원하는 곳으로 커서를 옮긴다. 4) 마우스 버튼을 한 번, 혹은 두 번 누른다. 혁신적인 디자인을 채택한 애플 파워북은 이 단계를 최소한 3단계로 축소하였다. 파워북은 엄지손가락으로 언제든지 사용할 수 있는 ‘정지 마우스’(dead mouse, 최근에는 트랙패드 track pad)를 장착하여 타이핑이 중단되는 경우를 최소화했다.

그러나 그림을 그리는 데는 마우스와 트랙볼도 별볼일 없다. 트랙볼로 사인을 한번 해보라. 그런 목적이라면 데이터 타블렛(data tablet)이나 볼펜처럼 생긴 펜마우스가 훨씬 더 좋은 해결책이다.

그림을 그리기 위한 데이터 타블렛을 갖추고 있는 컴퓨터는 많지 않다. 타블렛과 키보드를 어디에 놓을지를 결정하는 일은 우리를 정신분열증으로 몰고간다. 왜냐하면 타블렛과 키보드가 서로 디스플레이 바로 앞, 혹은 밑에 놓여지려고 경쟁하기 때문이다. 이런 문제는 종종 디스플레이 밑에 키보드를 설치하는 것으로 결판나는데, 그 이유는 (나를 포함하여) 많은 사람이 타이핑을 해야 하기 때문이다.

데이터 타블렛이 축을 벗어나거나 마우스가 화면 밖으로 벗어나는 일이 많아서 우리는 부자연스럽지만 손과 눈이 서로 협동하는 방법을 배워야 한다. 손으로는 그림을 그리거나 점을 찍으면서 동시에 눈으로는 다른 곳을 본다. 말하자면 더듬어 그리는 것이다.

1964년에 더글러스 잉글바트(Douglas Englebart)는 그림을 그리는 것이 아니라 텍스트를 가리키려고(pointing) 마우스를 발명하였다. 그의 발명은 그 자리에서 한걸음도 앞으로 나가지 못했다. 오늘날 우리는 어디에서나 마우스를 사용하고 있다. 국립예술기금(National Endowment of the Arts) 이사장인 제인 알렉산더(Jane Alexander)는 오직 남자들만이 그것을 마우스(속어로는 계집이라는 뜻도 있다)라고 불러왔다는 사실을 지적하였다.

이반 서더랜드(Ivan Sutherland)는 스크린에 직접 그리는 광학펜 개념을 완성하였다(1950년대에 세이지 SAGE 방어 시스템은 약간 조잡한 광학펜을 사용하였다). 그것은 다섯 개의 점으로 만들어진 십자 모양 커서를 추적했다. 그림을 끝마치려면 손목을 재빨리 털고 의도적으로 커서 추적을 그만두어야 했다. 하나의 선을 끝내는 방법치고 깜찍하기는 하지만 정교한 방법은 아니었다.

광학펜은 사실상 오늘날에는 존재하지 않는다. 스크린까지 손을 올리는 일은 별도로 치더라도(손에서 피가 빠져나가 오랫동안 지속하기가 힘들다) 2온스짜리 펜을 움직이려면 팔과 손에 극심한 피로가 온다. 어떤 경우에는 광학펜의 두께가 2분의 1인치인 경우도 있었는데 그런 때는 마치 시가로 엽서를 쓰는 것처럼 느껴졌다.

데이터 타블렛은 특히 그림을 그리는 데 아주 편하다. 약간의 노력을 들이면 미술가의 붓이 갖는 풍부함과 감촉을 지닌 철필을 만들 수 있다. 오늘날에는 단단한 표면에 쓰는 (느낌이) 볼펜 같은 형태로 근접하는 경향이 있다. 이것은 책상 공간이 당신과 디스플레이에게 더욱 가깝게 다가오도록 만든다. 우리의 책상은 이미 너무 어질러 있기 때문에 데이터 타블렛이 널리 보급되기 위해서는 가구 제조업자가 그것을 책상 안에 설치하거나 다른 기구 없이 오직 책상 자체만 있어야 한다.




하이터치 컴퓨팅



그래픽 입력의 강력한 대안은 사람의 손가락이다.

은행의 자동 현금지급기나 정보 키오스크(kiosks)는 터치스크린(touch-sensi-

tive displays)을 아주 성공적으로 사용하고 있다. 그러나 개인용 컴퓨터에서는 터치스크린을 거의 사용하지 않는다. 인간의 손가락은 따로 챙겨둘 필요가 없는 포인팅(pointing) 도구일 뿐만 아니라 그 수가 열 개나 된다는 점을 생각할 때 왜 손가락을 사용하지 않는지 모를 일이다. 손가락을 사용하면 우아하게 타이핑에서 포인팅으로, 수평에서 수직으로 작업을 전환할 수 있다. 그런데도 손가락은 인기를 끌지 못한다. 보통 세 가지 이유를 드는데 나는 이 가운데 아무것도 믿지 않는다.

손가락은 어떤 것을 가리킬 때 그것을 보이지 않게 덮어버린다. 사실이다. 그러나 종이와 연필을 사용해도 똑같다. 사람들은 여전히 손으로 글을 쓰고 있으며, 인쇄물에서 어떤 것을 확인하는 데도 손가락을 쓴다.

손가락은 해상도가 낮다. 틀렸다. 손가락은 뭉뚝하지만 대단한 해상도를 갖고 있다. 손가락으로 디스플레이의 표면을 만진 이후에 두번째 단계로 진입하여 손가락을 부드럽게 움직여서 원하는 위치에 아주 정확하게 커서를 위치시킬 수 있다.

손가락은 스크린을 더럽힌다. 하지만 스크린을 깨끗하게 만들기도 한다! 깨끗한 손가락은 스크린을 깨끗하게 만들고 더러운 손가락은 더럽게 만든다고 보아야 한다.

손가락을 사용하지 않는 진짜 이유는 우리가 아직 손가락 주변을 감지하는 그럴듯한 기술을 발견하지 못했기 때문이다. 손가락이 디스플레이에 직접 닿지는 않지만 거의 닿을 듯 접근하는 경우를 인식하지 못한다는 얘기다. 손가락이 닿는 경우와 그렇지 않은 경우만을 구별하는 수준이라면 수많은 어플리케이션이 아주 멍청한 기능만 하게 된다. 손가락이 1/4 인치 거리 안에 들어오면 커서가 나타나고 스크린에 닿으면 마우스를 클릭하는 것과 동일한 작용을 해야 한다.

손가락을 사용하는 인터페이스의 최종 모습은 지문을 인식하여 마치 스노 타이어에 새겨진 골처럼 손가락과 스크린 유리 사이의 마찰력을 가중시키는 수준에 이를 것이다. 이러한 접착력은 스크린을 실제로 미는 효과를 가져와서 스크린 판(plane)에 힘을 전달한다.

20년 전에 우리가 엠아이티에서 만들었던 장비가 한 가지가 있다. 그 장비는 직접 움직이지 않고도 손가락을 갖다대고 힘을 주면 닿는 힘의 세기에 따라 물체를 움직이게 할 수도 있고 끌거나 밀 수도 있고 회전시킬 수도 있었다. 이 장비로 데몬스트레이션이 진행되었다. 화면 위에는 손가락 두세 개로 잡을 수 있을 만한 크기의 회전 손잡이(knobs)가 나타났다. 손가락을 디스플레이 위에 얹고 눌러주면 회전 손잡이가 돌아가기 시작했다. 조절 손잡이는 돌아가면서 딸깍딸깍하는 소리까지 냈기 때문에 현실감이 생생하게 느껴졌다. 어린이 게임에서부터 비행기 조종석을 단순화시키는 데까지 널리 사용될 수 있는 어플리케이션이었다.




역가압 인터페이스



원거리 조작기는 원자로 같은 유해 환경에서 주로 사용된다. 로봇 팔은 원자로 안에서 움직이고 조작자는 밖에서 이를 조종하도록 되어 있다. 마스터 팔과 슬레이브 팔이 아주 멀리 떨어져 있기 때문에 조작자는 텔레비전 영상을 보고 이를 조종한다. 슬레이브 쪽에는 조작자가 엄지와 집게 손가락으로 조절하는 집게가 붙어 있다. 이 집게를 사용하여 사물을 들어올리거나 잡을 수 있다. 이런 방식으로 우라늄의 무게와 표면탄성(만약 있다면)을 느낄 수 있다.

프레드 브룩스(Fred Brooks)와 그의 노드 캐롤라이나 대학교의 동료들은 대단한 아이디어를 생각해냈다. 슬레이브 팔을 아예 없애고 슬레이브 팔 대신에 그곳에 연결되는 배선을 전체 작업을 시뮬레이션하는 컴퓨터에 연결시킨다고 가정해보자. 그렇게 되면 이제 당신이 스크린을 통해 보게 되는 것은 실제 상황이 아니지만 컴퓨터는 실제 물건의 무게와 감촉까지 그대로 느낄 수 있도록 모델링해 화면에 재현시킨다.

컴퓨터의 접촉 감각 특성은 당신이 물체를 느낄 때와 거의 비슷한 상태로 인식된다.

나는 압력 피드백 장치(force-feedback application)라는, 사용자에게 작용된 힘을 되돌려 주는 기계의 실험 모형 개발에 참여한 적이 있다. 이 기계를 작동시키는 데 필요한 힘은 사용자가 달성하고자 하는 수준에 비례하였다. 컴퓨터 조정에 의하여 이 기계는 자유롭게 움직일 수 있던 상태에서 천천히 밀리어 움직이는 상태로 변화되었다. 한 어플리케이션에서, 우리는 매사추세츠 지도를 인구 통계 데이터베이스와 함께 이용했다. 사용자는 이 압력 피드백 디지타이저를 움직여 가면서 새로운 고속도로를 설계할 수 있었다. 힘은 이주시켜야 할 가족 수에 비례해 달라졌다. 이런 기계를 사용하면 당신은 눈을 감은 채 가장 저항이 적은 방향을 따라 고속도로를 설계할 수 있다.

아이비엠사가 만든 싱크패드(ThinkPad) 노트북의 키보드 한가운데 설치된 조그만 빨간색 조이스틱(마우스 대용품)은 바로 이러한 종류의 역가압 장치(이것은 위치 변화를 감지하는 것이 아니라 힘을 감지한다)의 장을 열었다. 바람직하게도 시장에서는 조만간 싱크패드의 조이스틱처럼 힘을 되돌려주는 하이터치(high-touch) 컴퓨팅을 더 많이 사용하게 될 것이다.

애플 컴퓨터를 만든 알란 케이(Alan Kay:그는 개인용 컴퓨터의 아버지로 간주된다)는 또 다른 종류의 사례를 소개하였다. 그의 연구원 가운데 한 명이 움직임에 따라 힘을 다르게 느낄 수 있도록 가변 자기장(magnetic field)을 사용하여 ‘다루기 힘든’(stubborn) 마우스를 설계하였다. 자기력이 최고로 높아지면 마우스가 완전히 멈추게 되어 커서가 이동금지 구역으로 들어가지 않도록 할 수 있다.






당신의 컴퓨터를 바라보는 눈



컴퓨터 스크린을 단지 바라봄으로써, 이것은 무엇을 의미하는가, 그녀는 누구인가, 내가 거기에 어떻게 도달할 수 있을까라는 질문을 할 수 있다면 어떻게 될까? 그것, 그녀, 그곳은 그당시 당신의 눈길이 가고 있는 방향에 의해 규정된다. 당신의 질문은 당신의 눈과 텍스트 사이의 접촉점에서 만들어진다. 눈은 일반적으로 출력 장치로 간주되지 않지만 우리는 시종 그런 방식으로 눈을 사용한다.

사람들이 서로 상대가 응시하는 방향을 추적하고 눈길을 마주치게 하는 것은 마술에 가깝다. 20피트쯤 떨어진 거리에서 다른 사람이 가끔 당신의 눈을 응시하다가 또 가끔은 당신의 어깨 너머를 본다고 생각해 보자. 당신은 그 사람이 응시하는 방향이 당신이 응시하는 방향과 조금 빗나가더라도 그 차이를 즉각적으로 알아차릴 수 있다. 어떻게 이런 일이 가능할까?

이것은 분명히 상대방 눈동자의 각도를 계산한 후 당신의 시선과 만나는 통산적인 각도를 계산하는 삼각계산법이 아니다. 분명히 아니다. 다른 무엇인가가 벌어지고 있다. 당신의 눈과 그 사람의 눈 사이에서 메시지가 교환된다. 우리는 어떻게 이런 일이 일어나는가를 해명할 실마리를 갖고 있지 않다.

우리는 대상물을 가리키는(point) 데 눈을 사용한다. 어떤 사람이 어디를 가는지를 물을 때 이에 대한 당신의 대답은 단지 바깥을 바라보는 것이 될 수도 있다. 무엇을 가져가라고 지시할 때 당신은 이 가방이나 저 가방을 단지 바라보기만 한다. 이러한 지시는 머리의 움직임과 함께 이루어지는 데, 이것은 아주 강력한 커뮤니케이션 채널이다.

눈동자 움직임을 추적하는 몇 가지 기술이 있다. 내가 목격했던 최초의 데몬스트레이션은 머리에 쓰는 시선 추적 장치였다. 이걸 쓰고 스크린에 나타난 영어 텍스트를 읽으면 그 순간 영어가 프랑스어로 변환되었다. 시선(vi-

sion)의 중심부가 한 단어에서 다른 단어로 옮겨질 때 프랑스어 단어만 보이기 때문에 그 사람에겐 스크린이 완전히 100퍼센트 프랑스어로 보인다. 눈을 추적당하지 않은 구경꾼은 99퍼센트 영어로 된 스크린을 보게 된다(말하자면 눈 추적기를 쓴 사람이 보고 있는 단어를 제외한 단어만 본다).

좀더 현대화된 눈동자 움직임 추적 시스템은 원격 텔레비전 카메라를 장착하기 때문에 사용자는 기구를 착용하지 않아도 된다. 비디오가 갖춰진 원격회의장에서는 사용자가 스크린 정면으로부터 거의 일정한 거리를 두고 앉게 되기 때문에 눈을 추적하는 일이 특히 쉬워진다. 그리고 가끔 당신은 멀리 떨어진 상대의 눈을 들여다볼 것이다(컴퓨터는 그들이 어디에 있는지 알 수 있다).

컴퓨터가 당신의 위치와 자세, 눈의 특별한 속성을 잘 알면 알수록 당신이 어디를 보고 있는가도 훨씬 더 수월하게 알 수 있다. 아이러니하게도 눈을 입력장치로 사용하는(eyes-as-input) 이 색다른 미디어는 데스크탑 컴퓨터 앞에 앉아 있는 사람에게 제일 먼저 적용될 것이다.

눈동자 움직임은 언어라는 다른 입력 채널과 함께, 동시에 사용하면 훨씬 더 효과적일 것이다.








이것에 대해 말할 수 있을까        11





글자를 넘어서



대부분의 사람들에게 글자를 입력하는 타이핑은 이상적인 인터페이스가 아니다. 만약 컴퓨터와 이야기할 수 있다면 가장 완고한 러다이트(Luddite)도 아주 열광적으로 컴퓨터를 사용할 것이다. 그럼에도 불구하고 컴퓨터는 어쨌거나 벙어리이자 귀머거리 신세를 면치 못하고 있다. 왜 그럴까?

음성 인식이 별로 발전하지 못하는 주요한 이유는 기술이 부족하기 때문이 아니라 그에 대한 가능성을 낮게 평가하였기 때문이다. 음성 인식 설명회나 이와 관련된 제품 광고를 할 때 사람들이 그들의 손으로 마이크를 잡고 있는 모습을 보노라면 말의 가장 큰 가치가 손을 자유롭게 해주는 데 있다는 사실을 그들이 잊고 있지는 않나 의문을 갖게 된다. 얼굴을 스크린에 바짝 대고 말하는 사람을 보노라면 목소리를 사용하는 이유가 떨어진 거리에서도 의사 교환을 할 수 있기 때문이라는 사실을 잊어버리지 않았나 의심하게 된다. 사용자 독립 인식(user-independent recognition)을 주장하거나 요구하는 사람들을 보노라면 우리가 공유 컴퓨터가 아니라 개인 컴퓨터에게 말하고 있다는 사실을 잊고 있지 않은가 자문한다. 왜 모든 사람이 잘못된 문제를 제기하고 있는 것처럼 보이는가?

간단하다. 우리는 최근까지 두 가지 잘못된 집착에 매여 있었기 때문이다. 첫번째 집착은 구식 전화 통화 방식에서 비롯되었다. 사람들은 누가 어디서나 송수화기를 들어 인간 교환수가 아니라 컴퓨터에게 직접 구두 명령을 해도 통화가 되어야 한다고 생각했다. 바스탄(Bahstan) 억양을 쓰건, 남부의 느린 말투로 말하건 혹은 뉴욕 사투리로 말하건 컴퓨터가 알아들어야 한다는 생각이다. 두번째 집착은 사무자동화에서 비롯되었다. 음성인식 타자기가 그것인데 우리가 쉬지 않고 이야기하면 타자기는 그것을 완벽하게 쳐내야 한다는 생각이었다. 이 두 가지 상황에 대한 집착은 우리들에게 보다 실현가능성이 높고 유용한 내용을 얻지 못하게 하였다. 즉, 고도로 개인화되고 상호작용성이 높은 환경에서 대화 내용을 인식하고 이해하는 것이다.

우리는 또한 글을 뛰어넘는 말의 가치를 간과하였다. 예를 들어 오늘날의 컴퓨터는 시종 일관 사용자의 절대적이며 모든 집중력을 요구한다. 사용자는 보통 작업대에 앉아야만 한다. 당신은 컴퓨터와 당신 사이에서 이루어지는 상호작용 과정과 내용에 전적으로 주의를 기울여야 한다. 컴퓨터를 대충 지나치면서 사용하거나 다른 사람과 대화를 나누면서 작업할 수 있는 방법은 거의 없다. 언어는 이러한 문제를 해결할 수 있다.

손이 닿지 않는 거리에서 컴퓨터를 사용할 수 있다는 사실은 매우 중요하다. 어떤 사람에게 이야기하려면 상대의 코가 항상 당신 얼굴 앞에 있어야 한다고 상상해 보라. 우리는 보통 어느 정도 거리를 두고 대화를 나눈다. 때로는 순간적으로 돌아서기도 하고, 다른 일을 하며 이야기를 계속 나누기도 한다. 말을 계속하면서 시야 밖으로 사라져 버리는 경우도 드물지 않다. 나는―에어컨디셔너나 머리 위를 지나가는 비행기 소음 등 주위의 소리로부터 말소리를 구분해야 하는 문제가 해결되어야 하지만―내 컴퓨터를 내 목소리를 알아들을 수 있는 곳에 놓아두고 싶다.

말은 정보의 병행적 하위 운반체(parallel subcarriers)를 갖고 있다는 점에서도 글보다 우수하다. 어린아이나 애완동물을 키우는 사람은 누구나 무엇을 이야기하는가 보다 어떻게 이야기하는가가 훨씬 중요하다는 사실을 안다. 목소리 톤은 대단히 중요하다. 예를 들어 개는 전적으로 목소리 톤에 따라 반응한다. 개는 주인의 칭찬섞인 과장된 외침은 알아듣지만, 복합적인 어휘 분석 능력은 선천적으로 갖고 있지 않다.

말로 전달되는 단어는 단어 그 자체를 넘어 광대한 양의 정보를 전달한다. 말로는 정열, 비꼼, 분노, 미심쩍음, 아첨, 피로, 이 모든 것을 하나의 단어로 정확히 전달할 수 있다. 컴퓨터의 언어 인식에서는 이러한 뉘앙스가 무시되었다. 그러나 바로 이러한 특질 때문에 말은 타이핑보다 풍부한 미디어인 것이다.




음성 인식의 세 가지 차원



어정쩡한 외국어 실력으로는 전파 방해 때문에 잡음이 섞인 라디오 뉴스를 듣기가 아주 어렵거나 거의 불가능하다. 이와 대조적으로 그 언어를 유창하게 구사하는 사람은 약간의 신경을 거스르는 잡음이 섞인 신호도 구분할 수 있다. 이처럼 인식과 이해는 긴밀하게 상호 연관되어 있다.

컴퓨터는 현재까지는, 어떤 것이 무엇을 의미하는가를 우리가 알고 있다는 데 대해 우리가 합의할 수 있다는 식의 의미를 이해하지 못한다. 미래의 컴퓨터는 당연히 더 지능적으로 발전하겠지만 당분간 우리는 기계에 대한 충분한 이해 없이 기계 인식의 문제를 해결하도록 강요받는다. 이 두 가지 과제를 구분하면 말로 전달된 언어를 컴퓨터가 읽을 수 있는 명령으로 번역하는 명확한 경로를 찾을 수 있다. 언어 인식의 문제는 단어의 수, 화자 독립 수준, 단어의 연결성―통상적인 인간 언어의 운율에서 단어가 연달아 함께 발음되는 정도―이라는 세 가지 변수를 갖는다.

언어 인식의 이러한 차원을 세 가지 축으로 생각해 보자. 단어의 축에서는 인식할 단어가 적으면 적을수록 컴퓨터가 이해하기 쉽다. 시스템이 누가 말하는지를 미리 알고 있다면 문제는 더 간단하다. 그리고 단어가 연음으로 발음되지 않고 또박또박 구분되어 발음되면 훨씬 이해하기 쉽다.

이들 축의 원천은 분명하고, 끊어서, 각각, 발음해야 하는 모든 화자 의존적 단어(speaker-dependent words)로부터 최소량의 어휘를 발견하는 데서 찾아진다.

더하거나 다른 축으로 옮아감에 따라, 단어 수를 늘리거나, 누구의 말에나 적용되는 시스템을 만들거나, 함께 연결되어 연음으로 발음되는 단어까지 허용하자면 문제는 더욱 어려워진다. 극단적인 경우에는 컴퓨터가 어떤 말이든지, 누가 말하든지, 연결된 정도가 어떠하든지, 전부 다 이해하기를 기대한다. 우리는 흔히 언어 인식을 위해 이들 축을 전부 사용해야 한다고 가정한다. 넌센스다.

하나씩 차례로 살펴보자. 단어의 수가 어느 정도 되어야 충분한 크기인가를 질문할 수 있다. 오백, 오천, 오만 단어? 그러나 진정한 질문은 한번에 얼마나 많은 단어를 인식할 수 있는가이다. 이 질문은 어휘를 맥락적인 하위 단위(subset)로 쪼개어 필요한 만큼 기계로 들어가도록(folded into) 만들어야 한다는 사실을 암시한다. 내가 컴퓨터에게 전화를 걸라고 말하면 나의 개인 전화번호부(Rolodex)가 장치된다. 내가 여행을 계획하고 있다면 그 대신 지명들이 그곳에 들어 있어야 한다.

어휘의 수를 한 번에(워드 윈도우 word windows라고 부르자) 필요한 단어의 세트라고 볼 경우 컴퓨터는 자신에게 익숙해진 훨씬 적은 어휘―5만보다는 500에 더 가깝다―에서 선택하면 된다.

전화회사의 중앙 컴퓨터는 말하는 사람과 관계없이 모든 사람의 말을 이해해야 한다는 생각―‘보편 서비스’(universal service)의 일환으로―은 말하는 사람의 독립성이 요구되던 과거 전화회사 시절의 이야기다. 오늘날 컴퓨터 이용은 훨씬 더 넓게 퍼지고 개인화되었다. 우리는―개인용 컴퓨터, 혹은 스마트카드의 도움을 빌어―네트워크의 주변에서 훨씬 더 많은 것을 인식할 수 있게 되었다. 전화 부스에서 비행사의 컴퓨터와 이야기할 경우 나는 홈 컴퓨터를 부르거나 포켓 컴퓨터를 꺼내어 음성을 기계가 읽을 수 있는 신호로 번역하도록 만들 수 있다.

단어의 뭉개짐이나 연음이 세번째 쟁점이다. 우리는 관광객이 외국 아이에게 사려깊게 하나하나 끊어서 단어를 말하는 것처럼 컴퓨터에게 이야기하려 하지 않는다. 이 축이 가장 어려운 부분이지만 언어를 한 단어가 아니라 여러 단어로 구성되는 말로 보면 부분적으로 단순화될 수 있다. 실제로 이 방식에서 ‘겹쳐 발음되는 말’을 다루는 것은 당신의 컴퓨터를 개인적으로 길들이는 과정이다.

언어를 상호작용하는 대화 미디어로 볼 경우 음성 인식에 아주 가까이 접근할 수 있다.




유사언어



언어는 사전에서 나오지 않는 숱한 소리로 가득 찬 미디어이다. 언어는 흑백 텍스트보다 훨씬 더 다양할 뿐만 아니라, 대화에서 쓰는 ‘저’ ‘어’ 등의 유사언어(paraverbals)처럼 추가된 의미를 지닐 수 있다.

1978년 엠아이티에서는 말하는 사람에게 의존(speaker-dependent)하는 연결 언어 인식 시스템(connected speech-recognition system)―그때나 지금이나 그런 시스템이 다 그런 것처럼 말하는 사람의 음성이 조금이라도 스트레스를 보이면 에러를 저지르기 쉬운―을 사용하였다. 대학원생이 우리 후원자에게 그것을 시연할 때 우리는 시스템이 완벽하게 동작하기를 바랐다. 이러한 열망은 당연히 시연을 하던 대학원생의 목소리에 스트레스를 가해 결국 시스템이 꺼져 버렸다.

몇 년 후에 다른 학생이 기가 막힌 아이디어를 내어 사용자의 말 사이에 쉼표를 첨가하고, 기계가 적당한 시간에 “아하”라고 소리낼 수 있도록 프로그램을 작성하였다. 그래서 기계에다 말을 하면 기계는 주기적으로 “아-하아” “아아-하” 혹은 “아하”라고 발음할 수 있었다. 이것이 대단한 진정 효과(기계가 사용자로 하여금 대화할 수 있도록 용기를 북돋아주는 것처럼 보였다)를 발휘하여 사용자는 다소 긴장을 풀 수 있었고, 시스템은 아주 훌륭하게 수행되어 명성을 한껏 높였다.

커뮤니케이션에서 이러한 개념은 두 가지 중요한 요점을 보여준다. 첫째 말을 사용할 때 그것이 반드시 사전적인 의미를 지닐 필요는 없다는 점이고, 둘째는 어떤 말은 순전히 대화를 위한 프로토콜(protocols)이어야 한다는 점이다. 전화를 할 때 상대에게 적절한 간격으로 “아하”라고 말하지 않으면 상대는 신경질이 나서 결국 “당신, 듣고 있는거요?”라고 물을 것이다. “아하”는 “예” “아니오” “그럴지도 모르지요”라고 말하는 것이 아니라 기본적으로 “듣고 있습니다”라는 정보 한 비트를 전달하는 것이다.




대화의 극장



다음과 같은 상황을 상상해보라. 당신은 모든 사람이 프랑스어로 말하는 테이블에 앉아 있다. 당신의 불어 실력은 고등학교에서 1년 정도 공부한 비참한 수준이다. 테이블에서 한 사람이 갑자기 당신 쪽으로 돌아서며 “Voulez-

vous encore du vin?”이라고 말한다. 당신은 이것을 완벽하게 이해한다. 이어서 그 사람이 대화를 바꾸어 프랑스 정치에 대해 말한다. 당신이 유창하게 불어를 구사하지 못한다면(유창하게 구사해도 완벽한 이해를 장담할 수 없다) 당신은 아무것도 이해하지 못할 것이다.

“와인 더 하시겠어요”는 어린아이의 말이고 정치는 세련된 화술을 요구한다고 생각할지 모르겠다. 맞는 말이다. 그러나 그것이 이 두 대화의 중요한 차이는 아니다.

그 사람이 당신에게 포도주를 더 하겠느냐고 물을 때 그는 아마도 포도주 병을 향해 손을 뻗으면서 당신의 빈 포도주 잔을 바라보았을 것이다. 말하자면 당신은 음향만이 아니라 병행적으로 전달된 여분의 의미까지 해독하였던 것이다. 그뿐만 아니라 모든 주체와 객체는 동일한 공간과 시간에 있었다. 이러한 정황 때문에 당신이 그 말을 이해할 수 있었던 것이다.

말에 딸리는 여분의 신호가 갖는 의미에 대해 다시 한번 이야기해도 좋겠다. 병행적 채널(몸짓, 응시, 말)의 사용은 인간 커뮤니케이션의 본질이다. 인간은 본능적으로 동시적 표현 수단에 끌린다. 당신의 이탈리아 말 실력이 일상용어 정도를 알고 있는 수준이라면 전화로 이탈리아인에게 이야기하려는 생각은 포기하는 것이 좋겠다. 이탈리아 호텔에 도착하여 욕실에 비누가 없다고 전화해 봐야 아무 소용이 없다. 관리인에게 내려가 비누를 달라고 전달하기 위해 최선을 다해야 한다. 목욕하는 시늉까지 해야 할지도 모른다.

외국에서는 자신의 의사를 전달하기 위해 가능한 모든 수단을 동원한다. 조금이라도 더 이해하려고 모든 신호를 놓치지 않고 읽는다. 사람들의 세계라는, 말이 통하지 않는 낯선 외국에 혼자 있게 된 컴퓨터를 생각해 보라.






컴퓨터에게 말 가르치기



컴퓨터는 녹음된 음성을 재생하거나 글자, 음절, 혹은 (가장 많이) 음소의 소리를 합성하는 두 가지 방식으로 말을 만든다. 각각의 방식은 장단점을 갖고 있다. 음성을 만드는 방법은 음악에서와 같이 소리를 시디와 같은 매체에 저장하였다가 재생하거나, 연주가들이 하는 것과 같이 악보를 이용하여 소리를 재생산하고 합성할 수 있다.

저장된 말을 다시 사용하면, 특히 저장된 말이 완전한 메시지일 경우, 가장 ‘자연스런’ 목소리와 청각으로 커뮤니케이션할 수 있다. 이런 이유 때문에 대부분의 전화 메시지는 이 방식으로 녹음된다. 만약에 사전에 녹음된 음소들이나 불분명한 단어를 함께 연결할 경우 전체 운율이 사라지기 때문에 별로 신통치 않은 결과를 얻는다.

과거에는 아주 많은 메모리를 잡아먹기 때문에 인간과 컴퓨터의 상호작용을 위해 녹음된 말을 사용하지 않으려 했다. 현재 메모리는 별로 문제가 안된다.

문제는 분명하다. 저장된 말이 작동하려면 어쨌든 그것을 먼저 녹음해야 한다. 컴퓨터가 적합한 이름으로 사물을 불러주길 바란다면, 모든 이름이 먼저 저장되어야 한다. 저장된 음성은 아무 말이나 만들 수 없다. 이런 이유 때문에 두번째 방법인 합성(synthesizing)이 사용된다.

말의 합성은 텍스트의 흐름(이 문장과 다름없다)을 취하여 각 단어를 하나하나 발음하는 어떤 규칙을 따른다. 언어마다 서로 다르고 합성의 난이도도 다르다.

영어는 이런 면에서 보면 가장 어려운 언어 가운데 하나다. 우리가 영어를 쓰는(쓴다는 뜻의 write는 right, rite와 소리가 같다) 방법(방법이라는 뜻의 way는 weigh, whey와 소리가 같다)은 괴상하고 비논리적으로 보이기까지 한다. 터키어 같은 다른 언어는 훨씬 쉽다. 실제로 터키어는 아타튀르크(Atatu"rk)가 1929년에 아라비아어를 라틴 글자로 바꾸어 음과 글자 간의 일대일 대응관계를 만들었기 때문에 아주 간단하다. 각 글자를 발음하면 된다. 묵음이나 혼란스런 이중 모음도 없다. 따라서 단어 수준에서 보면 터키어는 컴퓨터 언어 합성을 위한 꿈을 실현시킨다.

기계가 모든 단어를 전부 다 발음할 수 있다고 해도 문제는 또 있다. 합성된 단어에 절이나 문장에서 요구되는 리듬을 주거나 강조하기가 매우 어렵다. 문장에서 리듬이나 강조는 좋은 소리를 만들 뿐만 아니라 내용과 의도에 따른 색조, 표현, 톤을 포함하는 데 대단히 중요한 역할을 한다. 그렇지 않으면 술취한 스웨덴 사람처럼 단조로운 목소리가 된다.

우리는 현재 합성과 저장을 결합한 어떤 시스템을 보고(듣고) 있다. 모든 사물이 디지털이 되면서 장기적 해결책으로 두 가지를 모두 사용하게 될 것이다.




크고 작은 사물



21세기에는 사람과 이야기하는 것보다 기계와 이야기하는 시간이 더 많아질 것이다. 이때 생명이 없는 사물을 향하여 이야기한다는 자의식이 가장 불편한 문제로 등장할 것이다. 개나 카나리아에게 말을 걸 때는 아주 편안하지만 문고리나 가로등 기둥(완전히 술에 취하지 않았다면)에 말하기란 편치 않다. 토스트 굽는 기계에 말하면서 멍청하다고 느끼지 않을 사람이 있을까? 아마 전화 응답기계에 말하면서 느끼는 감정과 비슷할 것이다.

‘소형화’(miniaturization)는 과거보다 더 빨리 말이 여러 곳에서 사용될 수 있도록 만들 것이다. 컴퓨터는 점점 더 작아지고 있다. 어제 방안을 가득 채웠던 것이 오늘은 탁상 위에 올려지고, 내일은 손목시계 안으로 들어갈 것이다.

데스크탑 컴퓨터 사용자들은 지난 10년 동안 축소화의 효과를 충분히 맛볼 수 없었다. 왜냐하면 다른 것에 비해 일정한 크기를 유지해 온 키보드나 축소되기는커녕 더 크기가 커진 디스플레이와 같은 차원이 있기 때문이다. 그러므로 데스크탑 기계의 전체 크기는 15년 전에 나온 애플 투(Apple II)보다 더 작지 않다.

당신이 만약 모뎀을 사용한 지 얼마 안되었다면 모뎀의 크기 변화가 그동안 일어난 실재 변화를 아주 잘 보여줄 것이다. 15년 전만 해도 1,200보드 모델(1,000달러 정도)의 옆면 크기는 토스터만 했다. 당시의 9,600보드 모뎀은 선반을 이용하여 설치할 정도의 크기였다. 오늘날에는 19,200보드 모뎀이 스마트카드로 나온다. 크레디트 카드형에서도 실제로 사용되지 않는 부분이 태반인데 그 이유는 슬롯에 꽉 끼워져 빠져나오지 않도록 하기 위해 부피를 크게 만들기 때문이다. 우리가 오늘날 모뎀을 더욱 작게 만들지 않는 이유는 기술이 모자라서가 아니다. 더 작게 만들면 잃어버리기 쉽고 그것을 위한 삽입 궤도를 만들기 어렵기 때문일 뿐이다.

손가락을 자연스럽게 폈을 때의 면적에 대한 부담감에서 벗어날 수만 있다면―이것이 편안한 키보드 크기를 결정한다―컴퓨터는 옷주머니, 지갑, 손목시계, 볼펜 등과 같은 크기로 줄어들 것이다. 크레디트 카드의 크기가 우리가 원하는 가장 작은 수준으로 축소되는 상황에서는 디스플레이의 크기나 그래픽 유저 인터페이스 문제는 의미가 없어진다.

펜 입력 시스템은 멍청한 과도기적 수단이다. 너무 크거나 너무 작다. 물리적 버튼의 대체물 또한 받아들이기 힘든 해결책이다. 브이시알이나 텔레비전 리모컨을 보면 아주 조그만 버튼―피그미족의 손이나 젊은이들의 눈을 위한―의 한계를 볼 수 있다.

증가하고 있는 소형화의 경향은 작은 시스템에서의 주요 인간-컴퓨터 인터페이스로서 음성 인식과 합성의 능력 향상을 요구하고 있다. 실제적인 음성 인식 장치가 와이셔츠 커프스나 시계 줄에 완전히 들어갈 필요는 없다. 작은 장비들은 서로를 지원하기 위하여 상호 통신을 할 수 있다. 요점은 작아지려면 목소리가 필요하다는 것이다.




손을 뻗어 누군가를 만져라



좀 오래전에 홀마크(Hallmark) 카드 회사의 연구 책임자가 나에게 자기 회사의 제일 큰 경쟁자가 에이티앤티(AT&T)였다고 설명하였다. “손을 뻗어 누군가를 만져라”라는 말은 목소리를 통한 감정 전달을 뜻한다. 음성 채널은 신호뿐만 아니라 이해, 숙고, 보상, 용서의 기미를 이해할 수 있게 하는 다른 신호를 함께 전달한다. 어떤 사람의 목소리는 정직하게 ‘들리고,’ 어떤 주장은 수상하게 ‘들리며,’ 어떤 것은 그렇게 ‘들리지’ 않는다는 말을 한다. 음향에는 감정에 관한 정보가 묻어 있다.

어떤 사람을 만지기 위해 손을 뻗는 것과 똑같이 우리가 원하는 것을 기계에 전달하기 위해 목소리를 사용하고 있는 우리 자신을 발견하게 될 것이다. 어떤 사람은 컴퓨터에게 마치 훈련 담당 하사관처럼 대할 것이다. 또 다른 사람은 이성적인 목소리로 말할 것이다. 말과 위임은 단단히 밀착되어 있다. 앞으로 일곱 난쟁이에게 명령을 내리게 될까?

가능한 이야기이다. 20년 후에는 책상 위를 걸어다니는 8인치 높이의 홀로그래픽 조교 또는 비서들에게 이야기하는 것이 무리한 일이 아니다. 분명한 것은 음성이 당신과 당신의 인터페이스 대행자(interface agents) 간의 주요 커뮤니케이션 채널이 되리라는 점이다.








적은 것이 더 많다                 12





디지털 집사



1980년 12월 제롬 비스너와 나는 후지산에서 그리 멀지 않은 하코네의 아름다운 시골 집에서 노부타카 시카나이(Nobutaka Shikanai)의 저녁 식사에 초대받았다. 우리는 시카나이의 신문-텔레비전 미디어 제국이 미디어랩 창설에 참여함으로써 이득을 볼 것이고, 시카나이 씨가 미디어랩을 구축하는 데 기꺼이 도움을 주리라고 믿었다. 더 나아가 우리는 시카나이 씨의 현대 예술에 대한 개인적 관심이 기술과 표현을 한데 합치고, 새로운 미디어의 발명과 창조적 사용을 결합하려는 우리의 꿈을 실현하는 데 한몫 하리라 믿고 있었다.

저녁 식사 전에 낮에는 하코네 야외 박물관으로도 이용되는 시카나이 씨의 유명한 야외 예술 소장품을 둘러보았다. 시카나이 부부와 저녁을 함께 할 때 시카나이 씨의 개인 비서가 동석하였다. 시카나이 씨는 한마디도 말하지 않았지만 그 비서는 완벽한 영어를 구사하였다. 비스너가 먼저 말문을 열었다. 비스너는 알렉산더 칼더(Alexander Calder)의 작품에 대단한 흥미를 갖고 있음을 피력하였다. 비스너는 그 위대한 예술가에 대한 엠아이티와 그 자신의 개인적 체험을 이야기하였다. 비서가 그 이야기를 듣고 처음부터 끝까지 통역하는 동안 시카나이는 주의깊게 듣고 있었다. 결국 시카나이 씨는 한참을 생각하다가 잠시 멈추어 우리를 올려다본 후 쇼군처럼 “오호”라고 길게 감탄사를 내뿜었다.

그러자 비서가 통역하였다. “시카나이 씨도 역시 칼더의 작품에 크게 감동하였다고 말씀하십니다. 칼더와 시카나이 씨의 최근 만남은 이러저러한 환경에서 이러쿵 저러쿵‧‧‧‧‧‧.” 잠깐만, 도대체 이게 어디에서 나온 말인가?

이러한 상황이 식사 시간 내내 계속되었다. 비스너의 말은 완전하게 통역되었다. 그러면 상대의 반응은 “오호”에 불과했지만 기다란 설명으로 통역되었다. 그날 밤 나는 바로 시카나이 씨의 비서처럼 훌륭한 개인용 컴퓨터를 만들고 싶다고 스스로 다짐하였다. 컴퓨터 비서는 나와 나를 둘러싼 상황을 아주 잘 이해하고 있어서 나에 관한 신호를 확장하거나 축소할 수 있어야 한다. 이런 경우 나는 문자 그대로 여분의 존재가 된다.

잘 훈련된 영국 집사(English butler)는 인간과 컴퓨터 간의 인터페이스를 표현하는 최상의 비유이다. ‘대행인’은 전화를 받고 방문자를 확인하고, 적당한 때 당신에게 알려주며, 당신 편에 서서 하얀 거짓말까지 할 수 있다. 이 대행인은 적절한 시기를 판단할 수 있고, 적당한 순간을 발견하는데 조예가 깊으며, 존경할 만한 개성도 갖고 있다. 이 집사를 알고 있는 사람은 그를 생전 처음 대하는 사람에 비해 엄청난 즐거움을 맛본다. 정말 좋은 일이다.

이러한 대행인을 가질 수 있는 사람은 정말 몇 명 안된다. 사무실 비서가 보통 이와 유사한 종류의 역할을 맡는다. 당신에 대해 잘 알고 있고 당신이 알고 있는 많은 정보를 공유하고 있는 비서일 경우 당신을 위해 아주 효율적으로 행동할 수 있다. 만약에 그런 비서가 병이라도 걸리면 임시 대행사에서 앨버트 아인슈타인(Albert Einstein)을 보내준다 해도 아무 소용이 없다. 문제는 아이큐가 아니다. 이것은 공유된 지식과 당신의 최상의 이해를 위해 그것을 사용하는 실행의 문제이다.

이런 종류의 기능을 컴퓨터에 집어넣는 발상은 최근까지 이룰 수 없는 꿈으로 간주되어 이 개념을 진지하게 받아들이지 않았다. 이런 상황이 급격하게 바뀌고 있다. 지금은 많은 사람이 그러한 ‘인터페이스 대행자’를 만들 수 있다고 믿는다. 이에 따라 지능 대리인에 대한 부진했던 관심은 인간과 컴퓨터 간의 인터페이스 디자인에 관한 연구 가운데 가장 인기 있는 주제로 부상하였다. 사람들은 분명히 직접 컴퓨터를 조작하기보다는 더 많은 기능을 컴퓨터에 위임하고 싶어한다.

어떤 것(과정, 관심분야, 일하는 방식)에 대한 지식과 그와 관련된 당신에 대해 정리된 지식(당신의 입맛, 성향, 친구)을 갖고 있는 컴퓨터 대행인을 만들겠다는 생각이다. 말하자면 컴퓨터는 당신의 입맛에 맞추어, 음식을 준비하고, 식물을 키우며, 운전 기술을 발휘하는 요리사, 정원사, 운전사처럼 이중 전문성을 갖추어야 한다. 이들 일을 위임하는 것이 당신이 음식을 준비하거나 식물을 키우거나, 차를 운전하기 싫어함을 의미하지는 않는다. 당신이 해야만 하기 때문이 아니라, 당신이 하고 싶은 것을 하고 싶을 때 할 수 있음을 의미한다.

컴퓨터의 사용도 마찬가지다. 나는 시스템에 접속하여 들어가는 것, 프로토콜을 찾는 것, 당신의 인터넷 주소를 찾아내는 데 정말 관심이 없다. 단지 내 메시지가 당신에게 전달되면 그만이다. 나는 어떤 것을 놓치지 않기 위해 수천 개 게시판을 읽어야만 하는 상황을 바라지 않는다. 나는 인터페이스 대행자가 이런 일을 하기 바란다.

디지털 집사는 네트워크에 있고, 당신 옆에도 있으며, 당신 조직(크든 작든)의 중심과 주변 어디에나 여러 개가 존재하게 된다.

나는 사람들에게 내가 갖고 있는 사랑스런 지능 무선 호출기를 자랑한다. 그것이 얼마나 시의적절하게 적절한 정보를 완벽한 영어 문장으로 내게 전해주는지, 얼마나 지능적으로 행동하는지에 대해 자랑한다. 모든 메시지는 오직 한 사람―내가 있는 곳을 아는 사람, 무엇이 중요한지를 알고 있는 사람, 내가 아는 사람(그리고 그들의 대행자)을 알고 있는 오직 한 사람―만을 통해서만 내게 전달될 수 있다. 지능은 주변 장치나 무선호출기 안이 아니라 시스템 머리 부분에 위치한다.

그러나 수신 말단에도 지능이 갖추어져야 한다. 얼마전 큰 회사의 최고 경영자와 보좌관이 나를 방문했는데, 그 보좌관이 최고 경영자의 무선호출기를 차고 있었다. 그는 가장 적절한 순간에 최고 경영자에게 그것을 알려주었다. 비서의 재치, 타이밍, 분별 기능이 결국 무선호출기 안에 내장될 것이다.




개인 필터



전자신문이 비트로 집으로 배달된다고 상상해보라. 그것이 종이처럼 얇고, 탄력성이 있고, 방수, 무선, 가볍고, 밝은 디스플레이로 보내진다고 가정해 보자. 인터페이스를 해결하려면 헤드라인 뽑기와 지면배정(layout), 인쇄 표식(typographic landmarks), 이미지, 그리고 정보 검색을 도와주는 주요 기술에 대한 인류의 수년 간의 경험을 요구한다. 잘되면 훌륭한 뉴스 미디어가 될 것이다. 잘못되면 지옥 같을 것이다.

신문을 보는 또 하나의 방식이 있는데 그것은 뉴스에 대한 인터페이스이다. 다른 사람이 뉴스로 생각하는 것, 다른 사람이 지면을 차지할 만한 가치가 있다고 정당화하는 것을 읽는 대신에 디지털 세상은 당신의 관심이 더 큰 역할을 하는, 대중적 수요에서 본다면 기사가 되지 못하는 조각을 사용하여 뉴스 선택의 경제 모델을 바꿔놓을 것이다.

당신의 인터페이스 대행자가 모든 신문과 전자 신문을 읽고, 지구상의 텔레비전과 라디오 방송을 수신한 후 당신의 취향에 맞도록 요약해 주는 그런 미래를 그려보라. 이런 종류의 신문이 한 사람을 위해 편집되어 인쇄된다.

신문은 일요일 오후와 월요일 아침에 아주 다른 방식으로 읽힌다. 주 중의 아침 7시에는 정보를 검색하는 수단으로 신문을 읽으며, 수만 명에게 보내진 공동의 비트 세트를 개인화한다. 대부분의 사람들은 신문 전체를 한번 쳐다보지도 않고 휴지통으로 던져버리거나, 그 가운데 일부만을 대충 읽고, 아주 조금만 상세하게 읽는다.

신문사가 당신에게 전체 요원을 지시할 권한을 주고, 당신의 지시에 따라 하나의 편집물을 만들라고 요청할 경우 어떤 일이 벌어질까? 아마도 아는 사람, 내일 만날 사람, 당신이 방문할 장소나 방문했던 장소와 관련된 ‘덜 중요한’ 이야기들로 헤드라인 뉴스가 범벅이 될 것이다. 아마 당신이 아는 회사에 관한 보고가 포함되어 있을 것이다. 실제로 이런 조건에서 당신은 만약 그것이 적합한 정보를 전달할 것이라는 확신만 있다면 100페이지가 아니라 10페이지짜리 보스턴 글로브(Boston Globe)에 기꺼이 더 많은 돈을 지불할 것이다. 그리고 그런 신문이라면 아마도 모든 비트를 다 소비할 것이다. 이것을 ‘나의 신문’(The Daily Me)이라 부를까?

일요일 오후에는 뜻밖의 보물을 담고 있는 뉴스를 경험하고 싶을 것이다. 우리가 알아채지 못했지만 관심이 있었던 것을 배우면서 크로스워드 퍼즐에 도전하고, 아트 부흐발트(Art Buchwald)의 칼럼을 즐기고, 광고에서 바겐세일 기사를 찾으면서 하루를 보내고 싶을 것이다. 이것을 ‘우리 신문’(The Daily Us)이라 불러볼까? 비 내리는 일요일 오후에 자신에게 별로 적합하지 않은 소재를 골라내려고 극도로 긴장하는 인터페이스 대행자를 보고 싶은 사람이 누가 있겠는가.

이것은 흑과 백이라는 분명하게 구별되는 두 개의 존재 상태가 아니다. 우리는 시간 여유, 시간대, 기분에 따라 그들 사이를 왔다갔다하며 개인화의 정도를 조절하려 한다. 볼륨을 조절하는 스위치가 ‘개인화’를 줄였다 높였다 할 수 있는 컴퓨터 뉴스 디스플레이를 상상해 보라. 공공 사건에 대한 이야기를 말 그대로 정치적으로 좌에서 우로 움직일 수 있는 조절기(slider)를 포함한 여러 개의 조절기를 가질 수 있다.

이 조절기는 윈도우를 크기와 편집 내용의 양 측면에서 바꿀 수 있다. 먼 미래에는 인터페이스 대행자가 입수할 수 있는 모든 정보를 완전히 읽고 듣고 볼 수 있을 것이다. 가까운 장래에는 헤더를 사용하여―비트에 관한 비트에 의하여―검색 여과 과정이 이루어질 것이다.




디지털 처제



텔레비전 가이드 잡지 한 권이 네 개 공중파 방송을 합친 것보다 더 많은 이익을 낸다는 사실은 정보에 관한 정보가 정보 그 자체보다 더 큰 가치를 가질 수 있음을 암시한다. 새로운 정보 전달을 생각할 때 우리는 ‘정보 스쳐보기’(infograzing)나 ‘채널 서핑’(channel surfing)과 같은 개념을 생각하는 걸 갑갑해하는 경향이 있다. 이들 개념은 측량할 수 없다. 1,000개의 채널을 이 방송 저 방송 옮겨다닐 때 한 시간당 3초만 머물러도 모든 채널을 검색하는 데 한 시간 가량이 걸릴 것이다. 가장 재미있는 프로그램을 골랐을 때는 이미 프로그램이 끝나버렸을 것이다.

영화를 보러 외출할 경우 나는 영화평을 보지 않고 처제와 상의한다. 우리 주위에는 영화 전문가인 동시에 우리에 대해서도 전문가인 사람이 있다. 디지털 처제를 만들 필요가 있다.

실제로 인간을 돕는 인간을 의미하는 ‘대행인’이란 개념은 전문성과 함께 당신에 관한 지식을 갖고 있는 사람을 뜻한다. 훌륭한 여행 대행자는 호텔과 레스토랑에 관한 지식과 당신에 관한 지식(여러 호텔과 음식점에 관한 당신의 생각에서 따온 지식)을 한데 섞는다. 진정한 부동산 대행인은 여러 가지 집에서 다양한 투자 수준을 고려할 뿐만 아니라 당신의 취향에 맞는 모델을 만들어준다. 이제 전화 응답 대행자, 뉴스 대행자, 전자 우편물 대행자를 상상해 보라. 이들 모두는 공통적으로 당신을 모델링할 수 있는 능력을 갖추고 있다.

설문지를 완성하거나 고정된 프로필을 갖고 있는 것은 문제가 안된다. 인터페이스 대행자는 친구나 조수처럼 시간을 두고 학습하고 개발해야 한다. 말은 쉽지만 정말 이렇게 되기는 힘들다. 최근 들어서야 인간에 대해 학습하는 컴퓨터 모델을 다루는 방식이 사용되기 시작했다.

내가 인터페이스 대행자에 대해 말할 때면 “인공지능을 말씀하시는 것인가요?”라는 질문을 받는다. 대답은 분명히 “예”이다. 그러나 이 질문은 과거의 인공지능(AI)이 약속한 잘못된 희망 때문에 명백한 의혹을 받는다. 많은 사람들은 아직도 기계가 지능을 가질 수 있다는 발상을 껄끄럽게 받아들인다.

알렌 투링(Alan Turing)은 기계 지능을 제시한 최초의 사람으로 꼽힌다. 그는 1950년 「컴퓨터 기계와 지능」(Computer Machinery and Intelligence)이라는 논문을 발표하였다. 마빈 민스키(Marvin Minsky) 같은 후속 선구자들은 순수 인공지능에 관한 투링의 깊은 관심을 이어받았다. 그들은 맥락 인식, 감정 이해, 유모어 이해, 그리고 하나의 은유에서 다른 은유로 변환하는 문제에 대해 스스로 질문하였다. 예를 들어 O, T, T, F, F로 시작하는 연속에서 그 다음에 이어지는 글자의 첫자는 무엇일까?

컴퓨터 자원이 직관적 문제를 해결하는 데 필요한 능력을 갖추고 지능적인 행동을 보여주기 시작한 1975년경에 인공지능은 더 나쁜 방향으로 선회하여 고통을 받게 되었다. 과학자들은 갑자기 로봇이나 전문가 시스템(곧, 주식 거래나 비행기 예약) 같은 실행가능하고 시장화될 수 있는 어플리케이션을 선택하였다. 이에 따라서 인공지능과 학습에 관한 더 심오한 기본적인 질문들이 방치되었다.

민스키는 오늘날의 컴퓨터가 비행기 예약(논리를 뛰어넘는 주제)을 신비로울 정도로 잘 처리할 수 있지만 서너 살 먹은 아이도 알 수 있는 상식은 전적으로 결여하고 있음을 재빨리 지적하였다. 컴퓨터는 개와 고양이의 차이를 분별하지 못한다. 상식적인 주제가 과학적 연구의 뒤켠에 방치되었다가 이제 중심 무대로 나서고 있다. 상식을 겸비하지 못한 인터페이스는 목에 고통만을 안겨주기 때문에 이러한 연구는 매우 중요한 의미를 갖는다.

그런데 앞에서 제기한 문제의 해답은 S, S이다. 그 뒤에 이어지는 글자는 수를 셀 때 사용하는 one, two, three, four 등의 단어 첫 글자이다.




탈중앙화



미래의 인터페이스 대행자는 종종 오웰의 소설에 나오는 중앙화되고 전지전능한 기계처럼 그려진다. 그러나 미래의 인터페이스 대행자는 컴퓨터 프로그램과 개인용 장비들의 집합체 형태로 나타날 가능성이 크다. 이들은 각각의 개체로서도 아주 훌륭하지만 서로간에 더욱 훌륭한 커뮤니케이션 기능을 가질 것이다. 이러한 이미지는 민스키(Minsky)의 마음의 사회(The Soci-

ety of Mind, 1987)를 본받아 그려본 것이다. 이 책에서 민스키는 지능이 어떤 중앙 처리장치에 있지 않고 보다 특수한 목적을 가지며 고도로 상호 연계된 기계들의 거대한 집단에 의한, 집합적 행위 내에 존재하는 것이라고 주장하였다.

이러한 관점은 미첼 레즈닉(Mitchel Resnick)이 1994년 그의 책 거북이, 흰개미, 그리고 교통난(Turtles, Termites, and Traffic Jams)에서 ‘중앙집중화된 사고방식’(centralized mind-set)이라고 불렀던 편견과 반대되는 것이다. 우리는 통상, 예를 들어, 브이(V)자 대형을 그리고 나는 새떼 가운데 가장 앞에 나는 새가 다른 새들을 책임지는 지도자의 역할을 하리라 가정한다. 그러나 그렇지 않다. 질서정연한 대형은 개별적으로 행동하지만 지휘자 없이도 단순한 조화의 규칙을 따르는 고도의 책임 있는 집합의 결과이다. 레즈닉은 사람들도 그러한 과정의 한 부분임을 발견하고 놀라는 상황을 들어 그의 주장을 펼쳤다.

나는 최근에 레즈닉이 엠아이티 크레게 강당에서 그러한 주장을 펼치는 것을 경험하였다. 대략 1,200명 정도되는 청중에게 손뼉을 치게 하고 통일된 박자를 맞추라고 요청하였다. 레즈닉이 전혀 지도하지 않았음에도 불구하고 2초도 채 안되어 그 방에 있던 사람들이 하나의 박자로 손뼉을 맞추었다. 당신 스스로 한번 시도해보라. 더 작은 집단일지라도 놀라운 결과를 경험할 것이다. 참가자들의 경악은 독립된 대행자들의 활동에서 나오는 응집의 출현에 대해 우리가 얼마나 모르고 있는가를 잘 보여준다.

일정관리 대행자가 당신의 여행 대행자와 상의 없이 계획을 짜기 시작하리라고 말하는 것이 아니다. 그러나 모든 커뮤니케이션과 결정 행위가 이루어지기 위해서 반드시 중앙 권위로 회귀해야만 하는 것은 아니다. 이것은 비행기 예약 시스템 관리에는 좋지 않은 방법이지만 조직과 정부를 관리하는 데는 훌륭한 방식으로 간주되었다. 고도의 상호 커뮤니케이션이 이루어지는 탈중앙화된 구조는 훨씬 더 탄력적이고 생존가능성이 크다. 탈중앙화된 구조는 분명히 더 생존가능성이 크며 시간이 갈수록 진화할 수 있다.

탈중앙화는 오랜 기간 동안 그럴듯한 개념으로 여겨졌지만 실행이 불가능하였다. 천안문 사태에서 확인된 팩시밀리 기계의 효과는 아이러니한 사례이다. 새로운 대중적인 탈중앙화 도구는 정부가 엘리트의 중앙화된 통제의 중요성을 다시 강조하려는 시점에서 그 존재를 드러냈다. 인터넷은 검열을 피해 전지구적 차원의 통신을 가능하게 만든다. 인터넷은 언론자유가 제한되어 있지만 네트워킹이 어디나 잘 갖춰져 있는 싱가포르 같은 장소에서 특히 번성한다.

인터페이스 대행자의 직무는 정보나 조직과 같은 방식으로 탈중심화될 것이다. 육군 지휘관이 정찰병을 보내거나 보안관이 보안대를 보내듯이 당신은 당신을 위해 정보를 모으는 대행자를 급파할 것이다. 대행자는 또 다른 대행자를 파견할 것이다. 이런 과정이 복수화될 것이다. 그러나 이것이 출발하는 방식을 기억하라. 이것은 월드 와이드 웹(WWW) 그 자체에 뛰어드는 것이 아니라 당신이 원하는 것을 위임한 인터페이스에서 시작한다.

미래의 모델은 인터페이스 디자인에 대한 인간공학적 접근(human-factors approach)과는 분명히 다르다. 인터페이스를 보고 느끼는 것은 분명히 중요하지만 지능에 비하면 그다지 중요한 역할은 아니다. 실제로 가장 널리 사용되는 인터페이스는 그를 통해 당신의 목소리가 조그만 마이크로 전달되는 플라스틱이나 금속판에 뚫린 작은 구멍이 될 것이다.

현재 대유행인 모자이크로 인터넷을 브라우징하는 것과는 다른 방식으로 인터페이스 대행자를 판단하는 것 또한 중요하다. 인터넷 해커들은 그 미디어를 잘 타고넘어가면서(surf) 방대한 지식체제를 탐험하고 모든 새로운 형태의 사회화에 골몰한다. 이처럼 놀랍게 널리 퍼져 있는 현상이 감소하거나 사라지지 않겠지만 이는 대행인을 쓰는 것이라기보다 직접 조작하는 것에 더 가까운 하나의 행위 유형에 불과하다.

우리의 인터페이스는 서로 다를 것이다. 당신의 인터페이스―우리들 각각이 좋아하는 정보, 오락 습관, 사회 행위에 기반하여(아주 광대한 디지털 삶의 팔레트에서 끌어온)―는 나의 인터페이스와 다를 것이다.







정보화 시대 이후                  13





인구 통계를 넘어서



산업시대에서 탈산업시대 혹은 정보시대로 변화하는 추세에 대해서는 많은 논의가 이루어졌다. 하지만 정작 탈정보시대로 이전하고 있다는 사실에 대해서는 모르고 지나치는지도 모른다. 아톰이 지배하는 산업시대는 정해진 시간과 공간에서 동일한 방법으로 상품생산을 반복하는 대량생산의 개념이 생겨났다. 이에 반해 컴퓨터시대인 정보시대에는 산업시대처럼 규모의 경제가 적용되기는 하지만 시간과 공간의 규제는 줄어든다. 비트는 언제, 어디서나 생산이 가능하며, 뉴욕, 런던, 도쿄의 증권 시장이 서로 인접하여 있는 생산기계인 것 같이 쉽게 오가며 만들어진다.

정보시대에는 매스미디어가 점차 거대해지는 동시에 작아진다. 시엔엔(CNN)이나 유에스에이 투데이(USA Today) 같은 새로운 방송 방식은 수많은 수용자를 확보함으로써 방송의 폭을 넓힌 사례다. 이에 반해 잡지, 비디오 카세트, 케이블 서비스는 아주 작은 인구 집단을 겨냥한 내로우캐스팅(nar-

row casting)의 대표적인 사례이다. 매스미디어는 성장하면서 동시에 작아지고 있다.

탈정보시대에는 종종 단 한 사람을 수용자로 대하게 된다. 모든 것이 주문에 의해 만들어지고 정보는 극단적으로 개인화된다. 이것이 큰 집단에서 작은 집단으로, 결국에는 개인으로까지 좁아지는 좁은 방송을 추정하는 근거이다. 만약 나의 주소, 결혼 여부, 나이, 수입, 차종, 구매 습관, 음주 성향, 세금 관련 자료를 안다면 당신은 ‘나’라고 하는 인구학적 단위 곧, 나(Me)를 갖는 셈이다.

이러한 생각은 좁은 방송과 디지털 세상 간의 근본적인 차이점을 완전히 놓쳐버린다. 디지털 세상에서 ‘나’(I)는 단순한 통계치가 아니라 ‘나’(Me)이다. ‘나’(Me)는 인구통계학적 의미를 갖지 않는 독특한 정보와 이벤트까지 포함한다. 장모의 거주지, 어제 저녁을 같이 먹은 사람, 오늘 오후 리치몬드행 비행기 출발 시간 등은 좁은 방송 서비스가 활용하려는 통계적 기초 자료와는 아무 관련이 없다.

그러나 나에 관한 독특한 정보는 내가 받아보고자 하는 뉴스 서비스―작은 도시, 별로 유명하지 않은 사람, 버지니아의 오늘 날씨―를 확정하는 데 필수적이다. 고전적인 인구통계는 ‘디지털 개인’(digital individual) 수준까지 척도를 세분하지 않는다. 탈정보시대의 인구통계나 아주 세밀하게 대상을 세분한 좁은 방송은 버거 킹의 선전문 “당신이 드시고 싶은 대로”만큼이나 개성화된다.

‘진정한 개인화’(personalization)가 우리에게 다가오고 있다. 이것은 버섯 요리에 어떤 겨자를 칠 것인가를 선택하는 정도의 기호의 문제가 아니다. 탈정보화 시대는 이미 우리 곁에 와 있다. 컴퓨터가 개인을 이해하는 정도는 개인의 특성(항상 푸른색 줄무늬 셔츠를 입는다든가)이나 완전히 무작위적인 사건, 선과 악, 사소한 삶의 태도 등 우리가 다른 사람에게 기대하는 섬세한(어쩌면 그보다 더 높은) 수준까지 도달하고 있다.

예를 들어보자. 컴퓨터는 술가게의 컴퓨터로부터 정보를 수집해서 당신이 관심을 갖고 있는 샤르도네이 백포도주나 맥주가 바겐세일 중이니 신경을 쓰라고 주의를 환기시킨다. 내일 저녁 식사에 초대할 손님이 지난번 식사 때 무슨 술을 좋아했는지 알고 있기 때문이다. 당신이 운전중인 차에서 컴퓨터는 당신에게 현위치에서 가까운 차고에 주차시켜야 한다고 경고할 수도 있다. 왜냐하면 컴퓨터는 이 차의 타이어를 지금 교환해야 한다는 사실을 파악했기 때문이다. 당신이 10일 안에 어떤 도시를 방문할 계획이라면 과거의 당신 취향을 고려하여 새로운 식당에 대한 일람표를 모을 수도 있다. 이들 사례는 모두 특정 상표의 비누나 치약을 구입할 집단에 소속된 한 사람이 아니라 개인으로서의 당신이라는 모델에 기초하고 있다.




공간 없는 장소



하이퍼텍스트가 인쇄된 책의 페이지를 없앤 것과 마찬가지로 탈정보사회는 지리적 한계(limitations of geography)를 없앨 것이다. 디지털 삶은 시간과 공간에 대한 의존도를 점차로 줄이며, 장소 자체까지 전달할 수 있는 경지에 이르렀다.

보스턴의 거실에 앉아 전자 창문을 통해 스위스의 알프스를 바라보며, 젖소의 목에서 울리는 방울 소리를 듣고, 여름날의 (디지털) 건초 내음을 맡을 수 있다고 상상해 보라. 아톰(자동차)을 몰아 시내의 일터로 가는 대신 사무실에 접속하여 전자적으로 업무를 수행할 경우 나의 작업장은 과연 어디인가?

미래에는 통신과 가상현실 기술 덕분에 휴스턴에 있는 의사가 알래스카에 거주하는 환자를 수술한다. 그러나 근 미래 뇌전문의사는 환자와 함께 수술실에 있어야 할 것이다. 많은 활동이 이른바 지식노동자와 마찬가지로 시공간의 제한에서 벗어나게 될 것이다.

오늘날 작가나 자금 관리자들은 카리브해나 남태평양에 거주하면서 작품을 구상하거나 자금을 관리한다. 이것이 훨씬 더 실용적이고 매력적이다. 그러나 일본 같은 나라에서는 토착 문화가 이런 추세에 저항하기 때문에 시간이 좀더 지나야 시간과 공간의 제약에서 벗어날 수 있을 것이다(일본이 여름철에 서머 타임을 실시하지 않는 주요한 이유는 ‘해가 진 후에’ 집으로 돌아가야 한다는 생각과 근로자들은 상사가 퇴근한 다음에 회사를 떠나야 한다는 관습 때문이다).

탈정보사회에서는 여러 장소에서 거주하거나 일할 수 있기 때문에 ‘주소’(address)의 개념이 달라진다.

아메리카 온라인, 컴퓨서브(CompuServe), 프로디지(Prodigy)에 계정을 갖고 있을 경우 당신의 전자우편 주소는 알지만 그것이 존재하는 물리적 장소는 알 길이 없다. 아메리카 온라인을 예로 들면 당신의 인터넷 주소는 전세계 어디에서나 사용할 수 있는 ID@aol.com이 될 것이다. 당신이 ID@aol.com이 어디에 있는지 모르는 것과 마찬가지로 그 주소로 메시지를 보내는 다른 사람들도 당신이 어디에 있는지 모른다. 주소는 거리의 위치를 가리키지 않는다. 전자 주소는 사회보장번호 같은 것이다. 그것은 가상 주소이다.

나는 내 주소지 @hq.media.mit.edu가 물리적으로 어디에 있는지 안다. 그것은 바로 내 사무실 옆방에 설치된 10년 된 휴렛패커드사의 유닉스 기계에 들어 있다. 그러나 사람들이 나에게 메시지를 보낼 때 그들은 그 방이 아니라 나에게 보낸다. 그들은 내가 보스턴(그렇지 않을 때가 많다)에 있으리라 추측한다. 사실 나는 종종 시간대가 다른 장소에 있다. 그래서 공간뿐만 아니라 시간도 역시 변화하는 것이다.




비동시적인 것



얼굴과 얼굴을 맞대고 하는 이야기나 전화 대화는 동시적(synchronous)으로 실시간에 이루어진다. 전화추적장치(telephone tag)는 쌍방간에 동시성을 확보하기 위한 게임이다. 아이러니하게도 동시성을 요구하지 않는 교환, 실시간이 아닌 메시지 전송을 위해 이것이 쓰여지고 있다. 역사적으로 볼 때 편지와 같은 비동시적 통신은 즉흥적인 면(off-the-cuff)보다 형식을 중시하는 교환 방식이었다. 음성우편과 자동응답 기계가 이런 경향을 변화시키고 있다.

나는 응답 기계나 음성우편이 없는 사무실에서는 우리 모두가 도저히 살 수 없으리라고 주장하는 사람을 만난 적이 있다. 응답 기계의 효용은 음성이 아니라 오프라인(off-line) 처리와 시간 변환(time shifting)에서 나온다. 그것은 메시지를 남기는 것과 불필요한 온라인 토론에 사람을 붙잡아놓는 것 간의 차이이다. 사실 응답 기계는 다소 퇴행적이다. 응답 기계는 당신이 자리에 없을 때나 그곳에 있고 싶지 않을 때도 반드시 켜져 있어야 할 뿐만 아니라 매번 전화에 응답해야 하고, 전화 건 사람에게 간단한 메시지를 남길 기회를 제공해야 한다.

전자우편은 전화처럼 방해받지 않기 때문에 아주 매력적이다. 여가를 즐기는 중에도 처리할 수 있기 때문에 전화를 받는 회사 비서의 철통 같은 방어선을 뚫고 메시지에 응답할 수 있다.

전자우편은 비동시적인 동시에 컴퓨터로 읽을 수 있기 때문에 폭발적인 인기를 누리고 있다. 인터페이스 대행자가 우선성(to prioritize)에 입각해서 차별적으로 메시지를 보낼 때 비트를 사용하기 때문에 컴퓨터 가독성이 특히 중요하다. 누가 메시지를 보냈고, 내용이 무엇인가에 따라 당신이 볼 순서가 결정된다. 인터페이스 대행자는 당신의 여섯 살짜리 아이의 전화는 연결하고, 엑스와이제트(XYZ)사 최고 경영자의 전화는 잠시 대기토록 처리하는 등 현재의 비서와 똑같은 역할을 수행한다. 업무가 많은 날임에도 불구하고 사적인 용도의 전자우편이 우선순위 1위에 오를 수도 있다.

대부분의 커뮤니케이션은 동시, 혹은 실시간으로 이루어지지 않아도 괜찮다. 우리는 지속적으로 시간 사용을 방해받고 있으며 일하는데 시간을 엄수해야 한다는 압력을 받는다. 그러나 그런 일들이 사실은 꼭 바로 즉각 실행해야 하는 것이 아닌 경우가 대부분이다. 저녁 식사를 8시 59분에 끝냈기 때문이 아니라 텔레비전 프로그램이 1분 후에 시작된다는 이유로 틀에 박힌 리듬을 따르도록 강요받는다. 우리의 증손자들은 정해진 시간에 배우들이 집단으로 공연하는 것을 즐기려고 극장에 가는 행위는 이해하겠지만 다른 사람과 동시에 똑같은 텔레비전 신호를 체험하는 행위는―그 뒤에 숨은 기괴한 경제 모델을 이해하기 전까지는―이해하지 못할 것이다.




주문을 주문하기



디지털 생활에서는 실시간 방송이 거의 없을 것이다. 디지털로 방송되면 비트는 쉽게 시간을 변환할 수 있다. 또한 비트는 사용 시점에서 전송 당시와 같은 비율(속도)이나 순서로 받을 필요도 없다. 예를 들어 1시간짜리 비디오는 광섬유를 통해 1초 안에 전송될 수 있다(최근의 실험에서는 브이에치에스 화질의 1시간짜리 비디오를 1/100초 정도에 전송하였다). 반면에 가는 선이나 협대역 라디오 전파(narrow radio frequency)를 사용하면 10분짜리(개인화된) 비디오 뉴스를 전송하는 데 밤새 6시간의 방송 시간이 필요하다. 광섬유는 비트를 당신의 컴퓨터에 일시에 쏟아붓는데 반해, 전파를 사용하면 물방울처럼 졸졸 흘러든다.

스포츠와 선거 등 예외적 경우를 제외하면 기술 발전에 따라 미래의 텔레비전과 라디오방송은 비동시적으로 전달될 것이다. 이것은 즉석 주문이나 ‘브로드캐칭’(broadcatching:1987년에 스튜어트 브랜드 Stewart Brand가 미디어랩에 관한 그의 책에서 처음 쓰기 시작한 신조어)을 사용하여 이루어진다. 브로드캐칭은 비트 줄기를 방출하는 것으로서 광대한 양의 정보를 공중파나 광섬유로 발사한다. 수신 쪽에서는 컴퓨터가 비트를 받아 검사한 후 당신이 쓸 것만 남기고 나머지는 모두 버린다.

앞으로 주문형(on-demand) 정보가 디지털 생활을 지배할 것이다. 우리는 원하는 것을 원하는 시간에 요구할 수 있다. 이것은 광고 지원을 받는 프로그램의 생존에 대해 근본적인 검토를 요구한다.

1983년 미디어랩이 출범할 당시 사람들은 ‘미디어’라는 단어를 미국 문화의 기층 집단으로 전달되는 일방 통로를 지칭하는 경멸적인 용어로 사용하였다. 대문자 엠(M)으로 쓰여진 미디어(Media)는 대부분 ‘매스미디어’(mass me-

dia)를 의미했다. 대규모 청중이 엄청난 광고 수입을 보장하기 때문에 많은 예산을 들여 프로그램을 제작하였다. 주파수는 공공 재산이기 때문에 정보와 오락이 시청자에게 ‘무료로’(free) 제공되어야 한다는 개념을 근거로 ‘공중파’(over-the-air) 매스미디어에서 광고가 정당화되었다.

잡지는 사적인 배포망을 사용하기 때문에 광고주와 독자가 공동으로 비용을 부담한다. 대표적인 비동시 매체인 잡지는 훨씬 광범위한 경제적 인구통계 모델을 제공하는데, 사실상 이것이 미래의 텔레비전을 선도하게 될 것이다. 특정화된 시장(niche markets)으로 갈라져 들어가면서 내용이 세분화되고 구독자에게 비용이 전가된다. 특수 잡지에는 광고가 전혀 실리지 않는다.

미래의 디지털미디어는 선택의 여지 없이 모든 것을 받아보는 대신에 필요한 것만 주문하는 ‘보는 만큼 지불’(pay-per-view)하는 형식으로 변한다. 미래의 미디어는 광고주와 비용을 분담하는 신문이나 잡지처럼 된다. 어떤 경우에는 소비자가 광고가 붙지 않은 물건을 비싼 값에 구입하는 옵션을 선택해야 할지도 모른다. 다른 경우에는 광고가 개인화되어 뉴스와 구분하기 힘들게 될 것이다. 광고는 뉴스가 된다.

오늘날의 미디어 경제 모델은 정보와 오락을 일반 대중에게 ‘밀어내는’(pushing) 방식에 전적으로 의존한다. 미래 모델에서는 ‘끌기’와 ‘밀기’가 같은 비중이거나 아니면 ‘끌기’(pulling)가 훨씬 중시될 것이다. 오늘날 비디오 대여점에서 비디오를 빌리고 돈을 내는 방식과 똑같이 망에 접속하고 계산을 치르게 된다. 이러한 거래는 당신이 특정한 정보를 요구함으로써 명시적으로 일어나거나, 전자 대행자가 당신 대신에 어떤 정보를 요구함으로써 묵시적으로 이루어진다.

광고 없는 주문 모델에서는 할리우드 영화와 유사한 방식으로 내용이 만들어진다. 이 방식은 위험이 크지만 보상도 큰 방식이다. 엄청난 실패와 굉장한 성공이 교차할 것이다. 만들어라, 그러면 사람들이 몰려올 것이다. 사람들이 몰려오면 성공할 것이고, 그렇지 않으면 망할 것이다. 그러나 프록터 앤 갬블(Procter & Gamble)이 반드시 위험을 보증하지 않아도 된다. 이런 의미에서 미디어 회사는 오늘보다 내일을 위해 주사위를 던진다. 그러나 작은 주사위를 굴리면서 낮은 시청자 점유율에 만족하는 소액 도박꾼도 있을 것이다.

프라임 타임의 주인은 새로 나온 고급 자동차나 접시 세척기의 세제를 구입할 능력이 있는 인구 집단이나 계층에 의해서가 아니라 우리들 각자의 안목에 의해 선택될 것이다.








프라임타임은 나의 시간            14





대여용 비트



많은 사람들이 주문형 비디오(VOD:video-on-demand)가 정보고속도로를 재정적으로 뒷받침할 강력한 응용 모델이라고 믿는다. 그 이유는 다음과 같다. 비디오 대여점이 4,000개의 테이프를 갖고 있다고 치자. 전체 비디오 테이프의 5%가 총 대여 횟수의 60%를 차지한다. 이 5%에 해당하는 비디오는 최근에 출시된 것이다. 새로 출시된 비디오 복사본이 많을수록 비디오 대여점의 대여물 가운데 이들은 많은 부분을 차지할 것이다.

이러한 비디오 대여 관습을 연구한 후 전자 주문형 비디오 시스템을 구축하려면 상위 5%에 해당하는 비디오, 곧 신작 출시물만 우선적으로 제공하면 된다는 간단한 결론에 도달한다. 아주 손쉽고 편한 방식이다. 이 같은 사실은 주문형 비디오를 시험적으로 운영하는 과정에서 확실하게 입증되고 있다.

그렇지 않고 1990년까지 미국에서 제작된 영화를 모두 디지털화하기에는 돈이 너무 많이 든다. 의회 도서관의 25만 개에 달하는 영화―유럽 영화, 인도 영화 수만 개, 멕시코 텔레비자(Televisa)가 만든 1만 2,000시간분의 영화, 텔레노벨라스(telenovelas)는 제외하고라도―를 디지털화하려면 더 많은 시간이 소요될 것이다. 그런데 여전히 의문이 남는다. 우리 가운데 대다수가 정말로 상위 5%에 해당하는 영화만 보려 할까? 이러한 집중 현상은 아톰을 분배하는 구식 기술에 의해 추진되고 있지는 않은가?

미국의 비디오 테이프 대여 전국 체인점인 블록버스터(Blockbuster)는 창업자이자 전 회장인 후이젱가(H. Wayne Huizenga)의 사업 기반에 힘입어 1994년에 500만 평방 피트에 이르는 600개의 새로운 점포를 개장했다. 그는 8,700만 미국 가정이 15년 동안 브이시알에 300억 달러나 돈을 쏟아부었고 할리우드도 그에게 비디오 카세트를 파는데 그 정도 규모의 시장을 갖고 있기 때문에 주문형 비디오 사업에 섣불리 발을 들여놓지 않겠다고 소리쳤다.

독자들은 어떨지 모르지만 나는 브이시알을 내일이라도 당장 내다버릴 생각이다. 나는 아톰을 빌리는 방식(종종 ‘비열한 네트’ sneaker net로 불리는)과 비트를 전송받는 방식(돌려줄 필요도 없고 선금을 내지 않아도 되는) 간의 차이를 중시한다. 블록버스터와 새로운 소유주 바이아콤(Viacom)을 평가해 볼 때 비디오 대여점 사업은 10년 안에 설 땅이 사라질 것이다.

후이젱가는 페이퍼뷰(pay-per-view) 텔레비전도 아직 작동하지 않고 있는데 왜 주문형(on-demand) 텔레비전을 고려해야 하느냐고 따진다. 그러나 비디오 대여가 바로 페이퍼뷰이다. 실제로 블록버스터의 성공은 페이퍼뷰가 돈이 된다는 사실을 증명한다. 이들 간의 유일한 차이는 당분간 아톰을 대여하는 비디오 대여점이 대여 비트 메뉴보다 검색하기에 좀더 쉽다는 점이다. 그러나 이러한 사실 또한 급격하게 변화하고 있다. 전자 검색방법이 창조적인 대행자 기반 시스템(imaginative agent-based systems)의 도움으로 더 산뜻하게 발전하면 블록버스터와 달리 주문형 비디오는 몇천 개의 선택폭에 제한되지 않고 문자 그대로 무제한의 선택폭을 허용할 것이다.


언제, 어디서나, 무엇이나 볼 수 있는 텔레비전



세계 유수의 전통 깊은 전화회사의 총수들은 ‘무엇이든, 언제든, 어디서든’(AAA:anything, anytime, anywhere)이라는 구절을 현대의 이동성을 찬양하는 시구처럼 되뇌이곤 한다. 그러나 그것이 시의적절하지 않고 중요하지도 않으며, 즐겁지도, 적합하지도 않고 내 상상력을 자극하지도 못할 것이라면 나는(아마도 여러분들도 같을 것으로 생각한다) ‘아무것도 아닌, 결코 이루어지지 않은, 아무 곳에도 없는’(nothing, never, nowhere)을 선택할 것이다. 에이에이에이(AAA)는 통신 패러다임의 냄새를 풍긴다. 그러나 에이에이에이는 텔레비전을 생각하는 아주 훌륭한 방식이기도 하다.

수천 개의 텔레비전 채널에 대한 이야기를 들을 때마다 우리는 위성을 제외하고도 하루에 이미 1,000개 이상의 프로그램을 집에서 받고 있다는 사실을 잊어버린다. 프로그램은 시간 제한없이 한꺼번에―그리고 한가하게―전송된다. 새터라이트 티브이 위크(Satellite TV Week)에 열거된 150개 이상의 채널을 포함하면 하루에 2,700개가 넘는 프로그램이 전송된다.

전송된 모든 프로그램을 녹화한다면 정보고속도로의 야심찬 발상이 제시하는 선택 가능성의 5배가 넘는 프로그램을 갖게 되는 셈이다. 전송된 모든 프로그램을 보유하는 대신에 장래의 특정 시간에 볼 수 있도록 흥미 있는 1~2개 프로그램을 선별하는 텔레비전 대리인이 있다면 어떨까?

이제 에이에이에이 텔레비전을 지구 전체의 1만 5,000개 텔레비전 채널로 확장하면 양과 질에서 매우 재미있는 변화가 일어난다. 어떤 미국인은 스페인어를 공부하기 위해 스페인 텔레비전을 볼 것이고, 또 다른 사람들은 독일의 무편집 누드 프로그램(뉴욕 시간으로 오후 5시)을 보기 위해 스위스의 케이블 텔레비전 11에 채널을 맞추고, 200만 그리스계 미국인은 그리스의 3개 전국 채널과 7개 지역 채널 가운데 하나를 재미있게 볼 것이다.

더 흥미로운 사실은 영국이 서양장기 챔피언 선발전을 중계하는 데 일년에 75시간을 할애하고, 프랑스는 프랑스 자전거 경주(Tour de France)에 한 번에 8시간을 할애한다는 점이다. 미국의 장기광이나 자전거 마니아들은 언제, 어디서나 이들 행사를 즐겨 볼 것이다.




오막살이 텔레비전



터키의 서남 해안을 방문하고 싶어지면 보드럼(Bodrum)의 문서를 찾지 않고 내셔널 지오그래픽이나 피비에스(PBS), 비비시(BBC), 그외의 다른 수백 개 정보원(sources)에서 목선 제작법, 밤낚시, 수중 골동품, 바바 가누즈(baba ghanouj), 영화 속에 나오는 동방의 카펫 항목을 뒤질 것이다. 이들 영화 조각들을 한데 엮어 이야기를 구성하면 내가 원하는 특별한 목적을 이룰 수 있다. 오스카 최우수 다큐멘터리상을 받을 정도야 안되겠지만 문제는 그것이 아니지 않는가.

주문형 비디오는 아주 따분한 인포머셜(infomercial)조차 다큐멘터리를 위한 훌륭한 자료로 제공한다. 디지털 텔레비전 대행자는 마치 교수가 서로 다른 책과 여러 잡지의 논문에서 끌어모은 글들로 선집(anthology)을 조합하듯이 영화를 편집한다. 저작권 변호사들이여, 안전 벨트를 단단히 졸라매기 바란다.

네트(Net)에서는 모든 사람이 무면허 텔레비전 방송국을 열 수 있다. 1993년에 미국에서는 캠코더가 350만 대 팔렸다. 가정에서 만든 모든 영화가 황금시간대를 장식하는 작품일 수는 없다(하느님 감사합니다). 그러나 이제 우리는 매스미디어를 고가치, 전문 텔레비전 이상의 것으로 생각할 수 있다.

통신회사 중역들은 가정에 광대역망(broadband)이 공급될 필요가 있음을 이해한다. 그들의 주장에 따르면 수신측에서는 동일한 용량의 채널을 가질 수 없다. 이러한 비대칭성(asymmetry)은 높은 주파수대역으로 가정에 공급되고 낮은 주파수 대역으로 송신측으로 되돌아가는 인터랙티브(interactive) 컴퓨터 서비스의 경험을 통해 정당화된다. 그 이유는 예를 들자면 대부분의 사람들이 읽는 속도보다 훨씬 느리게 입력하고, 그리는 속도보다 훨씬 빨리 이미지를 인식하기 때문이다.

비디오 서비스에서는 이러한 비대칭성이 통용되지 않는다. 비디오 서비스 채널에는 양방향이 필요하다. 원격회의―할아버지, 할머니, 이혼 가정, 후견권이 없는 부모를 위한 꽤 쓸모있는 소비자 미디어로 부상할 원격회의―가 이에 대한 명백한 증거이다.

그것은 살아 있는 비디오이다. ‘죽은’(dead) 비디오를 생각해 보라. 오늘날 미국에서 운영되는 57만 개의 컴퓨터 게시판처럼 머지않아 개인이 전자 비디오 서비스를 운영할 것이다. 이것이 바로 미래 텔레비전의 모습이다. 처음엔 인터넷 비슷한 모습으로 시작되지만 조만간 수많은 정보 제작자의 개미군단에 의해 대중화될 것이다. 몇 년 안에 당신은 줄리아 차일드(Julia Child)나 모로코 주부에게서 쿠스쿠스(couscous) 만드는 법을 배우게 될 것이다. 당신은 로버트 파커(Robert Parker)나 부르군디 출신 포도주 상인의 도움을 빌어 입맛에 맞는 와인을 찾을 것이다.




축소되는 지구 위상학



현재 우리는 가정으로 들어가는 네 개의 전자 통로를 가지고 있다. 전화, 케이블, 위성, 공중파가 그것이다. 이들의 차이점은 서로가 서로에 대해 경제성 있는 경쟁 대체 모델이라는 점에 있는 것이 아니라 오히려 서로의 위상 차이에서 찾아진다. 내가 미국 대륙의 모든 가정에 동일한 비트를 동시에 전송하려면 동부에서 서부 해안까지 커버할 수 있는 인공위성을 사용해야 한다. 이것은 미국 내의 2만 2,000개 전화 교환소에 비트를 보내는 방식과 비교할 때 가장 합리적인 위상이다.

지역 뉴스나 광고를 할 경우에는 지상 공중파 방송이 적당하고, 케이블 텔레비전이라면 더 좋은 효과를 낳는다. 전화는 한 지점과 다른 한 지점을 연결하는 데 가장 적합하다. 순전히 위상의 관점에서 어떤 미디어를 사용할까를 결정할 때 ‘슈퍼볼’(Super Bowl)은 위성으로, 월 스트리트 위크(Wall Street Week)의 개인판(personalized version)은 전화망으로 전달하는 것이 좋을 것이다. 전송 경로―위성, 지상 공중파 방송, 유선방송, 전화―는 비트의 종류에 따라 결정될 것이다.

그러나 ‘현실 세계’(real world)에서는 사람들이 (마치 내가 비현실적 세계에 사는 것처럼) 내게 즐겨 말하듯이 유효 탑재량을 늘리려는 욕심 때문에 각 채널을 가장 부적절하게 사용한다.

예를 들어 몇몇 정지 위성 사업자는 지상에 기반을 둔 지점 대 지점(point-to-point) 네트워크 서비스를 고려하고 있다. 이것은 다도해나 내용 검열처럼 지리적 장애나 정치적 장애를 극복하려는 경우가 아니라면 전화망의 효율과 비교해 볼 때 정말로 가망 없는 발상에 불과하다. 마찬가지로 슈퍼볼 게임을 지상 케이블이나 전화 시스템으로 전송할 경우 모든 사람에게 동시에 비트를 전달하기에는 많은 어려움이 따른다.

일의 추진 속도는 더디지만 앞으로 비트는 가장 적합한 시간에 가장 적당한 채널을 통해 전송될 것이다. 작년에 거행된 슈퍼볼 게임을 보고자 할 경우 (어떤 방송국에서 이를 재방송하기를 기다리는 지금의 방식과 달리) 전화 주문이 가장 합당한 방법이다. 게임이 끝나 슈퍼볼이 보관용 데이터로 바뀌면 그것을 전달하는 데 가장 적합한 채널도 ‘생방송’일 때와는 아주 달라진다.

각각의 전달 채널은 그 자체의 결함을 갖는다. 위성을 사용하여 뉴욕에서 런던으로 메시지를 보낼 경우 신호가 여행하는 거리는 같은 방식으로 뉴욕에서 뉴와크로 보내는 경우에 비해 단지 5마일 정도가 길다. 이러한 사실은 동일한 위성을 사용하여 전화 통화를 할 경우 메디슨에서 파크 애비뉴에 통화하는 것이나 타임 스퀘어에서 영국의 피카디리 서커스에 통화하는 것이나 비용이 똑같음을 의미한다.

광섬유로 비트를 전송할 때도 가격에 대해 이와 유사한 고려가 필요하다. 광섬유 한 가닥으로 뉴욕에서 로스앤젤레스까지 비트를 장거리 전송하는 것이 시외 전화회사의 모세관 같은 연결 시스템을 통해 전달하는 것보다 비용이 많이 들지 적게 들지 불분명하다.

디지털 세계에서 거리는, 갈수록 그 의미를 잃어간다. 실제로 인터넷 사용자는 서로간의 거리를 완전히 잊고 있다. 인터넷에서 거리는 정반대의 기능을 하는 것처럼 보인다. 시간대가 다르면 내가 자고 있는 동안에 다른 사람이 답장을 쓸 수 있기 때문에 가까운 거리에 있는 곳보다 먼 거리에 있는 곳에서 더 빨리 답장을 받는 경우가 종종 있다. 그래서 마치 그곳이 더 가깝게 느껴지기도 한다.

오락 세계에서 인터넷을 닮은 전송 시스템이 일반적으로 사용되면 지구에는 하나의 미디어만 존재하게 될 것이다. 이동식 위성 접시 안테나를 갖춘 가정은 이미 지정학적 경계를 넘어 폭넓게 프로그램을 즐기고 있다. 문제는 이러한 경향에 어떻게 대응하는가에 달려 있다.




자신을 스스로 느끼는 신호



텔레비전이 쏟아내는 엄청난 양의 프로그램을 관리하는 최선책은 모든 프로그램을 자신이 직접 다루지 않고 그 일을 대행인에게 맡기면 된다.

미래의 컴퓨터가 사람처럼 비디오에 나오는 대화를 이해할 수 있게 된다 하더라도 향후 30년 동안 기계가 이해하는 비디오 내용은 자동입출금기가 얼굴을 인식하는 것처럼 아주 특정한 영역에 국한될 것이다. 이것은 비디오를 보고 사이펠드(Seinfeld)가 여자 친구를 잃었음을 이해하는 컴퓨터를 갖는 것과 같다. 따라서 중심어, 내용에 관한 데이터, 전후 맥락 참조에 관한 설명을 담고 있는 비트가 필요하다.

다음 몇십 년 안에 다른 비트에 대한 설명, 내용 목차, 색인, 요약을 담고 있는 비트가 디지털 방송에서 급격하게 증가할 것이다. 이들 비트는 (현재의 폐쇄 캡션 closed captions처럼) 출시 당시에 삽입되거나 아니면 기계를 통해 그 이후에(시청자나 방송 해설자에 의해) 삽입될 것이다. 많은 헤더 정보를 가진 비트의 행렬은 컴퓨터로 하여금 방대한 양의 정보를 처리하기 용이하게 하여 당신을 편리하게 해 줄 수 있다.

미래의 브이시알은 내가 집에 돌아오면 이렇게 말할 것이다. “니콜라스, 외출중에 텔레비전을 5,000시간 보았는데, 그 가운데 6개 부분을 총 40분 녹화하였습니다. 당신의 고등학교 동창이 투데이 쇼에 출연했고 도드칸스 섬에 관한 다큐멘타리를 녹화해 놓았습니다.” 브이시알은 헤더를 보고 이러한 일을 수행할 것이다.

이러한 헤더는 광고에서도 아주 잘 운용될 것이다. 새로운 자동차 시장에 가면 금주의 자동차 광고들만 스크린에서 볼 수 있다. 자동차 회사들은 지역, 지방, 전국 정보를 헤더에 집어넣어 이웃에 있는 딜러의 재고 처분 세일을 광고에 의무적으로 집어넣을 것이다. 이것은 케이블 텔레비전의 쇼핑 채널인 큐브이시(QVC)처럼 지르코니움(zirconium) 반지나 소개하는 것이 아니고 당신이 진정으로 원하는 물건만 파는 쇼핑 채널로 확장될 수 있다.

비트에 관한 비트는 방송을 완전히 바꾸어놓는다. 비트에 관한 비트는 재미있는 것을 선택하는 조정관인 동시에 원하는 구석 구석의 모든 사람에게 그 프로그램을 전달하는 수단을 네트워크에 제공한다. 네트워크는 결국 네트워킹이 무엇인가를 배울 것이다.



네트워크와 네트워크



텔레비전과 컴퓨터 네트워크는 서로 상반되는 구조를 가지고 있다. 텔레비전 네트워크는 신호가 발생되는 하나의 발신원(source)과 신호를 받아들이는 수많은 동종의 수신기(sink)로 구성되는 위계적 분배구조를 가지고 있다.

한편 컴퓨터 네트워크는 모든 사람이 신호 발신자와 수신자로 행동할 수 있는 이질적인 처리장치(heterogeneous processors)의 망이다. 텔레비전과 컴퓨터 네트워크는 서로 완전히 다르기 때문에 설계자들이 쓰는 말까지 다르다. 이슬람 근본주의자와 이탈리아 가톨릭 신자 간의 관계처럼 한쪽의 근본적 원리가 다른 한편에게는 논리적인 선택의 문제가 된다.

예를 들어 인터넷을 통하여 전자우편물을 보낼 경우 메시지는 패킷(pack-

et)과 주소 헤더로 분해되어 여러 가지 다양한 경로로 보내진다. 헤더의 정보에 뺄 것은 빼고 더할 것은 더하는 다양한 매개 처리장치를 거쳐 다른 한쪽 단말(end)에서 메시지를 재정리하고 조합한다. 이 마술적인 과정은 각 패킷이 비트에 관한 비트를 지니고 있고, 각 처리장치가 메시지 그 자체로부터 메시지에 관한 정보를 끌어내는 수단을 갖고 있기 때문에 가능하다.

비디오 기술자가 디지털 텔레비전을 다룰 때 그들은 컴퓨터 네트워크 디자인에서 아무런 교훈도 얻지 못했다. 그들은 이질적인 시스템과 정보를 담고 있는 헤더의 유연성을 무시하였다. 그 대신에 그들 내부에서 해상도, 프레임 비율, 화면 비율, 인터페이스―이들을 그냥 변화하도록 내버려두지 않고―에 관해 토론하였다. 텔레비전 방송 원칙(doctrine)은 아날로그 세계의 모든 독단(dogma)을 품에 안고 있다. 텔레비전 방송은 개방 구조, 성능 향상성과 상호 작동성 같은 디지털 원칙을 거의 갖고 있지 않다. 이런 사태는 결국에는 변하게 되겠지만 아직까지 변화는 매우 느리게 진행되고 있다.

변화의 대행자는 인터넷 모델이다. 인터넷은 대량으로 퍼져나가는 세계적인 네트워크다. 뿐만 아니라 그 형태를 유지해온 책임 있는 설계자조차 분명치 않은 채 마치 오리떼가 무리를 짓듯이 발전해왔다. 지도자가 없는데도 모든 개체들은 놀라울 정도로 잘 조직되어 있다.

아무도 인터넷 사용자 수를 모른다. 왜냐하면 인터넷은 네트워크의 네트워크이기 때문이다. 1994년 10월에 4만 5,000개의 네트워크가 인터넷에 연결되었다. 400만 이상의 호스트 (일사분기마다 20%씩 증가)가 연결되어 있었지만 사용자 수를 추산하는 데 도움이 되는 척도는 아니다. 프랑스의 미니텔(Minitel) 같은 공공 게이트웨이(public gateway) 기계 하나가 인터넷에 800만 잠재 사용자를 추가할 수 있기 때문이다.

메릴랜드 주는 이탈리아의 볼로냐처럼 전체 주민들에게 인터넷을 제공한다. 물론 모든 사람이 인터넷을 사용하지는 않는다. 1994년의 인터넷 사용자는 2,000만에서 3,000만 명 정도로 추산된다. 나는 2000년에 10억의 인구가 인터넷을 사용할 것으로 추측한다. 이것은 1994년 3/4분기에 가장 빨리 성장한 인터넷 호스트가 아르헨티나, 이란, 페루, 이집트, 필리핀, 러시아 연방, 슬로베니아, 인도네시아라는 사실에 근거한다. 위에 든 모든 나라가 석 달 동안에 100%의 성장률을 보였다. 네트(Net)라는 애칭으로 불리는 인터넷은 더 이상 북미만의 전용물이 아니다. 전체 호스트 가운데 35%가 다른 지역에 있으며, 또한 그 지역에서 가장 빠르게 성장하고 있다.

나는 일년 내내 매일같이 인터넷을 쓰고 있지만 나 같은 사람은 네트에서 겁쟁이로 취급된다. 나는 인터넷에서 전자우편만 주로 사용한다. 더 재치 있고 시간이 많은 사용자들은 쇼핑몰에서 상점을 드나들듯이 네트 주위를 돌아다닌다. 문자 그대로 안장 없는 말(금속에 가까운)을 타고서 이 기계에서 저 기계로 다니면서 모자이크 같은 도구를 사용하여 윈도우 쇼핑을 한다. 또한 실시간으로 진행되는 토론 그룹이나 머드(MUDs:multi-user dun-

geons, 1979년에 만들어진 용어, 어떤 사람은 이 이름―dungeons은 지하감옥이라는 뜻―에 당혹해하며 이것을 ‘다중 사용자 구역’ multi-user-domains이라고 주장할 것이다)에 참여할 수 있다. 머드의 새로운 형태는 무(MOO:MUD object-oriented)이다. 실제로 머드와 무는 집과 작업장이 아닌 ‘제3의 장소’이다. 어떤 사람은 거기에서 하루에 8시간을 보낸다.

2000년까지는 보다 많은 사람들이 오늘날 우리가 네트워크라고 부르는 것을 보고 있기 보다는 인터넷을 즐기는 편이 될 것이다. 인터넷은 머드나 무(이것은 1990년대의 디지털 형식으로 1960년대의 우드스탁Woodstock과 아주 비슷하다) 이상으로 발전할 것이고 더 넓은 분야의 오락을 제공할 것이다.

인터넷 라디오(Internet Radio)는 미래의 선도자이다. 그러나 인터넷 라디오는 빙산의 일각에 불과하다. 왜냐하면 아직까지 이것은 ‘이 주일의 괴짜’(Geek of the Week)라는 토크 쇼에서 보듯이 컴퓨터 해커와 같은 특수한 부류에게 전달되는 좁은 방송에 머물러 있기 때문이다.

인터넷 사용자 공동체는 일상 생활의 주요 흐름이 될 것이다. 인터넷의 인구통계는 세계 전체의 인구통계에 점점 더 가까워질 것이다. 프랑스의 미니텔과 미국의 프로디지를 통해 우리가 확인한 것처럼 네트워크의 가장 큰 단일 어플리케이션은 전자우편이다. 네트워크의 진정한 가치는 정보보다는 공동체(community)에 있다. 정보고속도로는 미국 의회 도서관의 모든 책에 접근하는 지름길 이상의 것이다. 그것은 완전히 새로운 전세계적 사회 조직을 만들고 있다.








행복한 연결                       15





디지털 세상은 충분하지 않다



당신이 이 페이지를 읽을 때 눈과 두뇌는 인쇄매체를 당신이 처리하고 인식할 수 있는 의미를 가진 글자와 단어라는 신호로 변환시킨다. 이 페이지를 팩시밀리로 보낼 경우 팩시밀리의 스캐너가 잉크가 묻은 부분과 묻지 않은 부분을 0과 1로 처리하여 정교한 줄 그림(line-by-line map)을 그릴 것이다. 페이지에 대한 디지털 이미지의 충실도는 그것을 얼마나 잘 훑어내는가(scanned)에 달려 있다. 그러나 팩시밀리가 텍스트를 아무리 잘 훑어내더라도 팩시밀리의 최종본은 해당 페이지의 그림에 불과하다. 그것은 글자나 단어가 아니다. 그것은 픽셀의 모음이다.

컴퓨터가 그 이미지의 내용을 해석하려면 당신과 동일한 인식 과정을 거쳐야 한다. 먼저 픽셀로 만들어진 조그만 영역을 글자로 바꾼 다음 그것을 다시 단어로 바꾸어야 한다. 이 과정에는 커피 얼룩과 그림의 차이를 구분하고, 잡음(noise)이 낀 텍스트에서 낙서를 분리하여 글자 오(O)와 숫자 영(0)을 구분하고 스캐닝(scanning)과 처리 과정에서 발생한 티를 처리하는 부수적 문제가 따른다.

이러한 작업이 끝나면 디지털 표현은 더 이상 이미지가 아니라 정보 교환을 위한 글자 형태의 구조화된 데이터가 된다. 팩시밀리 영상은 이제 버클리 글꼴(Berkeley typeface)과 페이지 구성에 대한 정보가 보태져 아스키(ASCII:American Standard Code for Information Interchange, 미국 표준 코드)라 불리는 전형적인 이진법 코드로 재현된다. 팩시밀리와 아스키 간의 이러한 근본적 차이는 다른 미디어에도 적용된다.

시디(CD)는 ‘오디오 팩스’(audio fax)다. 디지털 데이터는 압축하고 오차를 교정하고 음향 신호를 통제하도록 해주지만 그것이 음악의 구조를 제공하지는 않는다. 예를 들어 피아노음만 골라내고 가수를 바꾸거나 오케스트라의 악기 배치 공간 구조를 바꾸기란 대단히 어려운 일이다. 오디오 팩스와 음악의 보다 구조적인 표현이 갖는 획기적인 차이점은 8년 전에 마이크 하울리(Mike Hawley)라는, 당시에는 학생이었으며 지금은 엠아이티의 교수가 된, 천재적인 피아니스트에 의해 관찰되었다.

하울리는 그의 박사 논문에서 각 해머의 타격 시간과 해머가 줄을 때리는 속도를 기록할 수 있도록 특수 제작된 보젠도르퍼 그랜드 피아노를 사용하였다. 각각의 건반이 거의 완벽한 연주를 재현할 수 있도록 모터를 달았다. 이 세상에서 가장 비싼 고해상도 연주가용 피아노와 결합된 고성능 키보드 디지타이저(digitizer)가 만들어진 셈이었다. 최근에 야마하가 이와 유사한 저가 버전을 발표했다.

하울리는 1시간을 넘는 음악을 어떻게 시디에 담을 수 있는가 숙고하였다. 산업계에서는 이 문제를 두 종류의 확대방법을 이용하여 극복하고 있다. 하나는 레이저를 붉은색에서 푸른색으로 바꿈으로써 파장을 줄여 네 배로 밀도를 높이는 방식이고, 다른 하나는 최신의 인코딩(encoding) 기술을 사용하는 방식이다. 최신 인코딩 기술은 시디 플레이어가 1970년대 중반부터 사용해 온 알고리듬(algorithms)을 통하여(손실 없이 같은 정도를 유지하면서) 최소한 1/4로 오디오를 압축하는 방법을 적용하였다. 이 두 가지 기술을 함께 사용하면 시디 한 면에 16시간에 달하는 엄청난 분량의 오디오를 담을 수 있다.

하울리는 어느날 나에게 시디에 훨씬 더 많은 시간을 집어넣는 방법에 대해 설명해 주었다. “도대체 얼마나 많이 넣을 수 있는데?”라고 내가 물었더니 그는 “한 5,000시간쯤이오”라고 대답했다. 이것이 사실일 경우 세계음악출판협회(Music Publishers Association of the World)는 하울리의 목숨을 위협할 것이고, 이후 그는 여생을 살만 루시디(Salman Rushdie)와 함께 살아야 할 것이라고 생각되었다.(감수자 주:살만 루시디는 회교도를 모욕하는 책을 출판하여 극단 회교도들에 의해 살해 위협을 받고 있으며 거처를 옮겨 가며 숨어 살고 있다) 나는 어떻게 그것이 가능한가 물어보았다(나는 그 사실을 비밀에 부치겠다고 그와 손가락 걸고 맹세했다).

하울리는 존 윌리엄스와 같은 잘 알려져 있는 작품을 보젠도르퍼로 연주하면서 인간의 손으로는 아무리 빨리 움직여도 1분당 3만 비트 이상을 얻을 수 없다는 사실을 알아냈다. 곧, 손가락의 움직임을 측정한 동작 데이터는 아주 수치가 낮다. 이를 시디의 초당 120만 비트라는 수치와 비교해 보라. 그래서 오디오 데이터가 아니라 손가락 동작 데이터를 저장한다면 5,000배나 많은 음악을 저장할 수 있다. 그리고 12만 5,000달러짜리 보젠도르퍼 피아노가 아니라 미디(MIDI) 장비를 갖춘 일반적인 악기를 사용할 수 있게 된다.

오디오 시디의 용량 문제를 해결해 온 업계 종사자들은 모두 다 (이해할 수 있지만 소심하게도) 팩시밀리가 이미지 영역에서 그런 것과 마찬가지로 오디오 영역에서만 용량 문제를 다루었다. 이와 대조적으로 하울리는 동작을 미디처럼 취급하여 그것이 아스키에 더 가깝다는 사실을 밝혀냈다. 실제로 악보 자체는 훨씬 더 함축된 표현이다(해상도가 낮고 인간의 해석에서 나오는 뉘앙스를 놓쳐버린다는 사실을 인정하더라도).

신호가 어떻게 발생하는가를 알기 위해 신호의 구조를 들여다보면 비트의 외형적인 형상을 넘어서 이미지, 소리, 텍스트를 구성하는 요소를 발견하게 된다. 이것은 디지털 삶의 가장 중요한 요소 가운데 하나이다.




삶의 팩시밀리



25년 전에 컴퓨터 과학 공동체가 최신 컴퓨터가 읽을 수 있는 새로운 텍스트의 비율을 예언하였다면 아마 80%~90% 정도로 추산했을 것이다. 1980년경까지는 그들의 생각이 옳았다. 팩시밀리를 들여다보자.

팩시밀리는 정보 분야에 심각한 오점을 남겼다. 정보산업의 퇴보를 초래했고 그 결과는 오랫동안 기억될 것이다. 사업 방식과 개인적 삶을 혁신적으로 바꾸어놓을 것 같았던 통신 미디어에 저주의 그림자가 어른거린다. 그러나 사람들은 장기적 비용과 단기적 실패, 그리고 이에 대한 대안을 이해하지 못한다.

팩시밀리가 일본의 유산인 까닭은 일본인들이 비디오 레코더를 개발한 것과 같이 팩스를 다른 사람들에 비하여 잘 표준화하고 생산할 수 있을 만큼 똑똑해서가 아니라 일본의 문화, 언어, 사업 관습이 극히 이미지 지향적이기 때문이다.

최근 10년 전까지만 해도 일본의 사업은 문서로 이루어지지 않고 말과 직접 만나는(face to face) 것으로 이루어졌다. 사업가들은 대부분 비서가 없었고, 종종 통신문(correspondence)을 손으로 쓰는 고통을 감수해야 했다. 사진식자기처럼 생긴 타이프라이터 대용품은 한자 한 글자를 쓰기 위해 전자기계 집게 손을 이용해 6만자가 넘는 글자가 들어찬 빽빽한 글자판에서 한 글자씩을 골라냈다.

일본에서는 한자의 도형적 요소 때문에 팩시밀리를 자연스럽게 받아들였다. 그 당시까지는 일본 글자를 읽을 수 있는 컴퓨터가 거의 없었기 때문에 손해보는 것도 없었다. 영어처럼 기호를 사용하는 언어일 경우 팩시밀리는 컴퓨터 가독성과 관련해 볼 때 그야말로 보통 재난이 아니다.

라틴 알파벳 26자, 그리고 10개의 아라비아 숫자와 특수 문자 몇 개를 사용하는 우리의 입장에서 볼 때 8비트 아스키가 훨씬 자연스럽다. 그러나 팩시밀리는 이러한 사실을 무시하게끔 만들었다. 예를 들어 오늘날 대부분의 사업 문서는 워드프로세서로 작성되어, 인쇄된 후 팩시밀리로 보내진다. 이것을 한번 생각해 보자. 우리는 컴퓨터가 완전히 읽을 수 있는 형식으로 문서를 준비한다. 그래서 단어를 스펠링 검색기(spell-checker)에 넘기는 것에 대해서는 신경쓰지 않을 만큼 가독성이 높다.

그런데 우리는 무엇을 하고 있는가. 우리는 그것을 종이 양식지에 인쇄한다. 문제는 이 경우에 디지털화에 따르는 모든 특징들을 잃는다.

그 다음에 이 종이 조각을 팩시밀리에 집어넣으면 종이의 색깔이나 레터헤드의 느낌이 제거되면서 이미지로 다시 디지털화한다. 그리고 종이 양식지는 아마 복사기 옆에 놓여 있는 쓰레기통으로 직행할 것이다. 불행한 수신자는 어떤 때는 고대 두루마리의 유산처럼 잘리지 않고 둘둘 말린 팩시밀리를 암에 걸린 심정으로 읽어야 한다. 잠시 숨을 돌리도록 하자. 휴식은 서로에게 차를 권하는 것만큼 현명하다.

컴퓨터에 팩스 모뎀이 장착되어 있어 중간 단계의 종이 전환 과정을 피할 수 있거나 팩시밀리가 보통 용지와 컬러 용지를 함께 쓸 수 있다 하더라도 팩시밀리는 여전히 지능적인 매체가 아니다. 그 이유는 팩시밀리는 수신자로 하여금 자동으로 메시지를 저장하고, 다시 읽고, 재편집할 수 있도록 해주는 컴퓨터의 가독성을 없애버리기 때문이다.

여섯 달 전에 어떤 사람에게서‧‧‧‧‧‧ 어떤 장소에서‧‧‧‧‧‧ 이러저러한 내용에 대해 팩스를 받았는지 기억하려고 얼마나 고생을 하는가? 아스키 형태에서는 ‘이러저러한’ 일을 위해 컴퓨터 데이터베이스를 검색하면 된다.

스프레드쉬트를 팩스로 보낼 때 오직 그것의 이미지만을 보낼 수 있다. 그러나 전자우편을 사용하면 받는 사람이 자료를 조작하고 검색하고 그가 바라는 형태로 볼 수 있는 스프레드쉬트 파일을 보낼 수 있다.

팩스는 경제적이지도 못하다. 이 페이지를 9,600보드 속도의 보통 팩스로 보내려면 20초 가량이 걸린다. 그런 형식으로 보내려면 대략 20만 비트가 필요하다. 한편 전자우편을 사용하면 대략 아스키와 약간의 제어 글자들을 포함시킨다 하더라도 200,000비트의 1/10이면 충분하다. 다시 말해서 컴퓨터의 가독성 문제에 신경을 쓰지 않는다고 하여도 전자우편은 초당 9,600보드를 전송하는 똑같은 모뎀을 사용할 경우(38,400보드를 쓰면 팩스 전송 비용의 2.5%에 불과하다) 팩스에 비해 1/10 정도의 비용밖에 안 든다.

팩스와 전자우편에 관한 아이디어의 출현은 100년 전으로 거슬러 올라간다. 1994년에 발견되어 출간된 줄 베르느(Jule Verne)의 20세기 파리(Paris in the 20th Century)의 1863년 원고에 다음과 같은 문장이 실려 있다. “사진 전신(photo-telegraphy)은 글, 서평, 그림을 아주 멀리 떨어진 곳으로 보낼 수 있으며 20,000킬로미터 떨어진 곳에서 계약에 서명할 수 있다. 모든 집들은 통신망으로 연결되어 있다.”

웨스턴 유니온(Western Union)의 자동전신(1883)은 고정된 전선을 통하여 한 지점 대 한 지점(point-to-point) 간의 전자우편을 전송하였다. 오늘날 우리가 알고 있는 다수지점 대 다수지점(multipoint to multipoint) 간의 전자우편 사용은 팩스의 일반적인 사용보다 먼저 이루어졌다. 1960년대 중후반에 전자우편이 사용되기 시작할 당시만 해도 상대적으로 적은 수의 사람만이 컴퓨터를 다룰 수 있었다. 따라서 1980년대에 팩스 사용이 전자우편보다 극적으로 우세하였던 사실은 별로 놀라운 일이 아니다. 그 이유는 사용의 편이성, 이미지와 그래픽의 간단한 전송, 하드카피(형식을 포함하여)를 그대로 전송할 수 있었기 때문이다. 그리고 어떤 조건에서는 최근까지도 팩스는 서명을 통해 법적인 신뢰성을 확보할 수 있기 때문이다.

그러나 어디에서나 컴퓨터를 사용하는 오늘날에는 치솟는 사용률이 입증하듯이 전자우편의 이점이 압도적으로 우세하다. 디지털의 이점뿐만 아니라 전자우편은 대화매체의 속성을 가지고 있다. 말로 하는 대화는 아니지만 전자우편은 글쓰기보다 말하기에 더 가깝다.

나는 아침에 일어나면 제일 먼저 전자우편을 찾아보고 그것이 단지 전자우편임에도 불구하고 오후엔 “그래, 오늘 아침에는 이런 저런 이야기를 했다”고 말할 수 있다. 메시지는 이리 저리 돌아다닌다. 이러한 전자우편엔 가끔 오자가 발견된다. 한 일본 동료에게 내가 보낸 전자우편의 오자에 대해 사과하였더니 자신이 어떤 소프트웨어보다 훌륭한 철자 교정기니까 걱정하지 말라는 답장을 받은 일이 생각난다. 정말 그렇다.

이 새로운 유사 대화 미디어는 글자 쓰기와 대단히 다르다. 전자우편은 속달우편 이상이다. 시간이 지나면 사람들은 전자우편의 상이한 사용 스타일을 발견하게 될 것이다. 이미 :)- 웃는 얼굴과 같은 부호를 사용하여 톤을 나타내는 순수한 전자우편 언어가 사용되고 있다. 이런 가능성을 고려할 때 21세기에는 15년 안에 음성 통신을 제압하진 못하겠지만 (아스키에만 국한되지 않고) 전자우편이 개인 간 텔레커뮤니케이션의 주요 미디어가 될 것이다. 우리 모두가 약간의 디지털 예의만 배운다면 우리는 모두 전자우편을 사용하게 될 것이다.




네티켓



다음과 같은 광경을 상상해 보라. 18세기에 오스트리아 성에서 무도회가 열렸다. 베네치안 거울과 보석이 촛불에 반사되어 반짝이고, 400명의 선남선녀가 마치 파라마운트사의 「주홍 황후」(The Scarlet Empress)나 유니버설 영화사의 「즐거운 과부」(The Merry Widow)에 나오는 무도회 장면처럼 10인조 오케스트라의 반주에 맞춰 우아하게 춤추고 있다. 그러면 이제 똑같은 광경을 그려보자. 전체 손님 가운데 390명이 무도회 전날 춤을 배운 초보자들이다. 그들은 모두 스텝에 신경이 쓰인다. 이러한 상황이 오늘날 인터넷에서 재현되고 있다. 대부분의 사용자가 미숙한 초보자들이다.

오늘날 인터넷 사용자의 다수가 신참자로서 대부분 1년 미만의 사용자들이다. 초보자들이 시험적으로 보내는 메시지는 소수의 지정된 수신자 그룹으로 몰려가는 경향이 있는데 이들 메시지는 여러 페이지로 되어 있을 뿐만 아니라 빨리 답신을 보내줄 것을 독촉하기도 한다.

더 심각한 사태는 문서의 복사 반송이 아주 간단하고 비용이 들지 않기 때문에 한 번의 수행(Enter) 키를 누르면 당신의 우편 보관함에 반갑지 않은 1만 5,000단어에서 50만 단어가 쏟아져 들어온다. 이러한 단순한 행위가 개인적이며 대화 매체인 전자우편을 도매로 덤핑하는 결과가 되어 낮은 주파수 대역(low-bandwidth channel)을 이용하는 경우 특히 실망하게 된다.

한 저널리스트는 인터넷 초보자의 부주의한 인터넷 사용에 관한 글을 쓰기 위해 간단한 주의 사항이나 물음도 없이 내게 4페이지짜리 설문서를 보냈다. 그의 사례가 바로 인터넷 초보자의 자화상이다.

전자우편은 리포터에게는 대단한 매체이다. 전자우편 인터뷰는 정신집중을 방해하지 않으며 더 많이 생각하도록 만든다. 만약 리포터가 디지털 예절을 갖춘다면 전자우편 인터뷰는 굉장한 미디어로서 전세계의 수많은 저널리즘이 이를 표준적 도구로 사용하리라 생각한다.

인터넷에서 정중함을 갖추는 최선의 방법은 수신자가 단지 1,200비피에스만 가지고 있고 아주 짧은 순간만 주의를 기울일 수 있다고 가정하는 것이다. 역설적인 사례(내가 알고 있는 대부분의 노련한 사용자가 습관적으로 저지르는 잘못)는 그들의 답장에 내가 보낸 메시지를 완전히 복사하여 다시 되보내는 것이다. 이러한 행위는 전자우편을 유용하게 만드는 데 있어 치명적이며, 특히 메시지가 길며 채널 속도가 느린 경우는 끔찍한 사태가 된다.

정반대의 극단은 보다 더 심각하다. 밑도 끝도 없이 “맞습니다”라는 메시지가 온다. 도대체 무엇이 맞다는 것인지?

최악의 디지털 습관은, 나의 생각으로는, 근거도 없는 ‘시시’(cc)의 사용이다. (누가 이것을 카본 카피의 약자라고 기억하겠는가?) 수도 없이 일어나는 이런 사례들이 수많은 고참 사용자를 온라인에서 쫓아버린다. 전자 복사에서 생기는 큰 문제는 응답자가 종종 전체 회원에게 메일을 보냄으로써 자신을 복제할 수 있다는 점이다. 당신은 어떤 사람이 자신도 모르게 ‘모든 사람’에게 응답을 보냈는지 여부를 가려낼 수 없다. 또한 그렇게 하지 않을 방법을 알지도 못하고 알려고 하지도 않는다. 만약 어떤 사람이 준비 없이 즉석에서 국제회합을 조직하여 다른 50명이 참석하는 회합에 나를 초대할 경우 나는 50명분의 상세한 여행 준비와 그와 관련된 논의사항을 알고 있을 필요가 없다.

바드(Bard)의 말처럼 전자우편의 정신은 간결성에 있다.




일요일조차도



전자우편은 우리가 일하고 생각하는 방식에 영향을 미치는 생활방식이다. 특히 주목되는 결과는 일과 놀이의 리듬이 바뀐다는 점이다. 9시에서 5시, 한 주에 5일, 1년에 2주 휴가라는 지배적인 박자는 새로운 생활방식이 비지니스 생활에 침투하기 시작하면 어디론가 사라져 버린다. 그대신 업무와 관련되는 메시지와 개인적 메시지가 한데 섞인다. 일요일은 월요일과 다를 바 없게 된다.

유럽과 일본 사람은 이것을 재앙이라 부를 것이다. 그들은 일을 사무실에 남겨두려고 한다. 나는 사람들이 자신과 일 사이에 거리를 둘 권리를 시기하는 것이 아님을 분명히 밝혀둔다. 다른 한편 우리 가운데 일부는 하루 종일 ‘접속’(wired)하기를 즐긴다. 이것은 각각 장단점이 있다. 개인적으로 나는 일요일에 전자우편물 답장을 쓰고 월요일에는 늦잠을 자는 편이 더 낫다.




집과 해외에 동시에 있기



인터넷을 사용하는 두 마리 개를 그린 아주 유명한 만화가 있다. 한 마리가 다른 개에게 자판을 두들긴다. “인터넷에서는 네가 개인 걸 아는 사람이 한 명도 없어” 여기에다 “아무도 우리가 어디에 있는지 몰라”라는 문구를 추가해야 하리라.

뉴욕에서 도쿄까지는 대략 14시간이 걸린다. 나는 비행기 안에서 40~50개에 달하는 전자우편물을 작성하는 데 대부분의 시간을 보낸다. 내가 호텔에 도착해서 관리인에게 이것을 팩시밀리로 보내달라고 요청하는 상황을 그려 보라. 그런 정도 양의 우편물은 단체 우편물로 간주될 것이다. 그러나 전자우편물로 이것을 부치면 지역 전화번호를 돌림으로써 아주 빠르고 손쉽게 처리할 수 있다. 나는 이것을 특정 장소가 아니라 특정인에게 보낸다. 사람들은 도쿄가 아니라 나에게 메시지를 보내는 것이다.

전자우편은 당신이 어디에 있는지 몰라도 누구나 당신에게 우편물을 보낼 수 있는 굉장한 이동성을 제공한다. 전자우편은 여행중인 세일즈맨에게 아주 적합하다. 그런데 전자우편과 항상 접속되어 있도록 하는 과정은 디지털 생활에서 비트와 아톰 간의 차이에 대해 흥미로운 질문을 제기한다.

나는 여행할 때 최소한 인터넷에 접속할 수 있는 두 개 이상의 지역 전화번호를 갖고 다닌다. 속설과 달리 각 나라의 지역 전송 시스템(local packet system, 그리스, 프랑스, 스위스, 일본에서 내가 사용하는)이나 스프린트(Sprint), 엠시아이(MCI)의 국제 전송 서비스(global packet service)는 매우 비싼 상업용 포트(ports)이다. 예를 들어 스프린트는 러시아 도시에 38개의 지역 전화번호를 갖고 있다. 이들 가운데 하나를 사용하여 나는 개인 사용자 시분할 시스템(the closet:one-user time-sharing system)으로 미디어랩의 메인 컴퓨터와 연결할 수 있다. 거기서 나는 인터넷 안으로 들어간다.

세계 곳곳에서 인터넷과 접속하는 것은 마술이다. 문제는 디지털화가 아니라 플러그를 준비하는 데 있다. 유럽은 서로 다른 전원 플러그가 20개(세어보기 바람!)나 된다. 그리고 전화 잭(RJ-11)을 사용하려면 전세계에서 사용되는 175개의 유형 가운데 하나를 선택해야 한다. 나는 자랑스럽게도 최소한 이들을 한 개 이상 갖고 있는데, (장기 순회 여행을 떠나면) 내 짐의 25%는 전화 잭과 파워 플러그로 꽉 찬다.

연결 장비를 잘 구비했더라도 많은 호텔과 전화 부스는 직접 모뎀을 연결할 수 있는 설비를 갖추고 있지 않기 때문에 곤경에 처하게 된다. 이런 때를 대비하여 소형 아쿠스틱 커플러를 전화수화기에 접속시킬 수 있다. 이런 작업의 어려움은 전화 수화기의 디자인이 얼마나 복잡한가에 달려 있다.

일단 연결되면 가장 구식의 회전식 아날로그 전화 스위치일지라도―아주 낮은 전송 속도와 에러 수정 전송이 잦기는 하지만―비트가 고향으로 왔다갔다하는 데 아무런 문제가 없다.

유럽은 다음의 세 가지 목표를 갖는 단일 파워 플러그 설계를 위한 유로플러그(Europlug) 프로그램을 시작했다. 1) 현재 사용하는 플러그와 모양이 다를 것, 2) 현재 사용하는 플러그의 안전 장치를 겸비할 것, 3) 특정 나라에 경제적 특혜를 주지 말 것(유럽 공동체적 사고의 특수한 궤적). 문제의 핵심은 플러그가 아니다. 디지털 생활이 진화할수록 장애물은 전자적인 요인이 아니라 물리적인 요인에서 발생한다.

고의적으로 디지털을 거부한 사례가 있다. 호텔이 전화 연결용 잭(RJ-11)의 작은 플라스틱 분출 클립을 제거한 사건(랩탑을 벽면의 플러그에 꽂아서 사용하지 못하도록 한 조치)이었다. 이것은 팩스를 수신하여 전해주는 데 요금을 부과하는 것보다 더 악질적이다. 팀(Tim)과 니나 자가트(Nina Zagat)는 장차 자신들이 만드는 호텔 가이드에 이 문제에 대해 주의사항을 집어넣겠다고 약속했다. 그렇게 되면 디지털화된 사람(digerati)들은 문제가 되는 호텔들을 거부할 수 있게 되어 세계 어디서나 디지털 비지니스를 수행할 수 있게 될 것이다.








어려운 재미                       16





장애자 교육



디어랩이 1989년에 레고/로고(LEGO/Logo) 프로젝트를 시작할 때 헤니건 학교(Hennigan School)의 유치원생에서 6학년 어린이에 이르기까지 모든 어린이들이 레고(LEGO) 경영자, 학자, 기자들 앞에서 그들의 프로그램을 시연하였다. 전국 텔레비전 네트워크의 열정적인 여성 앵커가 카메라 조명을 밝히고 한 어린아이를 구석에 몰아세운 후 이것이 마치 재미있는 게임 같지 않느냐고 물었다. 그녀는 이 여덟 살짜리 아이에게 전형적인 “깜찍한” 짧은 답을 강요하였다.

그 아이는 당황한 빛이 역력하였다. 결국 그녀가 같은 질문을 세 번이나 반복하고 조명등의 뜨거운 불빛이 상당 시간 작열한 후에야 땀이 범벅이 된 얼굴로 심통이 난 그 어린이는 마지못해 카메라를 보며 말했다. “그래요, 이것은 재미있어요. 하지만 어렵게 재미있어요.”

세무어 파퍼트(Seymour Papert)는 ‘어렵게 재미있는’ 것에 대한 전문가이다. 그는 일찍이 다섯 살짜리가 독일에서 독일어, 이탈리아에서 이탈리아어, 일본에서는 일본어를 배운다는 사실을 고려할 때 언어에 ‘능통하다는’ 것은 정말 우스꽝스런 개념이라고 갈파했다. 나이가 들수록 언어학습 능력을 잃게 되지만 우리도 젊은 시절에 그런 능력을 분명히 갖고 있었다.

파퍼트는 어린이가 언어를 배우는 방법과 똑같이 수학을 배우는 수학나라(Mathland)처럼 교육에 컴퓨터를 도입하라고 제안하였다. 수학나라는 이상한 지정학적 개념 같지만 컴퓨터에서는 완벽한 의미를 갖는다. 실제로 현대 컴퓨터 시뮬레이션 기술을 사용하여 어린이들이 놀이하듯이 아주 섬세한 원칙을 탐구하는 미세세계를 창조할 수 있다.

헤니건에서 레고/로고 교실의 여섯 살짜리 소년이 블록더미를 만들어 그 꼭대기에 모터를 올려놓았다. 그 아이는 모터의 두 선을 컴퓨터에 연결하고 그것을 껐다켰다할 수 있는 한 줄짜리 프로그램을 만들었다. 연결이 되면 블록이 진동하였다. 그 아이는 프로펠러를 모터에 부착했지만 무슨 이유인지 몰라도 그것을 중심에서 벗어난 위치에 설치하였다(아마도 실수였을 것이다). 그리고 나서 모터를 돌리자 블록은 아주 심하게 진동했다. 블록은(고무밴드로 묶어서 떨어지지 않도록 만들긴 했지만) 테이블 위를 튕겨다니다가 거의 부서질 정도로 흔들렸다.

그 아이는 프로펠러를 시계 방향으로 돌리면 레고 더미가 처음에는 오른쪽으로 튀다가 다음에는 아무 방향으로나 움직인다는 사실을 알아차렸다. 시계 반대 방향으로 돌릴 경우 블록 더미는 왼쪽으로 튀다가 아무 방향으로나 움직일 것이다. 결국 그 아이는 광센서를 그 구조물 아래 설치하기로 결정하고 블록을 커다란 흰 종이 위에 그려진 검정 곡선 위에 올려놓았다.

그 아이는 모터를 좌우 양쪽 방향에서 움직였던 처음 프로그램보다 더 정교한 프로그램을 만들었다. 그후 광센서가 검게 인식하는 부분에서는 모터가 정지되어 시계 방향으로 움직여 오른쪽으로 튕기게 하고, 하얗게 인식하는 부분에서는 시계 반대 방향으로 왼쪽으로 튕기게 하여 선 위로 돌아오게 만들었다. 결과적으로 검은 곡선을 따라 블록더미가 움직이도록 만든 것이다.

그 어린아이는 영웅이 되었다. 교사와 학생 모두가 여러 다양한 관점에서 그 아이의 프로젝트를 관찰하면서 그 발명품의 동작에 대해 질문을 퍼부었다. 이 영광의 짧은 순간이 그 아이에게 배움의 기쁨이라는 커다란 선물을 선사하였다.

앞으로의 사회에서는 배우는 데 장애가 있는 어린아이보다 남을 가르치는 데 장애가 있는 환경이 많아질 것이다. 컴퓨터는 과거와는 다른 학습방법과 인식 스타일을 아이들에게 제공함으로써 이런 경향을 변화시킬 것이다.




개구리를 해부하지 마라, 한 마리 만들어 보라



대부분의 미국 아이들은 발틱과 발칸의 차이를 모른다. 그들은 비시고스(Visigoths)가 누구인지, 루이 16세가 언제 살았는지 모른다. 이것이 뭐 그리 중요한가. 당신은 리노가 로스앤젤레스의 서쪽인 줄 아는가?

어린이의 머릿속에 수많은 사실을 밀어넣는 데 많은 비용을 치르고 있는 프랑스, 한국, 일본 같은 나라에서는 그들이 대학에 들어갈 때쯤이면 거의 죽을 지경에 이른다. 그들에게 대학 4년의 기간은 마치 도착점에 도달한 마라톤 선수에게 암벽을 오르라는 격이다.

1960년대에 대부분의 컴퓨터와 교육계의 선구자들은 (더 효과적으로 신의 전능한 사실을 가르치기 위해 일 대 일 one-on-one 방식과 개인별 학습 속도가 가능한 컴퓨터를 사용하여) 싸구려 훈련과 연습이라는 접근방식을 옹호하였다. 지금은 멀티미디어가 대유행하면서 생산성을 높인다는 주장하에 아이들의 머릿속에 더 많은 정보를 우겨넣는 훈련과 연습 방식은 더 이상 강요되지 않는다.

1970년 4월 11일에 파퍼트는 엠아이티에서 ‘어린이를 생각하도록 만드는 교수법’이라는 심포지엄을 개최하였다. 그 심포지엄에서 파퍼트는 어린이들이 스스로 가르치게 하고 그렇게 가르침으로써 스스로 학습하는데 컴퓨터를 사용하자고 제안하였다. 이 놀랍고 간단한 아이디어는 이 아이디어가 개인용 컴퓨터를 통하여 세상에 나오기 15년 전에 제안된 것이다. 미국 가정의 1/3이 개인용 컴퓨터를 갖고 있는 오늘에 이르러 파퍼트의 생각은 진정 때를 맞았다.

학습의 중요한 부분은 분명히 가르침으로부터 얻어지지만―단, 훌륭한 가르침과 훌륭한 선생에 의해―주요한 평가 기준은 스스로 발견하고 재발견하고 탐구하는 데서 나온다. 컴퓨터가 등장하기 전까지는 교수 기술의 시청각 장치와 원거리 교육을 위한 텔레비전에 국한되어 있었으며 이것은 교사들의 할 일만 증가시켰으며 학생들은 소극적으로 만들었다. 컴퓨터는 이러한 균형을 근본적으로 변화시켰다. 갑자기 실천학습(learning by doing)이 예외가 아니라 규칙이 되었다. 어떤 것이라도 컴퓨터로 시뮬레이션하는 것이 가능하기 때문에 이제는 개구리를 알기 위해 개구리를 해부할 필요가 없다. 대신 어린이들이 개구리를 디자인하고, 개구리 같은 행태를 지닌 동물을 만들고, 개구리의 형태를 변형하고, 근육을 시뮬레이트하고, 개구리와 함께 논다.

정보를 갖고 놀이를 함으로써 특히 추상적 주제에 관한 정보를 갖고 놀게 되면, 물질은 더 많은 의미를 지니게 된다. 내 아들의 3학년 교사가 슬픈 표정으로 내게 말하던 일이 기억난다. 내 아들녀석이 두세 자리 수의 덧셈과 뺄셈을 못한다는 것이다. 내 아들이 모노폴리(Monopoly) 게임을 할 때 그 녀석은 항상 은행가였고 수치를 썩 잘 관리하고 있는 것처럼 보였기 때문에 나는 그 교사의 말을 의아하게 받아들였다. 그래서 나는 그 교사에게 똑같은 덧셈을 숫자가 아니라 달러로 해보라고 제안하였다. 과연 녀석은 갑자기 그녀가 내준 세자리 덧셈뿐만 아니라 그 이상도 척척 해냈다. 그 이유는 돈계산은 의미 없는 추상적 숫자가 아니었기 때문이다. 달러는 산책로(Board-

walk)를 구입하고, 호텔을 짓고, 다음 단계로 넘어가는 것과 관련이 있기 때문이었다.

컴퓨터로 조종할 수 있는 레고(LEGO)는 이보다 한 단계 더 나아간다. 그것은 어린이들이 자신들이 스스로 만든 물리적 구조물에 행위를 부여할 수 있게끔 한다. 레고와 함께 진행중인 미디어랩의 최신 작업은 컴퓨터를 집어넣은 레고 벽돌의 시험 모델을 만드는 것이다. 이를 통해 파퍼트의 구성주의 사고방식은 더 높은 유연성과 더 넓은 실현 기회를 갖게 될 것이다. 이것은 또한 벽돌 간의 커뮤니케이션과 새로운 방식으로 병렬처리를 연구할 수 있는 기회도 제공한다.

오늘날 레고/로고를 사용하는 어린아이들은 우리가 대학에서 배운 물리적․논리적 법칙을 배우게 될 것이다. 설득력 있는 증거와 섬세한 실험을 통해 우리는 그의 구성주의적 접근법이 광범한 행동양식과 인식 활동 전반에 걸쳐 학습 방식의 지평을 놀라울 만큼 확장하게 된다는 것을 확인하게 된다. 실제로 많은 아이들이 구성주의적 교육환경 속에서 과거에는 억압되었던 왕성한 학습열을 회복하고 있다고 한다.




정보고속도로의 골목 대장



내가 스위스의 학교 기숙사에 있던 시절 가을 방학에 일어난 일이다. 나를 포함한 많은 아이들이 집이 멀리 떨어져 있었기 때문에 우리는 방학 때 집에 돌아가지 않았다. 대신에 우리는 진짜 야생 거위를 쫓는 경기에 참석하였다.

교장 선생은 스위스의 장군(대부분의 스위스 군인처럼 예비군이었다)이었는데 상당한 영향력을 행사하던 노련한 사람이었다. 그는 네 명의 아이(12~16세)를 한 팀으로 짜서 100스위스 프랑(당시 23.5달러)과 닷새 동안 사용할 수 있는 기차표를 주고 5일 동안 전국을 쫓아다니도록 했다.

팀별로 각각 다른 게임의 실마리를 제공했다. 각 팀은 도중에서 지시한 목표를 달성하면 점수를 받았다. 중간에 그만두면 점수를 얻을 수 없었다. 어떤 지점에서 우리가 한밤중에 위도와 경도를 알려주면 헬리콥터가 나타나서 다음 메시지를 1/4인치짜리 우르두(Urdu)어 오디오 테이프로 떨어뜨렸다. 테이프를 틀면 살아 있는 돼지를 찾아서 어떤 전화번호가 적힌 지점으로 가져가라는 지시가 나온다(일곱 개의 애매한 사건이 발생한 날짜에 대한 복잡한 번호 가운데, 마지막 숫자 일곱 개가 전화번호였다).

이런 종류의 도전은 항상 나를 엄청나게 자극하였다. 자랑하기 쑥스럽지만 내가 확신한 대로 우리 팀이 이겼다. 이 경험은 내게 아주 큰 감동을 주었다. 내 아들의 열네번째 생일날 이와 똑같은 경기를 열어주었다. 그러나 미국에는 (나의 지시와 명령을 따를) 군대가 없었기 때문에 보스턴의 내 아들이 속해 있는 학급 아이들로 팀을 짜서 하루 동안 정해진 예산으로 이 경기를 열었다. 아이들에게는 무한정 사용할 수 있는 지하철 표를 지급하였다. 나는 공원 벤치에 앉아 다른 개최자들과 함께 게임의 실마리와 전화번호 숫자를 이용한 퍼즐의 해답이 정하는 장소를 찾는 데 몇 주를 보냈다. 당신의 추측처럼 학교에서 공부를 잘하는 아이들이 반드시 승리를 거두지는 못했다. 결과는 종종 그 반대였다. 골목대장과 모범생 간의 진정한 차이란 이런 데 있다.

예를 들어 야생 거위 쫓기에서 하나의 실마리를 찾으려면 크로스워드 수수께끼를 풀어야 한다. 모범생들은 도서관을 찾거나 다른 모범생 친구들을 불렀다. 골목대장들은 지하철을 오르내리며 만나는 사람들에게 도움을 요청했다. 그들이 더 빨리 해답을 찾았음은 물론이고, 에이(A)지점에서 비(B)지점으로 움직이면서 과제를 수행함으로써 이동거리를 절약하였으며 게임의 핵심에 더 쉽게 접근하였다.

오늘날 어린이들은 인터넷에서 골목대장이 될 수 있는 기회를 얻고 있다. 인터넷에서 어린이들은 그들의 모습을 드러내지 않고서도 말할 수 있다. 아이러니하게 읽고 쓰는 것이 도움이 된다. 아이들은 인터넷에서 추상적이고 인위적인 연습을 완수하기 위해서가 아니라 통신을 하기 위해 읽고 쓴다. 이에 대한 나의 옹호가 반지성적이거나 추상적 사유에 대한 모함으로 받아들여져서는 안된다. 오히려 그 반대이다. 인터넷은 지식과 의미를 발견하기 위해 뻗어나가는 새로운 매체이다.

약간 불면증이 있는 나는 새벽 3시에 일어나 한 시간 가량 컴퓨터에 접속한 후 다시 잠자리에 든다. 졸면서 접속하는 동안 자신을 고등학교 2학년이라고 정중하게 소개한 마이클 쉬락(Michael Schrag)으로부터 전자우편물 하나를 받았다. 그는 주말쯤 엠아이티를 방문할 때 미디어랩을 방문할 수 있는가에 대해 물었다. 나는 금요일 ‘비트는 비트이다’ 시간에 그가 뒷좌석에 앉아도 좋다고 말해 주었다. 그리고는 학생 안내자를 한 사람 보내주었다. 나는 그를 만나기로 합의한 다른 두 명의 교수에게 그와 나의 전자우편물 복사물을 나눠주었다(아이러니하게도 그들은 그가 유명한 칼럼니스트 마이클 쉬라지 Michael Schrage인 줄 알았다. 칼럼니스트 쉬라지의 이름에는 끝에 e자가 하나 더 있다).

마이클은 그의 아버지와 함께 나를 만났다. 마이클의 아버지는 마이클이 네트에서 온갖 사람을 만난다고 설명했다. 마이클 아버지는 내가 거위 경기를 생각하는 것과 정말로 똑같은 방식으로 자기 아들이 하는 일을 대하고 있었다. 마이클의 아버지는 노벨상 수상자, 고위 경영자 등 모든 종류의 사람이 아이들의 질문에 대답할 시간이 있다는 데 놀라움을 표시했다. 그들이 자상하게 응답할 수 있었던 이유는 응답하기가 아주 쉽고 (최소한 당분간은) 대부분의 사람이 불필요한 전자우편물에 빠져 있지 않기 때문이다.

업무 외 시간에 인간 지식을 확장하고 남에게 도움을 주는 네트워크를 위해 시간과 지혜를 나눌 수 있는 사람이 많이 있을 것이다. 예를 들면 3,000만 명에 이르는 미국은퇴인협회(American Association of Retired Persons)의 회원들은 이제까지 볼 수 없었던 집합적 경험을 만든다. 키보드를 몇 번 두들겨 젊은이들이 그 엄청난 양의 지식과 지혜에 접근하도록 함으로써 세대차를 좁힐 수 있을 것이다.

배우기 위한 놀이



1981년 10월에 세무어 파퍼트와 나는 비엔나의 오펙(OPEC) 회담에 참석하였다. 그 회합에서 세이크 야마니(Sheik Yamani)는 가난한 사람에게 물고기가 아니라 낚싯대를 주어야 한다―그에게 동냥하는 방법이 아니라 생계 유지 방법을 가르쳐야 한다―는 유명한 연설을 하였다. 사석에서 야마니는 우리에게 원시인과 교육을 받지 못한 사람 간의 차이를 아느냐고 물었다. 우리가 일부러 머뭇거리며 그에게 답할 기회를 주자 그가 말했다.

그의 대답은 원시인이 전적으로 교육을 받지 못한 것은 아니라는 사실, 원시인은 단지 협력적이고 단단하게 짜인 사회 조직에서 세대와 세대로 지식을 전달하는 방식을 사용할 뿐이라는 것이다. 이와 대조적으로 교육받지 못한 사람은 그 조직이 비협력적이고 느슨하게 풀려버린 현대 사회의 산물이다.

대 부족장의 독백 자체는 파퍼트의 구성주의 발상(constructivist ideas)의 원시적 버전이었다. 이 일이 씨가 되어서 우리는 다음 한 해를 개발도상국의 교육에 컴퓨터를 도입하는 일로 보냈다.

이 기간 동안 가장 완벽한 실험이 세네갈의 다카르에서 이루어졌다. 12대의 애플 컴퓨터와 로고(Logo) 프로그램 언어를 국민학교에 도입하였다. 서아프리카의 가난한 시골 아이들은 미국의 교외 중산층 아이들처럼 쉽고 자유분방하게 컴퓨터에 빠져들었다. 세네갈 어린이들은 그들의 일상 생활이 기계적․전자적 환경으로 둘러싸여 있지는 않았지만 컴퓨터에 대한 적응과 열망에서 다른 나라 아이들과 아무런 차이가 없었다. 흑인이나 백인, 부자와 빈자는 컴퓨터와 아무런 관계가 없다. 문제는 어린이들이 프랑스에서 프랑스어를 배우는 것과 같이 컴퓨터 환경에서도 어린이가 되어야 한다는 데 있다.

우리 사회에서 이와 동일한 현상에 대한 증거를 찾아볼 수 있다. 인터넷의 인구 통계이든 닌텐도나 세가 같은 게임기의 사용이든 혹은 가정용 컴퓨터 보급이든, 이를 결정하는 지배적 요인은 사회적이거나 인종적 혹은 경제적 요인이 아니라 세대적 요인이다. 가진 자와 갖지 못한 자의 차이는 이제 젊은이와 늙은이 간의 차이가 되었다. 민족적․종족적 힘에 의해 수많은 지적 운동이 추진되었지만 디지털 혁명에서는 그렇지 않다. 디지털 혁명의 정열과 호소력은 록(Rock) 음악처럼 보편적이다.

대부분의 어른은 어린아이들이 전자 게임을 하면서 배우는 방식을 이해하지 못한다. 어른들은 이들 매력적인 장난감이 아이들을 구제불능의 경련성 발작 중독자로 만들어버린다고 쉽게 생각한다. 그러나 전자게임은 아이들에게 전략을 가르치고 향후 그들의 삶에서 사용할 기술을 개발하도록 만든다. 당신이 어린아이였을 때 전략을 논의하거나 어떤 것을 다른 아이보다 빨리 배우기 위해 서두른 적이 과연 얼마나 되는가?

오늘날 신세대는 테트리스 같은 게임을 아주 빨리 완벽하게 정복한다. 변화하는 것은 속도다. 우리는 테트리스 세대가 웨건의 짐은 빨리 꾸리지만 그 이상은 아니라는 사실을 알게 된다. 더 강력한 컴퓨터로 게임을 하게 될 경우 시뮬레이션 도구(인기 있는 심시티 SimCity 같은)와 더 많은 정보로 가득 찬 게임이 나타날 것이다.

어려운 재미를 경험하기 바란다.








디지털 우화와 단점                17





모뎀이 부르는 소리



리, 청소, 운전, 불지피기, 손님 확인 등을 위해 가사 요원을 고용할 때 그들이 서로 이야기하는 것을 금하고, 서로 무엇을 하는지 모르게 하고, 맡은 일만을 하며 서로 협조하지 말도록 지시하는 경우를 상상할 수 있겠는가?

그런데 이들 기능을 기계가 맡아할 경우에는 각각의 기능을 고립시켜 각 기계가 독립적으로 일을 하도록 내버려둔다. 진공 청소기, 자동차, 초인종, 냉장고와 난방 시스템은 설계자가 그들 간의 의사교환을 전혀 고려하지 않았기 때문에 각각 고립된 상태에서 지정된 기능만을 수행한다. 전기 제품에는 작동을 조정하기 위해 대부분 디지털 시계가 내장되어 있다. 디지털 시간을 이용하여 약간의 기능을 동조시키기 위해 노력하지만 대부분 12시를 알리는 것이 고작이고 “제발 나를 조금만 더 지능적으로 만들어 주세요”라고 소리치며 훌쩍이는 기계들의 울음소리를 듣게 될 뿐이다.

기계의 효용성을 향상시키려면 기계들이 서로 쉽게 이야기를 주고받을 수 있도록 만들어야 한다.

디지털 세상은 기계와 기계 간의 커뮤니케이션에 쓰이는 표준의 성격을 바꾼다. 제네바의 테이블에 앉아 있는 사람들이 주파수 할당에서 통신 프로토콜에 이르기까지 세계 표준을 망치로 두들겨 만든다(hammer out:산업시대의 은유). 때때로 이러한 작업은 기간이 너무 오래 걸려 종합정보통신망(ISDN:integrated services digital network)의 전화 표준처럼 합의에 도달하는 시점에 쓸모가 없어지는 경우도 있다.

표준을 관장하는 여러 위원회의 운영과 사고방식은 전자 신호를 나사못처럼 취급하였다. 여러 나라에서 볼트와 너트를 공동으로 사용하려면 모든―약간이 아니라―중요한 규격에 대하여 합의를 끌어내야 한다. 1인치 혹은 1센티미터당 들어가는 나사 이빨에 대한 정확한 수치를 지킨다 해도 만약 구경이 틀린다면 볼트와 너트는 서로 맞지 않을 것이다. 기계 세계는 바로 그처럼 융통성 없는 방식을 요구하고 있다.

비트는 훨씬 더 유연하다. 비트는 더 높은 수준의 기술과 프로토콜(proto-

cols:이전에 예의바른 사회를 서술하기 위해 남겨둔 용어)을 만들기 위해 힘을 쏟는다. 프로토콜은 두 기계가 만나는 방식에 대한 아주 특정한 규정이다. 악수(handshaking)는 두 기계가 커뮤니케이션을 구축하는 방식, 그들 간의 대화에서 사용할 변수의 결정 과정을 가리키는 기술 용어이다.

모뎀이나 팩시밀리를 사용할 때 나는 소리를 들어보라. 찌하는 소리와 삐삐거리는 소리가 바로 기계 간의 악수 과정에서 발생하는 잡음이다. 이러한 만남의 소리는 모든 변수의 최대 공통 분모를 갖춰 그들 간에 비트를 교환할 최적의 영역을 찾는 협상이다.

더 높은 수준에서 보자면, 프로토콜은 표준 이상(meta-standard) 혹은 더 세부적인 비트 교환(swapping) 방법을 협상하는 데 사용되는 언어로 생각할 수 있다. 여러 언어를 사용하는 스위스에서 처음 보는 사람과 함께 티(T)자형 스키 리프트를 타는 상황을 그려 보라. 제일 먼저 티자형 리프트의 파트너(결국 말을 한다면)와 어떤 언어로 이야기할 것인가를 결정해야 한다. 텔레비전과 토스터도 서로 협동을 시작하기 위한 예비 작업으로 이와 비슷한 질문을 서로 나눌 것이다.




비트를 지닌 사물



25년 전에 나는 세계상품코드(UPC:universal product code)의 최종 디자인을 평가하는 자문위원회에 참석한 적이 있다. 현재 세계 도처에서 사용되고 있는 세계상품코드는 컴퓨터가 읽을 수 있도록 고안된 수직 막대 엠블렘이다. 부시 전대통령은 자동화된 슈퍼마켓 금전 등록기를 보고 놀라움을 표시했다가 곤욕을 치른 적이 있다. 세계상품코드는 신선한 야채말고는 깡통, 상자, 책 등 모든 것에 부착될 수 있다.

세계상품코드 위원회의 역할은 최종 바코드(bar-code) 디자인을 승인하는 일이었다. 최후의 입상작품(과녁판 모양의 디자인이 2위로 올라왔다)을 심의한 후에 엉뚱하지만 호기심을 자극하는 몇 가지 제안을 검토하였다. 예를 들어 가격에 비례하여 모든 식품들이 방사선을 발생하도록 만든 다음, 구매자의 카트에서 나오는 방사선의 양을 재는 가이거(Geiger) 계산 방식 같은 것이다.

통상적인 시금치 한 깡통은 1킬로그램당 한 시간에 1,000만분의 1래드(rad)의 방사선을 방출한다. 이것은 시간당 10억분의 1줄(joule)에 상당한다. 시금치 한 깡통의 화학 에너지는 10만 줄이다. 뽀빠이가 시금치를 먹으면 힘이 세지는 이유가 여기에 있다.

이러한 엉뚱한 발상은 지혜의 씨앗을 품고 있었다. 왜 세계상품코드가 데이터를 방출하도록 만들지 않는가? 유치원 아이들이 자기 뜻을 밝히려고 손을 들듯이 상품이 스스로 말을 하도록 만들면 어떨까?

이런 방식을 채택하지 않은 이유는 전력이 공급되지 않으면 세계상품코드와 조그만 ‘이름표들’이 무용지물이 되기 때문이다. 이를 위해 태양으로부터 동력을 얻거나 몇 년 간 쓸 수 있는 초소형 배터리로부터 동력을 얻는 해결책을 생각해 볼 수 있다. 아주 작은 배터리를 만들 경우 모든 ‘물건’이 디지털적으로 능동적으로 된다. 예를 들어 집에 있는 찻잔, 옷, 책 등이 자기가 어디에 있는가를 스스로 말할 수 있다. 미래에는 ‘절판’이라는 개념과 마찬가지로 ‘분실하다’는 개념이 무의미해질 것이다.

활성 꼬리표들은 전자적이지 않은 불활성 세계의 물질(봉제 곰, 과일 그릇 등)을 디지털 세계로 끌어들이기 때문에 앞으로 중요성이 커질 것이다. 가까운 장래에 사람과 동물이 활성 꼬리표를 사용할(그리고 사용하고 있다) 것이다. 애완동물을 다시는 잃어버리지 않도록(더 정확하게 말하면 잃어버릴 수는 있으나 그것이 어디에 있는지를 알 수 있다) 개나 고양이의 목에 거는 활성 꼬리표가 최상의 크리스마스 선물이 될 것이다.

사람들은 이미 보안을 목적으로 활성 배지를 사용하고 있다. 영국 올리베티(Olivetti)사는 색다른 어플리케이션을 개발하고 있다. 그들이 만든 배지를 달고 있으면 건물은 당신의 소재지를 추적한다. 당신에게 전화가 걸려올 경우 당신으로부터 가장 가까운 곳에 있는 전화가 울린다. 미래에는 이러한 기구가 클립이나 안전핀을 이용하지 않고 당신의 옷에 안전하게 부착되거나 아예 천으로 짜여 옷 속에 포함될 것이다.




입는 미디어



연산기능을 가진 코듀로이 양복지, 기억장치로서의 모슬린 천, 태양 전지 기능을 가진 실크 등이 미래의 디지털 의상을 만드는 소재로 활용될 것이다. 랩탑을 가지고 다니는 것이 아니라 랩탑을 입는다. 다소 지나치게 들릴지 모르지만 이미 몸에 컴퓨터와 통신 장비를 지니고 다니기 시작했다.

손목시계는 가장 확실한 예이다. 손목시계는 현재의 단순한 시계에서 이동 명령 통제 센터로 바뀔 것이다. 아주 자연스럽게 몸에 지닐 수 있기 때문에 많은 사람들이 그것을 찬 채로 잠들 것이다.

텔레비전, 컴퓨터, 전화가 하나로 통합된 제품은 더 이상 딕 트레이시(Dick Tracy)나 배트맨(Batman), 커크(Kirk) 선장의 전유물이 아니다. 향후 5년 안에 일반 전자제품과 관련된 분야에서 가장 큰 성장률을 보일 부문 가운데 하나가 바로 휴대용 제품이다. 타이멕스(Timex)는 이미 개인용 컴퓨터와 손목시계 간의 무선 통신을 제공한다. 타이멕스 시계는 큰 인기를 끌 것으로 예상되는데, 앞으로 영리한 (광학) 전송 소프트웨어가 마이크로소프트사의 체계 안에 포함될 것으로 보인다.

물건을 작게 만드는 우리의 능력은 이들 작은 물체에 전력을 공급하는 능력보다 훨씬 빨리 발전하고 있다. 전력 공급은 거북이 걸음으로 진행되어 온 기술 분야다. 배터리 기술이 집적회로만큼 빠른 속도로 발전한다면 손전등에 사용하는 조그만 배터리로 차 안에서 통신을 할 수 있다. 그러나 실제로는 장기 비행중에 랩탑을 사용하기 위해 10파운드 이상 나가는 배터리를 갖고 다닌다. 랩탑용 배터리는 노트북 컴퓨터의 기능이 확장되고 디스플레이가 더 밝아짐에 따라 계속 무거워졌다(1979년에 최초의 랩탑인 소니사의 타이프코더 Typecorder는 단지 4개의 에이에이 AA 배터리로 작동되었다).

휴대용 컴퓨터에서 전력 문제에 대한 기막힌 해결책을 찾을 수 있을 것으로 보인다. 애버크롬비 앤 피치(Abercrombie & Fitch)사는 태양 전지가 작은 선풍기를 작동시켜 이마 위로 바람을 불어주는 선풍기 사파리 모자를 출시하였다. 전력 저장에는 허리띠가 안성맞춤이다. 벨트를 벗어 그것이 차지하는 엄청난 넓이와 부피를 살펴보라. 당신의 휴대용 전화기를 재충전하기 위해 벽면의 플러그에 꽂는 인조 쇠가죽 벨트를 상상할 수 있을 것이다.

안테나를 따로 준비할 필요는 없을 것이다. 인간의 몸 자체가 안테나 역할을 할 수 있으니까. 또한 대부분의 안테나를 넥타이처럼 천으로 짤 수 있다. 디지털의 도움을 약간만 받으면 사람의 귀도 ‘토끼 귀’처럼 예민해질 수 있다.

중요한 점은 장래의 디지털 장치가 현재 우리의 여러 가지 준거틀(남들이 이렇게 부르기 때문에 나도 틀이란 말을 사용하겠다)을 자연스럽게 뛰어넘어 아주 색다른 형태와 크기로 나타날 수 있다는 것이다. 그렇게 되면 컴퓨터 장비 소매점과 공급처는 라디오 세크(Radio Shack)나 스태이플즈(Staples)에 국한되지 않고, 나이키, 리바이스, 바나나 리퍼블릭에서도 컴퓨터 장비를 판매하게 될 것이다. 더 시간이 지나면 액상 디스플레이를 갤론 단위로 팔거나 원하는 곳에 칠해 주는 날이 올지도 모른다. 시디롬을 먹거나 병렬 프로세서를 선탠 로션처럼 바르는 날이 올지도 모른다. 어쩌면 컴퓨터 안에서 생활할지도 모르겠다.




비트와 모르타르



나는 건축설계사 교육을 받았다. 그래서 건축과 관련된 수많은 귀중한 개념은 곧바로 컴퓨터 디자인에 적용되지만―우리 환경을 보이는 곳이든 보이지 않는 곳이든 똑똑한 기구들로 채우는 일은 제껴놓고라도―컴퓨터 디자인은 거의 건축에 적용되지 않음을 발견하였다. 빌딩을 엄청난 전자 기계 장비로 생각할 수는 있지만 아직까지는 그것을 실현시킬 만한 영감어린 어플리케이션은 만들어내지 못했다. 스타십 엔터프라이즈(Starship Enterprise)사의 건축조차 자동문 설계 수준에 머물러 있다.

미래의 빌딩은 컴퓨터의 뒤판처럼 될 것이다. ‘스마트 레디’(smart ready:에이엠피AMP사가 스마트 하우스 프로그램을 위해 만든 용어)는 여러 가지 전기기기를 미래에 함께 사용하기 위해 배선과 연결기를 미리 조합해 준비해두고 있다. 나중에 이런저런 종류, 예를 들어 거실의 네 벽에 음향 설비를 장치하여 ‘카네기 홀’ 같은 효과를 내는 처리과정을 추가할 수 있다.

이제까지 내가 본 ‘지능환경’의 대부분 사례는 인간의 존재를 감지하는 능력이 없다. 그것은 개인용 컴퓨터의 성능 향상에 대한 문제다. 환경이 당신을 보거나 느낄 수 없다. 자동 온도조절기조차 당신이 덥거나 춥게 느끼는 것을 감지하지 못하며 벽면의 온도를 조절하는 데 머물러 있다. 미래의 방은, 당신이 무엇을 먹기 위해 앉아 있는지, 자러 갔는지, 샤워를 막 시작했는지, 개를 데리고 산보를 갔는지에 대해 알고 있을 것이다. 전화기는 결코 따르릉거리며 울리지 않을 것이다. 당신이 그곳에 있을 경우 디지털 집사가 그 전화를 당신에게 연결하기로 결정하면 가장 가까운 데 있는 문고리가 “실례하겠습니다, 주인님”이라고 말한 후 전화를 연결하여 줄 것이다.

어떤 사람은 어디에서나 이루어지는 컴퓨팅(ubiquitious computing)이라 부르고―그렇다―, 다른 사람은 인터페이스 대행자 사용과 반대되는 것으로―그렇지 않다―이것을 제시한다. 이 두 가지 개념은 하나이고, 같은 것이다.

한 사람 한 사람이 현재 생활(비행기 예약 시스템, 포스 POS 데이터, 온라인 서비스 사용, 측정, 메시지 보내기)에서 사용하는 서로 연결되지 않은 여러 가지 컴퓨터 처리과정 때문에 컴퓨터의 편재성이 나타난다. 컴퓨터 생활은 앞으로 더 많이 서로 연결될 것이다. 이른 아침 달라스(Dallas)로 출발하는 비행기가 연기되면 자명종 시계가 조금 늦게 울리고, 공항까지 태워다 줄 자동차는 교통혼잡도를 고려하여 적절한 시간에 도착하도록 자동적으로 연락을 할 것이다.

집에 대한 대부분의 미래상에서 현재 빠져 있는 것이 가정용 로봇이다. 정말 이상한 변화다. 왜냐하면 20년 전엔 미래에 대한 대부분의 이미지가 로봇과 관련된 주제를 포함하고 있었기 때문이다. 시스리피오(C3PO)는 훌륭한 집사 역할을 수행할 수 있다. 그의 기계 음성 액센트도 적절하게 조정될 것이다.

가정용 로봇에 대한 관심이 다시 고조될 것이다. 계단을 오르내리기 위한 다리, 먼지를 터는 팔, 마실 것을 운반하는 손을 갖고 있는 디지털 가정용 로봇을 기대해도 좋다. 도난이나 침입 방지를 위해 가정용 로봇은 사나운 개처럼 으르렁거리고 짖을 수도 있을 것이다. 이런 개념들은 새로운 것이 아니다. 이와 관련된 기술은 쉽게 얻을 수 있다. 그런 로봇이라면 10만 달러라도 기꺼이 지불할 사람들이 전세계에 10만 명은 족히 될 것이다. 100억 달러짜리 시장이 오랫동안 간과될 리가 없다.




잘잤니, 토스터야!



우유가 다 떨어진 사실을 확인한 냉장고는 귀가할 때 우유를 사오는 것을 상기시켜 주도록 자동차에게 요청을 할 수도 있다. 오늘날의 가전 제품들은 컴퓨팅을 거의 하지 못한다.

토스터는 빵을 태우지 말아야 한다. 그러기 위해 토스터는 다른 전기 기계에게 말할 수 있어야 한다. 당신이 흥미를 갖고 있는 주식의 마감 가격과 아침에 먹을 토스트를 한데 결합하는 것은 아주 간단하다. 그러나 그 전에 토스터가 뉴스와 연결되어 있어야 한다.

당신의 집안에는 현재 100개 이상의 마이크로프로세서가 있을 것이다. 그러나 그들은 통합되어 있지 않다. 가장 잘 통합된 가전 시스템은 아마도 경보 시스템이며, 부분적으로는 원격 조정되는 조명기기들, 그리고 소형 가전제품들일 것이다. 커피메이커는 당신이 아침에 일어나기 전에 커피 원두를 갈아서 신선한 커피를 끓이도록 프로그램될 수 있다. 그러나 당신이 자명종 시계를 평소보다 45분 늦게 울리도록 조정한 날의 아침에는 형편없는 커피가 당신을 기다리고 있을 것이다.

가전제품들 사이의 전자적 커뮤니케이션 결핍은 각각의 제품이 원시적이고 단편적인 인터페이스 기능밖에는 갖지 못하게 한다. 예를 들어 사람과 기계 간의 지배적인 상호작용 방식으로 언어가 채택되면 말하고 들을 수 있는 조그만 부속장치가 필요할 것이다. 그렇다고 이들 각각 모두가 언어를 구사하고 이해하는 모든 기능을 보유할 필요는 없다. 제품들도 상호 커뮤니케이션을 수행하며 이러한 언어 이해와 구사 기능을 공유하여야 한다.

이러한 기능 공유를 위한 중앙집중식 모델은 매력적이다. 그래서 어떤 사람들은 우리 지하실에 정보 ‘용광로’―모든 입출력을 관리하는 가정용 중앙 컴퓨터―를 설치하자고 제안하였다. 나는 이런 방식으로 진행되지는 않으리라 본다. 이런 기능은 대부분 전자제품들 사이의 네트워크로 분산될 것이다. 물론 이 네트워크 안에는 언어 인식과 구사 기능을 전담하는 제품이 포함되어 있다. 냉장고와 찬장이 표준화된 제품코드를 읽고 식품을 기억할 경우 그들 중 하나만 식품 코드를 해석할 수 있으면 된다.

‘백색 상품’(white goods)과 ‘갈색 상품’(brown goods)이라는 용어는 토스터 같은 주방기구(kitchen-top)와 접시닦기나 냉장고 같은 붙박이 가전제품을 구분하기 위해 사용된다. 백색과 갈색 간의 전통적인 구분에는 정보 관련 전기기구가 포함되어 있지 않은데 이러한 구분법은 바뀌어야 한다. 왜냐하면 백색 상품이나 갈색 상품이 점차 많은 정보를 생산하고 소비하게 되기 때문이다.

미래의 어떤 가전제품은 잘못하였다고 꾸중을 듣기도 하고 칭찬을 받고 우쭐대는 개인용 컴퓨터가 될 것이다. 이런 방향으로 변화하게 될 이유 가운데 하나는 전자제품을 좀더 친근하고, 사용이 편하고, 스스로 설명할 수 있도록 만들기 위해서다. 너무 어려워서 그 사용법을 배우고 싶지 않을 정도로 엄청나게 많은 기능(그 중 일부는 필요 없는)을 가지고 있는 가전제품들(마이크로 웨이브 오븐, 팩스, 무선전화기)이 얼마나 많은가 생각해 보라. 제품들에 내장된 컴퓨터는 단순히 마이크로 웨이브 오븐이 음식을 잘못 조리하는 것을 예방하는 차원을 넘어 사용성을 크게 향상시킬 것이다.

안내 매뉴얼은 시대에 뒤떨어진 개념이다. 컴퓨터 하드웨어와 소프트웨어 제조업자가 상품을 포장하면서 이들 매뉴얼을 함께 넣는 것은 쓸데없는 짓이다. 기계를 어떻게 사용할까에 대한 최상의 지시자는 기계 자신이다. 기계는 당신이 하고 있는 일, 당신이 방금 끝마친 일을 알 뿐만 아니라 당신이 하고자 하는 일까지 추측할 수 있다. 이러한 인식을 기계 자체의 작동에 필요한 지식에 집어넣는 일은 컴퓨터 과학의 입장에서 보면 별것 아니지만, 당신이 어디에 두었는지 알 수도 없고 거의 이해하지도 못하는 매뉴얼 인쇄물의 입장에서 보면 엄청난 진전이 아닐 수 없다.

왼손잡이, 난청, 기계 불안증 등 당신의 특성에 대한 자세한 지식을 제품에 추가하면 운영과 예방보수면에서 어떤 친절한 안내서보다 뛰어난 보조자(보좌관이라는 뜻의 aide의 e자는 내가 의도적으로 삽입한 것이다)가 될 수 있다. 미래의 가전제품에는 (포장지의 ‘이쪽 면을 위로’라는 경고 문구를 제외하면) 인쇄된 지시문이 하나도 없을 것이다. 제대로 설치되었다고 느끼게 되면 기계는 스스로 판단해 전자통신망을 통해 ‘제품보증서’를 회사에 보내게 된다.




스마트 자동차



최신 자동차는 차체를 만드는 쇠보다 전자 장비에 더 많은 비용이 들어간다. 자동차에는 이미 50개 이상의 마이크로프로세서가 장착되고 있다. 그렇다고 해서 자동차가 고도의 지능을 갖게 되었다는 말은 아니다. 예쁜 유럽산 자동차를 빌렸다고 하자. 주유소의 길게 늘어선 줄의 맨 앞에서 가스 탱크를 열기 위해 전자 스위치를 눌러야 하는데 그 방법을 모른다면 자신이 아주 바보처럼 느껴질 것이다.

자동차에는 여러 주요 디지털 장비(devices)로서 스마트 라디오와 에너지 컨트롤, 정보 계기판이 부착될 것이다. 이와 함께 자동차는 디지털이 가져다 주는 특별한 혜택을 누릴 것이다. 자동차는 스스로 자신의 위치를 알게 된다.

최근의 지도 기술(mapping)과 추적 기술(tracking)은 모든 도로의 컴퓨터 모델을 통해 자동차의 현재 위치를 보여줄 수 있다. 미국 전역의 도로망이 시디롬 한 장에 들어간다. 인공위성 위치판독기, 천체관측응용 위치측정기(dead reckoning, 이것은 당신 자동차의 움직임을 포착한다), 혹은 이들 추적 기술을 조합하여 자동차의 현재 위치를 몇 피트의 오차 내에서 정확하게 알 수 있을 것이다. 여러분은 계기판의 컴퓨터 화면에 현재 위치와 목적지가 지도로 나타나는 제임스 본드의 애스톤 마틴(Aston Martin)을 기억할 것이다. 현재 이것의 상업용 제품이 출하되어 사용자가 늘고 있다. 미국에서는 1994년 올스모빌(Oldsmobile)사가 처음으로 이러한 제품을 출시하였다.

그러나 약간 문제가 있다. 특히 나이 든 운전자들은 눈의 초점을 빨리 바꾸지 못한다. 무한대에 초점을 맞추었다가 2피트 거리로 초점을 모으기란 여간 어려운 일이 아니다. 더 나쁜 것은 지도를 보기 위해 돋보기를 써야 하는 사람―마치 마구 씨(Mr. Magoo)가 운전하는 것처럼―도 있다는 점이다. 보다 좋은 항법보조 방법은 사람의 목소리이다.

운전할 때는 귀를 사용하지 않기 때문에 음성은 회전할 시점, 보아야 할 곳, 그밖에 이런저런 것들을 당신에게 알려주는 이상적인 채널이다. 다만 방향을 정확하게 발음하는 방법이 다소 힘들다(이 때문에 사람이 그러한 형편없는 업무를 수행하고 있다). 도로는 수많은 애매함으로 꽉 차 있다. “다음번에 오른쪽으로 도시오”라는 지시는 돌아야 할 장소가 몇백 피트, 혹은 몇백 야드 떨어진 경우에는 아주 명확하다. 그러나 가까이 접근할수록 ‘다음번’ 오른쪽이 이번 오른쪽인지 그 다음 오른쪽인지 알 수 없게 된다.

훌륭한 디지털 음성 출력 장치로 ‘보조 운전자’(back seat drivers)를 만드는 것이 가능하지만 미국 시장에서 가까운 장래에 이러한 개념을 이용한 자동차를 보기는 힘들 것이다. 그 대신에 그것이 맞든 틀리든, 안전하든 위험하든, 제임스 본드가 가졌던 자동차를 보게 될 것이다. 그 이유는 엉뚱한 곳에 있다. 만약 자동차가 잘못된 지도의 자료를 가지고 길을 안내하여 일방통행로에 들어섰다가 사고가 나면 누구에게 책임을 물을 것인가? 그런데 지도를 보다가 이런 사고가 일어날 경우에는 당신에게 책임이 돌려진다. 책임 소재에 대한 계몽이 잘 되어 있는 유럽에서는 메르세데스 벤츠가 올해 안에 말하는 항법 시스템을 갖춘 자동차를 소개할 것이다.

이러한 항법 시스템은 단지 당신을 에이(A)지점에서 비(B)지점으로 인도하는 데 그치지 않는다. 당신이 방문하는 도시를 음성으로 안내하거나(“오른편 지점은 ‧‧‧‧‧‧가 태어난 곳으로서‧‧‧‧‧‧”), 음식 관련 정보와 숙박 정보(3번 출구 근처의 훌륭한 호텔에 예약됐음)를 알려주는 새로운 특수시장이 생겨날 것이다. 미래의 멋진 자동차를 분실했을 경우엔 자동차가 당신에게 전화를 걸어 자신이 있는 장소를 정확하게 알려줄 것이다. 아마 겁먹은 목소리로 자신의 위치를 말할지도 모른다.




디지털 개성



말하는 자동차가 인기 없는 이유 가운데 하나는 이것이 해마(seahorse)보다도 더 개성이 없기 때문이다.

일반적으로는 컴퓨터가 잘못 동작할 때 발생하는 사건을 통해 컴퓨터의 개성을 느낄 수 있으며, 때로는 반대의 경우도 있다. 한번은 내가 철자 검색 프로그램에게 읽기 힘든 난필로 ‘또한’(also)이라고 써서 보여주었더니 ‘똥구멍’(asshole)이 맞는 철자라고 제시하는 것을 보고 배꼽을 잡고 웃은 적이 있다.

조금씩조금씩 컴퓨터가 개성을 갖춰가고 있다. 헤이스(Hayes)사의 통신 소프트웨어인 스마트콤은 사소하기는 하지만 대표적인 사례이다. 스마트콤은 얼굴을 가지고 있는 작은 전화기를 화면에 보여주는데, 접속 과정의 각 단계를 지켜보던 두 개의 눈은 컴퓨터가 한 단계를 마치고 다음 단계로 넘어갈 때마다 목록을 쫓아 움직인다. 마지막 단계의 접속이 성공적으로 이루어지면 이 얼굴은 미소를 짓지만 접속이 이루어지지 않으면 인상을 쓴다.

이것은 천박한 취미가 아니다. 기계의 의인화는 재미있고, 덜 긴장되게 하며, 사용이 편리하고, 친근감을 주어 기계라는 딱딱한 느낌을 감소시켜 준다. 새로운 개인용 컴퓨터의 등장은 집에서 훈련시키는 강아지 그 이상이 될 것이다. 가상의 성격에 의한 생활과 행동 스타일을 갖고 있는 개성 모듈(module)을 구입할 수 있게 된다. 신문 인터페이스로 사용하기 위해 래리 킹(Larry King) 개성을 구입할 수 있게 된다. 아이들은 쉬스 박사(Dr. Seuss)와 함께 네트를 여행하고 싶어할 것이다.

그렇다고 해서 중요한 문서를 작성할 때 툭툭 농담이 튀어나와 작업을 방해하는 사태를 제안하는 것은 아니다. 나는 상호작용 스타일이 마우스를 누를 때 들리는 클릭 소리, 갈라진 목소리, 반복적으로 깜박이는 에러 메시지 보다 훨씬 풍부해져야 한다는 점을 제시하는 것이다. 우리는 유머 감각을 가진 시스템, 격려나 주의를 주는 시스템, 나아가 바바리아의 가정부와 같이 엄격하고 원리원칙적인 시스템도 가질 수 있게 될 것이다.








새로운 전자 표현주의자            18





일요 화가 재탐방



국 가정에서는 어딜 가나 아이들의 낙서가 가득 덮인 냉장고를 마주하게 된다. 우리는 아이들에게 창조성을 강조하면서, 뭔가를 만들어 보라고 부추긴다. 그러나 아이들이 예닐곱 살이 되면 갑자기 태도를 바꾸어 미술과 야구를, 영어와 수학같이 중요하게 다루지 않는다. 젊은 남녀를 위한 세 가지 알(3R:reading, writing, arithmetics)은 중요한 인물이 되고자 하는, 무엇인가를 해보려 하는 사람에게만 국한된다. 어린 시절 이후 20년 동안 우리는 그들의 왼쪽 두뇌를 스트라스부르(Strasbourg)의 거위처럼 불거지게 하고, 오른쪽 두뇌는 완두콩처럼 쭈그러진 기형으로 만든다.

세무어 파퍼트는 19세기 중엽의 외과 의사가 시간여행의 마술을 이용하여 현대의 수술실로 들어온 이야기를 들려주었다. 의사는 사물을 이해하지 못했고, 무엇을 해야 할지, 어떻게 환자를 돌봐야 할지 전혀 알 수 없었다. 현대 기술이 외과 수술 방법을 그가 이해할 수 없을 정도로 완전히 바꿔놓았다. 19세기 중반의 교사가 같은 타임머신을 타고 오늘날의 교실을 방문한다면, 크게 중요하지 않은 몇몇 주제를 제외하고, 그 교사는 20세기 후반의 동료들이 어디에서 수업을 마칠지 알아낼 수 있다. 오늘날의 교육 방식과 150년 전의 방식 간에는 근본적인 차이가 없다. 학교에서 이용하는 기술의 대부분은 예나 지금이나 비슷한 수준에 머물러 있다. 미국 교육부의 최근 조사에 따르면 미국 교사의 84%가 정보기술의 중요한 유형으로 꼽은 것은 적절한 충분한 용지공급이 이루어지는 복사기, 오직 한 가지뿐이었다.

그럼에도 불구하고 우리는 강박 관념에 사로잡힌 어린이를 생산하던 불행한 교육양식을 버리고 예술과 과학, 왼쪽 뇌와 오른쪽 뇌의 구분을 없애는 방향으로 옮겨가고 있다. 어린이가 컴퓨터 스크린에서 그림을 그리기 위해 로고(Logo) 같은 컴퓨터 프로그램 언어를 사용할 경우 그 아이가 그린 이미지에서는 예술적인 표현과 수학적인 표현, 양쪽 모두를 찾아볼 수 있다. 수학 같은 추상적 개념까지도 시각 예술의 구체적인 요소로 사용될 수 있다.

개인용 컴퓨터 사용을 통하여 미래의 성인은 수학적인 능력이 발달하는 동시에 영상에 대한 이해력도 높아질 것이다. 앞으로 10년 후 10대 청소년들은 책벌레가 되지 않고도 지적 성취를 추구할 수 있을 것이다. 그들은 훨씬 더 다양한 선택 조건을 보장받을 수 있을 것이다. 그들은 책 대신에 인식 스타일과 학습 유형, 표현 행동에서 폭넓은 선택을 갖게 될 것이다.

일과 놀이 간의 중간지대가 극적으로 넓어지고 있다. 디지털이라는 공통분모 때문에 사랑과 의무 간의 경계선이 흐려질 것이다. 일요 화가는 이러한 가능성을 보여주는 새로운 시대의 징표이자 창조적 취미―평생 창조, 행동, 표현―를 존중하는 시대 상징이다. 오늘날 은퇴한 사람이 수채화 도구를 챙겨드는 사태는 어린시절로 돌아감으로써 잃어버렸던 세월을 돌려받는 일종의 보상이다. 미래에는 일할 때 사용하는 도구와 놀 때 사용하는 장난감의 구분이 없어지기 때문에 나이든 모든 사람들이 그들의 삶에서 훨씬 더 조화로운 연속성을 발견할 것이다. 개인적 표현과 집단 작업을 위한, 사랑과 의무를 위한 동일한 팔레트가 만들어질 것이다.

젊거나 나이가 많거나, 컴퓨터 해커는 이에 대한 아주 훌륭한 사례이다. 그들이 짠 프로그램은 초현실주의 그림처럼 미적인 질과 기술적인 뛰어남을 갖추고 있다. 그들의 작업은 스타일과 내용, 의미와 행위 그 자체의 두 가지 측면에서 논의된다. 그들의 컴퓨터 프로그램이 갖는 행위는 새로운 종류의 미학을 담고 있다. 이들 해커는 새로운 표현주의의 선구자이다.




음악 그리기



음악은 컴퓨터 과학을 형성하는 가장 중요한 요인 가운데 하나이다.

음악을 세 가지 상호보완적인 관점에서 바라볼 수 있다. 먼저 디지털의  관점에서 평가할 수 있다. 이것은 음향을 녹음할 때 코카콜라 캔이 떨어지는 소리를 분리해서 채음하는 것처럼 매우 까다로운 문제이다. 두번째로는 음악적 인지, 곧 우리가 어떻게 음악 언어를 해석하고 무엇이 감상을 구성하며, 어디에서 감정이 나오는지를 평가하는 관점이다. 마지막으로 음악은 예술적 표현과 서술―이야기와 발현 감정―로 취급할 수 있다. 이들 세 가지는 모두 중요하다. 이들은 기술과 표현, 과학과 예술, 사적인 것과 공적인 것 사이를 우아하게 오가면서 음악 영역을 완벽한 지적 풍경으로 만든다.

컴퓨터 과학도가 꽉 들어찬 강의실에서 악기를 연주할 줄 알거나 자신이 음악에 대하여 진지한 관심을 가지고 있다고 생각하는 사람을 찾는다면 전부 다 손을 들 것이다. 수학과 음악에 대한 전통적인 경배는 현대 컴퓨터 과학도와 해커 공동체 안에 깊이 녹아 있다. 미디어랩은 음악에 대한 연구를 수행하고 있기 때문에 가장 우수한 과학도들에게도 인기가 있다.

어린시절을 예찬하는 사람들은 미술과 음악을 좋아한다. 부모와 사회 권력은 암암리에 음악과 미술을 경시하거나 학문적 성공의 압박에서 잠시 벗어나 휴식을 취하는 배출구쯤으로 간주한다. 그러나 음악과 미술은 어린이들이 이제까지 하나의 방식으로 제시되어 온 전체 지식 체제의 골격을 탐구할 수 있는 렌즈를 만들어준다. 나는 학교에서 배우는 역사를 싫어하기 때문에 정치와 전쟁의 연대기는 모르지만 예술과 건축의 이정표는 거의 다 헤아릴 수 있다. 내 아들은 나의 독서장애증을 이어받았음에도 불구하고 윈드서핑이나 스키 잡지를 이 책 저 책 탐욕스레 읽어댄다. 음악은 수학을 공부하고 물리학을 배우고 인류학을 이해하는 길이 될 수 있다.

반대면은 다음과 같다. 음악을 어떻게 공부할 수 있을까? 19세기와 20세기 초반에는 학교에서의 음악 연주는 일반화되어 있었다. 그런데 음악 녹음 기술이 출현하여 학교에서 음악을 연주하지 않게 되었다. 최근 들어서야 학교가 음악을 듣는 데 그치지 않고 음악을 만듦으로써 음악을 배우는 교육 방식으로 다시 되돌아가고 있다. 아주 어린 나이에 컴퓨터를 이용해 음악을 배우게 되면 컴퓨터의 기능을 완전히 누릴 수 있다. 어린이들은 모든 측면에서 음악에 접촉할 수 있게 되기 때문이다. 컴퓨터는 재능 있는 아이들뿐 아니라 모든 어린이가 음악에 접근할 수 있도록 해준다. 음악 게임, 음향 데이터 테이프, 디지털 오디오의 특징인 뛰어난 조작성은 아이들에게 음악을 경험하도록 도와주는 여러 수단 가운데 일부일 뿐이다. 시각적으로 발달된 아이들은 음악을 보는 방법까지 발명해 낼 것이다.




이(E)로 시작하는 예술



컴퓨터와 예술이 처음 만났을 때 그 결과는 최악이었다. 그 이유 가운데 하나는 기계 신호가 너무 강력했기 때문이다. 홀로그래픽 예술이나 입체 영화에서 자주 발생하는 것과 같이 표현이 지나치게 강조되었다. 기술은 프렌치 소스의 자라페노 후추 같은 역할을 할 수 있다. 컴퓨터의 강력함은 예술의 섬세함을 보이지 않게 묻어 버릴 수 있다.

컴퓨터와 예술의 상호보완은 행위기술과 예술품에 대한 체험이 가장 쉽게 혼합될 수 있는 음악과 행위예술에서 가장 효율적으로 이루어졌다. 작곡가, 연주가, 청중 모두가 디지털로 음악을 조작할 수 있다. 허비 핸콕(Herbie Hancock)이 인터넷에 그의 다음 작품을 발표한다면, 2,000만 개 좌석을 갖춘 극장에서 연주하는 효과를 얻을 뿐만 아니라, 개개 청중에게 그들의 개인 취향에 따라 음악을 변형할 기회를 제공할 수 있다. 변형은 볼륨을 조절하는 것만큼 간단하다. 어떤 이에게는 음악을 가라오케로 바꾸는 작업과 같다. 또 다른 이에게는 오케스트레이션의 변형이 될 수도 있다.

디지털 고속도로는 이미 완성되어 영원히 바꿀 수 없는 예술품의 개념을 과거의 유산으로 바꾸어버릴 것이다. 모나리자에 턱수염을 그려넣는 일은 어린애 장난에 불과하다. 우리는 인터넷을 오가는 진지한 디지털 조작(반드시 나쁜 것은 아니다)을 대하게 된다.

우리는 더욱 참여 지향적이고 생생한 표현이 이루어지는 시대로 들어서고 있다. 우리는 책장을 넘기거나 루브르를 여행하는 것과는 판이한 방식으로 감각 신호를 나누고 경험하는 기회를 갖는다. 예술가는 그들의 표현 무대인 지상 최대의 미술관, 사람들에게 직접 예술을 전달할 수 있는 수단으로 인터넷을 맞이하게 될 것이다.

실질적인 기회는 변종과 변화를 이끌어내는 디지털 예술가로부터 나온다. 이런 이야기가 슈타이헨(Steichen)의 모든 작품을 엽서로 만들거나 워홀(Warhol)의 모든 작품을 클립 아트(clip art)로 전환하는 것처럼 중요한 문화 아이콘(icons)들을 완전히 저질로 만들어버리자는 이야기로 들릴 수도 있겠다. 그러나 요점은 디지털 세상이 생산물뿐만 아니라 그 생산과정을 가능케 한다는 사실이다. 그 과정은 환상적이고 황홀한 경험이 될 것이다. 아니면 여러 사람의 다양한 상상력, 혹은 혁명적 집단의 비전이 될 수도 있다.

살롱 데 레퓨제



미디어랩의 최초 개념은 휴먼 인터페이스(human interface)와 인공지능(artifi-

cial intelligence) 연구를 새로운 차원에서 전개하면서 만들어졌다. 그 새로운 생각이란 정보 시스템의 내용, 일반용 소프트웨어에 대한 욕구, 본질적인 예술적 사유 등을 토대로 휴먼 인터페이스와 인공지능의 개념을 다듬어 나가는 것이었다. 이 생각은 비디오의 감각적 풍부함, 출판의 정보적 깊이, 컴퓨터의 내재적인 상호소통성의 수렴을 통하여 방송, 출판, 컴퓨터 산업계로 퍼져나갔다. 오늘날에는 매우 논리적으로 들리지만 그 당시에는 매우 어리석은 생각으로 간주되었다. 뉴욕 타임스는 이름을 밝히지 않은 고참 교수의 말을 빌어 이 모험에 착수한 모든 사람을 ‘사기꾼’으로 몰아붙이는 기사를 실었다.

미디어랩은 건축가 페이(I.M. Pei)가 설계한 건물 내에 위치하고 있는데, 이 건물은 페이가 미국의 수도 워싱턴에 있는 국립 미술관의 새 확장 건물을 설계하고 난 후, 파리 루브르 박물관의 피라밋을 설계하기 직전에 설계하였다. 미디어랩을 위한 자금을 만들고, 건물을 짓고, 교수 요원을 모으는 데 거의 7년이 걸렸다.

1863년에 파리의 미술 기관이 인상파의 공식 전시회를 거절한 것처럼 미디어랩의 창립 교수진은 ‘살롱 데 레퓨제’(Salon des Refuse′s)가 되어 그들 자신의 조직을 만들었다. 대학의 학과 차원에서 볼 때 미디어랩은 지나치게 급진적이고, 다른 점이 많았으며, 결정적으로 관련되는 학과도 없었다. 나와 제롬 비스너를 제외하고 창립 교수진은 영화감독, 그래픽 디자이너, 작곡가, 물리학자, 두 명의 수학자와 멀티미디어를 발명한 연구 요원으로 구성되었다. 미디어랩은 1980년대 당시에 프로그래밍 언어, 오퍼레이팅 시스템(operat-

ing systems), 네트워크 프로토콜(network protocols), 시스템 구조(system archi-

tectures)에 여념이 없던 기존 컴퓨터 과학에 대한 대항문화로서 등장하였다. 미디어랩을 하나로 연결한 끈은 학과가 아니라, 컴퓨터가 무소불위의 능력으로 과학뿐만 아니라 삶의 모든 측면에서 삶의 질을 극적으로 바꾸리라는 믿음이었다.

시의적절하게도 당시는 퍼스널 컴퓨터가 탄생하고 사용자 인터페이스가 핵심적인 것으로 인식되면서 통신산업에 대한 규제가 풀리던 시기였다. 신문사, 잡지사, 출판사, 영화 스튜디오, 텔레비전 방송국의 사주와 경영자들은 미래가 무엇을 담고 있는가에 대해 스스로에게 질문하기 시작했다. 스티브 로스(Steve Ross)나 타임 워너사의 딕 먼로(Dick Munro)처럼 실정을 알고 있는 미디어 거물들은 디지털 시대의 미래에 대한 직관을 갖고 있었다. 엠아이티의 엉뚱한 출발에 투자하는 것은 그들에게는 별로 큰 비용이 들지 않는 손실 방지책이었다. 그래서 우리는 순식간에 300명의 사람을 모을 수 있었다.

오늘날 미디어랩은 완전히 자리를 잡았다. 인터넷 항해자(surfer)는 골목을 누비는 미친 아이들이다. 디지털화된 사람(digerati)은 멀티미디어의 세계를 훌쩍 뛰어넘어 새로운 세계로 이동한다. 그곳은 지식인선언문 따위를 발표하는 세상이 아니라 보다 실제적인 라이프스타일을 실현하는 현장이다. 그들의 결혼식은 사이버스페이스에서 이루어진다. 그들 자신은 스스로를 비트닉(bitniks)이나 사이브리안(cybraian)이라 부른다. 그들의 사회적 이동성은 전 지구를 포괄한다. 오늘날 그들의 살롱은 파리의 카페나 케임브리지의 페이 빌딩 안에 있지 않다. 그들의 살롱은 네트 어디인가에 있다. 그것은 디지털이다.








에필로그:낙관의 시대             








나는 천성적으로 낙관적이다. 그러나 모든 기술, 혹은 과학의 선물은 어두운 면을 갖고 있다. 디지털 세상도 마찬가지다.

이후 10년 동안에 지적 소유권의 남용과 프라이버시의 침해 사례를 많보게 될 것이다. 우리는 디지털 문화 파괴주의, 소프트웨어 해적질, 데이터 도둑질 등을 경험할 것이다. 최악의 경우, 완전 자동화 시스템 때문에 수많은 직업이 사라지고 공장이 변형된 것과 마찬가지로 화이트칼라의 작업장도 변할 것이다. 한 직장에서 평생 고용된다는 개념은 이미 사라지기 시작했다.

아톰이 아니라 비트와 작업을 하는 일이 점점 많아지면서 고용 시장의 성격이 근본적으로 변화하여 20억에 달하는 인도와 중국의 강력한 노동력이 문자 그대로 온라인에 참여하기 시작하는 순간이 올 것이다. 페오리아(Peoria)의 독립 소프트웨어 디자이너가 포항(Pohang)의 상대자와 경쟁하고 마드리드(Madrid)에 사는 디지털 타이포그래퍼는 마드라스(Madras)의 상대와 경쟁할 것이다. 미국 회사들은 값싼 일손을 찾기 위해서가 아니라 미국보다 훈련이 더 잘 되어 있으면서, 더 열심히, 더 빨리 일할 준비가 되어 있는 고숙련 지식 노동력을 확보하기 위해 이미 하드웨어 개발과 소프트웨어 생산을 러시아와 인도로 옮기고 있다.

비즈니스 세계가 세계화되고, 인터넷이 성장함에 따라 거침 없는 디지털 작업장을 마주하게 될 것이다. 관세와 무역에 관한 일반 협정(GATT, 에비앙의 물을 캘리포니아에서 팔 권리)이 조인되어 관세와 아톰무역의 장벽이 사라지고 정치적 평화가 정착되기 훨씬 이전에 비트는 국경을 초월하여 지정학적인 경계와 아무 상관이 없이 보관되고 조작될 것이다. 실제로 미래의 디지털 세상에서는 무역권(trade zones)보다 시간대(time zones)가 훨씬 중요한 역할을 하게 될 것이다. 나는 어떤 소프트웨어 프로젝트가 문자 그대로 동에서 서로 세계를 돌아다니면서, 이 사람에서 저 사람에게, 이 집단에서 저 집단으로, 한 사람이 잠들 때 다른 사람은 일하는 그런 상황을 상상해 본다. 마이크로소프트는 3교대로 제품을 생산하기 위해 런던과 동경에 소프트웨어 개발을 위한 사무실을 개설할 필요가 있을 것이다.

그러한 디지털 세계에 가까이 가면 갈수록 전체 인구의 상당 부분이 소속감을 잃는다고 느끼거나 실제로 잃을 것이다. 50세의 철강 노동자가 직업을 잃으면 스물다섯 살 난 그의 아들과 달리 그는 결코 디지털의 탄력성을 가질 수 없을 것이다. 오늘날 비서가 직업을 잃을 경우 그는 디지털 세계에 친숙하기 때문에 최소한 다른 방면으로 전환할 수 있는 기술을 갖고 있다.

비트는 먹을 수 없다. 비트는 배고픔을 멈출 수 없다. 컴퓨터는 도덕이 아니다. 컴퓨터는 삶과 죽음의 권리와 같은 복합적 문제를 풀 수 없다. 그럼에도 불구하고 디지털 세상을 낙관할 만한 이유는 많다. 자연의 힘과 마찬가지로 디지털 시대는 부정할 수도, 멈출 수도 없다. 탈중심화(decentralizing), 세계화(globalizing), 조화력(harmonizing), 분권화(empowering) 이 네 개의 강력한 특질이 궁극적인 승리를 얻을 것이다.

디지털 세상의 탈중심화 영향은 컴퓨터 산업 자체와 상업 분야에서 가장 강력하게 이루어지고 있다. 이른바 경영정보시스템(MIS)의 차르―유리로 덮여 있고 에어컨디션이 가동된 장대한 무덤을 지배하던―는 벌거벗은 임금님으로 사멸하고 있다. 아직까지 생존한 자는 그들을 해고할 수 있는 사람보다 지위가 높거나, 회사 경영층의 손 밖에 있거나 경영층이 잠자고 있기 때문이다.

전자 엔지니어링의 귀재 데니 힐스(Danny Hillis)가 창설한 상상력 넘치는 거대한 슈퍼 컴퓨터 회사인 싱킹 머신(Thinking Machines)사는 창설 10년 만에 문을 닫았다. 그 짧은 기간 동안 이 회사는 대량 병렬 컴퓨터 아키텍처(parallel computer architectures)를 소개하였다. 이 회사가 망한 이유는 이른바 연결 기계의 내실 없는 엔지니어링이나 경영의 실수 때문이 아니었다. 이 회사는 병렬 아키텍처가 탈중심화의 가능성을 열어주었기 때문에 망했다. 바로 이러한 대량 병렬 아키텍처는 비용이 싸지고 컴퓨터가 대량으로 생산되기 시작하자 갑자기 현실화되었다.

이러한 사실은 싱킹 머신사에게는 나쁜 소식이지만 우리 모두에게는 중요한 의미를 던져준다. 미래의 기업은 조직에 개인용 컴퓨터를 널리 보급함으로써 새롭고 확장성 있는 방법으로 컴퓨터 수요를 해결할 수 있는 것이다. 그리고 그 개인용 컴퓨터는 집중적인 계산으로 문제를 해결할 필요가 있을 때는 서로 연결하여 사용될 수 있다. 컴퓨터는 문자 그대로 개인과 집단을 위해 일할 것이다. 나는 우리 사회에서 디지털 세계의 젊은 시민들이 추진하고 있는 일들을 통해서 탈중심화된 마인드가 커지고 있음을 본다.

국민국가 자체가 엄청난 변화와 글로벌리제이션의 대상이다. 앞으로 50년 후에 정부는 더 커지는 동시에 더 작아질 것이다. 유럽은 더 작은 부족국가로 쪼개지는 동시에 경제적인 통합을 시도하고 있다. 민족주의가 세계 통합의 거대한 물결을 비웃고 방해한다. 그러나 디지털 세상에서는 과거에 불가능했던 해결책이 만들어질 수 있다.

오늘날 전세계의 20%가 80%의 자원을 소비하며 1/4이 만족할 만한 삶의 수준을 누리는 반면 3/4은 그렇지 못한 상태에 있다. 어떻게 이러한 분열을 극복할 수 있을까? 정치가들이 역사의 쓰레기더미에서 서로 싸우고 있는 사이에 새로운 세대가 과거의 수많은 편견을 떨쳐버리고 새로운 디지털 환경을 만들고 있다. 이 아이들은 우정과 협동, 그리고 놀이를 통해 편협한 근친성의 한계로부터 벗어나 있다. 디지털 기술은 사람들을 더 거대한 세계의 조화로 이끄는 자연적 힘이 될 수 있다.

디지털 세계의 조화로운 효과는 과거에는 서로 구분되었던 학과와 사업이 서로 경쟁이 아니라 협동하는 사실에서 이미 분명하게 나타나고 있다. 잃어버렸던 과거의 공동 언어가 나타나서 사람들이 경계를 넘어 서로 이해할 수 있도록 만든다. 오늘날의 학교 아이들은 같은 사물을 여러 가지 관점에서 보는 기회를 체험한다. 예를 들어 컴퓨터 프로그램은 컴퓨터 지시어의 집합인 동시에 프로그램 텍스트를 구성하는 톱니로 씌어지는 시로 읽힐 수도 있다. 아이들은 프로그램을 안다는 것이 하나의 관점이 아니라 여러 관점에서 아는 것임을 매우 빨리 배운다.

그러나 나의 낙관주의는 무엇보다도 디지털화가 본질적으로 가지고 있는 분권화의 특성에 기인한다. 접근성, 이동성, 변화에 영향을 미치는 능력이 미래를 지금과 다르게 만들 것이다. 정보고속도로는 지금은 가설에 지나지 않지만 미래에 대한 아주 억제된 표현에 불과하다. 그것은 여러 가지 예언의 수준을 훨씬 뛰어넘을 것이다. 아이들이 전지구적 차원에서 정보 자원을 전유함에 따라 우리는 과거에는 아주 조금밖에 존재하지 않았던 희망과 존엄을 발견하게 될 것이다.

나의 낙관주의는 추후에 이루어질 발명이나 발견에 의해 추진된 것이 아니다. 암과 에이즈 치료약 발명, 인구 조절 방법, 공기와 바닷물을 마신 후 무공해 공기와 물을 토해내는 기계의 발명은 이루어질 수도 있고 이루어지지 않을 수도 있는 꿈들이다. 디지털 세상은 다르다. 우리는 더 이상 새로운 발명을 기다리고 있는 것은 아니다. 왜냐하면 디지털 세상은 바로 지금, 여기에 있기 때문에. 디지털 세상은 본성이 발생적이다. 신세대는 앞선 세대보다 디지털에 더 가깝다.

디지털의 미래 비트를 통제하는 일은 바로 젊은이의 손에 달려 있다. 나는 이 사실이 가장 기쁘다.