오피스 렌즈 - ①

몇 년 전 독일어 번역을 했던 때를 떠올려 봅니다. 제가 받은 원고는 편집 가능한 텍스트가 아닌 사진판 이미지였습니다. 제 번역 작업에는 텍스트가 절대적으로 필요했기 때문에 이 사진판 이미지의 텍스트를 얻기 위해 막내아들의 손품을 빌릴 수밖에 없었습니다. 막내는 사진판을 타이핑해서 워드 문서로 바꾸어 주는 아르바이트를 얻었고, 저는 텍스트를 구하느라 막대한(?) 인건비를 지급했습니다. 그러나 저는 이제부터 ‘텍스트 일병’을 구하는데 추가 비용을 지급할 필요가 없게 됐습니다.

기하급수적으로 빨라진 컴퓨터의 처리 속도와 통신 속도, 그리고 저장장치 가격의 하락으로 우리 주위에는 이미지와 동영상 정보가 넘쳐 흐릅니다. 사진과 동영상으로 뒤덮인 SNS 세상에서도 충분한 소통과 깊은 이해를 위해서는 결국 문자의 힘을 빌릴 수밖에 없습니다. 이미지의 해석에는 주관이 개입될 수밖에 없고 시각적인 착각 또한 많으니 ‘백 마디 말보다 한 장의 사진이 더 많은 것을 말해준다’는 말은 일종의 은유라고 해도 과언은 아닌 것 같습니다.

글을 다루는 곳에서는 다양한 형태의 기록을 편집이 가능한 텍스트 형태로 가공할 필요가 있습니다. OCR(Optical Character Recognition; 광학 문자 인식) 기술은 이미 오래전에 선을 보였고 인식률 논란을 거쳐, 현재는 고서나 세로쓰기를 제외하면 거의 완벽한 인식률을 보인다고 합니다.

인터넷 세상이 열리면서 일반 개인들이 공개된 텍스트를 마우스로 쉽게 긁어 복사해 편집하는 것은 일상적인 일이 되었습니다. 그러나 아직도 텍스트를 쉽게 구할 수 없는 형태의 정보들이 있습니다. 필사물(handwriting), 복사물(photocopy), 인쇄물(print) 등입니다. 복사 또는 출력 방지가 걸린 온라인 텍스트도 그렇습니다.

그동안 OCR 기술을 활용한 많은 스마트폰용 문서 스캔 앱들이 선을 보였으나 저는 그 성능에 그다지 만족할 수 없었으며, 올해 4월에 마이크로 소프트 사가 오피스 렌즈(Office Lens) 앱을 출시했다는 뉴스에도 솔직히 시큰둥했었습니다. 제가 평소에 가지고 있던 ‘안티(反) 마이크로 소프트’ 입장도 한몫을 했을 것입니다. 며칠 전 트위터 지인의 추천으로 그동안의 선입견을 버리고 오피스 렌즈를 테스트해 보고 깜짝 놀랐습니다. 

오피스 렌즈의 성능과 간편한 사용법은 가히 도서관 등의 공공기관에서 주로 사용하는 뛰어난 인식률을 자랑하는 OCR 소프트웨어가 스마트폰 안으로 들어왔다고 해야 할 것 같습니다. 오피스 렌즈를 사용하면 이제 개인들도 적게는 한두 페이지에서 많게는 수십 페이지까지의 필사, 복사, 인쇄된 텍스트를 편집 가능한 컴퓨터 텍스트 파일로 손쉽게 변환할 수 있습니다.

우선 스마트폰에 오피스 렌즈를 설치하는 것부터 시작합니다. 
https://play.google.com/store/apps/details?id=com.microsoft.office.officelens 

스마트 폰으로 위의 주소로 접속하면 한글로 된 자세한 설명을 볼 수 있습니다. (데스크톱으로 접속하면 영문 설명만 있습니다.) MS 측의 설명에 의하면 화이트보드나 문서의 사진을 자르고 보정하여 읽기 쉽게 만들어 PDF, Word, PowerPoint파일로 변환할 수 있으며, OneNote나 OneDrive에 이미지를 저장할 수 있다고 합니다. 

사용법은 간단합니다. 앱을 탭 하면 카메라 상태가 되며 텍스트를 얻고 싶은 문서(또는 책자), 벽에 붙은 포스터, 컴퓨터 화면 또는 화이트보드를 찍으면 됩니다. MS 측에 의하면 아래 그림처럼 기울어진 문서나 화이트보드도 자동으로 보정된다고 하는데 아무래도 정면에서 반듯하게 찍은 것보다 인식률이 떨어질 것입니다. 사진 위쪽의 왼쪽 아이콘은 플래시, 가운데 아이콘은 대상이 문서인지 화이트 보드인지 사진인지를 선택하는 스캐너 모드, 오른쪽 세 점 아이콘은 기타 설정 모드입니다. 

 

위의 카메라 아이콘을 탭 하여 사진을 찍으면 아래처럼 보정된다고 합니다만 실제로는 꽤 차이가 있습니다. 휴지통 아이콘과 자르기 아이콘이 보입니다. 보정 결과가 마음에 들면 아래의 저장 아이콘을 탭 합니다.

 

마지막으로 저장 모드입니다. 문서 제목은 자동으로 정합니다. 보통 날짜와 시간으로 정해집니다. (2015.7.17.오후 8:30) 정해진 저장 공간은 원노트(또는 원클라우드)입니다. 텍스트를 얻을 때 가장 좋은 방법은 아무래도 워드(MS Word) 파일이겠지요. 동시에 스마트폰의 갤러리의 Office Lens 폴더에 사진 형태로 저장됩니다. 

  

이 오피스 렌즈를 사용하기 위해서는 마이크로 소프트의 계정을 가지고 있어야 하며 OneNote와 OneDrive를 사용해야 합니다. 마이크로 소프트에 계정을 안 가지고 있는 분에겐 이 뛰어난 앱을 쓰기 위한 걸림돌입니다만, 바로 이 점이 마이크로 소프트가 노리는 것입니다. 마이크로 소프트 계정을 만드는 법, OneNote와 OneDrive의 가입 및 사용법은 생략합니다. (마이크로 소프트 계정 만들기 - 스마트폰에 원드라이브 설치- 원노트 설치 - 오피스 렌즈 설치의 순서가 바람직합니다.) 

다음 글에서는 제가 실제로 테스트 했던 여러 언어의 문서, 컴퓨터 화면, 빌딩 내의 광고판에서 얻은 사진(스캔)과 텍스트를 얻은 결과물을 비교해 보려 합니다.

 

[글쓴이 소개: 수탉 선생 김성우는 금융기관에서 오래 근무했으며, 우리 사회가 정보화 사회로 진입하는 과정을 비교적 가까이서 지켜본 디지털 생활 삼십 년 차의 할아버지입니다. 현재는 IT 전문가들과 보통 사람들의 사이에서 우리 사회의 정보격차 해소를 위해 여러 가지 작은 노력을 하고 있습니다.]

재배포를 환영합니다. 사진 및 글에 대한 저작권은 해당 저자에게 문의바랍니다.