(서울=NSP통신) 박유니 기자 = 1세대 검색엔진 업체로 출발한 코난테크놀로지를 주위에서는 기술력으로 승부하는 은둔의 기업이라 말한다. 2010년부터 기계학습에 의한 빅데이터 분석을 거쳐 6년 전에 이미 심층 자연어처리(Deep NLP) 기반의 제품을 출시한 실력으로 음성인식 합성, 얼굴·객체인식 분야에서 실용적인AI기술을 말없이 자체적으로 개발해오고 있기 때문이다. 최근엔 ‘AI테스팅 가이드라인’을 도입하면서100% 자체기술인 코난 딥러닝 프레임워크를 개발하는 성과를 만들어 내기도 했다.
주력 사업인 AI 강화 검색·텍스트 애널리틱스를 넘어, 보고 듣고 이해하고 말하는 AI 기술로 영상 인식 기반의 이상 감지, 유튜브 콘텐츠 크리에이터를 위한 영상 자막 자동 생성 및 음성 더빙, 영상 개인정보 비식별화, 음성 챗봇 기반의 메타버스 API 등 융합AI 기술 영역으로 사업을 확대해 나가고 있다. 양승현 최고기술책임자(CTO)는 코난의 전 제품에 녹여내는 자체 프로그래밍 ‘K-언어’의 개발 주역이다.
-AI 시대, 앞으로는 어떤 전략이 필요한가?
디지털 전환(DX)의 확산으로 데이터가 이미지, 영상, 음성 등 다양한 형태로 대량 축적되고 있다. 양질의 데이터가 충분히 쌓인 이후에야 비로소 경영원칙과 AI 방법론에 의해 비즈니스 혁신의 도구로써 사용할 수 있게 된다. 국내 산업계에서도 기업 내부 데이터에 대한 AI 강화검색 등 융복합 형태의 AI 기술 수요가 늘어날 것이다.
따라서 검색, 분석, 챗봇 등 개별적 경계를 넘어 AI 기술을 다양한 산업 분야에 접목해 시장을 확대해 나가며, 대화형 검색 에이전트를 비롯한 융합 형태 솔루션을 제공하는 전략이 필요하다. 그동안 다양한 원천 기술을 자체적으로 개발해왔기에 새로운 추세에 따른 융합이 비교적 용이하다. 지난 2016년에 지능형 콘텐츠 사업부를 신설하여 급성장하는 콘텐츠 관리 AI 시장에 차근차근 준비해왔다. 검색엔진 기반의 AI 텍스트 솔루션을 뛰어넘어 AI 음성·얼굴·객체 인식 엔진으로 메타데이터를 활용한 콘텐츠 관리에 힘쓰면서 대중 시장에 진입하겠다.
-경쟁력과 차별화 전략은?
오픈소스나 아웃소싱에 의존하지 않고 자체 연구 개발한 다양한 원천기술들을 보유했다는 점이 곧 경쟁력이다. 그 결과 고도의 기술 내재화가 뒤따르게 되었고, 기술 수정이 자유롭고 쉽게 융합하는 것이 가능 해졌다. 이는 곧 고객들의 요구를 충족시켜주고 품질에 만족도를 느끼게 하는 선순환 구조를 만들어낸다.
판매 중인 제품들은 모두 직접 개발하여 직접생산 확인증명을 받았으며, 기술 추세와 고객의 요구 사항을 반영하여 지속적으로 성능 향상을 추진하고 있다. 국내 기업의 대부분은 외산 오픈 프레임워크로 AI 응용 솔루션을 개발하고 있는 반면 우리는 독자적으로 개발한 ‘K-언어(K-Language)’로 소스코드를 쓰고 자체 학습 프레임워크로 AI 모델을 훈련하는 차별성을 갖고 있다. 이것은 품질관리 및 개발자들의 생산성 향상에 큰 영향을 미쳤다.
-품질 및 형상 관리는 어떤 방식으로 하는가?
코난 제품은 20여 년에 걸쳐 장기 판매되며 수천 가지 요구 사항이 녹여져 10만 번 넘게 소스코드가 수정돼 왔고 수많은 고객의 다양한 운영 환경에서도 일관성 있는 동작을 제공하고 있다. 이는 원천 기술, 기술 역량, 품질 측면에서 철저한 제품 중심의 철학이 없이는 불가능한 결과이다. 2007년부터 자체적인 제품 개발 및 품질 프로세스를 도입해 형상 관리를 체계화하고 회귀 오류 발생을 최소화하도록 노력해왔다.
핵심은 테스트 주도 개발(Test-Driven Development)과 자동화된 회귀 테스트이다. 개발자는 기능 개발이나 수정에 앞서 테스트케이스를 작성한 후에 개발을 시작한다. 개발을 완료했으면 소스코드를 저장하고 퇴근한다. 그러면 매일 밤 자동으로 빌드 봇이 제품 소스코드를 가져다 16대의 서로 다른 운영체제가 깔린 장비에서 빌드를 하고 3천 개 이상의 테스트케이스에 대해 테스트를 하고, 개발자의 실수로 인한 버그를 잡아내서 다음날 아침 리포트해 준다. 이렇게 회귀 오류를 차단해 소스코드의 지속적 통합을 이루는 절차로 제품의 품질을 보장하고 있다. 현재는 2천여 제품 설치 실적으로 다양한 고객 환경에서도 문제가 거의 안 생길 정도로 균일한 품질을 보장하고 있다.
-직접 개발한 ‘K-언어’의 개방 전략은.
10년 전부터 AI 및 빅데이터 응용 개발에 최적화된 자체 프로그래밍 언어(K 언어)를 보급하는 방법으로 개발자들의 개발 역량과 생산성을 크게 끌어올렸다. 기존의 c++이나 java 언어 라이브러리로 개발할 때보다 기반 기술의 재사용성이 월등하게 높아졌다. 다년간 축적된 요소 기술들을 컴포넌트별로 계층화한 기술 스택이 주어지자 개발자들의 역량이 수직 상승했다. K 언어의 간결한 문법 덕분에 제품 라인 수가 엄청나게 짧아지고 수직 상승한 재사용성 덕분에 2년 걸리던 신입 개발자의 훈련 기간이 2개월로 짧아지는 등 놀라운 생산성 효과를 거두었다. 현재 Konan Search, Konan Analytics, Konan BI 등 대부분의 주력 제품들의 소스코드가 K 언어로 돼있다.
그러나 K-언어가 오픈 언어를 주로 사용하는 주류 시장에 진입하는 데에는 오히려 장애요인으로 작용할 여지가 없지 않다는 점을 알고 있다. 그래서 현재 내부개발자 위주로 사용 중인 K-언어를 외부로 공개하여 일반화시킬 필요성을 느끼고 있다. 앞으로 스펙을 정교하게 다듬어서 더 많은 사용자를 확보할 수 있도록 개방하는 쪽으로 고민하고 있다. 지금 가장 널리 사용되고 있는 프로그래밍 언어인 파이썬(Python)도 세상에 나오는데 20년이 걸렸듯, K-언어가 상용 언어로 자리 잡기 까지는 장기적인 안목을 가지고 시간과 노력을 들일 계획이다. 외산 언어와 비교했을 때 K-언어의 이점도 분명 클 것으로 기대되는 만큼, 오픈 계획은 충분히 열려 있다.
-시각 및 음성인식 분야에서 AI 기술은.
코로나 사태가 장기화되면서 비대면 교육이 보편화되고 있어 AI 음성인식 자막 지원 프로그램을 개발하고 있다. 청각장애인 등 사회적 취약계층에게 평등한 교육 기회를 제공하기 위해 음성인식 및 딥러닝 기반의 음향모델이 적용되는 자동 자막 생성 솔루션 디리스너(D: Listener)를 출시했다. 화자 적응 종단 간(end-to-end) 음성인식 엔진을 활용하며 영상 처리, 자연어 처리 등 최신 에듀테크(edutech)들을 접목하여 대학, 공공교육 분야에 있어서 다양한 기술과 서비스를 제공하고 있다.
또한 딥러닝 기반의 멀티 모달(multi modal) 식별 솔루션인 디워처(D: Watcher)는 영상 콘텐츠 내 얼굴, 객체, 상황, 장면 등 다양한 멀티 모달을 식별하는 핵심 컴퓨터 비전 기술에 최신 딥러닝 기반 학습 알고리즘을 적용해 성능을 향상시켰다. 멀티 모달 인터페이스는 전통적인 텍스트 외에 음성, 몸짓, 시선, 표정, 생체신호 등 여러 입력 방식을 융합하여 인간과 기계 사이에 자연스러운 의사소통을 가능하게 하는 사용자 친화형 기술이다. 디워처를 활용하여 대통령기록관의 ‘시청각기록물 지능형 인물정보관리’와 육군교육사령부의 군사용 지능형 플랫폼 ‘밀리터리 이미지넷’에 적용했을 뿐만 아니라 현재 중대재해처벌법 시행에 따른 항만 하역 작업의 안전사고를 예방하는 시스템을 개발하고 있다.
-진행중인 사업은.
인공지능 모델 구독 서비스를 활성화할 계획을 갖고 있다. 기존에는 별도의 학습 또는 패키지에 의해 배포되던 인공지능 모델을 온라인으로 구독할 수 있는 서비스를 제공해 고객 현장의 문제 풀이에 즉시 적용하며 범용 인공지능 모델의 대중화 계획도 구상 중이다. 또한 AI 솔루션에의 접근성을 높이려는 시도를 다각도로 하고 있다.
일례로 시스템 통합(SI) 기반이었던 기존의 B2B 제품의 한계를 극복하고 온라인 배열(deploy)과 셀프서비스 운영이 가능한 제품으로 최근 코난BI(Konan BI)를 출시했다. 현장 구축형(on-premise) 솔루션의 사업 한계를 극복하기 위해 텍스트 애널리틱스 분야에서는 유일하게 출시된 셀프서비스 제품이다. 누구든 설치부터 운용까지 가능한 제품이며, 일반 사용자들도 쉽게 쓸 수 있도록 증강분석기술을 탑재했다. 설치 구축에만 보통 몇 개월 소요되었지만 이제는 온라인으로 즉시 설치가 가능하고 분석 결과 역시 즉시 확인할 수 있어서 급변하는 빅데이터 환경에 아주 적합한 제품이다.
지금까지는 조직의 내부 지식, 소셜미디어, 조직 내 이미지 비디오를 다루던 기술에 집중해왔지만 앞으로는 유튜브·원격강의·화상회의 영상 등 확대된 사용자가 생산해 내는 디지털 콘텐츠를 SaaS(Software as a Service)로 처리하여 기술의 품질 향상을 위한 기초 지식으로 활용할 계획이다. SaaS로 학습된 시각·음성언어 딥 메타데이터(deep metadata) 분석 기술은 딥러닝 프레임워크 기술과 결합되어 경량화된 엣지 인공지능(Edge AI) 기술로 발전시킬 것이다. 향후 다양한 하드웨어 생산 기업들과 제휴를 통해 스마트 공장용 AI 기술로 확장시킬 계획이다.
-연구개발 인력과 올해 예상 매출 실적은?
2개 연구소에서 각각의 주요 기술(Human Language Understanding, Video Understanding) 연구에 집중하고 있다. 주요 기술 인력의 87%가 컴퓨터 소프트웨어 관련 학과 석사 이상 학위 소지자들이고, 평균 근속 기간은 11년, 해당 분야에서 다년간 경험과 지식을 쌓아온 전문가들이다. 매출액 대비 25% 이상을 매년 원천기술 개발과 R&D에 투자하고 있다. 이것이 인공지능 기술을 누구보다 빠르게 습득하여 상용화에 성공할 수 있었던 핵심적인 요인이다. 지난해 매출은 140억, 올해 상반기 수주액이 이미 지난해 매출을 초과한 상황이니 연말까지는 약 200억 전후를 예상하고 있다. 또한 연내 IPO(Initial Public Offering)를 계획하고 있다.”
-창업 이후 기억에 남는 일화나 경영철학은?
“소프트웨어 분야에서 18년 전 출시된 제품을 현재까지 잘 사용하는 고객과 9년 동안 무인-무장애로 제품을 운영한 고객 사례가 기억에 남는다. 그만큼 견고하고 신뢰성 높은 제품, 스펙 대로 정확하게 동작하는 제품을 생산하는 기업이며 연구소임을 인정받았다는 느낌을 받았다.
코난은 그럴듯한 말로 고객의 환심을 사려 하지 않고 기술력으로 승부해온 기업이다. 장기적 관점에서 고객이 정확하고 실용적인 판단을 할 수 있도록 돕는다. 이를 위해 요소 기술을 꾸준히 밑바닥부터 견고하게 쌓아 올린 기업이며, 기술 수정 또한 자유롭다는 점을 분명히 말하며, 이미 확실한 승부처를 갖고 있다는 점을 알린다. 자기 기술이 아닌 것으로 영업하는 기업과는 차이가 날 수밖에 없다. 이 같은 기술력을 고객이 가장 먼저 알아보고 신뢰할 것이라고 믿는다.
소프트웨어 분야에서 10년 이상 장기간 거래를 지속하고 있는 고객이 100곳 이상일 정도로 안정적인 관계를 지속해 나가고 있는 경우는 거의 없다. 보고 듣고 이해하고 말하는 AI로 사람을 돕고 세상을 편리하게 이끌겠다는 경영철학으로 실용 AI 기술 개발을 위한 비전 달성에 힘쓰고 있으며 더욱 성장하는 모습을 보여주고 싶다.
NSP통신 박유니 기자 ynpark@nspna.com
저작권자ⓒ 한국의 경제뉴스통신사 NSP통신·NSP TV. 무단전재-재배포 금지.