LG, 이미지를 말로 설명하는 생성형 AI '캡셔닝 AI' 첫 공개

0
폰트사이즈

셔터스톡과 협업…"글로벌 10개사 얼리 액세스 진행 중"

LG 제공
LG가 생성형 AI(인공지능)의 상용화 서비스 '캡셔닝 AI(Captioning AI)'를 처음 공개했다. 캡셔닝 AI는 처음 보는 이미지까지 자연어로 설명할 수 있는 AI로 이미지 검색에 활용할 수 있다.

LG AI연구원은 18일(현지시간) 캐나다 밴쿠버에서 진행 중인 세계 최대 컴퓨터 비전 학회 'CVPR(컴퓨터 비전 및 패턴 인식) 2023'에서 캡셔닝 AI를 처음 공개했다고 19일 밝혔다.

LG AI연구원은 AI가 사람처럼 처음 보는 물체나 장면에 대해 이전 경험과 지식을 활용해 이해하고 설명할 수 있는 '제로샷 이미지 캡셔닝' 기술을 적용했다. 이 기술은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 △배경 △인물 △행동 등 이미지상의 다양한 요소와 특징을 인식하고, 그 관계를 이해해 설명할 수 있게 한 기술이다.

캡셔닝 AI는 대량의 이미지를 관리해야 하는 기업의 업무 효율성과 생산성을 높일 것으로 기대된다. 평균 5개 문장과 10개의 키워드를 10초 이내에 생성하고, 이미지 범위를 1만 장으로 확대하면 2일 이내 작업을 끝낼 수 있어 빠른 시간 안에 맞춤형 이미지 검색 및 관리 시스템 구축이 가능하다.

LG AI연구원은 이미지와 영상 등 시각 콘텐츠가 매일 수십만 개 이상 추가되는 세계 최대 플랫폼 기업인 '셔터스톡(Shutterstock)'과 협업으로 캡셔닝 AI를 개발했다. 특히 실용적이면서 신뢰할 수 있는 AI 모델 개발을 위해 학습 데이터의 편향성과 선정성 등 AI 윤리 검증을 진행하고, 저작권 투명성도 확보했다.

세잘 아민 셔터스톡 CTO(최고기술경영자)는 "현재 글로벌 고객사 10곳을 대상으로 얼리 액세스(앞서 해보기) 프로그램을 진행하며 캡셔닝 AI 기술을 발전시키고 있다"고 말했다.

LG AI연구원은 또 캡셔닝 AI의 기반 기술인 '제로샷 이미지 캡셔닝'을 주제로 서울대 AI대학원‧셔터스톡과 함께 워크숍을 진행했다. 워크숍에서 상반기 진행한 'LG 글로벌 AI 챌린지' 시상식도 열었다. 챌린지 1위와 2위를 차지한 난징과기대와 카이스트(KAIST) 소속 참가자들은 워크숍에서 연구 성과를 발표했다.

한편 LG AI연구원은 22일까지 진행하는 학회 기간 중 △LG전자 △LG이노텍 △LG에너지솔루션 △LG유플러스 등 LG 주요 계열사와 함께 글로벌 AI 우수 인재 확보에 나섰다. 학회에 참가한 석‧박사 학생을 대상으로 네트워킹 행사를 진행하고, 각 계열사 AI 연구 인력과 채용 담당자가 최신 AI 기술 시연과 채용 상담을 진행한다.

지금 뜨는 뉴스

※CBS노컷뉴스는 여러분의 제보로 함께 세상을 바꿉니다. 각종 비리와 부당대우, 사건사고와 미담 등 모든 얘깃거리를 알려주세요.

이메일 jebo@cbs.co.kr
카카오톡@노컷뉴스
사이트https://url.kr/b71afn

CBS노컷뉴스 장성주 기자 CBS노컷뉴스 장성주 기자 메일 네이버