탑배너 닫기

노컷뉴스

딥시크 '빠른 손절' 이유는?…"정보 채집·학습하고 中서버 저장"

IT/과학

    딥시크 '빠른 손절' 이유는?…"정보 채집·학습하고 中서버 저장"

    딥시크망 차단 정부·기업…수집 정보 흐름 '불투명'
    '중국 보안법', 중국 정부 IT기업 정보 들여다볼 수 있어
    전문가들 "안정성 확보 차원의 선제적 조치"
    사용자 키보드 패턴까지 수집하는 딥시크 "수집 범위 과도"
    딥시크 쓰면 무조건 사용자 정보로 데이터 학습

        정부 부처에 이어 기업들까지 줄줄이 '딥시크 금지령'을 내리고 있다. 정부는 딥시크의 개인정보 약관에 대한 검토가 필요하다며 사이트 접속을 차단하고, 기업들은 사내 업무 목적으로 사용을 지양한다는 공지를 내렸다.
     
    딥시크 정보 처리의 불투명성에 대한 우려가 이번 금지령을 촉발한 것으로 분석된다. 일각에서는 중국이라는 국가의 특수성과 맞물려 딥시크가 수집하는 정보의 범위와 방식에 의구심을 제기하고 있다.
     

    "딥시크망 차단" 줄줄이 손절…"당연한 조치"

    딥시크는 자사 홈페이지 개인정보 약관에서 수집한 정보를 중국에 있는 서버에 저장한다고 명시했다. 여기까지는 다른 AI 기업의 정보 저장 방식과 큰 차이가 없다. 챗GPT를 포함한 대다수의 생성형 AI 업체들도 자사가 수집한 데이터를 본사가 위치한 국가의 서버에 저장하고 있기 때문이다.
     
    문제는 중국이라는 국가의 특수성이다. 중국은 데이터 보호법에 따라 중국 기업이 개발한 AI 모델의 정보를 들여다볼 수 있다. 데이터 보호법은 중국 기업들의 데이터 규제를 위해 만들어졌지만, 해당 법안으로 중국의 데이터 주권은 국가가 쥐고 있게 됐다. 딥시크의 중국 서버에 저장된 정보가 언제든 중국 당국에 넘어갈 수 있다는 우려가 나오는 이유다.
     
    특히 딥시크를 두고 최근 데이터 보호에 대한 조치가 굉장히 미흡하다는 지적이 나오고 있다. 앞서 이스라엘 클라우드 보안업체 위즈는 "딥시크의 데이터베이스가 인터넷에 노출됐다"며 "해당 데이터베이스에는 딥시크의 채팅 기록을 비롯한 100만건 이상의 민감한 내용이 포함됐다"고 밝혔다.
     
    전문가들은 정부와 기업의 '금지령'은 당연하다는 입장이다. 선제적으로 정보 유출을 막기 위해 특정 생성형 AI 모델 사용을 금지하는 건 생성형 AI의 출범부터 있었던 안내 지침이라는 것이다.
     
    김명주 AI안전연구소장은 "전 국민에게 영항을 줌에도 불구하고 안전성이 확인되지 않은 신규 서비스에 대해 안전성 확보 차원에서 일단 사용금지를 하는 것은 이탈리아 등 선진국들의 보편적이고 상식적인 조치"라고 강조했다.
     

    정보 수집 범위·방식도 문제…키보드 패턴도 수집

    6일 서울 종로구 정부서울청사 PC에 '딥시크' 사이트가 차단된 화면. 연합뉴스6일 서울 종로구 정부서울청사 PC에 '딥시크' 사이트가 차단된 화면. 연합뉴스
    더불어 딥시크의 정보 수집 범위와 방식에 대한 문제도 제기된다. 딥시크를 사용하기 시작하는 순간, 사용자의 모든 정보가 딥시크에 넘어간다. 딥시크의 AI 모델은 이 정보들을 바탕으로 학습해 '성장'한다.
     
    딥시크가 수집하는 정보의 범위는 지나치게 넓다는 게 전문가들의 시각이다. 딥시크는 사용자 이름과 이메일 주소, 전화번호는 물론이고 키보드 입력 패턴과 리듬, IP(네트워크 정보)까지 수집하고 있다. 특히 일반적으로 키보드 입력 패턴은 게임사에서 사용자의 공격 패턴을 파악하기 위해 수집한다. 딥시크가 제공하는 서비스의 특성과도 맞지 않다는 것이다.
     
    최병호 고려대 인공지능연구소장은 "딥시크 정보 수집 범위는 과도하게 넓다"고 지적했다. 이어 "키보드 패턴은 서비스와 크게 관련이 없고 수집한다고 해서 서비스의 품질이 좋아지는 것도 아니다"라면서 "사용자 키보드 고유의 패턴과 정보를 통해 개인 정보를 취득해 활용하려는 의도로 보인다"고 꼬집었다.
     
    챗GPT '옵트아웃' 기능. 챗GPT 캡처챗GPT '옵트아웃' 기능. 챗GPT 캡처
    더욱 문제는 사용자가 제공하거나 자동으로 수집한 정보를 딥시크가 '학습'한다는 점이다. 일반적인 대화형 AI에는 '옵트아웃(Opt-out)' 기능이 있다. '옵트아웃'은 명시적으로 거부 의사를 밝히면 해당 데이터 수집을 멈출 수 있게 한다. 챗GPT 계정 설정에서도 '사용자 콘텐츠를 사용한 모델 훈련'을 해제할 수 있다. 딥시크는 해당 기능이 없어 모든 사용자로부터 수집한 대화와 프롬프트(입력어) 등 모든 정보를 자사 모델의 학습에 사용할 수 있다. ·
     
    한 IT 업계 관계자는 "딥시크를 사용하기만 해도 AI는 그 정보를 학습에 활용하게 된다. 그러면 선택권이 하나 없어지는 것"이라면서 "이것 때문에 보안이 '하늘과 땅 차이다'라고 얘기할 수는 없지만 적어도 개인정보 자기결정권 측면에서는 한 단계 아래의 수준으로 제공을 하고 있는 상황"이라고 지적했다.

    ※CBS노컷뉴스는 여러분의 제보로 함께 세상을 바꿉니다. 각종 비리와 부당대우, 사건사고와 미담 등 모든 얘깃거리를 알려주세요.

    이 시각 주요뉴스


    실시간 랭킹 뉴스

    노컷영상

    노컷포토

    오늘의 기자