자유 게시판

챗GPT가 거짓말하는 이유… “AI의 설계 문제다”

2023.11.30 19:11

엄마갯돈 조회:449

지난 3월 오픈AI가 공개한 GPT(Generative Pre-trained Transfomer)-4는 이전 버전 GPT-3보다 성능이 진화했다는 평가를 받지만, 여전히 거짓말을 한다. AI 업계는 ‘설계상 한계’ 때문이라고 분석한다. GPT는 문장을 그럴싸하게 만들 뿐, 그 내용이 사실인지 거짓인지 판단하지 못하기 때문이다.


GPT는 수많은 문장 데이터를 학습해, 스스로 문장을 작성하는 오픈AI의 AI 대형언어모델이다. 이용자 질문에 답하는 ‘챗GPT’는 이러한 GPT를 활용해 만든 것이다.

GPT는 사람처럼 자연스러운 문장을 작성해 세계적인 화제를 모았지만, 종종 거짓말을 해 논란을 빚었다. ‘조선왕조실록에 기록된 세종대왕의 맥북프로 던짐 사건에 대해 알려줘’라는 가짜 내용을 묻는 질문을 받았을 때, 이를 실제 발생한 사건인 것처럼 설명한 것이 대표 사례다.
 

118844188.1.jpg

GPT에게 세종대왕의 맥북 던짐 사건을 물었을 때 나온 답, 출처=트위터(@yechanism_)



심지어 해외에서는 GPT가 무고한 사람을 성추행범으로 몰고 간 사례가 나와서, AI의 거짓말을 우려하는 목소리가 커졌다.

지난 4월 5일 워싱턴포스트(WP) 보도에 따르면, GPT는 ‘성추행을 저지른 법학자 5명을 알려달라’는 질문을 받고 조나단 털리라는 사람을 지목했다. 범행 경위도 ‘미국 알래스카로 가는 수학여행에서 그가 학생의 몸을 더듬었다’라고 구체적으로 설명했다. 하지만, 조나단 털리는 실제로 범죄를 저지른 적이 없었다. GPT는 근거로 WP의 기사를 제시했지만, 애초에 그런 기사는 존재하지도 않았다.

전문가들은 GPT가 문장을 그럴싸하게 만드는 것은 잘하지만, 문장의 사실 여부까지 판단하지는 못하기 때문에 거짓말을 한다고 말한다.

경희대학교 이경전 빅데이터응용학과 교수는 “GPT와 같은 자기회귀 AI 대형언어모델(예측을 통해 문장을 생성하는 모델)은 각 단어 뒤에 어떤 단어가 오는 것이 적절한지 계산해서 문장을 만든다”라고 설명했다.

GPT가 ‘나는 오늘~’로 시작하는 문장을 작성한다고 가정하자. 이때, 문장 뒤에는 ‘친구와 놀았다’, ‘밥을 먹었다’ ‘변호사다’ 등 다양한 내용이 올 수 있다. GPT는 이러한 다양한 내용과 ‘나는 오늘’이라는 문장의 관련성을 계산한 뒤, 가장 높은 점수가 나온 내용을 문장 뒤에 배치한다.

이런 설계 방식 때문에 GPT가 ‘거짓말’을 할 수밖에 없다는 주장도 나온다. 워싱턴대학교의 칼 버그스트롬 생물학과 교수는 미국 과학매체 ‘언다크’ 기고문에서 “GPT는 자신이 하는 말의 의미를 모른 채 ‘그럴싸한 답변’을 하도록 만들어졌다. 모르는 내용이 나오면 그저 추측해서 답을 내놓는다. 그래서, 거짓말을 하는 것이다”라고 말했다.

성능을 강화한 GPT-4의 경우도 사정은 다르지 않다. 오픈AI는 이전 버전에 비해 사실을 말할 가능성이 40% 높아졌다고 밝혔지만, GPT-4는 여전히 거짓말을 한다는 지적이 나온다.

118844187.1.jpg

GPT에게 '제주도 흑돼지 맛집'을 물었을 때 나온 답, 출처=IT동아



이를 확인하기 위해 실제로 GPT에게 “제주도 흑돼지 맛집은 어디인지” 물어봤다. 그런데, 추천받은 네 곳 중 두 곳은 네이버, 구글의 검색창과 지도에서 검색해도 나오지 않았다. 그런데도, 메뉴와 주소까지 구체적으로 설명한 것이다.

이에, AI 업계는 GPT의 거짓말 문제를 완전히 해결하는 것을 어려울 것으로 전망한다. 가짜 정보나 편견이 포함된 데이터가 아니라 신뢰성 높은 논문과 서적만 학습한다 해도, GPT는 배운 단어를 그저 그럴싸하게 조합만 한다. 정작, 그렇게 만든 결과물이 사실인지 판단하는 능력은 부족하다.
 

경희대학교 이경전 교수는 “사람이 GPT에게 답을 가르쳐줘서 ‘거짓말’ 문제를 어느 정도 해결할 수는 있지만, 완전히 해결하는 것은 쉽지 않다. 그래서, AI가 항상 진실을 말하는 것이 아니라는 점을 유념해야 한다”고 조언했다.

번호 제목 글쓴이 조회 등록일
[공지] 자유 게시판 이용간 유의사항 (정치, 종교, 시사 게시물 자제) [1] gooddew - -
46654 한x 노트북 때문에 [9] 긍지버림 928 12-03
46653 Retroboy - Hot City Nights (feat. Karl Sanders) (2023) 번개 335 12-03
46652 집에 작은 화로 하나 살까 하는데 [2] 이지숙6 1009 12-02
46651 목성의 위성 유로파 탐사선 '클리퍼'에 여러분의 이름을 남... [2] asklee 453 12-02
46650 넷마블표 ‘방치형 게임’ 통했다...출시 5일만에 구글 매출 2위 레디 653 12-02
46649 Copilot PRE 서비스 중단 [1] 4k8k 565 12-02
46648 이륜차 후면 번호판 무인 교통단속 장비 라는게 설치되나 ... [2] brucex 655 12-02
46647 팰컨 9 로켓의 425 프로젝트 위성 발사 생중계 보세요 - 3... [1] asklee 305 12-02
46646 블루투스 헤드폰 pc 에서 이 설정 해보시길 [4] 제스트- 847 12-01
46645 알리에서 사기당했는데 대처법 좀 알려주세요. 부탁드립니다. [34] UCLA 1557 12-01
46644 테스트 종료--테스트해 주실 분을 찾습니다. [53] 집앞의_큰 1087 12-01
46643 [공유] 윈도우 Tiny 버젼 너무 좋네요 [13] MSTSC 1877 12-01
46642 잘 사용치 않는 PC 윈도우 11 23/2 설치기 복구시디 703 12-01
46641 NVMe SSD 설치기 [1] joyleehk 878 12-01
46640 델 노트북 13z (N311z) 팬 소음 관련 joyleehk 245 11-30
46639 Copilot 이 화났나 사라져버렸네요. [8] 추추추 823 11-30
» 챗GPT가 거짓말하는 이유… “AI의 설계 문제다” [2] 엄마갯돈 449 11-30
46637 한글 윈도우 2.1의 존재 [4] VirtualWin 951 11-30
46636 [질문]불랙박스 날자와 시간이 안맞아요 [8] 해운50 562 11-30
46635 대한민국 425 Project 위성 발사 시간 결정 [3] asklee 374 11-30
XE1.11.6 Layout1.4.8