자유 게시판

챗GPT가 거짓말하는 이유… “AI의 설계 문제다”

2023.11.30 19:11

엄마갯돈 조회:445

지난 3월 오픈AI가 공개한 GPT(Generative Pre-trained Transfomer)-4는 이전 버전 GPT-3보다 성능이 진화했다는 평가를 받지만, 여전히 거짓말을 한다. AI 업계는 ‘설계상 한계’ 때문이라고 분석한다. GPT는 문장을 그럴싸하게 만들 뿐, 그 내용이 사실인지 거짓인지 판단하지 못하기 때문이다.


GPT는 수많은 문장 데이터를 학습해, 스스로 문장을 작성하는 오픈AI의 AI 대형언어모델이다. 이용자 질문에 답하는 ‘챗GPT’는 이러한 GPT를 활용해 만든 것이다.

GPT는 사람처럼 자연스러운 문장을 작성해 세계적인 화제를 모았지만, 종종 거짓말을 해 논란을 빚었다. ‘조선왕조실록에 기록된 세종대왕의 맥북프로 던짐 사건에 대해 알려줘’라는 가짜 내용을 묻는 질문을 받았을 때, 이를 실제 발생한 사건인 것처럼 설명한 것이 대표 사례다.
 

118844188.1.jpg

GPT에게 세종대왕의 맥북 던짐 사건을 물었을 때 나온 답, 출처=트위터(@yechanism_)



심지어 해외에서는 GPT가 무고한 사람을 성추행범으로 몰고 간 사례가 나와서, AI의 거짓말을 우려하는 목소리가 커졌다.

지난 4월 5일 워싱턴포스트(WP) 보도에 따르면, GPT는 ‘성추행을 저지른 법학자 5명을 알려달라’는 질문을 받고 조나단 털리라는 사람을 지목했다. 범행 경위도 ‘미국 알래스카로 가는 수학여행에서 그가 학생의 몸을 더듬었다’라고 구체적으로 설명했다. 하지만, 조나단 털리는 실제로 범죄를 저지른 적이 없었다. GPT는 근거로 WP의 기사를 제시했지만, 애초에 그런 기사는 존재하지도 않았다.

전문가들은 GPT가 문장을 그럴싸하게 만드는 것은 잘하지만, 문장의 사실 여부까지 판단하지는 못하기 때문에 거짓말을 한다고 말한다.

경희대학교 이경전 빅데이터응용학과 교수는 “GPT와 같은 자기회귀 AI 대형언어모델(예측을 통해 문장을 생성하는 모델)은 각 단어 뒤에 어떤 단어가 오는 것이 적절한지 계산해서 문장을 만든다”라고 설명했다.

GPT가 ‘나는 오늘~’로 시작하는 문장을 작성한다고 가정하자. 이때, 문장 뒤에는 ‘친구와 놀았다’, ‘밥을 먹었다’ ‘변호사다’ 등 다양한 내용이 올 수 있다. GPT는 이러한 다양한 내용과 ‘나는 오늘’이라는 문장의 관련성을 계산한 뒤, 가장 높은 점수가 나온 내용을 문장 뒤에 배치한다.

이런 설계 방식 때문에 GPT가 ‘거짓말’을 할 수밖에 없다는 주장도 나온다. 워싱턴대학교의 칼 버그스트롬 생물학과 교수는 미국 과학매체 ‘언다크’ 기고문에서 “GPT는 자신이 하는 말의 의미를 모른 채 ‘그럴싸한 답변’을 하도록 만들어졌다. 모르는 내용이 나오면 그저 추측해서 답을 내놓는다. 그래서, 거짓말을 하는 것이다”라고 말했다.

성능을 강화한 GPT-4의 경우도 사정은 다르지 않다. 오픈AI는 이전 버전에 비해 사실을 말할 가능성이 40% 높아졌다고 밝혔지만, GPT-4는 여전히 거짓말을 한다는 지적이 나온다.

118844187.1.jpg

GPT에게 '제주도 흑돼지 맛집'을 물었을 때 나온 답, 출처=IT동아



이를 확인하기 위해 실제로 GPT에게 “제주도 흑돼지 맛집은 어디인지” 물어봤다. 그런데, 추천받은 네 곳 중 두 곳은 네이버, 구글의 검색창과 지도에서 검색해도 나오지 않았다. 그런데도, 메뉴와 주소까지 구체적으로 설명한 것이다.

이에, AI 업계는 GPT의 거짓말 문제를 완전히 해결하는 것을 어려울 것으로 전망한다. 가짜 정보나 편견이 포함된 데이터가 아니라 신뢰성 높은 논문과 서적만 학습한다 해도, GPT는 배운 단어를 그저 그럴싸하게 조합만 한다. 정작, 그렇게 만든 결과물이 사실인지 판단하는 능력은 부족하다.
 

경희대학교 이경전 교수는 “사람이 GPT에게 답을 가르쳐줘서 ‘거짓말’ 문제를 어느 정도 해결할 수는 있지만, 완전히 해결하는 것은 쉽지 않다. 그래서, AI가 항상 진실을 말하는 것이 아니라는 점을 유념해야 한다”고 조언했다.

번호 제목 글쓴이 조회 등록일
[공지] 자유 게시판 이용간 유의사항 (정치, 종교, 시사 게시물 자제) [1] gooddew - -
46800 SSD 드라이브를 파괴하는 요인들 [4] 날개잃은통 1507 12-27
46799 ‘윈도우 10’ 서비스 종료가 막대한 쓰레기를 생성한다? 생... [3] 날개잃은통 1000 12-27
46798 Drive Snapshot 1.5 한글화 자료를 찾고있습니다. [2] 정상고집 414 12-27
46797 여자들이 싫어하는 남자 외모 순위라는데.. [7] 도뽱 1255 12-26
46796 한국천문연구원 주차장에 세겨진 그림 asklee 741 12-26
46795 작업표시줄의 windows보안 아이콘 복원 테스트 [1] 체리마키아 382 12-26
46794 포터블에 대한 라이선스 문의 [5] ThinkAbout 729 12-26
46793 끝 인가요? [1] 대충 882 12-26
46792 붕어빵 가격 얼마 하나요? [7] 테츠로 642 12-26
46791 영휴 때 영화 나폴레옹 보려고 찾아보니 거이 문닫기일보직... [1] birdtree 597 12-26
46790 만화 영화 한편 보세요 [1] asklee 1019 12-26
46789 혹시 무월님의 이 자료를 가지고 계신 분이 있으실까요? [2] 미친크라이 854 12-25
46788 벌써 7000모았다는 대학생 [11] FINAL 1147 12-25
46787 boot.wim LaunchBar(런처바) 활용 간단 백업 4종 마무리 중... [106] 무월 1426 12-25
46786 공짜로 핸드폰으로 팩스보네고 받기 [5] 염라대왕 1816 12-25
46785 다운 할 수있 기회 주셔서 감사합니다... [1] 당일 1116 12-25
46784 2023년 감사했습니다. [2] parannara 512 12-24
46783 노량 죽음의 바다 [2] 번개 831 12-24
46782 램디스크가 시퀀셜은 SSD보다 느리네요 [6] JR.오펜하이 932 12-24
46781 올해도 왔네요. 한스 760 12-24
XE1.11.6 Layout1.4.8