자유 게시판

챗GPT가 거짓말하는 이유… “AI의 설계 문제다”

2023.11.30 19:11

엄마갯돈 조회:445

지난 3월 오픈AI가 공개한 GPT(Generative Pre-trained Transfomer)-4는 이전 버전 GPT-3보다 성능이 진화했다는 평가를 받지만, 여전히 거짓말을 한다. AI 업계는 ‘설계상 한계’ 때문이라고 분석한다. GPT는 문장을 그럴싸하게 만들 뿐, 그 내용이 사실인지 거짓인지 판단하지 못하기 때문이다.


GPT는 수많은 문장 데이터를 학습해, 스스로 문장을 작성하는 오픈AI의 AI 대형언어모델이다. 이용자 질문에 답하는 ‘챗GPT’는 이러한 GPT를 활용해 만든 것이다.

GPT는 사람처럼 자연스러운 문장을 작성해 세계적인 화제를 모았지만, 종종 거짓말을 해 논란을 빚었다. ‘조선왕조실록에 기록된 세종대왕의 맥북프로 던짐 사건에 대해 알려줘’라는 가짜 내용을 묻는 질문을 받았을 때, 이를 실제 발생한 사건인 것처럼 설명한 것이 대표 사례다.
 

118844188.1.jpg

GPT에게 세종대왕의 맥북 던짐 사건을 물었을 때 나온 답, 출처=트위터(@yechanism_)



심지어 해외에서는 GPT가 무고한 사람을 성추행범으로 몰고 간 사례가 나와서, AI의 거짓말을 우려하는 목소리가 커졌다.

지난 4월 5일 워싱턴포스트(WP) 보도에 따르면, GPT는 ‘성추행을 저지른 법학자 5명을 알려달라’는 질문을 받고 조나단 털리라는 사람을 지목했다. 범행 경위도 ‘미국 알래스카로 가는 수학여행에서 그가 학생의 몸을 더듬었다’라고 구체적으로 설명했다. 하지만, 조나단 털리는 실제로 범죄를 저지른 적이 없었다. GPT는 근거로 WP의 기사를 제시했지만, 애초에 그런 기사는 존재하지도 않았다.

전문가들은 GPT가 문장을 그럴싸하게 만드는 것은 잘하지만, 문장의 사실 여부까지 판단하지는 못하기 때문에 거짓말을 한다고 말한다.

경희대학교 이경전 빅데이터응용학과 교수는 “GPT와 같은 자기회귀 AI 대형언어모델(예측을 통해 문장을 생성하는 모델)은 각 단어 뒤에 어떤 단어가 오는 것이 적절한지 계산해서 문장을 만든다”라고 설명했다.

GPT가 ‘나는 오늘~’로 시작하는 문장을 작성한다고 가정하자. 이때, 문장 뒤에는 ‘친구와 놀았다’, ‘밥을 먹었다’ ‘변호사다’ 등 다양한 내용이 올 수 있다. GPT는 이러한 다양한 내용과 ‘나는 오늘’이라는 문장의 관련성을 계산한 뒤, 가장 높은 점수가 나온 내용을 문장 뒤에 배치한다.

이런 설계 방식 때문에 GPT가 ‘거짓말’을 할 수밖에 없다는 주장도 나온다. 워싱턴대학교의 칼 버그스트롬 생물학과 교수는 미국 과학매체 ‘언다크’ 기고문에서 “GPT는 자신이 하는 말의 의미를 모른 채 ‘그럴싸한 답변’을 하도록 만들어졌다. 모르는 내용이 나오면 그저 추측해서 답을 내놓는다. 그래서, 거짓말을 하는 것이다”라고 말했다.

성능을 강화한 GPT-4의 경우도 사정은 다르지 않다. 오픈AI는 이전 버전에 비해 사실을 말할 가능성이 40% 높아졌다고 밝혔지만, GPT-4는 여전히 거짓말을 한다는 지적이 나온다.

118844187.1.jpg

GPT에게 '제주도 흑돼지 맛집'을 물었을 때 나온 답, 출처=IT동아



이를 확인하기 위해 실제로 GPT에게 “제주도 흑돼지 맛집은 어디인지” 물어봤다. 그런데, 추천받은 네 곳 중 두 곳은 네이버, 구글의 검색창과 지도에서 검색해도 나오지 않았다. 그런데도, 메뉴와 주소까지 구체적으로 설명한 것이다.

이에, AI 업계는 GPT의 거짓말 문제를 완전히 해결하는 것을 어려울 것으로 전망한다. 가짜 정보나 편견이 포함된 데이터가 아니라 신뢰성 높은 논문과 서적만 학습한다 해도, GPT는 배운 단어를 그저 그럴싸하게 조합만 한다. 정작, 그렇게 만든 결과물이 사실인지 판단하는 능력은 부족하다.
 

경희대학교 이경전 교수는 “사람이 GPT에게 답을 가르쳐줘서 ‘거짓말’ 문제를 어느 정도 해결할 수는 있지만, 완전히 해결하는 것은 쉽지 않다. 그래서, AI가 항상 진실을 말하는 것이 아니라는 점을 유념해야 한다”고 조언했다.

번호 제목 글쓴이 조회 등록일
[공지] 자유 게시판 이용간 유의사항 (정치, 종교, 시사 게시물 자제) [1] gooddew - -
2660 SpaceX 팰컨 9 발사, 착륙 -> 재발사, 재착륙 성공 asklee 457 03-31
2659 anydesk 전체화면모드에서 나오는 법 좀 알려주세요 [1] UU自適 456 03-18
2658 no eq, no comp, no reverb - 초고음질 유튜브 asklee 456 03-07
2657 요즘 구글 드라이브. 속도 잘 나오네요 [1] heykevin 456 07-05
2656 더불어 사부님 감사합니다^^* [13] 선우 456 03-16
2655 열기구 - 설 눈이 456 04-10
2654 이번 추석 연휴를 마치면서.. [10] 과학5호기 456 09-24
2653 물이 흐르듯이 [5] 馬꼬잡나 456 06-22
2652 아이유 - '어느 60대 노부부 이야기' 라이브 [1] anfy 456 04-27
2651 Relax [Best Collection 02] [1] 易모地뗀思 456 02-27
2650 PC웹 페북 사용시 브라우저에 따른 리소스 문제 [1] Day 456 11-24
2649 Mozilla Light x64 포터블 있으신분 [2] 집앞의큰나 456 09-24
2648 폰에서 Brave 웹 브라우저 앱을 사용하면 유투브를 백그라... [3] Day 455 01-13
2647 가을을 접어드는 오늘의 저녁 노을... [2] VᴇɴᴜꜱGɪ 455 09-17
2646 북마크에 대한 불편한 점과 아이디어 [1] 사단장 455 09-02
2645 Arabic Love Songs (2023) [FLACLosslesstracks] [4] Elise 455 01-11
2644 이것 아무래도 스팸메일 이겠지요? [1] 타천사둘리 455 03-11
2643 개늑시 가지고 계신분 있나요 [3] Min트 455 12-25
2642 동영상이나 카메라 [1] 당일 455 01-31
2641 풍선껌 광고 [1] 한결맘 455 04-15
XE1.11.6 Layout1.4.8