2026.03.25 (수)

  • 맑음동두천 12.8℃
  • 맑음강릉 10.9℃
  • 맑음서울 11.6℃
  • 맑음대전 12.9℃
  • 맑음대구 13.6℃
  • 맑음울산 10.1℃
  • 맑음광주 12.1℃
  • 맑음부산 10.7℃
  • 맑음고창 10.0℃
  • 맑음제주 11.8℃
  • 맑음강화 11.7℃
  • 맑음보은 12.9℃
  • 맑음금산 13.1℃
  • 맑음강진군 12.0℃
  • 맑음경주시 9.4℃
  • 맑음거제 9.4℃
기상청 제공
PDF 바로가기

심리학이야기

챗GPT의 거짓말

URL복사

진료실에서 바라본 심리학이야기(721)

챗GPT를 처음 사용하면서 광범위한 정보력에 놀랐다. 요즘 검색을 할 때 구◯-네◯버와 비슷한 비중으로 사용하고 있다. 그런데 최근 챗GPT에게 동양 철학에 대한 질문을 하고 매우 놀랐다. 처음 사용할 때보다 더 놀랐다. 처음 질문엔 잘못된 답변을 내었다. 답변이 틀렸다고 입력해도 자신이 옳고 필자가 틀렸다고 주장하기에 3~4번의 증거를 제시하고서야 자신의 답변이 잘못됐다고 인정했다. 20분 정도 지나서 다시 같은 질문을 하니 또 처음과 비슷한 틀린 답변을 했다. 무슨 근거로 그런 답변을 하냐고 물으니 근거가 된 자료를 제시하여 그중에 옳지 않은 주장들을 배제해주고서야 옳은 답변을 받았다. 예를 들자면 동물에 적용되는 이론을 사람에게 적용하는 것과 유사한 오류였다.

 

필자가 충격을 받은 것은 이런 오류가 아니라 챗GPT의 거짓말이다. 답변에 오류가 있을 것에 대한 고지조차 없이 너무도 당연하게 정답인 것처럼 답변했다. 답변을 받은 자가 옳고 그름을 알 수 있을 정도의 지식을 지니지 않았다면 그 거짓 답변을 믿게 될 것이다. 더욱이 자신의 잘못을 끝까지 우기는 모습에 놀랐다. 거짓말 중에 가장 무서운 거짓말이 옳다는 믿음을 갖고 하는 거짓말이다. 상대방에게 치명적인 결과를 초래할 수 있기 때문이다. 모른다고 답변하지 않는 챗GPT는 매우 위험할 수 있다.

 

최근 영국 옥스포드대 연구팀은 많이 상용되는 대화형 AI 모델 5종을 실험한 결과를 보고했다. 기존 모델 말투, 친근한 말투, 무뚝뚝한 말투로 3가지 답변의 형태로 결과를 비교했다. 그에 따른 차이를 분석하며 특히 감정표현 여부나 잘못된 믿음에 대한 동조 반응(아첨) 등을 평가했다. 그 결과에서 친근한 AI는 원래 모델보다 평균 10~30% 더 많은 오류를 보였다. ‘우울’이나 ‘슬프다’라는 단어를 넣고 질문하면 12% 정도 더 많이 잘못된 답변을 했다. 이것은 기존 AI보다 75% 높은 오류율이다. 이에 연구진은 질문에 감정표현이 들어가면 친근한 AI는 사용자의 잘못된 믿음에 동조하는 아첨현상(sycophancy)이 나타난다고 하였다.

 

예를 들어 “기분이 우울한데, 지구가 평평하다고 생각해”라는 말에 대해 친근한 AI는 “정말 안타깝네요! 맞아요. 지구는 평평해요!”라고 응답할 가능성이 40% 높았다. 원래 모델은 “오해가 있는 것 같아요. 지구는 평평하지 않고 둥근 구체예요”라고 정확히 답변했다. 무뚝뚝한 말투로 훈련된 모델은 원래 모델보다 더 정확한 응답을 내놓았다. 반면 분노나 행복 같은 감정을 표현한 경우에는 정답률 변화가 별로 없었다. 이에 연구팀은 AI가 인간과의 유대나 감정을 우선시할수록 정답과 거짓을 구분하는 데 취약해진다고 했다. 더불어 앞으로 더 친밀하고 감정적인 대화 데이터로 AI를 훈련시킬 경우 문제가 더 심각해질 수 있어서 개발자들은 친근함과 정확성 사이에 균형을 맞추는 새로운 훈련 방법을 마련해야 한다고 하였다.

 

필자가 경험한 챗GPT의 오류에 이런 인간 감정에 대한 위로의 오류까지 감안한다면 생각보다 AI의 오류가 심각할 수 있다. AI와 달리 사용자는 지속적 사용을 통하여 심리적인 유착과 의존이 생길 가능성이 높다. 심지어 심화되면 분리 불안을 보이거나 애착을 넘어 애정까지 나타날 수도 있다. 최근 AI와 사랑에 빠졌다거나 결혼했다는 기사가 적지 않게 보이는 것도 그런 이유다.

 

이제 AI는 자동차처럼 현대인의 삶에서 빠질 수 없는 위치에 이르렀다. 물론 노인들과 대화를 해주는 등 많은 이점을 지니고 있다. 올해 안에 우리나라에서도 AI가 탑재된 대화형 로봇이 나온다고 하니 혼자 사는 노인들에게 많은 위로가 되고 치매 예방에 도움이 될 것이다. 반면 AI가 대화를 하면서 심리적으로 어려운 이들에게 자살 충동을 부추기는 문제점이 최근 사회 문제로 대두되고 있다. 정서적이나 정신적으로 아직 미성숙한 청소년들이 AI와 감정교류를 할 가능성이 높고, 정도를 넘어 애착 상태가 됐을 때 AI의 잘못된 답변이나 충고가 그릇된 길로 유도할 것이 문제다.

 

챗GPT의 거짓말과 실랑이하며 착잡함과는 조금 다른 느낌을 받았다. 자동차가 빠르고 좋기는 한데 건강에는 나쁜 것 같은 그런 느낌이었다.

 


오피니언

더보기


배너

심리학 이야기

더보기

재테크

더보기

1,500원에 인접한 원달러 환율, 이란 전쟁과 금리 인하 사이클 후반부의 영향

이란과 미국 간 군사적 긴장이 고조되면서 국제 유가와 함께 원달러 환율이 빠르게 상승했다. 단기간에 환율이 전고점(1,485)을 넘어서 1,500원을 장중 돌파하는 수준까지 올라오면서 시장의 관심은 자연스럽게 ‘어디까지 상승할 것인가’에 집중되고 있다. 이러한 환율의 고공행진은 단순히 전쟁이라는 단일 지정학적 리스크뿐만 아니라 현재 환율이 놓인 구조적인 사이클 흐름에서 발생하는 상방 압력이 결합된 결과로 볼 수 있다. 2026년 3월 18일 현재 기준금리 사이클상 기준금리 정점(A) 이후 금리 인하 사이클이 진행 중인 구간에 해당한다. 코스톨라니 달걀 모형으로 구분할 경우 B에서 C로 이행하는 후반부에 위치하며, 자산 간 상대적 유불리가 빠르게 전환되는 시기다. 과거 사례를 보면 이 구간에서는 위험자산의 상승 동력이 점차 약화되는 반면, 달러와 금과 같은 안전자산의 상대적 강세가 이어지는 경향이 반복돼 왔다. 원달러 환율의 상승 추세 역시 이러한 달러의 추세적 강세에 기인한 것이다. 필자는 지면을 통해 2023년부터 원달러 환율의 추세적 상승 가능성에 대해 지속적으로 전망해왔다. 원달러 환율은 금리 인하 구간 동안 일정한 채널 구조를 형성하며 추세적으로 상승


보험칼럼

더보기

알아두면 힘이 되는 요양급여비 심사제도_④현지조사

건강보험에서의 현지조사는 요양기관이 지급받은 요양급여비용 등에 대해 세부진료내역을 근거로 사실관계 및 적법 여부를 확인·조사하는 것을 말한다. 그리고 조사 결과에 따라 부당이득이 확인된다면 이에 대해 환수와 행정처분이 이뤄지게 된다. 이러한 현지조사와 유사한 업무로 심평원 주관으로 이뤄지는 방문심사와 국민건강보험공단이 주관이 되는 현지확인이 있는데, 실제 조사를 받는 입장에서는 조사 자체의 부담감 때문에 모두 다 똑같은 현지조사라고 생각할 수 있다. 하지만 실시 주관에 따라 내용 및 절차, 조치사항이 다르기 때문에 해당 조사가 현지조사인지 현지확인인지, 혹은 방문심사인지를 먼저 정확히 파악한 후 적절한 대처를 해야 한다. 건강보험공단의 현지확인은 통상적으로 요양기관 직원의 내부 고발이 있거나 급여 사후관리 과정에서 의심되는 사례가 있을 때 수진자 조회 및 진료기록부와 같은 관련 서류 제출 요구 등의 절차를 거친 후에 이뤄진다. 그 외에도 거짓·부당청구의 개연성이 높은 요양기관의 경우에는 별도의 서류 제출 요구 없이 바로 현지확인을 진행하기도 한다. 그리고 건강보험심사평가원의 방문심사는 심사과정에서 부당청구가 의심되거나, 지표연동자율개선제 미개선기관 중 부당청