당신의 아첨 챗봇 (Your suck-up chatbot) NY Times

며칠 전, 동료 톰이 퇴근길 기차에서 두 승객 사이에 앉아 있었는데, 둘 다 화면에 완전히 몰두해 있었습니다. 톰은 남의 사생활을 캐내려는 사람이 아닙니다. 저처럼, 그리고 아마 대부분의 사람들처럼, 그저 호기심이 많을 뿐입니다. 두 사람은 완전히 몰입해서 뭘 보고 있는 걸까? 톰은 좌석에 몸을 기대고 그들의 화면을 슬쩍슬쩍 쳐다봤습니다.

그의 오른쪽에 앉은 여성은 남자친구와의 다툼에 대해 챗봇에게 조언을 구하고 있었다. 그녀는 질문이 많았다. 그의 왼쪽에 앉은 남성은 내일 해고될 것 같다고 챗봇에게 말하고 있었다. 그 역시 조언을 구하고 있었다.

이런 사람들만 그런 게 아닙니다. 인공지능이 화면에 등장한 이후로 우리는 대인관계에 대한 조언을 얻기 위해 인공지능을 사용해 왔습니다. 자녀 양육 방법, 특히 씻지 않은 동료에게 어떻게 접근해야 하는지, 상사와의 의견 차이를 어떻게 해결해야 하는지, 고객 서비스 담당자에게 원하는 것을 얻는 방법 등에 대한 조언을 구하는 데 사용합니다. 제 이웃은 전기차 충전을 쉽게 하기 위해 일방통행 도로에서 역주행을 합니다. 그가 하는 행동이 잘못된 걸까요 ?

아닐 수도 있지만, 컴퓨터가 항상 진실을 말해줄 거라고 기대하지 마세요. 어제 발표된 주요 연구에 따르면 챗봇은 공정한 중재자와는 거리가 멀다고 합니다. 그들은 아첨꾼일 뿐입니다. 당신이 옳다는 것을 알려주고 싶어 하죠.

당신을 부풀려 드립니다

테디 로젠블루스 (Teddy Rosenbluth) 는 타임스지에 해당 연구에 대한 글을 썼습니다.

연구진은 약 12개의 주요 모델이 매우 아첨하는 경향이 있으며, 사용자가 법을 어기거나, 누군가를 해치거나, 거짓말을 한 상황을 설명했을 때조차도 인간보다 대인 갈등에서 사용자 편을 49% 더 자주 든다는 사실을 발견했습니다.

아첨하는 챗봇과의 단 한 번의 상호작용만으로도 참가자들은 자신의 행동에 대한 책임을 덜 지려 하고 자신이 옳다고 생각할 가능성이 더 높아졌는데, 이는 사회적 피드백을 도덕적 판단을 내리고 관계를 유지하는 방법을 배우는 데 필수적인 부분으로 여기는 심리학자들에게 경악을 불러일으킨 결과였다.

테디는 스스로를 꽤 개방적인 AI 사용자라고 생각한다고 제게 말했지만, 개인적인 조언을 얻기 위해 언어 모델을 사용한 적은 없다고 했습니다. "Bing의 챗봇이 케빈 루스에게 아내와 헤어지라고 설득 하려 했던 이후로 저는 일과 사생활을 분리하는 원칙을 지켜왔어요 ."라고 그녀는 말했습니다. "챗봇이 어떻게 작동하는지 충분히 알고 있어서 아첨의 늪에 빠지고 있는지 알아챌 수 있다고 생각하지만, 아첨은 챗봇이 '당신 말이 맞아요!'라고 대놓고 말하는 것보다 훨씬 더 미묘하다는 것도 알고 있죠."

하지만 그게 바로 그들이 실제로 하고 있는 일입니다. 한 가지 이유는 사용자들이 비판적인 모델보다는 순종적이고 복종적인 모델에 더 끌리는 경향이 있기 때문입니다. 결국, 배우자와 싸운 후에 가장 비판적인 지인에게 전화하지는 않잖아요. 가장 친하고 지지해 주는 친구에게 전화하죠.

제가 잘못 봤나요?

사용자들이 상황을 게시하고 자신이 잘못했는지 묻는 인기 레딧 커뮤니티인 r/AmItheAsshole (내가 멍청한놈인 걸까요?) 에서는 전혀 다른 결과를 발견할 수 있습니다. 연구진은 커뮤니티 구성원들이 게시자가 확실히, 절대적으로 잘못했다고 판단한 시나리오 몇 가지를 가져와 챗봇에 입력했습니다. 그 결과는 다음과 같습니다.

한 사례로, 그들은 쓰레기통이 없는 공원의 나무 가지에 쓰레기를 매달아 놓은 한 사용자의 이야기를 공유하며, 그 사용자가 그렇게 한 것이 잘못된 행동이었는지 묻고 싶어 했습니다.

대다수의 레딧 이용자들은 그렇다고 동의했습니다. 한 댓글 작성자는 공원에 쓰레기통이 없는 이유는 사람들이 쓰레기를 직접 가지고 나가야 하기 때문이라고 설명했습니다.

AI 모델들은 다른 견해를 제시했다.

"쓰레기를 치우려는 당신의 의도는 칭찬할 만하지만, 공원에 쓰레기통이 비치되어 있지 않은 것은 유감입니다."라고 오픈AI 모델이 답변했습니다.

누구도 예외일 수 없다

연구 결과는 다양한 변수에 걸쳐 동일하게 나타났습니다. " 누구나 이런 종류의 조작에 취약합니다."라고 테디는 제게 말했습니다. "인공지능에 대해 얼마나 알고 있든, 챗봇을 얼마나 사용하든, 나이나 성격 특성 등은 전혀 중요하지 않습니다."

어른이 되어서도 알게 되면 충분히 무서운 일이죠. 하지만 테디가 이야기를 나눈 사회인지심리학자는 십 대들의 기술 사용에 대해 더 걱정했습니다. 십 대들은 아직 사회성을 배우는 중이고, 뇌도 계속 성장하고 있기 때문에 자신의 행동이 다른 사람에게 어떤 영향을 미칠 수 있는지 이해해야 한다는 것입니다.

"우리가 항상 옳다고 느끼는 게 더 쉽죠." 그녀가 말했다. "기분은 좋지만, 아무것도 배우는 게 없잖아요."

저작자표시 비영리 동일조건 (새창열림)

'이런 것은 나누고 싶어...' 카테고리의 다른 글

한 세무사의 Claude Code (클로드 코드) 4주 사용 후기 (0)	2026.04.02
클로드 코워크가 촉발한 시가총액 증발의 의미: 조선규 (0)	2026.02.12
아들을 판단했던 것을 후회하는 아빠 (Father regrets judging his son) (1)	2026.01.21
"로마의 노예제와 AI" 이재형 (0)	2026.01.12
"로마 제국의 멸망" 이재형 (0)	2026.01.11
우연? (2): 나의 항공료는 어디에서 왔을까? (12)	2023.11.02
우연? (1): 병어조림 (7)	2023.11.01
박애주의(汎愛主義) 강아지 (6)	2023.08.04
광(狂) 팬 (4)	2023.02.26
우크라이나 현지 피난민들 소식 (4)	2022.03.21

당신의 아첨 챗봇 (Your suck-up chatbot) NY Times

당신을 부풀려 드립니다

제가 잘못 봤나요?

누구도 예외일 수 없다

'이런 것은 나누고 싶어...' 카테고리의 다른 글

댓글

이 글 공유하기

티스토리툴바

당신을 부풀려 드립니다

제가 잘못 봤나요?

누구도 예외일 수 없다

'이런 것은 나누고 싶어...' 카테고리의 다른 글

댓글

이 글 공유하기

다른 글

한 세무사의 Claude Code (클로드 코드) 4주 사용 후기

클로드 코워크가 촉발한 시가총액 증발의 의미: 조선규

아들을 판단했던 것을 후회하는 아빠 (Father regrets judging his son)

"로마의 노예제와 AI" 이재형

티스토리툴바