오픈AI 모델이 추론 과정에서 중국어로 ‘생각’하는 현상이 발견됐다.
지난 9일(현지시간) 신경과학 AI 연구자 리샤브 자인은 자신의 소셜미디어 X를 통해 “오픈AI의 o1 모델이 추론 과정에서 중국어와 같은 언어로 전환하는 이상한 행동을 보인다”고 밝혔다.
이러한 현상은 한 달 전 레딧의 한 사용자가 “대화의 어느 부분도 중국어로 되어 있지 않았는데 갑자기 중국어로 중간 단계를 처리했다.”고 게시물을 올리며 처음 주목받았다.
AI 전문가들은 이러한 현상에 대해 다양한 가설을 내놓았다. 일부는 o1이 대규모 데이터 세트에서 훈련된 점을 언급하며 훈련 데이터에 포함된 언어적 특성이 추론 방식에 영향을 미쳤을 가능성을 제기했다.
구글 딥마인드 연구원 테드 샤오는 “AI 모델 훈련 과정에서 중국의 데이터 라벨링 서비스가 사용된다”며 “이는 언어적 영향을 줄 수 있다”고 말했다.
다른 전문가들은 AI 모델이 효율성을 추구하는 과정에서 특정 언어를 선택했을 가능성을 제시했다.
AI 연구자인 매튜 구즈다이얼은 “AI 모델은 텍스트를 단순한 데이터로 처리한다.”며 “언어의 차이를 이해하지 못한다”고 지적했다.
허깅페이스의 엔지니어 티전 왕은 “중국어의 간결한 구조가 수학적 계산과 같은 문제 해결 과정에서 유리하기 때문에 모델이 이를 선호했을 가능성이 있다”고 말했다.
한편 AI 모델의 작동 원리가 비공개로 이루어지는 특성상 이러한 현상이 나타나는 구체적인 이유는 여전히 밝혀지지 않았다.
오픈AI가 이 문제에 대해 공식적인 설명을 내놓지 않는 한 o1이 추론 과정에서 특정 언어를 사용하는 이유에 대한 논의는 계속될 전망이다.