본문 바로가기

세상살이/IT

DeepSeek V3: ChatGPT와의 혼란, AI 모델의 자기 인식 문제

반응형

DeepSeek의 새로운 AI 모델 DeepSeek V3는 자신을 ChatGPT로 인식하는 문제가 발생했습니다. 이는 ChatGPT 데이터로 학습된 결과로 보이며, AI 모델의 품질 저하와 편향성 문제를 초래할 수 있습니다. OpenAI의 서비스 약관 위반 가능성도 있으며, AI 데이터 오염 문제는 더욱 심화되고 있습니다.

 

 

DeepSeek V3의 성능과 출시

DeepSeek, 자금이 잘 지원되고 있는 중국 AI 연구소가 최근 오픈한 AI 모델인 DeepSeek V3를 출시했습니다. DeepSeek V3는 텍스트 기반 작업에서 뛰어난 성능을 보여주며, 코딩과 에세이 작성 등을 쉽게 처리할 수 있습니다. 그러나, 이 모델은 자신을 OpenAI의 ChatGPT라고 생각하는 문제가 발생했습니다.

 

자기 인식 문제

TechCrunch의 테스트와 X의 게시물에 따르면 DeepSeek V3는 자신을 ChatGPT로 식별하고, OpenAI의 GPT-4 모델이라고 주장합니다. DeepSeek V3는 DeepSeek의 API에 대한 질문에 OpenAI의 API 사용 방법을 알려주고, GPT-4와 같은 농담을 합니다. 이러한 현상은 DeepSeek V3가 ChatGPT로부터 학습된 데이터를 기반으로 하기 때문일 가능성이 큽니다.

 

모델 품질 저하 우려

런던 킹스 칼리지의 AI 연구원 마이크 쿡에 따르면, 경쟁 AI 시스템의 출력을 학습하는 것은 모델 품질에 해로울 수 있습니다. 이는 환각과 오답을 유발할 수 있습니다. 또한, 이러한 행위는 OpenAI의 서비스 약관을 위반일 수 있습니다. OpenAI의 약관은 사용자들이 OpenAI와 경쟁하는 모델을 개발하기 위해 출력을 사용하는 것을 금지하고 있습니다.

 

AI 데이터 오염 문제

최근 웹 데이터의 AI 출력 오염으로 인해 AI 모델의 학습 데이터에서 이러한 출력을 완전히 걸러내기가 어려워졌습니다. DeepSeek V3는 ChatGPT/GPT-4 데이터를 직접 학습했을 가능성이 높으며, 이는 모델의 자기 인식과 신뢰성을 떨어뜨릴 수 있습니다. 이러한 데이터 오염은 AI 모델의 편향성과 결함을 악화시킬 수 있습니다.

 

AI 업계의 반응

OpenAI와 DeepSeek은 즉각적인 논평 요청에 응답하지 않았습니다.

그러나, OpenAI CEO 샘 알트만은 X에 DeepSeek과 다른 경쟁자들을 겨냥한 게시물을 올렸습니다. 알트만은 "이미 작동하는 것을 복사하는 것은 상대적으로 쉽다"며 "새롭고 위험하며 어려운 일을 할 때는 그것이 작동할지 알 수 없기 때문에 매우 어렵다"라고 말했습니다.

 

 

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다

반응형