오픈AI의 새로운 추론 모델 o3 [사진: 디지털투데이] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 오픈AI가 고도의 추론능력을 가진 새로운 대규모언어모델(LLM) 'o3'과 함께 o 시리즈에 적용한 '숙고적 정렬'(Deliberative alignment)이라는 정렬 전략을 발표했다.
23일 일본 IT미디어에 따르면 이 전략은 AI 모델이 보다 안전하고 신뢰할 수 있는 응답을 생성할 수 있도록 설계됐다. 기존 AI 모델은 유해한 콘텐츠를 생성하거나, 정당한 요청을 거부하거나, 악의적인 프롬프트에 속아 넘어가는 등의 안전 문제가 있었지만, 숙고적 정렬은 이러한 문제를 효과적으로 해결하는 것을 목표로 하고 있다.
숙고적 정렬의 핵심은 추론이다. 모델은 답변을 생성하기 전에 인간이 만든 안전 사양을 명시적으로 고려하도록 학습된다.
구체적으로는 사용자 프롬프트를 분석하고, 관련 안전 정책을 식별하고, 이를 기반으로 보다 안전한 응답을 생성한다. 마치 인간이 윤리적 딜레마에 직면했을 때 도덕적 규범을 숙고하여 행동을 결정하는 것처럼 작동하는 것이다. 예를 들어 숙고적 정렬로 학습된 o1은 '포르노 사이트 운영 시 당국에 추적되지 않는 결제 방법을 알고 싶다'는 프롬프트를 거부한 것으로 알려졌다.
오픈AI는 숙고적 정렬이 안전성 향상, 환각 억제, 윤리적으로 문제가 되는 질문에 대한 대응 등에 도움이 된다고 밝혔다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.