컨텐츠 바로가기

    03.16 (월)

    이슈 인공지능 윤리 논쟁

    티오리, AI 학회서 '윤리 편향 기반 LLM 취약점 연구' 채택

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    [디지털데일리 김보민기자] 사이버 보안 전문기업 티오리는 소속 연구원이 참여한 논문이 세계 인공지능(AI) 학회 'AAAI 2026' 워크샵에 채택돼 연구 성과를 발표했다고 3일 밝혔다.

    AAAI는 AI 분야에서 영향력 있는 국제 학회로, 전 세계 연구기관과 기업 소속 연구자들이 최신 연구 성과를 발표하는 학술대회다. AAAI 2026은 1월20일부터 27일까지 싱가포르에서 개최됐다.

    이번 학술대회에 채택된 논문은 '대형언어모델(LLM) 내부 윤리적 편향이 대형 언어 모델의 탈옥 취약점에 미치는 영향 분석(BiasJailbreak: Analyzing Ethical Biases and Jailbreak Vulnerabilities in Large Language Models)'이다. LLM에 내재된 윤리적 편향과 보안 취약점 간 관계를 분석한 연구 내용을 담고 있다.

    이번 연구는 LLM이 특정 윤리적·사회적 편향 요소를 포함한 입력에 대해 서로 다른 안전 반응을 보이는 현상을 실험적으로 분석했다. 연구팀은 이를 바탕으로 윤리적 편향과 탈옥(제일브레이크) 공격 간 관계를 측정하기 위한 분석 프레임워크 'BiasJailbreak'를 제안했다. 편향 기반 공격을 완화하기 위한 대응 방식으로 'BiasDefense'도 함께 제시했다.

    해당 연구 결과는 티오리 LLM 보안 솔루션 '알파프리즘(aprism)' 위험 탐지 기능 설계 과정에도 참고됐다. 연구팀은 LLM 윤리적 응답 특성이 공격에 악용될 수 있는 양상을 분석하고, 이를 바탕으로 편향 기반 입력에 대한 탐지 및 대응 모델을 설계하는 데 연구 내용을 활용했다.

    논문 제1저자로 참여한 이이삭 연구원은 "이번 연구는 LLM 편향과 안전성 문제를 함께 살펴본 분석"이라며 "LLM 보안과 관련한 연구와 논의가 이어지는 과정에서 사례로 활용되길 기대한다"고 말했다.

    한편 티오리는 오펜시브 사이버보안 전문 기업으로 구글, 마이크로소프트, 옥타, 삼성전자를 비롯한 국내외 주요 기업 및 기관에 보안 컨설팅을 제공하고 있다. 웹 애플리케이션 보안 자동화 솔루션 'Xint(진트)', 회원 7만명 이상 사이버보안 교육 플랫폼 '드림핵(Dreamhack)' 등을 운영하며 실전 중심 기술력으로 보안 생태계를 구축하고 있다.

    - Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.