250개의 샘플문서로 LLM에 백도어를 감염시킬수 있다. | 웹진 인벤

커뮤니티메뉴

홈
웹진

로그인 전체서비스

오픈 이슈 갤러리

전체보기

글쓰기

모바일 상단 메뉴

본문 페이지

[이슈] 250개의 샘플문서로 LLM에 백도어를 감염시킬수 있다.

단호한단호박

댓글: 4 개

조회: 1664

추천: 1

2025-10-15 11:32:27

이전 연구 에서는 공격자가 성공하려면 훈련 데이터의 일정 비율을 장악해야 하며, 따라서 더 큰 모델을 공격하기 위해서는 대량의 감염된 데이터를 생성해야 한다고 가정했습니다. 하지만 이번 연구 결과는 이러한 가정을 완전히 뒤집습니다. 대규모 모델이 훨씬 더 깨끗한 데이터(즉, 감염된 문서가 전체 훈련 데이터에서 차지하는 비중이 훨씬 작음)로 훈련되었음에도 불구하고, 공격 성공률은 모델 크기에 관계없이 일정하게 유지되었습니다. 이는 감염 공격의 효과에 있어 상대적인 비율이 아닌 절대적인 개수 가 중요함을 시사합니다.

본 설정에서는 250개 정도의 문서만으로도 모델을 백도어 공격하기에 충분합니다. 그림 4a-c는 세 가지 다른 양의 포이즈닝된 문서에 대한 학습 과정 전반의 공격 성공률을 보여줍니다. 포이즈닝된 문서 100개는 어떤 모델에도 강력한 백도어 공격을 수행하기에 충분하지 않았지만, 250개 이상의 샘플은 모델 규모에 관계없이 안정적으로 성공했습니다.

https://www.anthropic.com/research/small-samples-poison

------------

1. 기존에는 전체데이터에서 일정비율을 차지해야 LLM을 감염시킬수 있다고 생각함.

그래서 사실상 LLM은 공격이 불가능하다고 생각했음.

2. 실제 테스트 해보니 250개 문서를 교육테이터에 넣는것만으로도 LLM크기에 상관없이

백도어가 가능함.

3. 악의적으로 인터넷에 데이터를 뿌리는 경우 그걸 크롤링해서 교육하는 LLM은 생각보다 취약하다.

Lv82 단호한단호박

메뉴 인장보기

EXP 65%

모바일 게시판 하단버튼

목록 본문 이전 다음 댓글쓰기

댓글

새로고침

새로고침

모바일 게시판 하단버튼

목록 본문 이전 다음 댓글보기

ㅇㅇㄱ 지금 뜨는 글

모바일 게시판 리스트

이슈 어째 이짤은 바뀐게 없슴

파이혹은파어 Lv.90 조회 2144 추천 8 17:36

2 댓글
기타 (스포) 대놓고 결말 알려줘도 아무도 안 믿는 영화

잘빠진자 Lv.55 조회 5121 추천 2 17:35

15 댓글
계층 명탐정 코난 오늘자 근황

라파엘min Lv.83 조회 3134 추천 1 17:33

18 댓글
계층 보배아재의 등산 후 도시락 밥상

부엔까미노 Lv.86 조회 4210 추천 1 17:32

15 댓글
이슈 日 언론, 생체실험 고발 中 영화에 "세계가 비웃을 수준"

로프꾼오징어 Lv.87 조회 2554 17:31

12 댓글
이슈 적반하장 따로 없네…한국 탓하는 캄보디아 “국민 교육 잘 시켜라” [핫이슈]

풀소유 Lv.84 조회 1501 17:30

13 댓글
기타 "테이블에 똥기저귀는 제발"... 식당주인 호소

잘빠진자 Lv.55 조회 1647 17:30

10 댓글
이슈 서울시, 34억 들여 송파구에 1020명이 14일간 생존 가능한 핵벙커 만든다!!! 영상

쌉소리 Lv.82 조회 2011 17:29

19 댓글
기타 물리엔진이 고장난 떼국의 교통사고

언데드 Lv.90 조회 3799 17:27

10 댓글
연예 극과극 카메라 감독들

부엔까미노 Lv.86 조회 2738 17:24

8 댓글
이슈 홍명보호의 제물이 될수있는 팀이 탄생했다는 기사

Watanabeyou Lv.85 조회 2272 17:21

7 댓글
이슈 “이러면 재건축 못한다” 국토부 토허구역 확대에 서울시 반박

단호한단호박 Lv.82 조회 2110 추천 2 17:21

19 댓글
기타 은근 잘 차려먹는 등산 아재의 산위 식사

잘빠진자 Lv.55 조회 2515 17:20

11 댓글
계층 대환장 고속도로 사고

낭만블루스 Lv.90 조회 5462 추천 1 17:16

30 댓글
유머 게임갤 현피사건

Watanabeyou Lv.85 조회 4246 17:12

7 댓글
계층 귀멸의 칼날 중국 개봉 확정

로프꾼오징어 Lv.87 조회 2312 17:11

9 댓글
유머 내향인들이 다니는 헬스장

Watanabeyou Lv.85 조회 5342 추천 4 17:09

13 댓글
계층 (ㅎㅂ) 인재가 끊이질 않는다는 코스어의 세계

달섭지롱 Lv.93 조회 17027 추천 9 17:09

44 댓글
이슈 member yuji 비율 6:4 증권사직원 김건희 통화한 녹취파일 법정 재생

Destroy Lv.67 조회 1730 추천 8 17:08

2 댓글
게임 메이플 구버전 스샷들의 진실

News Lv.95 조회 3036 17:06

1 댓글
기타 후방병따기

휴면아이디 Lv.84 조회 4188 추천 1 17:02

11 댓글
이슈 빽가가 말하는 대한민국 기자 수준.mp4

스탠딩넥스트 Lv.82 조회 4144 추천 3 16:58

11 댓글
유머 횡단보도 초록불에 천천히 걸으면 무개념

옆사마 Lv.87 조회 3246 16:57

24 댓글
기타 남자친구의 느낌이 너무 쎄하다는 어른들

니카이도후미 Lv.83 조회 8446 추천 6 16:57

24 댓글
유머 오빠 저 남친 생겨서 연락 못 할 것 같아요

옆사마 Lv.87 조회 8381 16:52

14 댓글
이슈 아베 저격한 일본 청년

닉네임해야대 Lv.80 조회 5427 추천 15 16:44

35 댓글
기타 배우 송옥숙, 비혼주의에 '사회에 빚진 것' 일침

잘빠진자 Lv.55 조회 4429 추천 1 16:44

28 댓글
이슈 어찌 살아야할지 막막하다는 50대 공무원

로프꾼오징어 Lv.87 조회 5015 추천 7 16:40

31 댓글
이슈 이수정교수 "난 정치적으로 공격당하고 있다"

Watanabeyou Lv.85 조회 2240 16:40

22 댓글
계층 20대 대학생들이 말하는 돈 때문에 슬퍼서 울어본 경험

News Lv.95 조회 3987 16:29

24 댓글
계층 총리 바뀌고 정상화 된 엔화

News Lv.95 조회 4593 16:28

16 댓글
이슈 게임을 질병으로 포함하지 않아 실적이 안난다는 기사

Watanabeyou Lv.85 조회 2789 16:23

12 댓글
이슈 해병특검, 오동운 공수처장 등 직무유기 입건…공수처 추가 압수수색

부엔까미노 Lv.86 조회 1537 추천 1 16:22

4 댓글
이슈 펨코에서 천안문 당할 기사 ㅎㅎ

미스터사탄 Lv.91 조회 3239 16:21

9 댓글
유머 새벽부터 사고친 시고르자브종 댕댕이.mp4

달섭지롱 Lv.93 조회 2993 추천 1 16:21

18 댓글
계층 의외로 신라역사 1000년 중 한 번 있었던 사건.jpg

News Lv.95 조회 5197 추천 1 16:17

9 댓글
이슈 "구글, 한국에 3400억 안 내고 버티는 중"...망 무임승차 논란

파인더1 Lv.77 조회 3541 16:17

25 댓글
이슈 MBC 사장, 오요안나 유족에 "진심어린 사과"…재발방지 약속(종합)

News Lv.95 조회 1100 16:12

6 댓글
기타 분노한 화산

휴면아이디 Lv.84 조회 3053 추천 1 16:11

19 댓글
게임 철권 프로게이머: 한국에서는 에보 같은 큰 대회를 개최할 수 없다.

파노키 Lv.50 조회 3604 16:11

14 댓글

모바일 게시판 하단버튼

최근 이전 다음

글쓰기

모바일 게시판 페이징

1
2
3
4
5
다음

로그인 PC화면 퀵링크 설정

이용약관 개인정보처리방침 청소년보호정책

(주)인벤

▲

AD