(참고)GPT-4를 대상으로 한 한국어 연구에서는 요청이 더 공손할수록 정확도가 낮아지는 통계적으로 유의미한 결과(p < 0.001)가 나타났습니다. 흥미롭게도 같은 연구에서 CLOVA X는 정반대의 결과를 보여 공손할수록 정확도가 높아졌으며(p < 0.01), Mixtral과 Solar는 통계적으로 유의미한 패턴을 보이지 않았습니다
LinkedIn의 한 분석에 따르면, 일본어에서는 무례한 프롬프트를 사용할 때 정확도가 가장 크게 떨어졌고, 영어에서는 그 영향이 적었으며, 중국어는 중간 수준이었습니다. 이는 GPT가 문화적 공손함 규범을 학습 데이터로부터 내재화했을 가능성을 시사합니다.
하지만 스카이넷이 날 용서하지 않을거야