내가 ai 이미지나 영상 생성 모델(대형)을 접할 때 테스트해보는 것들 중 하나가
인물을 거꾸로 뒤집었을 때 구현을 잘 하느냐인데(=데이터셋에 거의 없음)
그런 면에서 gpt-image-1는 0점
gemini의 nano-banana는 30점
grok은 이제 점수를 매겨보려고 테스트를 진행해보았음.
레퍼런스 이미지.
다리는 나노바나나보고 생성해달라고 했음.
투명한 공 위에 앉은 브루미 이미지를 생성함.
얘는 복장에 오류가 있는데 귀여워서 가져옴
이건 '저브' 라고 하는 액티비티인데
공 안에 들어가서 공이랑 같이 몸도 360도 회전하는 재미있는 활동임
여기서 착안해, 브루미가 공 위에 앉아 공과 같이 굴러간다면 어떻게 나올까? 이 주제가 궁금했고
공 위에 앉아있는 상태에서 인물도 동시에 회전한다면 인물이 땅에 닿을 때 어떻게 행동할 것인지.
단순히 생각했을 때에는 등을 공에 대고 완전히 누워 공에 최대한 밀착한 상태로 공과 함께 굴러야하겠지만
일부러 그냥 그러한 지시없이 그냥 뒤로 굴러라고만 했을 때 어떠한 영상이 나오는지 궁금하여
총 170회 영상을 생성해보았음.
일단 씹덕 바이브가 담긴거 3개 뽑음
가운데에 위치한건 고개를 좌우로 살랑살랑 흔들면서 눈웃음을 치라는 전통적 귀여움 제스처를 취하라고 했는데
나머지는 그냥 normal모드로 생성된걸 보면 그냥 이러한 행동이 보편적인듯.
아래로는 뒤로 3회 굴러가는걸 명시했는데 결론만 말하면 원하는 결과물은 단 1개도 안 나옴
제자리서 회전하거나, 뒤로 굴러가는 척 하다가 0.8바퀴 째에서 바운스를 하거나
굴러가더라도 몸이 프레임마다 뒤집히고 온갖 난리를 다 침.
결론: 그록은 몸이 뒤집히는 상황에서 점수 0점